昆明理工大学信息工程与自动化学院云南省计算机技术应用重点实验室,云南 昆明 650500
行人轨迹预测能够有效降低行人轨迹突变造成的碰撞风险,在智能交通及监控系统等领域有着广泛应用。目前已有的研究大多利用无向图卷积网络对行人间的社会交互关系进行建模,这种方法缺少对行人隐藏状态关联性的考虑,容易产生行人间的冗余交互。针对这一问题,提出一种基于注意力机制和稀疏图卷积的行人轨迹预测模型(DASGCN),通过构建深度注意力机制,捕捉行人间运动隐藏状态的关联性,从而准确地提取行人运动状态特征。进一步提出自调节稀疏方法,减小冗余信息带来的运动轨迹偏差,解决行人密集无向交互的问题。将所提模型在ETH和UCY数据集上进行验证,其平均位移误差(ADE)和最终位移误差(FDE)分别达到0.36和0.63。实验结果表明,DASGCN对行人轨迹的预测能力要优于传统算法。
图像处理 深度注意力 图卷积神经网络 轨迹预测 稀疏交互 激光与光电子学进展
2023, 60(10): 1010013
1 上海大学材料基因组工程研究院, 上海 200444
2 之江实验室, 杭州 311100
热电材料是环境友好型能源转换材料, 涉及的体系十分多样。其性能优化是一个多参数协调的复杂问题, 一直是研究者们关注的热点。虽然热电的计算模拟方法和实验方法发展迅速, 但是热电材料的搜索效率仍需要进一步提高。机器学习具有计算成本低和预测速度高的优势, 可以快速缩小搜索空间, 加快对热电材料结构和性能优化的研究。本综述从数据类型的角度出发, 介绍了热电材料中的小样本数值数据(数据量约为102), 大样本数值数据(数据量大于104)及图片数据中机器学习的应用和研究进展, 进一步详细地讨论了在不同的数据类型中研究热电材料的结构和性能所使用的不同的机器学习算法模型, 并对其未来的发展趋势和应用方向进行了展望。
热电材料 机器学习 图卷积神经网络 thermoelectric materials machine learning graph convolutional neural networks
红外与激光工程
2021, 50(10): 20200500
点云分类和分割是三维场景理解中的关键步骤。针对稀疏点云输入和遮挡不能有效识别点云的问题,提出一种改进型分类和分割网络Linked-DGCNN。在动态图卷积网络(DGCNN)的基础上增加EdgeConv卷积层数以提取深层次点云特征;去除DGCNN的转换网络以简化网络结构;引入深度残差网络的思想连接不同网络层的输出特征,形成点云特征,同时使网络训练更加稳定。基于ModelNet40和ShapeNet Parts数据集将该网络与其他点云网络进行对比实验,实验结果表明,该网络在稀疏点云输入和遮挡情况下,相比其他方法有较高的点云分类和分割精度,由此说明该网络具有较强的鲁棒性。
机器视觉 深度学习 点云分类与分割 图卷积神经网络 深度残差网络 激光与光电子学进展
2021, 58(12): 1215008
华东理工大学 信息科学与工程学院,上海 200237
对场景中的物体进行深度估计是无人驾驶领域中的关键问题,红外图像有利于在光线不佳的情况下解决深度估计问题。针对红外图像纹理不清晰与边缘信息不丰富的特点,提出了将注意力机制与图卷积神经网络相结合来解决单目红外图像深度估计问题。首先,在深度估计问题中,图像中每个像素点的深度信息不仅与其周围像素点的深度信息相关,还需考虑更大范围的其他像素点的深度信息,采用注意力机制可以针对这一点有效提取图像的像素级全局深度信息关联。其次,基于深度信息关联得到的特征可以考虑为非欧数据,进一步使用图卷积神经网络(graph convolutional neural network, GCN)来进行推理。最后,在训练阶段将连续的深度估计回归问题转化成分类问题,使训练过程更稳定,降低了网络的学习难度。实验结果表明,该方法在红外数据集NUST-SR上获得了良好的效果,在阈值指标小于1.253时,准确率提升了1.2%,相较其他方法更具优势。
红外图像 深度估计 注意力机制 图卷积神经网络 infrared images depth estimation attention mechanism graph convolutional neural network
1 辽宁工程技术大学软件学院, 辽宁 葫芦岛 125105
2 中国科学院海西研究院泉州装备制造研究所, 福建 泉州 362200
大部分现有深度聚类方法都试图最小化重构损失,然而深层特征的判别能力与重构损失并没有必然联系,并且这些深度聚类方法通常只关注从样本自身提取的有用特征,很少考虑样本背后的结构信息。为解决这些问题,提出一种新的结构化深度判别嵌入编码网络聚类(SDDECC)算法,用于无监督图像聚类。首先在多层卷积自编码器网络中引入最大化互信息与最小化先验分布约束,然后使用传递算子将深度判别嵌入编码网络(DDECN)模块学习到的特征表示融入到图卷积神经网络(GCN)模块中,最后利用Kullback-Leibler(K-L)散度联合双网络结构产生的潜在特征分布端到端地完成聚类训练。实验结果表明,SDDECC算法能够有效提取更多有鉴别性的深层特征,并且由于在GCN中融合了样本的属性信息和结构信息,最终该模型取得了良好的聚类效果。
图像处理 深度聚类 图卷积神经网络 无监督学习 三元组互信息 激光与光电子学进展
2021, 58(6): 0610016
上海工程技术大学电子电气工程学院, 上海 201620
近年来,深度传感器和三维扫描仪的普及,使三维点云得到了快速发展。点云语义分割作为三维场景理解和分析的关键步骤,受到了研究者的广泛关注。深度学习具有优良的高层语义理解能力,基于深度学习的点云语义分割已成为当前研究的热点。首先,从语义分割的概念出发,简要叙述了点云语义分割的优势和现存的挑战;进而详细介绍了点云分割算法和常见的数据集,重点对点云语义分割领域中基于点排序、特征融合和图卷积神经网络的深度学习方法进行了综述;最后,分析了所述方法的定量结果,并展望了点云语义分割技术未来的发展趋势。
图像处理 三维点云 语义分割 深度学习 特征融合 图卷积神经网络 激光与光电子学进展
2020, 57(4): 040002