作者单位
摘要
昆明理工大学信息工程与自动化学院云南省计算机技术应用重点实验室,云南 昆明 650500
行人轨迹预测能够有效降低行人轨迹突变造成的碰撞风险,在智能交通及监控系统等领域有着广泛应用。目前已有的研究大多利用无向图卷积网络对行人间的社会交互关系进行建模,这种方法缺少对行人隐藏状态关联性的考虑,容易产生行人间的冗余交互。针对这一问题,提出一种基于注意力机制和稀疏图卷积的行人轨迹预测模型(DASGCN),通过构建深度注意力机制,捕捉行人间运动隐藏状态的关联性,从而准确地提取行人运动状态特征。进一步提出自调节稀疏方法,减小冗余信息带来的运动轨迹偏差,解决行人密集无向交互的问题。将所提模型在ETH和UCY数据集上进行验证,其平均位移误差(ADE)和最终位移误差(FDE)分别达到0.36和0.63。实验结果表明,DASGCN对行人轨迹的预测能力要优于传统算法。
图像处理 深度注意力 图卷积神经网络 轨迹预测 稀疏交互 
激光与光电子学进展
2023, 60(10): 1010013
作者单位
摘要
1 上海大学材料基因组工程研究院, 上海 200444
2 之江实验室, 杭州 311100
热电材料是环境友好型能源转换材料, 涉及的体系十分多样。其性能优化是一个多参数协调的复杂问题, 一直是研究者们关注的热点。虽然热电的计算模拟方法和实验方法发展迅速, 但是热电材料的搜索效率仍需要进一步提高。机器学习具有计算成本低和预测速度高的优势, 可以快速缩小搜索空间, 加快对热电材料结构和性能优化的研究。本综述从数据类型的角度出发, 介绍了热电材料中的小样本数值数据(数据量约为102), 大样本数值数据(数据量大于104)及图片数据中机器学习的应用和研究进展, 进一步详细地讨论了在不同的数据类型中研究热电材料的结构和性能所使用的不同的机器学习算法模型, 并对其未来的发展趋势和应用方向进行了展望。
热电材料 机器学习 图卷积神经网络 thermoelectric materials machine learning graph convolutional neural networks 
硅酸盐学报
2023, 51(2): 499
作者单位
摘要
1 哈尔滨工业大学 光电子技术研究所可调谐(气体)激光技术重点实验室, 黑龙江哈尔滨5000
2 复杂系统控制与智能协同技术重点实验室,北京100074
GM-APD激光雷达具有单光子探测灵敏度,大幅降低了系统体积和功耗,但受像元数限制,难以获得远距离小目标清晰轮廓,目标检测率不高。针对该问题,提出了基于强度像和距离像多级处理的小目标深度学习检测算法,充分挖掘强度图像和点云特征信息及相互关联性,提高小目标检测概率。通过改进特征金字塔网络,将感受野模块和注意力机制模块与特征提取网络相结合,增强强度像初筛目标准确性,在候选区域内将强度像与距离像融合成带有强度信息的四维点云。然后,使用动态图卷积网络对候选区内目标进行二次检测,利用点云信息进一步筛选候选框内的目标。经GM-APD激光雷达远距离车辆数据集测试,网络的检测准确率达到98.8%,对于车辆结构不完整,车辆回波弱,背景存在强反射光斑等复杂场景有很好的鲁棒性。相较于SSD,YOLOv5等较为先进的目标检测网络,检测准确率分别提升了3.1%与2.5%,该算法为激光雷达弱小目标检测识别提供了一种可行性解决方案。
激光雷达 目标检测 感受野 注意力机制 动态图卷积神经网络 lidar object detection receptive field block convolutional block attention module dynamic graph convolution neural network 
光学 精密工程
2023, 31(3): 393
作者单位
摘要
1 上海理工大学 光电信息与计算机工程学院,上海 200093
2 上海宇航系统工程研究所,上海 201109
动作识别是计算机视觉领域的一项重要任务,主要有基于RGB视频和人体骨架两种数据模态的领域,主流方法分别是3D卷积神经网络和图卷积神经网络。针对视频和人体骨架两种数据模态的不同特点,设计了双分支网络分别对两种数据模态进行建模。对于人体骨架数据,基于自注意力机制设计了图卷积神经网络,该算法能在基于骨架的动作识别任务中达到先进的性能。对于视频数据,采用3D卷积网络进行特征提取。同时,利用深监督方法对两种数据模态的中间特征进行监督,提高两种数据特征的耦合度,进一步提高网络效率。这种算法的网络结构简单,在NTU-RGBD60(CS)数据集上仅用3.37×107的参数量可达到95.6%的精度。
基于人体骨架的动作识别 图卷积神经网络 自注意力机制 3D卷积神经网络 skeleton-based action recognition graph convolutional neural network self-attention mechanism 3D convolution neural network 
光学仪器
2022, 44(4): 16
林依林 1,2林珊玲 2,3林志贤 1,2,3,*
作者单位
摘要
1 福州大学 物理与信息工程学院,福建 福州 350116
2 中国福建光电信息科学与技术创新实验室,福建 福州 350116
3 福州大学 先进制造学院,福建 泉州 362200
针对手部的高自由度问题和结构相似问题引起的三维关键点姿态估计误差,本文提出了一套联合识别、检测以及姿态估计的三维手部骨架姿态回归网络。采用基于YOLOv3的预处理网络,提出基于级联多特征热度图的二维和三维关键点检测网络,并在特征提取网络架构中引入人体骨架手部约束,利用渐进的图卷积神经网络特征增强模块对骨架关键点结果进行进一步精细化修正,完成姿态由粗到细的调整。本文与现有多种算法在不同公共数据集下进行PCK指标和AUC指标比较,本文算法在不同测试集上的AUC指标均达到最高,平均AUC精度达到92.9%。实验表明本文方法可以通过单张二维数据准确、细致地估计三维手部姿态,并且在测试集与自然场景下均有较好表现。
三维姿态估计 目标检测 手势识别 特征增强 卷积神经网络 图卷积神经网络 3D pose estimation target detection gesture recognition feature enhancement convolutional neural network graph convolutional neural network 
液晶与显示
2022, 37(6): 736
作者单位
摘要
天津大学 微电子学院,天津 300072
针对激光雷达点云的稀疏性和空间离散分布的特点,通过结合体素划分和图表示方法设计了新的图卷积特征提取模块,提出一种基于体素化图卷积神经网络的激光雷达三维点云目标检测算法。该方法通过消除传统3D卷积神经网络的计算冗余性,不仅提升了网络的目标检测能力,并且提高了点云拓扑信息的分析能力。文中设计的方法在KITTI公开数据集的车辆、行人、骑行者的3D目标检测和鸟瞰图目标检测任务的检测性能相比基准网络均有了有效提升,尤其在车辆3D目标检测任务上最高提升了13.75%。实验表明:该方法采用图卷积特征提取模块有效提高了网络整体检测性能和数据拓扑关系的学习能力,为三维点云目标检测任务提供了新的方法。
图卷积神经网络 激光雷达 三维点云目标检测 拓扑信息 KITTI数据集 graph convolution neural network lidar 3D point cloud object detection topological information KITTI dataset 
红外与激光工程
2021, 50(10): 20200500
作者单位
摘要
长安大学信息工程学院, 陕西 西安 710064
点云分类和分割是三维场景理解中的关键步骤。针对稀疏点云输入和遮挡不能有效识别点云的问题,提出一种改进型分类和分割网络Linked-DGCNN。在动态图卷积网络(DGCNN)的基础上增加EdgeConv卷积层数以提取深层次点云特征;去除DGCNN的转换网络以简化网络结构;引入深度残差网络的思想连接不同网络层的输出特征,形成点云特征,同时使网络训练更加稳定。基于ModelNet40和ShapeNet Parts数据集将该网络与其他点云网络进行对比实验,实验结果表明,该网络在稀疏点云输入和遮挡情况下,相比其他方法有较高的点云分类和分割精度,由此说明该网络具有较强的鲁棒性。
机器视觉 深度学习 点云分类与分割 图卷积神经网络 深度残差网络 
激光与光电子学进展
2021, 58(12): 1215008
作者单位
摘要
华东理工大学 信息科学与工程学院,上海 200237
对场景中的物体进行深度估计是无人驾驶领域中的关键问题,红外图像有利于在光线不佳的情况下解决深度估计问题。针对红外图像纹理不清晰与边缘信息不丰富的特点,提出了将注意力机制与图卷积神经网络相结合来解决单目红外图像深度估计问题。首先,在深度估计问题中,图像中每个像素点的深度信息不仅与其周围像素点的深度信息相关,还需考虑更大范围的其他像素点的深度信息,采用注意力机制可以针对这一点有效提取图像的像素级全局深度信息关联。其次,基于深度信息关联得到的特征可以考虑为非欧数据,进一步使用图卷积神经网络(graph convolutional neural network, GCN)来进行推理。最后,在训练阶段将连续的深度估计回归问题转化成分类问题,使训练过程更稳定,降低了网络的学习难度。实验结果表明,该方法在红外数据集NUST-SR上获得了良好的效果,在阈值指标小于1.253时,准确率提升了1.2%,相较其他方法更具优势。
红外图像 深度估计 注意力机制 图卷积神经网络 infrared images depth estimation attention mechanism graph convolutional neural network 
应用光学
2021, 42(1): 49
作者单位
摘要
1 辽宁工程技术大学软件学院, 辽宁 葫芦岛 125105
2 中国科学院海西研究院泉州装备制造研究所, 福建 泉州 362200
大部分现有深度聚类方法都试图最小化重构损失,然而深层特征的判别能力与重构损失并没有必然联系,并且这些深度聚类方法通常只关注从样本自身提取的有用特征,很少考虑样本背后的结构信息。为解决这些问题,提出一种新的结构化深度判别嵌入编码网络聚类(SDDECC)算法,用于无监督图像聚类。首先在多层卷积自编码器网络中引入最大化互信息与最小化先验分布约束,然后使用传递算子将深度判别嵌入编码网络(DDECN)模块学习到的特征表示融入到图卷积神经网络(GCN)模块中,最后利用Kullback-Leibler(K-L)散度联合双网络结构产生的潜在特征分布端到端地完成聚类训练。实验结果表明,SDDECC算法能够有效提取更多有鉴别性的深层特征,并且由于在GCN中融合了样本的属性信息和结构信息,最终该模型取得了良好的聚类效果。
图像处理 深度聚类 图卷积神经网络 无监督学习 三元组互信息 
激光与光电子学进展
2021, 58(6): 0610016
作者单位
摘要
上海工程技术大学电子电气工程学院, 上海 201620
近年来,深度传感器和三维扫描仪的普及,使三维点云得到了快速发展。点云语义分割作为三维场景理解和分析的关键步骤,受到了研究者的广泛关注。深度学习具有优良的高层语义理解能力,基于深度学习的点云语义分割已成为当前研究的热点。首先,从语义分割的概念出发,简要叙述了点云语义分割的优势和现存的挑战;进而详细介绍了点云分割算法和常见的数据集,重点对点云语义分割领域中基于点排序、特征融合和图卷积神经网络的深度学习方法进行了综述;最后,分析了所述方法的定量结果,并展望了点云语义分割技术未来的发展趋势。
图像处理 三维点云 语义分割 深度学习 特征融合 图卷积神经网络 
激光与光电子学进展
2020, 57(4): 040002

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!