作者单位
摘要
烟台大学计算机与控制工程学院,山东 烟台 264000
现在大多数基于图卷积的点云语义分割方法忽略了边构建的重要性,不能充分地表示局部区域的特征。基于此,提出一种结合注意力机制的边增强的图卷积网络(AE-GCN)。首先,将邻居点特征加入边中,而不仅仅是中心点与邻居点的特征差异;其次,加入注意力机制保证点云的局部信息得到更充分的利用;最后,采用U-Shape的分割结构,确保网络更好适应点云的语义分割这一任务。在两个公开数据集Toronto_3D和S3DIS上的实验结果表明,与目前的大多数方法相比,AE-GCN取得了具有竞争力的结果:在Toronto_3D数据集的平均交并比为80.3%,总体准确度为97.1%;在S3DIS数据集的平均交并比为68.0%,总体准确度为87.2%。
三维图像处理 点云语义分割 注意力机制 边增强 图卷积 
激光与光电子学进展
2024, 61(8): 0837009
作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
现如今,短视频事件检测展现出广阔的应用前景。现有的事件检测研究普遍缺乏对关键帧重要性程度的考虑,且多是针对事件的显性语义进行学习,忽略了潜在语义及其相关性的学习在短视频事件检测中的作用。针对上述问题,提出了一种基于深度动态语义关联的短视频事件检测方法。首先,设计了帧重要性评估模块来获得具有区分度的帧重要性分数,其内嵌的变分自编码器和生成对抗网络联合结构可以最大程度地强化帧重要性信息;其次,设计了帧间自注意力增强模块,进一步协同帧间的重要性分数与其特征内在关联性的学习;最后,设计了动态图卷积下的隐藏属性关联学习模块来学习复杂事件的隐藏属性及事件之间的关联性,最终获得具有潜在语义信息感知的短视频检测系统并将其用于最终的短视频事件检测。在公开数据集和新构建数据集上进行了实验,实验结果表明了所提方法的有效性。
短视频 语义关联 特征表示 图卷积 
激光与光电子学进展
2024, 61(4): 0437002
作者单位
摘要
1 辽宁工程技术大学电子与信息工程学院,辽宁 葫芦岛 125100
2 沈阳理工大学自动化与电气工程学院,辽宁 沈阳 110159
点云 图卷积网络 多分辨率点云 特征融合模块 point cloud graph convolutional network multi-resolution point cloud feature fusion module 
光电工程
2023, 50(10): 230166
作者单位
摘要
1 哈尔滨工业大学 电气工程及自动化学院,黑龙江 哈尔滨 150001
2 山东科技大学 电气与自动化工程学院,山东 青岛 266590
在**空中目标识别领域,由于样本数量缺失,现有人工智能算法无法完成准确识别。文章利用已有足量辅助域图像辅助少样本应用域进行跨域目标识别,解决因标签缺失与样本稀疏导致的识别模型泛化能力不强及性能不佳问题。文章提出一种基于深层-浅层双流学习图模型(D-SLGM)的跨域目标识别算法。首先,提出一种深层-浅层双流特征提取算法,解决无监督少样本条件下特征表示困难的问题;同时,提出一种基于图模型的特征融合算法,实现特征间高精度融合;基于融合后的特征训练识别模型,提升算法的泛化能力。使用自建空中目标数据集,设计三种应用场景。实验结果表明,D-SLGM平均识别准确率均值达到78.2%,优于对比方法,在实际空中目标识别应用中具有较大潜力。
目标识别 无监督少样本学习 特征提取 特征融合 图卷积网络 object recognition unsupervised few-shot learning feature extraction feature fusion graph convolutional network 
红外与毫米波学报
2023, 42(6): 916
作者单位
摘要
华南理工大学土木与交通学院,广东 广州 510641
为了解决现有的深度学习点云分类方法对局部特征挖掘不充分的问题并提升不同层级特征融合的质量,提出一种基于图卷积和多层特征融合的点云分类方法。首先,构造K邻域图,在此基础上利用改进的边缘函数提取更细粒度的边特征,并使用基于注意力机制的聚合方法获取更具代表性的局部特征。然后,通过多层特征融合模块调整中间特征的通道权值,引入残差连接融合不同层级的特征,加深网络层之间的信息传递。在标准公开数据集ModelNet40上的实验结果表明,相比其他点云分类方法,所提方法的分类性能更好,总体分类精度为93.2%,并且具有较强的鲁棒性。
机器视觉 深度学习 点云分类 图卷积 多层特征融合 
激光与光电子学进展
2023, 60(14): 1415003
作者单位
摘要
昆明理工大学信息工程与自动化学院云南省计算机技术应用重点实验室,云南 昆明 650500
行人轨迹预测能够有效降低行人轨迹突变造成的碰撞风险,在智能交通及监控系统等领域有着广泛应用。目前已有的研究大多利用无向图卷积网络对行人间的社会交互关系进行建模,这种方法缺少对行人隐藏状态关联性的考虑,容易产生行人间的冗余交互。针对这一问题,提出一种基于注意力机制和稀疏图卷积的行人轨迹预测模型(DASGCN),通过构建深度注意力机制,捕捉行人间运动隐藏状态的关联性,从而准确地提取行人运动状态特征。进一步提出自调节稀疏方法,减小冗余信息带来的运动轨迹偏差,解决行人密集无向交互的问题。将所提模型在ETH和UCY数据集上进行验证,其平均位移误差(ADE)和最终位移误差(FDE)分别达到0.36和0.63。实验结果表明,DASGCN对行人轨迹的预测能力要优于传统算法。
图像处理 深度注意力 图卷积神经网络 轨迹预测 稀疏交互 
激光与光电子学进展
2023, 60(10): 1010013
杨涛 1,2,*韩军 1,2姜海燕 1,2
作者单位
摘要
1 上海大学通信与信息工程学院,上海 200444
2 上海先进通信与数据科学研究院,上海 200444
针对人体骨架行为识别中因时空特征提取不充分、网络计算量大和计算效率低导致相似行为识别结果不理想的问题,提出一种基于密集残差移位图卷积网络的骨架行为识别算法。使用姿态估计算法提取人体骨架信息,经坐标向量计算得到骨架的关节、骨骼以及各自的运动信息,并分别输入网络中。在移位图卷积模块间引入密集残差结构,提高网络性能和提取时空特征的效率。所提算法可应用于日常行为场景,例如:行走、坐下、站起、脱衣服、穿衣服、扔以及摔倒等。其在自制数据集上的识别准确率达到81.7%,在NTU60 RGB+D数据集两种评估标准下的准确率也分别达88.1%和95.3%,验证了算法具有优秀的识别精度。
图像处理 时空特征 图卷积 密集残差 日常行为 
激光与光电子学进展
2023, 60(10): 1010012
作者单位
摘要
1 上海大学材料基因组工程研究院, 上海 200444
2 之江实验室, 杭州 311100
热电材料是环境友好型能源转换材料, 涉及的体系十分多样。其性能优化是一个多参数协调的复杂问题, 一直是研究者们关注的热点。虽然热电的计算模拟方法和实验方法发展迅速, 但是热电材料的搜索效率仍需要进一步提高。机器学习具有计算成本低和预测速度高的优势, 可以快速缩小搜索空间, 加快对热电材料结构和性能优化的研究。本综述从数据类型的角度出发, 介绍了热电材料中的小样本数值数据(数据量约为102), 大样本数值数据(数据量大于104)及图片数据中机器学习的应用和研究进展, 进一步详细地讨论了在不同的数据类型中研究热电材料的结构和性能所使用的不同的机器学习算法模型, 并对其未来的发展趋势和应用方向进行了展望。
热电材料 机器学习 图卷积神经网络 thermoelectric materials machine learning graph convolutional neural networks 
硅酸盐学报
2023, 51(2): 499
作者单位
摘要
1 哈尔滨工业大学 光电子技术研究所可调谐(气体)激光技术重点实验室, 黑龙江哈尔滨5000
2 复杂系统控制与智能协同技术重点实验室,北京100074
GM-APD激光雷达具有单光子探测灵敏度,大幅降低了系统体积和功耗,但受像元数限制,难以获得远距离小目标清晰轮廓,目标检测率不高。针对该问题,提出了基于强度像和距离像多级处理的小目标深度学习检测算法,充分挖掘强度图像和点云特征信息及相互关联性,提高小目标检测概率。通过改进特征金字塔网络,将感受野模块和注意力机制模块与特征提取网络相结合,增强强度像初筛目标准确性,在候选区域内将强度像与距离像融合成带有强度信息的四维点云。然后,使用动态图卷积网络对候选区内目标进行二次检测,利用点云信息进一步筛选候选框内的目标。经GM-APD激光雷达远距离车辆数据集测试,网络的检测准确率达到98.8%,对于车辆结构不完整,车辆回波弱,背景存在强反射光斑等复杂场景有很好的鲁棒性。相较于SSD,YOLOv5等较为先进的目标检测网络,检测准确率分别提升了3.1%与2.5%,该算法为激光雷达弱小目标检测识别提供了一种可行性解决方案。
激光雷达 目标检测 感受野 注意力机制 动态图卷积神经网络 lidar object detection receptive field block convolutional block attention module dynamic graph convolution neural network 
光学 精密工程
2023, 31(3): 393
作者单位
摘要
1 重庆师范大学计算机与信息科学学院,重庆 401331
2 重庆师范大学重庆国家应用数学中心,重庆 401331
针对视网膜血管分割任务中存在的毛细血管分割遗漏和断连的问题,从最大限度地利用视网膜血管的特征信息的角度出发,添补视网膜血管的全局结构信息和边界信息,在U型网络的基础上,提出边界注意力辅助的动态图卷积视网膜血管分割网络。本模型先将动态图卷积嵌入到U型网络中形成多尺度结构,提升模型获取全局结构信息的能力,以提高分割质量,再利用边界注意力网络辅助模型,增加模型对边界信息的关注度,进一步提高分割性能。将模型在DRIVE、CHASEDB1和STARE三个视网膜图像数据集上进行实验,均取得了较好的分割效果。实验结果证明,该模型能较好地区分噪声和毛细血管,分割出结构较完整的视网膜血管,具有泛化性和鲁棒性。

医学图像处理 视网膜血管分割 U型网络 动态图卷积网络 边界注意力网络 medical image processing retinal vessels segmentation U-shaped network dynamic graph convolution network boundary attention network 
光电工程
2023, 50(1): 220116

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!