期刊基本信息
创刊:
1964年 • 半月刊
名称:
激光与光电子学进展
英文:
Laser & Optoelectronics Progress
主管单位:
中国科学院
主办单位:
中科院上海光机所
出版单位:
中国激光杂志社
主编:
范滇元
执行主编:
邱建荣
副主编:
戴琼海 张龙 张雨东 曹良才
ISSN:
1006-4125
刊号:
CN 31-1690/TN
电话:
021-69918427
邮箱:
地址:
上海市嘉定区清河路390号
邮编:
201800
定价:
120元/期

当前目录 第61卷 第8期

作者单位
摘要
北京航空航天大学医学科学与工程学院,北京 100191
扩散光学成像技术在生物医学领域有着广泛的应用。相较于磁共振成像(MRI)、计算机X射线断层扫描(CT)、正电子发射断层扫描(PET)和超声成像等成像方式,扩散光学成像利用经组织吸收和散射的扩散光进行成像,可无创、无标记、宽场、定量测量氧合血红蛋白、脱氧血红蛋白、血氧、水分、脂质、黑色素等成分浓度和组织功能信息,在安全性、特异性和系统成本等方面有明显优势。本文介绍了扩散光学成像的基本原理,包括光与组织的相互作用和光传播模型,并总结扩散光学成像的相关方法和应用,包括脉搏血氧术、漫射光谱、扩散光学层析成像、荧光分子层析成像和空间频域成像,并对它们的未来发展进行了展望。
扩散光学成像 组织光学 功能信息 生物医学光学 
激光与光电子学进展
2024, 61(8): 0800001
作者单位
摘要
山东中医药大学智能与信息工程学院,山东 济南 250355
甲状腺结节是成人临床最常见的结节性病变之一,发病率一直居高不下。甲状腺结节有良性和恶性之分,后者即为甲状腺癌,会造成患者呼吸吞吐困难甚至危及患者生命。因此,识别甲状腺结节的良恶性是诊断和治疗甲状腺结节的首要问题。深度学习能够自动提取结节特征,并完成甲状腺结节的良恶性初步分类。随着深度学习分类准确率的不断提高,目前它已成为甲状腺结节良恶性辅助诊断的重要手段。为更好地进行甲状腺结节良恶性分类辅助诊断研究,对常用的结节分类性能评价指标进行介绍;按卷积神经网络、Transformer、深度神经网络、生成对抗网络、迁移学习、集成学习以及基于深度学习的计算机辅助诊断系统进行分类,对它们在甲状腺结节良恶性分类中的应用进行阐述,并进行综合对比分析;总结了目前研究中存在的问题,并对未来的研究方向进行了展望。
甲状腺结节 良恶性分类 深度学习 图像处理 辅助诊断 
激光与光电子学进展
2024, 61(8): 0800002
作者单位
摘要
1 厦门烟草工业有限责任公司,福建 厦门 361022
2 同济大学机械与能源工程学院,上海 201804
烟草行业高端产品规模的扩大与消费者对产品质量需求的提高,给烟草在线检测技术带来了巨大挑战。针对烟草生产过程中烟丝异物难以剔除,影响卷烟口感、烟草叶片病情害种类繁多且病情复杂、卷烟外包装瑕疵难以识别等问题,传统人工在线检测方法效率低下,且正确率难以保证,无法适应我国烟草行业的高质量发展。在阐明基于机器视觉的烟草在线检测原理的基础上,围绕视觉检测原理和深度学习模型两个方面系统地阐述烟草在线检测技术的研究现状与最新进展,结合现有典型应用分析不同视觉模型以及深度学习模型检测方法的优越性和局限性,进而探讨基于机器视觉的烟草在线检测技术的发展趋势和前景。
机器视觉 图像识别 深度学习 在线检测 瑕疵剔除 
激光与光电子学进展
2024, 61(8): 0800003
作者单位
摘要
1 石家庄铁道大学信息科学与技术学院,河北 石家庄 050043
2 河北省电磁环境效应与信息处理重点实验室,河北 石家庄 050043
激光成像雷达是一种综合激光技术与雷达技术于一体的主动式光电成像设备,具有探测精度高、图像信息量丰富、抗干扰能力强等优点,在科学领域和商业领域等都有广阔的发展前景。为了满足人们日益增长的实际需求,不同成像体制的先进激光成像雷达技术应运而生。首先介绍先进体制激光成像技术的工作原理;然后开展不同体制下先进激光成像雷达的分类,阐述国内外不同分类方式下激光成像雷达技术的关键性能,分析不同激光成像雷达系统的优势与不足;最后总结激光成像雷达技术的未来发展趋势,可为先进激光成像雷达技术的发展提供一定的借鉴和参考。
激光雷达 成像体制 精度高 抗干扰 
激光与光电子学进展
2024, 61(8): 0800004
颜蒙 1,2黄启泰 1,2,*任建锋 1,2
作者单位
摘要
1 苏州大学光电科学与工程学院&苏州纳米科技协同创新中心,江苏 苏州 215006
2 江苏省先进光学制造技术重点实验室&教育部现代光学技术重点实验室,江苏 苏州 215006
在非球面零位干涉检测中,待测面检测误差分布与实际误差分布间存在干涉投影畸变。针对目前投影畸变校正方法计算复杂、通用性差等问题,提出一种基于卷积神经网络(CNN)的投影畸变校正方法。该方法首先在待测面上加入井字形柔性遮挡物,并根据投影畸变系数范围合成干涉图像作为CNN的数据集;然后选择合适的网络结构基于该数据集来训练网络;最后将实际干涉图像输入该网络以预测畸变系数,从而实现投影畸变的标定与校正。实验结果表明,该方法的理论校正误差小于1 pixel,实际误差校正精度优于传统标记点法,证明了该方法高效可行。
干涉检测 畸变校正 深度学习 卷积神经网络 系统标定 
激光与光电子学进展
2024, 61(8): 0805001
作者单位
摘要
1 昆明理工大学理学院,云南 昆明 650500
2 昆明理工大学云南省高校现代信息光学重点实验室,云南 昆明 650500
针对较大尺寸物体彩色全息图重建操作复杂、色彩融合不准确、重建时受零级影响等问题,提出一种基于深度学习的彩色全息图重建方法。采用改进的U-Net模型作为网络结构,使用混合实际拍摄和模拟生成的彩色离轴菲涅耳全息图频谱作为训练样本,实现对彩色全息图的准确重建。对模拟全息图和实际拍摄的数字全息图进行重建实验,结果表明,所提方法相较于传统方法,能够在保持重建图像高分辨率和颜色准确性的同时,具有更好的重建效果。研究结果可应用于大尺寸检测场彩色全息图的重建,为彩色全息检测及深度学习在光学成像领域中的应用提供有益的参考。
数字全息 深度学习 彩色全息重建 全息频谱 
激光与光电子学进展
2024, 61(8): 0809001
李春琦 1,2,3,4黄启泰 1,2,3,4,*任建锋 1,2,3,4
作者单位
摘要
1 苏州大学光电科学与工程学院,江苏 苏州 215006
2 苏州大学苏州纳米科技协同创新中心,江苏 苏州 215006
3 苏州大学江苏省先进光学制造技术重点实验室,江苏 苏州 215006
4 苏州大学教育部现代光学技术重点实验室,江苏 苏州 215006
利用计算全息图(CGH)能够实现对非球面面形的高精度检测。为了提高CGH的编码效率,提出一种以圆弧为基元对刻线条纹进行分段描述的编码方法,该方法将编码过程分为二值化编码和曲线描述两个步骤。二值化编码采用牛顿迭代法将相位等高分界线离散化;曲线描述结合二分法及残余误差均方根最小准则,利用圆弧对条纹离散点进行编码计算,从而得到刻线条纹。针对一离轴非球面,进行了CGH的设计、编码与制作,在编码精度优于λ/1000的前提下,运算时间仅需3 h,编码文件仅为39 MB,刻蚀时长仅需40 min,证明所提方法相对于传统编码方法能够大幅度提高编码效率,且误差分析表明CGH的波前root-sum square(RSS)误差仅为0.00255λ,证明所提编码方法高效可行。
计算全息图 编码计算 圆弧 刻线条纹 
激光与光电子学进展
2024, 61(8): 0809002
赵龙云 1,2伞红军 1,2,*陈久朋 1,2彭真 1,2
作者单位
摘要
1 昆明理工大学机电工程学院,云南 昆明 650500
2 云南省先进装备智能制造技术重点实验室,云南 昆明 650500
针对移动机器人在进行传统2D环境的定位时所存在的定位精度低且定位实时性差等问题,提出一种改进的迭代近邻点(ICP)算法的定位方法。首先,建立位姿搜索空间,采用由低到高的分辨率对搜索空间进行逐层搜索,并结合多点云密度进行部分点云扫描匹配,排除非最优位姿,加速搜索过程;在进行点云匹配中,采用帧对图的方式,有效地利用了历史帧信息;对得到的最优位姿进行稀疏矩阵位姿优化,进一步提高定位精度。在SLAM Benchmark数据集上进行测试,结果表明所提方法的算法效率是现流行的Cartographer算法的1.8倍到4.9倍之间,同时平移误差较小。并利用Turtlebot2机器人进行实际测试,结果表明所提方法的定位误差相比Cartographer和Gmapping均有明显的降低,且实时性较好;与传统的自适应蒙特卡罗重定位(AMCL)相比,平移误差均值降低了0.035 m,旋转误差均值降低了0.001 rad,具有较高的重定位精度。
激光雷达 移动机器人定位 多分辨率 迭代近邻点 多点云密度 
激光与光电子学进展
2024, 61(8): 0811001
作者单位
摘要
1 兰州交通大学光电技术与智能控制教育部重点实验室,甘肃 兰州 730070
2 轨道交通信息与控制国家级虚拟仿真实验教学中心,甘肃 兰州 730070
3 兰州交通大学电子与信息工程学院,甘肃 兰州 730070
针对增量运动恢复结构(SFM)算法在重建大规模无人机影像数据集时效率低、易产生场景漂移的问题,提出一种可并行化处理的增量SFM重建算法。首先,利用词汇树图像检索结果约束图像特征匹配的空间搜索范围,提高图像特征匹配的效率。其次,综合考虑特征匹配数量和无人机平台获取的全球定位系统(GPS)信息构建无向加权场景图,并选用归一化割算法将场景图划分为多个相互重叠的子集。然后,将每个子集分布在多核CPU上并行执行增量SFM重建算法。最后,基于子集间公共重建点和强相关子集优先被合并的策略实现子集合并。此外,结合GPS信息为光束法平差(BA)代价函数添加位置约束项,有效消除每次执行BA优化引入的误差。为了验证所提算法的有效性,在3个无人机数据集上进行实验,实验结果表明,所提算法相比原始增量SFM重建算法不仅显著提高了位姿估计和场景重建的效率,而且合理优化了重建结果的精度。
增量运动恢复结构 光束法平差 词汇树图像检索 归一化割 场景合并 
激光与光电子学进展
2024, 61(8): 0811002
作者单位
摘要
1 江苏科技大学理学院,江苏 镇江 212100
2 山东大学信息科学与工程学院,山东 青岛 266237
叠层成像的成像分辨率会受到数值孔径和电荷耦合器件(CCD)像素尺寸的限制。CCD靶面有限则数值孔径有限,采集大光斑图像时,易丢失CCD靶面边缘的部分高频信息。此外,像素尺寸较大会导致成像时采样率不足,也会丢失部分细节高频信息。提出了一种高分辨率叠层成像方法,可同时处理数值孔径和CCD像素尺寸的分辨率限制问题。首先,利用外推法补充因数值孔径有限丢失的高阶衍射信息,之后将外推法重建的图像代入基于多权重损失函数的生成对抗网络中,即可快速解决像素尺寸受限问题,提高成像分辨率。多权重损失函数为均方误差、特征图误差和对抗误差的加权和。通过设置合理的权重,可以实现像素和视觉层面的均衡处理。仿真及实验结果表明,该方法在提高叠层成像系统分辨率上具有显著效果,且运算效率高。
超分辨率 叠层成像 外推法 生成对抗网络 多权重损失函数 
激光与光电子学进展
2024, 61(8): 0811003
鲁斌 1,2刘亚伟 1,2,*张宇航 1,2杨振宇 1,2
作者单位
摘要
1 华北电力大学计算机系,河北 保定 071003
2 河北省能源电力知识计算重点实验室,河北 保定 071003
针对现有三维点云语义分割算法对点间密度信息以及空间位置特征利用不充分的问题,提出一种基于密度感知和自注意力机制的三维点云语义分割算法。首先,基于自适应K近邻(KNN)算法和局部密度位置编码构建密度感知卷积模块,从而有效地提取点间关键密度信息,加强初始输入特征的信息表达深度,提升算法捕获局部特征的能力。然后,构建空间特征自注意力模块,基于自注意力和空间注意力机制强化全局上下文信息和空间位置信息的关联性,对全局特征和局部特征进行有效聚合,从而提取更深层次的上下文特征,有效提升算法的分割性能。最后,在公开的S3DIS数据集和ScanNet数据集上进行了大量实验。实验结果表明,算法的平均交并比分别达到了69.11%和72.52%,与其他算法相比有明显提升,验证了所提算法有着良好的分割性能和泛化性能。
三维点云 语义分割 密度信息 注意力机制 密度位置编码 
激光与光电子学进展
2024, 61(8): 0811004
作者单位
摘要
湘潭大学自动化与电子信息学院,湖南 湘潭 411105
快速识别和精准定位周围目标是自动驾驶车辆安全、自主行驶的前提和基础。针对基于体素的点云三维目标检测方法识别与定位不准的问题,提出一种基于改进SECOND算法的点云三维目标检测算法。首先,在二维卷积骨干网络中引入自适应的空间特征融合模块融合不同尺度的空间特征,提高模型的特征表达能力。其次,充分利用边界框参数之间的关联性,采用three-dimensional distance-intersection over union(3D DIoU)损失作为边界框的定位回归损失函数,使得回归任务更加高效。最后,同时考虑候选框的分类置信度和定位精度,通过一个新的候选框质量评价标准,获得更平滑的回归结果。在KITTI测试集的实验结果表明,所提算法的3D检测精度优于许多以往的算法,与基准算法SECOND相比,在简单难度下的car类和cyclist类分别提高2.86百分点和3.84百分点,中等难度下分别提高2.99百分点和3.89百分点,困难难度下分别提高7.06百分点和4.27个百分点。
自动驾驶 三维目标检测 特征融合 损失函数 
激光与光电子学进展
2024, 61(8): 0811005
作者单位
摘要
东北石油大学电气信息工程学院,黑龙江 大庆 163318
基于圆形标定板的相机标定过程中,当镜头畸变较大时图像质量降低、圆形投影边缘模糊,导致标定产生误差。基于此,提出一种基于亚像素边缘检测和圆心修正补偿的高精度相机方法。首先,通过Canny-Zernike矩法提取亚像素级的圆形特征轮廓点,使用边缘点链连接独立轮廓点,得到闭环的精确特征轮廓,增强对模糊边缘轮廓的提取能力;其次,对内外轮廓分别采样取点拟合椭圆,将两者中心的均值作为特征点,并通过三点判断排序法得到有序特征点集后进行粗标定;最后,用粗标定参数对轮廓的采样点集进行校正,重新获取中心坐标后反投影回图像上进行相机精标定,实现畸变情况下的圆心修正补偿标定。实验结果表明,所提方法有效提高了镜头畸变较大时相机标定的精度。
相机标定 Canny-Zernike矩 边缘点链 圆心修正补偿 
激光与光电子学进展
2024, 61(8): 0811006
陈凯余 1,2,3,4,5李颖 1,2,3,4李政岱 1,2,3,4郭友明 1,2,3,4,*
作者单位
摘要
1 中国科学院自适应光学重点实验室,四川 成都 610209
2 中国科学院光电技术研究所,四川 成都 610209
3 中国科学院大学,北京 100049
4 中国科学院大学电子电气与通信工程学院,北京 100049
5 光场调控科学技术全国重点实验室,四川 成都 610209
无透镜成像系统使用掩模板替代镜头,在降低成本的同时使设备更加轻巧,然而在进行目标识别前需通过计算重建图像,涉及参数调优和计算耗时问题。基于此,提出一种无重建的目标识别方案,直接在无透镜相机拍摄的编码图像上训练网络识别目标,在节约计算资源的同时还提供隐私保护。使用具有相位掩模板和振幅掩模板的无透镜相机,仿真生成MNIST与Fashion MNIST数据集和实采MNIST数据集,然后在这些数据集上训练ResNet-50与Swin_T网络进行目标识别。结果表明,在仿真MNIST、Fashion MNIST和真实MNIST数据集上,所提方案的最高识别准确率达99.51%、92.31%和98.06%,与先重建目标后识别方案的准确率相当,证明所提方案是一种高效的、具有隐私保护的端到端方案,且在两种掩模板和两类常规骨干分类网络上得到了验证。
计算成像 目标识别 深度学习 无透镜成像 
激光与光电子学进展
2024, 61(8): 0811008
作者单位
摘要
63891部队光电对抗测试评估技术重点实验室,河南 洛阳 471000
超连续谱激光辐照可见光成像系统的干扰效应研究具有广泛的应用前景。针对超连续谱激光干扰效应,开展了不同辐亮度背景下超连续谱激光对可见光成像系统的干扰实验研究。采用白光光纤激光器产生超连续谱干扰源,搭建了超连续谱激光对可见光成像系统的干扰实验系统,得到不同辐亮度下探测器的干扰阈值数据,建立了探测器饱和像元数与干扰激光功率密度之间的数学关系模型,并对干扰阈值数据进行分析。结果表明,探测器饱和像元数与干扰激光功率密度近似呈线性对数关系,在低辐亮度背景下可见光成像系统更易受到干扰。实验结果对超连续谱激光干扰装备的设计、论证及作战使用具有一定的参考意义。
超连续谱激光 成像系统 干扰 不同辐亮度背景 饱和像元个数 
激光与光电子学进展
2024, 61(8): 0811009
作者单位
摘要
1 桂林电子科技大学电子工程与自动化学院,广西 桂林 541004
2 桂林电子科技大学信息与通信学院,广西 桂林 541004
短磁聚焦脉冲展宽分幅相机是一种具有长漂移区的二维超快诊断设备。通常采用轴上和离轴的点空间分辨率对其近轴空间分辨能力和工作面积进行评估,但由于像场弯曲会引起高斯像面的空间分辨不均匀,因此难以评价相机的整体空间分辨能力,所以研究一种能量化空间分辨能力的方法具有重要意义。为探讨新方法,采用COMSOL软件建立模型,基于场曲特性重建三维成像曲面,采用标准差分析成像曲面与高斯像面之间的偏离程度,通过融合点空间分辨率和整体调制度构建高斯像面空间分辨率,并运用相对误差量化高斯像面空间分辨均匀性。研究结果显示,在组合磁透镜的孔距为200 mm、漏磁缝隙为10 mm、轴向宽度为100 mm、漂移区长度为400 mm、成像半径为21 mm、阴极为-3.75 kV的情况下,随着成像磁场变化,成像曲面与高斯像面之间的偏离程度,以及高斯像面空间分辨率均呈开口向上的抛物线形状,并在成像磁场为41.97 Gs(1 Gs=10-4 T)时,两像面偏离程度标准差达到最小,为2.82 mm,高斯像面空间分辨率提升至最优,为292.80 μm,表征空间均匀性的调制度差值降低至最小,为330%。本文研究为评估短磁聚焦脉冲展宽分幅相机的最优空间分辨性能提供了一种可量化的参考方法。
超快诊断技术 脉冲展宽分幅相机 短磁聚焦 高斯像面 空间分辨能力 
激光与光电子学进展
2024, 61(8): 0811010
李文杰 1谷洪刚 1,2,*刘力 1钟磊 1[ ... ]刘世元 1,2,**
作者单位
摘要
1 华中科技大学智能制造装备与技术全国重点实验室,湖北 武汉 430074
2 光谷实验室,湖北 武汉 430074
衍射场作为叠层衍射成像技术(ptychography)的重要约束,其信息的丰富度和准确性将直接影响重构质量。提出一种基于极大似然噪声估计的高动态范围(ML-HDR)叠层衍射成像方法,即在探测器线性响应假设下,构建复合高斯噪声模型,根据极大似然估计求解最优权重函数,由多张低动态范围衍射场合成高信噪比衍射场。对比了单次曝光、传统HDR和ML-HDR三种方法的重构质量。仿真和实验结果表明:相比单次曝光,ML-HDR能将动态范围拓宽8位,重构分辨率提升至2.83倍;相比传统HDR,ML-HDR能提高重构图像的均匀性和对比度,且无需额外标定硬件参数。
计算成像 叠层衍射成像术 高动态范围 相位恢复 极大似然估计 
激光与光电子学进展
2024, 61(8): 0811011
作者单位
摘要
长安大学工程机械学院,陕西 西安 710000
裂缝是路面最主要的病害之一,及时、有效地检测和评估裂缝对路面养护至关重要。为实现路面裂缝图像快速、准确的语义分割,提出一种基于DeepLabv3+模型的路面裂缝检测方法。为减小模型参数量、提高推理速度,采用MobileNetv3作为模型的主干特征提取网络,且在空洞空间金字塔池化模块中使用Ghost卷积代替普通卷积,使模型更加轻量化。为避免替换主干网络降低模型精度:首先,在空洞空间金字塔池化模块中使用条形池化模块代替全局平均池化,有效捕获裂缝结构的上下文信息,避免无关区域噪声的干扰;其次,引入轻量级通道注意力机制efficient channel attention(ECA)模块,增强特征的表达能力,并设计浅层特征融合结构丰富图像的细节信息,优化模型对裂缝的识别效果;最后,构造混合损失函数解决裂缝数据集类别不平衡而导致检测精度较低的问题,利用迁移学习的训练方式提高模型的泛化能力。实验结果表明:所提路面裂缝检测模型参数仅为14.53 MB,比原模型参数量减少93.04%,平均帧率达到47.18,满足实时检测的要求;在精度方面,该模型裂缝检测结果的交并比和F1值分别为57.21%和72.76%,优于经典的DeepLabv3+、PSPNet、U-Net模型和先进的FPBHN、ACNet等模型。所提方法可大幅减小模型参数量,在保证路面裂缝检测精度的同时满足实时性,为基于语义分割的路面裂缝在线检测奠定基础。
图像处理 路面裂缝检测 语义分割 DeepLabv3+ 轻量化 检测精度 
激光与光电子学进展
2024, 61(8): 0812001
王慧 1王军 1,2,*曹召良 1,2
作者单位
摘要
1 苏州科技大学物理科学与技术学院,江苏 苏州 215009
2 中国科学院长春光学精密机械与物理研究所应用光学国家重点实验室,吉林 长春 130033
针对传统水接触角测量过程需要人工干预,导致测量结果精度低、可复现性差等问题,提出一种基于改进Faster RCNN的水接触角测量方法。首先,把Faster RCNN骨干网络VGG16替换为ResNet101,在其残差块末尾处添加注意力机制模型convolutional block attention module(CBAM),增强网络提取特征的能力;其次,融入特征金字塔网络(FPN),充分提取不同尺度下的特征信息,此外,引入Focal损失函数来解决正负类样本不均衡的问题;最后,对定位到的水滴进行边缘检测和角点提取,再利用迭代重加权最小二乘法(IRLS)拟合椭圆轮廓计算水接触角。实验结果表明,改进后的Faster RCNN目标检测算法与原算法相比,平均精度均值提高10.794%,速度提升11 frame/s,水接触角测量结果平均标准偏差为0.109°。
图像处理 水接触角 特征金字塔网络 注意力机制 Faster RCNN 
激光与光电子学进展
2024, 61(8): 0812002
作者单位
摘要
1 西华大学电气与电子信息学院,四川 成都 610036
2 民航成都电子技术有限责任公司,四川 成都 610041
3 成都川哈工机器人及智能装备产业技术研究院有限公司,四川 成都 610041
4 成都文物考古研究院文物考古工作队,四川 成都 610031
针对古青铜器年代鉴别任务需要大量的相关史料、鉴别耗时长以及主观性强等问题,提出一种新思路用于辅助考古专家对古青铜器进行分析和年代鉴别。所提方法在图像分类预训练权重的基础上应用深度学习方法对古青铜器进行年代鉴别:首先,通过大量的基础实验,在较为有代表性的4种网络模型中选出鉴别结果较好的EfficientNetV2-L作为基线模型;接下来,使用EfficientNetV2-L对古青铜器数据集进行特征提取;然后,将原有的线性分类层替换为cosin_classifier,减小方差带来的风险,提高模型鉴别能力;最后,引入Focal损失函数替换原有的交叉熵损失函数进行损失计算,在聚焦因子(focusing parameter)和加权因子(class weighting)作用下有效地改善样本数量较少类别所导致的模型学习效果较差的问题。所提方法较原始EfficientNetV2-L在准确率、精确率、召回率、F1分数和曲线下面积等指标上提高4.1百分点、4.0百分点、4.1百分点、4.2百分点和0.9百分点,在测试集上取得91.7%的最优准确率。在此基础上,还对分期有争议的青铜器进行了模型预测分析。结果表明,深度学习技术在古青铜器数据集年代鉴别任务上是有效的,可提供参考分析数据,减轻考古专家的工作强度。
图像处理 深度学习 青铜器 EfficientNetV2 年代鉴别 
激光与光电子学进展
2024, 61(8): 0812003
作者单位
摘要
1 广西大学计算机与电子信息学院,广西 南宁 530004
2 广西大学机械工程学院,广西 南宁 530004
为了实时检测乘客的异常行为,提出一种基于YOLOv5s算法的轻量化自动扶梯乘客异常行为实时检测算法YOLO-STE。首先在主干网络中引入轻量化ShuffleNetV2网络,以减少主干网络的参数量和计算量;其次在骨干网络的最后一层引入基于Transformer编码的C3TR模块,以更好地提取丰富的全局信息和融合不同尺度的特征;最后在YOLOv5s的特征融合网络中嵌入SE(Squeeze-and-excitation)注意力机制,以更好地关注主要信息,从而提高模型精度。自建数据集并进行实验,实验结果表明,相比于原YOLOv5s,改进算法的全类平均精度值(mAP)高出1.9百分点,达到了96.1%,模型大小减少了70.8%。并且在Jetson Nano硬件上部署测试所得,改进后的算法前传耗时比原YOLOv5s模型缩短了39.9%。通过对比改进前后的算法,后者能更好地实现对自动扶梯乘客异常行为的实时检测,从而可以更好地保障乘客乘梯安全。
目标检测 轻量化 YOLOv5s ShuffleNetV2 C3TR模块 注意力机制 
激光与光电子学进展
2024, 61(8): 0812004
作者单位
摘要
武汉工程大学机电工程学院,湖北 武汉 430205
针对现有激光软钎焊流水线上焊点缺陷检测设备成本高和传统算法检测速度慢的问题,提出了一种能部署在激光软钎焊设备上的改进YOLOv5s焊点缺陷检测算法。通过引入GhostNetV2卷积方式对骨干网络进行轻量化改进,减少了原网络模型的参数量,提高了网络模型的检测速度;同时引入全维动态卷积模块,提升了网络模型的特征提取能力,提高了网络模型的检测精度。实验结果表明:对YOLOv5s模型进行改进后,其网络参数量较原模型下降了23.89%;模型在自制的激光软钎焊焊点缺陷数据集和验证集上的均值平均精度达到了95.0%,相比原模型提高了1个百分点;实验平台上检测速度较原模型提高了12.62 frame/s。最后,在激光软钎焊设备上部署了所提算法,设备基本能够检测出相应的焊点缺陷,并且运行速度达到42.2 frame/s,基本达到了激光软钎焊实时焊点缺陷检测的应用需求。
YOLOv5s 激光软钎焊焊点缺陷检测 深度学习 轻量化 全维动态卷积 
激光与光电子学进展
2024, 61(8): 0812005
顾清华 1,2李佳威 1,2,*陈露 1,2祝河杰 1,2
作者单位
摘要
1 西安建筑科技大学资源工程学院,陕西 西安 710055
2 西安建筑科技大学西安市智慧工业感知、计算与决策重点实验室,陕西 西安 710055
针对露天矿无人矿卡运输作业中路况差、光照强和灰尘大等原因导致小尺寸落石检测困难和实时性差的问题,提出一种使用固态激光雷达检测露天矿非结构化运输道路小尺寸落石的方法。首先使用具有双回波技术的激光雷达进行数据采集,减少灰尘干扰并提取车辆前方可行驶区域;然后采用基于扇面的直线拟合地面分割算法分割地面,实现对有坡度的非结构化粗糙路面的彻底分割;之后引入八叉树的分层网格树模型进行邻域查找,提高邻域查找的速度,引入双色最近对构建图,快速生成聚类簇,引入自适应聚类半径ε,进行聚类并输出小尺寸落石的盒模型。实验结果表明:相较于使用k-d树加速的DBSCAN算法,所提方法的正检率提升9.61个百分点,检测时间缩短379.77 ms。
露天矿 无人驾驶 障碍物检测 激光雷达点云 密度聚类 
激光与光电子学进展
2024, 61(8): 0812006
作者单位
摘要
东北石油大学计算机与信息技术学院,黑龙江 大庆 163318
针对目前基于点云的三维目标检测算法中小目标检测效果差的问题,提出了基于改进PointPillars模型的三维目标检测方法。首先,改进了PointPillars模型中的pillar特征网络,提出了一个新的pillar编码模块,在编码网络中引入了平均池化和注意力池化,充分考虑了每个pillar模块的局部详细几何信息,提高了每个pillar模块的特征表示能力,从而提升了模型的小目标检测性能。其次,基于ConvNeXt改进了骨干网络中的二维卷积下采样模块,使模型在网络特征提取阶段能够提取丰富的上下文语义信息和全局特征,从而增强了算法的特征提取能力。在公开数据集KITTI上进行验证,实验结果表明,所提方法具有更高的检测精度,相较于原网络,改进后的算法的平均检测精度提升了3.63个百分点,证明了该方法的有效性。
三维目标检测 PointPillars 小目标检测 注意力池化 ConvNeXt 
激光与光电子学进展
2024, 61(8): 0812007
作者单位
摘要
1 河北工业大学人工智能与数据科学学院,天津 300130
2 河北省控制工程技术研究中心,天津 300130
针对光伏(PV)电池缺陷检测中存在的数据不均衡、缺陷尺度不一和背景纹理复杂多变等因素导致的误检、漏检问题,提出一种基于YOLOv8的缺陷检测算法YOLOv8-EL。首先,使用GauGAN进行数据增强,处理数据集的类内和类间不均衡的问题,提高模型泛化能力,降低模型过拟合的风险;其次,在主干网络和特征融合网络之间嵌入上下文聚合模块,自适应地融合不同层次的语义信息,对齐局部特征,减少微小微弱缺陷信息的丢失,抑制无关背景信息的干扰;最后,构建多注意力检测头以替换解耦头,引入不同的注意力机制细化分类和定位任务,提取空间和通道层面上的关键信息,减少特征混淆。实验结果表明,该模型在扩充后的PV电池EL数据集上的平均精度达到89.90%,模型参数量为13.13×106,在提升精度的基础上兼顾了后续部署时轻量化的要求。在PASCAL VOC数据集上进行泛化性实验,证明了改进算法的泛化性能。
缺陷检测 YOLOv8 生成对抗网络 特征融合 注意力机制 解耦头 
激光与光电子学进展
2024, 61(8): 0812008
作者单位
摘要
南京邮电大学地理与生物信息学院,江苏 南京 210023
针对传统变形监测中整体变形模型无法有效提供监测对象局部独特详细变形信息的不足,基于地面三维激光扫描技术提出一种包含元变形、子变形、变形图的三层混合变形模型,并设计了一种基于单元的变形计算方法。该方法主要包括单元分割、变形估计、变形融合等3方面内容,可以实现无先验监测信息条件下,自动增量地提取不同尺度的变形信息。模拟实验结果表明,在该方法下,RANSAC算法的平面拟合回归估计角度变化误差均值为1.21″,估计可靠性在一定范围内随单元大小增大而提高;滑坡实验结果表明,最小值法位移估计结果噪声更少,0.2 m单元大小分割可以提供更多的变形估计细节。所提方法尤其适用于具有非均匀变形特性的监测领域,对推动滑坡等人员难以到达的灾害监测从“点监测”向“面监测”的转变具有一定的理论与实际意义。
测量 激光扫描 变形监测 混合模型 三维分割 变形估计 
激光与光电子学进展
2024, 61(8): 0812009
作者单位
摘要
天津大学精密仪器与光电子工程学院光电信息技术教育部重点实验室,天津 300072
图像匹配能将待匹配图像变换到原有图像的坐标系中,在各种视觉任务中起着重要的作用。基于特征的图像匹配算法能够在图像中匹配到一些更具区分度的特征,与其他图像匹配方法相比,其具有高精度、高灵活性、高鲁棒性等特点。针对传统特征匹配算法匹配稀疏的问题,提出一种基于改进深度特征匹配算法的密集特征匹配方法。首先,通过VGG网络提取图像的一系列特征图,在初始特征图进行最邻近匹配计算单应性矩阵并进行视角变换;然后,基于特征图的频域匹配特点进行深层特征图融合,用于特征粗匹配;最后,基于粗匹配的结果在浅层特征图上进行特征细匹配用于校正特征匹配的结果。实验结果表明:所提算法提升了特征匹配的精度和匹配的特征数量。
机器视觉 卷积神经网络 特征融合 图像匹配 图像处理 
激光与光电子学进展
2024, 61(8): 0815001
夏倩 1汤浩 1葛玮 1付丽疆 1[ ... ]郭亚 1,*
作者单位
摘要
1 江南大学物联网工程学院轻工过程先进控制教育部重点实验室,江苏 无锡 214122
2 绿视芯科技(无锡)有限公司,江苏 无锡 214000
叶绿素荧光检测技术作为一种无损检测技术应用十分广泛。传统叶绿素荧光检测技术激发信号时使用的阶跃或调制脉冲(PAM)频带窄,而光合系统是一个高阶的宽带系统,难以激发出光合系统所有的动态特性,使叶绿素荧光信号含有的信息丰富度受限。目前市面上的叶绿素荧光仪均不具备宽带激励功能,限制了新兴的人工智能算法能够处理复杂信号、挖掘丰富信息的能力。针对该问题,基于伪随机二进制序列(PRBS)信号,设计开发了一套具有宽带激励功能的叶绿素荧光仪。该仪器同时能测量传统的叶绿素荧光诱导动力学曲线(OJIP)与PAM曲线,对5种不同植物在3种激发光下的叶绿素荧光的信息熵进行对比,结果表明,PRBS激发的叶绿素荧光具有最高的信息熵。该仪器能够提供信息更丰富的叶绿素荧光信号,有望为植物生理及环境胁迫检测提供新型的科学仪器。
叶绿素荧光 宽带激励 叶绿素荧光仪 信息熵 
激光与光电子学进展
2024, 61(8): 0815002
刘国华 1,2,*闫克丁 2,**邢静 1马国军 2[ ... ]陈艳丽 2
作者单位
摘要
1 西安培华学院智能科学与信息工程学院,陕西 西安 710025
2 西安工业大学电子信息工程学院,陕西 西安 710021
目前,病理专家通过肉眼识别显微镜视场下乳腺癌病理切片图像中的乳腺癌细胞具有很强的主观性。因此,设计了一款基于显微图像的乳腺癌细胞识别系统,该系统包括显微图像采集模块和乳腺癌细胞识别算法实现模块。通过USAF 1951分辨率测试板验证设计的乳腺癌细胞识别系统显微图像采集模块,最终的成像分辨率可以达到2.19 μm。通过多组乳腺癌病理图像验证所提乳腺癌细胞识别算法,结果表明设计的乳腺癌细胞识别系统识别乳腺癌细胞的平均准确率达到93.4%。
乳腺癌 图像采集 显微图像 细胞识别 
激光与光电子学进展
2024, 61(8): 0817001
作者单位
摘要
1 长安大学地质工程与测绘学院,陕西 西安 710054
2 中国自然资源航空物探遥感中心,北京 100083
3 武汉大学测绘遥感信息工程国家重点实验室,湖北 武汉 430079
目前主流的神经网络在面对复杂多样的地物目标时难以精确区分,同时样本数量少、弱监督条件也容易为神经网络带来大量噪声与错误。为此,在分析遥感影像的地物特点后,提出一种基于权重动态变形的双重网络遥感影像分类方法,通过构架灵活、简易却有效的权重动态变形结构,构建经过改进的分类网络与目标识别网络,形成双网络对照的自我验证,从而提高学习性能、修复误差、增补遗漏、提高分类精度。实验结果表明,所提方法在容易实施的基础上,表现出更强的地物认知能力和更强的噪声抵抗能力,即其能够适应各种遥感影像的分类任务,具有较为广阔的应用潜力。
遥感影像分类 神经网络 权重动态变形 双重神经网络 自我验证 
激光与光电子学进展
2024, 61(8): 0828001
作者单位
摘要
昆明理工大学国土资源工程学院,云南 昆明 650093
提出了一种基于粒子群优化的融合方法,旨在解决图像融合过程中可能出现的光谱信息和空间细节信息损失、融合图像不清晰等问题。首先对原始图像进行预处理,以获取图像各通道的边缘检测矩阵;其次,利用最小二乘法计算光谱覆盖系数,以获取细节图像;最后自适应注入模型框架,引入加权矩阵,利用粒子群优化算法和综合全局相对误差(ERGAS)指数函数优化边缘检测的权重,计算数据集波段权重,生成最终的融合图像。选取了不同分辨率的遥感卫星影像(WorldView-2、GF-2和GeoEye)进行了研究,并采用5种不同融合方法进行对比实验,选用6种评价指标进行定量分析。结果表明,所提方法在主观视觉效果以及平均梯度和空间频率等客观定量评价指标上表现优于其余方法,在保留光谱和空间信息方面也取得了较好的融合效果。
图像融合 多光谱与全色图像 最小二乘法 粒子群优化 边缘检测权重 
激光与光电子学进展
2024, 61(8): 0828002
作者单位
摘要
1 河海大学地球科学与工程学院,江苏 南京 211000
2 江苏省测绘工程院,江苏 南京 211000
针对传统语义分割网络变化检测结果易受阴影及其他地物干扰、建筑物边界分割较为粗糙的问题,提出一种轻量级双侧输入的变化检测网络D-WNet。新网络从W-Net出发,采用深度可分离卷积块和空洞空间金字塔池化模块代替原本繁琐的卷积和下采样过程,利用右侧线特征编码器加强高低维特征的融合,同时在解码器上采样部分引入通道和时空注意力机制获取网络在不同维度下的有效特征,得到的D-WNet在性能方面有明显提升。在公开的WHU和LEVIR-CD建筑物变化检测数据集上进行实验,并与W-Net、U-Net、ResNet、SENet和DeepLabv3+语义分割网络进行对比。实验结果表明,D-WNet在交并比、F1值、召回率、准确率和运行时间等5项指标中综合表现优异,对阴影干扰及建筑物边缘区域具有更精确的变化检测结果。
航空遥感 建筑物变化检测 D-WNet 双侧输入 轻量级网络 
激光与光电子学进展
2024, 61(8): 0828003
张普 1,2,3,4刘金清 1,2,3,*肖金超 4熊俊峰 4[ ... ]王忠泽 4
作者单位
摘要
1 福建师范大学医学光电科学与技术教育部重点实验室,福建 福州 350007
2 福建省光子技术重点实验室,福建 福州 350007
3 福建省光电传感应用工程技术研究中心,福建 福州 350007
4 广州工业智能研究院,广东 广州 511458
环境感知是无人驾驶的关键技术,针对相机缺乏深度信息无法定位检测目标以及目标跟踪精度较差的问题,提出一种基于相机与激光雷达融合的目标定位与跟踪算法。该算法通过图像检测框内的激光雷达点云簇在像素平面的面积比例大小获得检测目标的定位信息,然后根据检测目标的轮廓点云在像素坐标系下的横向移动速度和纵向移动速度融合图像检测框中心坐标提高目标跟踪精度。实验结果表明:所提目标定位算法正确率为88.5417%,且平均每帧处理时间仅为0.03 s,满足实时性要求;图像检测框中心横坐标的平均误差为4.49 pixel,纵坐标的平均误差为1.80 pixel,平均区域重叠率为87.42%。
传感器融合 机器视觉 3D激光雷达 目标定位 目标跟踪 
激光与光电子学进展
2024, 61(8): 0828004
作者单位
摘要
南京航空航天大学能源与动力学院,江苏 南京 210016
以中高层大气背景的红外辐射特性和红外成像为研究目的,建立中高层大气背景探测模型和红外成像模型,分析中光谱分辨率大气辐射传输模式(MODTRAN)在红外波段的适用范围,利用战略高空辐亮度代码(SHARC)仿真分析3~5 μm波段不同观测参数下的中高层大气背景红外辐射特性,并建立相关辐射特性数据库,完成中高层大气背景红外辐射场景成像仿真。结果表明:3~5 μm和8~12 μm波段MODTRAN分别在切点高度50 km和70 km以下具有较好的计算精度;中高层大气背景辐亮度随着切点高度和太阳天顶角的增大而减小,随着观测天顶角的增大而增大;短路径和长路径的辐射特性分别由路径长度和处于低层大气的路径大气参数占主导影响;白天和夜晚的辐亮度分别在36 km和34 km为最大值,在75 km和85 km处为极大值。研究结果可为中高层大气背景红外探测提供理论支持。
中高层大气 红外辐射 临边背景 红外成像 数据库 
激光与光电子学进展
2024, 61(8): 0828005
作者单位
摘要
1 中国科学技术大学生物医学工程学院(苏州)生命科学与医学部,安徽 合肥 230026
2 中国科学院苏州生物医学工程技术研究所康复工程技术研究室,江苏 苏州 215163
针对传统2D激光雷达建图存在空间环境信息获取不完全的问题,提出一种基于Gmapping算法融合固态激光雷达和2D激光雷达的建图策略。首先,对固态激光雷达点云数据进行平面投影,利用生成的激光数据结合Gmapping算法中最优粒子轨迹建立栅格地图后,再与最优粒子携带的栅格地图融合生成的融合地图,实现对空间障碍物的识别。其次,为提升建图精度,使用扩展卡尔曼滤波(EKF)对轮式里程计(WO)、激光里程计(LO)和惯性测量单元(IMU)进行动态权重融合,解决因车轮打滑或激光里程计在低特征环境下特征匹配失败等因素造成的融合里程计精度下降问题。最后,对融合地图和融合里程计算法进行测试实验。实验结果表明,融合地图可以正确识别空间障碍物,融合里程计在平均定位精度上相较于传统方法提升17.0%。
激光雷达 固态激光雷达 扩展卡尔曼滤波 激光里程计 动态融合 
激光与光电子学进展
2024, 61(8): 0828006
杨宁 1,2,3苏海冰 1,2,3,4,*张涛 1,2,4
作者单位
摘要
1 中国科学院光电技术研究所,四川 成都 610209
2 中国科学院光场调控科学技术全国重点实验室,四川 成都 610209
3 中国科学院大学电子电气与通信工程学院,北京 100049
4 中国科学院大学光电学院,北京 100049
针对水下图像因成像环境造成的色彩失真、对比度下降、模糊等问题,提出一种自适应水下图像增强算法。首先,基于Lab色彩空间的局部色偏和全局色偏对衰减颜色进行色彩补偿,再利用灰度世界算法恢复水下图像的色彩平衡。其次,使用自动色阶和伽马校正方法调整各通道信息,以获得高动态范围、高照度的图像。最后,通过反锐化掩膜方法获得高频信息并增强图像细节,从而获得清晰的水下图像。所提算法利用图像的色偏、均方差等统计信息,实现了自适应处理。实验结果表明,所提算法能有效去除水下图像色偏,提高图像对比度与清晰度,提升视觉效果。较之其他算法,其在处理效果及时间上均有优势。
图像处理 水下图像增强 色彩校正 对比度提升 细节增强 
激光与光电子学进展
2024, 61(8): 0837001
作者单位
摘要
北京联合大学智慧城市学院,北京 100101
针对肺结节计算机断层(CT)图像具有的细节多样性以及类间相似性的问题,构建了一种集卷积神经网络(Convolutional neural network,CNN)和Transformer优势的双路径交叉融合网络对肺结节进行更精确的分类。首先,以窗口多头自注意力和滑动窗口多头自注意力为基础,构建全局特征块,用于捕获结节的形态特征;以大核注意力为基础构建局部特征块,用于提取结节的纹理、密度等内部特征。其次,设计特征融合块用于融合上一阶段的局部与全局特征,使每一条路径都能获得更综合的判别信息。然后,引入KL(Kullback-leibler)散度来增加不同尺度特征之间的分布差异性,优化网络性能。最后,采用决策层融合的方法获得分类结果。在LIDC-IDRI数据集上进行实验,网络的分类准确率、召回率、精确率、特异性、受试者操作特征(ROC)曲线下的面积(Area under curve,AUC)分别为94.16%、93.93%、93.03%、92.54%、97.02%。实验结果表明,所提方法具有较好的肺结节良恶性分类能力。
肺结节良恶性分类 CT图像 局部-全局特征 Transformer 注意力机制 
激光与光电子学进展
2024, 61(8): 0837002
作者单位
摘要
上海海洋大学信息学院,上海 201306
设计了一种多阶段水下图像增强模型,可以同时将空间精细纹理和高级上下文信息两种特征融合。模型由三个阶段组成,前两个阶段采用编码器-解码器结构,第三阶段则采用并行注意子网,所提模型可以同时学习空间细节和上下文信息两种特征,并且引入了监督注意力模块,能够加强特征学习,还设计了一个跨阶段特征融合机制用来巩固前后子网的中间特征。最后将所提模型与其他水下增强模型在同一测试集上运行,从运行结果得出,所提模型处理后的水下图像在主观视觉效果和客观评价质量上均优于大部分对比算法,在Test-1测试集上,峰值信噪比和结构相似度分别达到了26.2962 dB和0.8267。
图像处理 水下图像增强 多阶段 空间细节 监督注意力 
激光与光电子学进展
2024, 61(8): 0837003
作者单位
摘要
江西理工大学能源与机械工程学院,江西 南昌 330013
针对指针式仪表的小目标图像分割特点以及现有方法存在的局限性,提出融合空间细节与语义特征的双边路深度学习主干网络BiUnet,用于指针式仪表图像分割。该网络以BiSeNet V2算法作为出发点,重新设计其语义支路、细节支路以及双边融合层。首先,利用ConvNeXt卷积模块对细节支路进行调整和优化,提升算法对指针及刻度线边界细节的特征提取能力;其次,结合编码器-解码器U型结构能够融合不同尺度语义信息的优势对语义支路进行重新设计,提高语义支路对指针和刻度这类小目标的分割能力;最后,提出双引导拼接聚合层,用于更好地融合细节支路和语义支路特征。在自制仪表图像分割数据集上的消融实验证实了所提出的网络设计方案的有效性和可行性。在仪表数据集上与不同主干网络进行对比实验,实验结果表明,BiUnet对仪表的平均分割精度mIoU(mean intersection of union)达到了88.66%,相比于BiSeNet V2网络的80.02%提升8.64个百分点,并且这两种网络的分割精度均优于基于Transformer和纯卷积的常见主干网络。
指针式仪表 双边路主干网络 深度学习 图像分割 
激光与光电子学进展
2024, 61(8): 0837004
作者单位
摘要
1 鲁东大学信息与电气工程学院,山东 烟台 264025
2 烟台理工学院信息工程学院,山东 烟台 264003
3 山东大学软件学院,山东 济南 250014
图像分割是计算机视觉领域的重要研究方向。模糊聚类方法由于其无监督的特性,在图像分割中得到了广泛的应用。然而,传统的模糊聚类方法在处理含高强度噪声和复杂形状的图像时,往往分割效果不理想。为了解决这一问题,提出了一种基于显著性检测的权重因子,用于构建加权滤波器和像素相关性模型,从而提高算法的抗噪能力。所提加权滤波器在结构相似性上比传统滤波器的最优结果高出0.1。此外,引入核度量以适应复杂图像的分割需求。在合成图像、自然图像、遥感图像和医学图像上进行了大量实验,结果表明,所提算法在视觉效果上优于传统方法,并且在分割精度上比传统方法的最优结果高出2%。
图像分割 模糊聚类 加权滤波 核度量 像素相关性 
激光与光电子学进展
2024, 61(8): 0837005
作者单位
摘要
1 天津大学精密仪器与光电子工程学院,天津 300073
2 天津大学光电信息技术教育部重点实验室,天津 300073
针对孪生架构单目标跟踪算法存在的目标状态更新不及时的问题,基于模板与记忆信息动态融合的跟踪策略,提出一种通用的模板更新机制。该机制采用双模块融合的更新策略:通过记忆融合模块融合搜索图像特征的短期记忆信息,获得目标变化情况;将前一帧可信的跟踪结果作为动态模板,从相关特征的角度,通过权重融合模块对原始模板和动态模板进行加权融合,通过结合跟踪过程的原始记忆与短期记忆实现更准确的目标定位。将模板更新机制应用于SiamRPN、SiamRPN++和RBO三种主流算法,并在VOT2019公开数据集上进行实验验证。结果表明:应用该机制后算法的性能得到了有效提升,具体而言,在SiamRPN++算法中,平均重叠期望值提升了6.67%,准确性提升了0.17%,鲁棒性下降了5.39%;此外,在遮挡、形变和背景干扰等复杂场景下,添加模板更新机制的SiamRPN++算法展现出较好的跟踪性能。
目标跟踪 孪生网络 模板更新 记忆信息 
激光与光电子学进展
2024, 61(8): 0837006
作者单位
摘要
长春理工大学电子信息工程学院,吉林 长春 130012
针对彩色图像引导的深度图像超分辨率重建算法中存在的纹理转移和深度流失的问题,提出一种基于双特征融合引导的深度图像超分辨率重建网络(DF-Net)。为了充分利用深度和强度特征的关联性,在网络模型的深度恢复重建部分采用双通道融合模块(DCM)和双特征引导重建模块(DGM)。利用输入金字塔结构提取深度信息和强度信息的多尺度特征:DCM基于通道注意力机制对深度特征和强度特征进行通道间的特征融合与增强;DGM将深度、强度特征自适应选择融合后实现重建的双特征引导,增加了深度特征的引导作用,改善了纹理转移和深度流失的问题。实验结果表明,所提方法的峰值信噪比(PSNR)和均方根误差(RMSE)优于RMRF、JBU和Depth-Net等方法,尤其4×超分辨率重建结果的PSNR值比其他方法平均提升6.79 dB,RMSE平均下降0.94,取得了较好的深度图像超分辨率重建效果。
图像处理 图像超分辨率重建 卷积神经网络 深度图像 特征融合 通道注意力 
激光与光电子学进展
2024, 61(8): 0837007
作者单位
摘要
1 天津大学微电子学院,天津 300072
2 天津师范大学数学科学学院,天津 300387
3 天津市成像与感知微电子技术重点实验室,天津 300072
多能计算机断层扫描(Computed tomography,CT)技术可以更加精确地分辨出人体组织对不同能量X射线光子的吸收情况,是医学成像领域的重要发展方向。为了解决因量子噪声等非理想效应加重导致重建图像质量急剧退化的问题,提出了一种基于移位窗口多头自注意力机制的双流Transformer网络结构。该结构利用移位窗口Transformer和局部增强窗口Transformer分别提取投影数据的全局和局部特征,充分利用投影数据的非局部自相似性以保留投影数据的内部结构;然后通过残差卷积融合提取的特征;最后使用带有非局部全变分的混合损失函数来监督网络模型的训练,提升该网络模型对投影数据内部细节的敏感程度。实验结果表明,所提方法处理后的重建图像峰值信噪比(PSNR)值、结构相似性(SSIM)值和特征相似度(FSIM)值分别达到37.7301 dB、0.9944和0.9961。与目前先进的多能CT去噪方法相比,所提方法在去除低剂量多能CT投影数据噪声的同时,可保留更多的细节特征,有利于后续的精确诊断。
图像处理 计算机断层扫描成像 低剂量 卷积神经网络 Transformer网络 
激光与光电子学进展
2024, 61(8): 0837008
作者单位
摘要
烟台大学计算机与控制工程学院,山东 烟台 264000
现在大多数基于图卷积的点云语义分割方法忽略了边构建的重要性,不能充分地表示局部区域的特征。基于此,提出一种结合注意力机制的边增强的图卷积网络(AE-GCN)。首先,将邻居点特征加入边中,而不仅仅是中心点与邻居点的特征差异;其次,加入注意力机制保证点云的局部信息得到更充分的利用;最后,采用U-Shape的分割结构,确保网络更好适应点云的语义分割这一任务。在两个公开数据集Toronto_3D和S3DIS上的实验结果表明,与目前的大多数方法相比,AE-GCN取得了具有竞争力的结果:在Toronto_3D数据集的平均交并比为80.3%,总体准确度为97.1%;在S3DIS数据集的平均交并比为68.0%,总体准确度为87.2%。
三维图像处理 点云语义分割 注意力机制 边增强 图卷积 
激光与光电子学进展
2024, 61(8): 0837009
作者单位
摘要
1 南京理工大学机械工程学院,江苏 南京 210094
2 南京理工大学智能弹药国防重点实验室,江苏 南京 210094
针对传统多尺度融合方法不能突出目标信息、融合图像缺失细节与纹理的问题,提出一种基于梯度域引导滤波和显著性检测的红外与可见光图像融合方法。该方法利用梯度域引导滤波将输入图像分解为基础层和细节层,同时利用加权的全局对比度方法将基础层分解为特征层以及差异层。在融合过程中,分别采用相位一致性组合加权局部能量、局部熵结合加权最小二乘优化、平均规则来融合特征层、差异层、细节层。实验结果表明,所提融合方法的多项指标相对于其他方法提升较多,且图像视觉效果更好,在突出目标信息、保留轮廓细节、提高对比度和清晰度方面十分有效。
图像融合 引导滤波 显著性分析 多尺度分解 
激光与光电子学进展
2024, 61(8): 0837010
作者单位
摘要
南京信息工程大学电子与信息工程学院,江苏 南京 210044
针对车底危险物图像拼接中存在特征点匹配精度低、匹配速度慢、拼接处存在裂缝以及拼接时间久的问题,提出一种车底危险物图像快速拼接算法。首先,利用角点检测(FAST)算法进行图像特征点提取,再用二进制鲁棒不变可扩展关键点(BRISK)算法对保留的特征点进行特征描述;其次,用快速最近邻搜索(FLANN)算法进行粗匹配;接着,使用渐进一致采样(PROSAC)算法进行特征点提纯;最后,利用拉普拉斯金字塔算法进行图像融合与拼接。实验结果表明:在车底危险物图像数据中,与SIFT、SURF、ORB算法相比,所提算法的图像特征匹配精度分别提高13.10百分点、8.59百分点、11.27百分点,匹配时间分别缩短76.26%、85.36%、10.27%,图像拼接时间分别缩短63.73%、64.21%、20.07%,拼接处不存在明显裂痕。因此,基于FAST、BRISK、PROSAC和拉普拉斯金字塔组合的图像拼接算法是一种优质的图像快速拼接算法。
图像处理 FAST算法 BRISK算法 PROSAC算法 拉普拉斯金字塔算法 图像融合 
激光与光电子学进展
2024, 61(8): 0837011
作者单位
摘要
1 桂林电子科技大学信息与通信学院,广西 桂林 541004
2 梧州学院机器视觉与智能控制广西重点实验室,广西 梧州 543002
传统非实时图像拼接方法易因局部图像失配导致全局拼接中断。此外,显微图像具有大量相似的微观结构,存在特征检测耗时长、误匹配率高等问题。为此,提出一种基于载物台运动信息的显微图像预测拼接算法。通过控制电动载物台XY轴移动距离来决定相邻图像间重叠区域大小,在图像的重叠区域采用加速稳健特征算法检测特征点。利用图像间前后位置关系预测待匹配特征点的范围,在预测范围内筛选出最小欧氏距离的待匹配点。最后通过匹配特征点对的斜率粗筛选匹配点对,随机抽样一致性算法进行精匹配并计算单应性矩阵配准图像完成拼接,使用改进的加权平均算法融合拼接图像。实验结果表明:与暴力匹配和快速最近邻搜索算法相比,所提算法匹配率提高7.95%~26.52%,有效提高配准精度。同时,当图像分辨率为1600×1200时,多图拼接速率为2 frame·s-1,其效果优于AutoStitch软件拼接效果。
图像处理 显微图像 特征匹配 预测拼接 
激光与光电子学进展
2024, 61(8): 0837012
作者单位
摘要
1 西安测绘研究所地理信息工程国家重点实验室,陕西 西安 710054
2 武汉轻工大学电气与电子工程学院,湖北 武汉 430048
3 武汉大学遥感信息工程学院,湖北 武汉 430079
4 湖北大学资源环境学院,湖北 武汉 430062
建筑物轮廓线是各类应用的数据源,但散乱、不规则激光点云数据给轮廓线提取带来了难度。针对上述问题,提出一种基于多层级最小外包矩形规则建筑物轮廓线提取方法,首先使用迭代区域增长算法对轮廓点进行分组,根据点数最多的一组确定初始最小外包矩形。再对初始最小外包矩形进行多层级分解,使轮廓点与不同层级最小外包矩形重合,最后根据不同层级最小外包矩形生成轮廓线。使用Vaihingen城区中规则建筑物进行实验,实验结果表明:与最小面积方法与最大重叠度方法相比,所提方法能准确确定初始最小外包矩形,且提取效率得到略微提高。提取的轮廓线角点均方根误差为0.71 m,优于其他4种方法。所提方法可快速提取规则建筑物轮廓线,有利于后续三维重建。
机载激光雷达 建筑物 最小外包矩形 多层级分解 轮廓线提取 
激光与光电子学进展
2024, 61(8): 0837013
毕程程 1,2,3黄妙华 1,2,3,*刘若璎 1,2,3王量子 1,2,3
作者单位
摘要
1 武汉理工大学现代汽车零部件技术湖北省重点实验室,湖北 武汉 430070
2 武汉理工大学汽车零部件技术湖北省协同创新中心,湖北 武汉 430070
3 武汉理工大学湖北省新能源与智能网联车工程技术研究中心,湖北 武汉 430070
为解决行人检测任务中低能见度场景下单模态图像漏检率高和现有双模态图像融合检测速度低等问题,提出了一种基于双模态图像关联式融合的轻量级行人检测网络。网络模型基于YOLOv7-Tiny设计,主干网络嵌入关联式融合模块RAMFusion用以提取和聚合双模态图像互补特征;将特征提取部分的1×1卷积替换为带有空间感知能力的坐标卷积;引入Soft-NMS改善结群行人漏检问题;嵌入注意力机制模块来提升模型检测精度。在公开的红外与可见光行人数据集LLVIP上的消融实验表明:与其他融合方法相比,所提方法行人漏检率降低、检测速度显著提高;与YOLOv7-Tiny相比,改进后的模型检测精度提高了2.4%,每秒检测帧数达到124 frame/s,能够满足低能见度行人实时检测需求。
行人检测 红外与可见光图像 关联式融合 轻量化网络 注意力机制 YOLOv7-Tiny 
激光与光电子学进展
2024, 61(8): 0837014
贾剑利 1,2,3韩慧妍 1,2,3,*况立群 1,2,3韩方正 1,2,3[ ... ]张秀权 1,2,3
作者单位
摘要
1 中北大学计算机科学与技术学院,山西 太原 030051
2 机器视觉与虚拟现实山西省重点实验室,山西 太原 030051
3 山西省视觉信息处理及智能机器人工程研究中心,山西 太原 030051
当前基于深度学习的目标检测算法已较为成熟。然而,基于少量样本检测新类仍具有挑战性,因为少样本条件下的深度学习容易导致特征空间退化。现有工作采用整体微调范式在丰富样本的基类上进行预训练,在此基础上构建新类的特征空间。然而,新类基于多个基类隐式地构造特征空间,其结构较为分散,导致基类与新类之间可分性较差。采用对新类和与其相似的基类进行关联再识别的方法进行少样本目标检测。通过引入动态感兴趣区域头,提升模型对训练样本的利用率,基于二者间的语义相似度,显式地为新类构建特征空间。通过解耦基类和新类的分类分支、添加通道注意力模块及增加边界损失函数,提升二者间的可分性。在标准PASCAL VOC数据集上的实验结果表明,所提方法的nAP50均值较TFA、MPSR及DiGeo分别提升10.2、5.4、7.8。
少样本目标检测 关联和识别 动态感兴趣区域头 通道注意力 边界损失 
激光与光电子学进展
2024, 61(8): 0837015

期刊网络办公




 

月度浏览top5

MORE
2023年第60卷第9期 pp.0900001
长周期光纤光栅
2022年第59卷第14期 pp.1415009
基于机器视觉的划痕检测技术综述
2019年第56卷第7期 pp.070003
磁光电混合存储技术研究综述

部门电话

稿件处理:李雅新,021-69918427

样刊寄送:阮依超,021-69912922,clp_fx@siom.ac.cn

发票&稿费:021-69918253

激光评论微信公众号


点击菜单“联系编辑”即可添加编辑为好友啦

作者微信群


添加编辑为好友,加入作者交流群;同时招募审稿专家,欢迎加入!