期刊基本信息
创刊:
1964年 • 半月刊
名称:
激光与光电子学进展
英文:
Laser & Optoelectronics Progress
主管单位:
中国科学院
主办单位:
中科院上海光机所
出版单位:
中国激光杂志社
主编:
范滇元
执行主编:
邱建荣
副主编:
戴琼海 张龙 张雨东 曹良才
ISSN:
1006-4125
刊号:
CN 31-1690/TN
电话:
021-69918427
邮箱:
地址:
上海市嘉定区清河路390号
邮编:
201800
定价:
120元/期

本期栏目 2021, 58(2)

MORE

激光与光电子学进展 第58卷 第2期

作者单位
摘要
华侨大学信息科学与工程学院, 福建省光传输与变换重点实验室, 福建 厦门 361021
由于随机散射效应,相干光束经过强散射介质后,出射光场变成光强呈无序分布的散斑场,因此无法直接从出射场获取入射光的信息。然而,在随机散射过程中,出射散斑场仍然携带着入射光场信息。从散斑场中获取原始信息以实现物体的重建是一个备受关注的研究课题。研究人员针对该问题提出了包括散斑相关、传输矩阵、波前调控及时间反演与相位共轭等技术。着重介绍了基于相关全息原理的散射成像技术,主要包括其原理、发展历史以及最新的研究进展,并对该技术的未来发展趋势进行了展望。
成像系统 散射成像 相关全息 散射介质 散斑场 
激光与光电子学进展
2021, 58(2): 0200001
作者单位
摘要
西安电子科技大学物理与光电工程学院, 陕西 西安 710071
易燃液体在食品、化工、能源等领域均有广泛应用,并创造了巨大的经济价值。然而,该类液体易燃易爆,且在使用过程中可能会产生有毒蒸汽,因而它的无损检测对于促进工业生产和保障人民的人身财产安全具有深远意义。光谱检测技术具有快速、在线检测、无损、样品无需预处理、检测精度高等优点,在易燃液体检测中发挥了重要作用。本文综述了易燃液体光谱检测方法的技术原理,重点介绍了近红外光谱法、拉曼光谱法、紫外光谱法、荧光光谱法和太赫兹时域光谱法等5种典型易燃液体光谱检测技术的发展历程和应用现状,同时结合光谱技术的优缺点,对其未来发展前景进行了展望。
光谱学 无损检测 易燃液体 光谱检测技术 检测灵敏度 光谱检测应用 
激光与光电子学进展
2021, 58(2): 0200002
作者单位
摘要
1 宁波大学信息科学与工程学院, 浙江 宁波 315211
2 南京大学计算机软件新技术国家重点实验室, 江苏 南京 210093
随着三维网格在数字游戏、影视动画、虚拟现实等领域的广泛应用,针对三维网格的处理方法也越来越多,包括压缩、简化、嵌入水印和去噪等,这些处理技术均不可避免地导致三维网格的失真。如何更好地评估三维网格的视觉质量成为目前亟需解决的问题。回顾了近20年来发展起来的三维网格的客观质量评价方法。介绍了这一领域常用评价方法的技术指标以及常用的数据库;对现有的典型三维网格的质量评价方法进行了分类并介绍了其各自的特点;在常用的数据库上对所介绍的典型算法进行性能测试和比较;对三维网格客观质量评价方法进行了总结与展望。
图像处理 三维网格 失真 视觉质量 数据库 质量评价 
激光与光电子学进展
2021, 58(2): 0200003
作者单位
摘要
河北工业大学人工智能与数据科学学院, 天津300100
提出一种基于卷积神经网络中残差网络的遥感图像场景分类方法。本文方法在原网络模型中嵌入了跳跃连接和协方差池化两个模块,用于连接多分辨率特征映射和融合不同层次的多分辨率特征信息,并在3个公开的经典遥感数据集上进行了实验。结果证明,本文方法不仅可以将残差网络中不同层次的多分辨率特征信息融合在一起,还可以利用高阶信息来实现更具代表性的特征学习。与已有的分类方法相比,本文方法在场景分类问题上拥有更高的分类精度。
图像处理 遥感图像 卷积神经网络 场景分类 残差网络 
激光与光电子学进展
2021, 58(2): 0210001
聂启颖 1,2,3朱振才 1,3,*张永合 1,3王亚敏 1,3
作者单位
摘要
1 中国科学院微小卫星创新研究院, 上海 201203
2 中国科学院大学, 北京 100049
3 中国科学院微小卫星重点实验室, 上海 201203
深空探测任务中,探测器需要在复杂的地形区域着陆,因此在轨障碍的快速检测至关重要,而图像分割是在轨检测的关键过程之一。鉴于此,提出一种基于粒子群和灰狼混合优化的多级阈值图像分割算法。在寻优过程中,所提算法在考虑图像能量分布的情况下,针对不同场景通过改变种群初始条件来自定义阈值级数。在位置更新过程中,所提算法增加扰动算子来扩大全局搜索的范围,引入动态权重来平衡群体的全局搜索能力与局部搜索能力,从而提高寻优的速度和精度,完成图像分割。实验结果表明,相较于传统的群智能算法,所提算法表现出较好的搜索能力,在处理灰度直方图不呈现双峰的复杂图像问题上有明显改善。
图像处理 小行星地表图像 群体智能 信息熵 图像分割 
激光与光电子学进展
2021, 58(2): 0210002
陈毅 1杨海马 1,*刘瑾 2,*李筠 1[ ... ]夏季 3
作者单位
摘要
1 上海理工大学光电信息与计算机工程学院, 上海 200093
2 上海工程技术大学电子电气工程学院, 上海 201620
3 第二军医大学长海医院, 上海 200433
为提高结构光三维重构系统的点云匹配速度及精度,提出二维视图及三维点云交叉特征点协同匹配的方法。首先,通过投影变换及维度映射关系实现待拼接投影图像的归一化,经预处理后提取端点及分叉点作为关键点,对同类点进行三角划分及相似匹配得到初始点集,并将其映射至三维空间。其次,利用kd-tree搜索得到双邻域质心,根据三点构成的三角形相似关系进一步筛选点集。最后,采用四元数法完成粗拼接,进而使用改进的迭代最近点(ICP)算法完成精拼接。实验结果表明,所提算法的匹配准确率达98.16%,匹配用时3s,粗拼接重叠区域的重心距离误差为0.018mm,所提算法对于二维图像视角变换、纹理光滑、光线不均等具有较高的鲁棒性。
图像处理 视角变换 双维度 协同匹配 点云拼接 迭代最近点算法 
激光与光电子学进展
2021, 58(2): 0210003
作者单位
摘要
1 西安科技大学安全科学与工程学院, 陕西 西安 710054
2 西安科技大学电气与控制工程学院, 陕西 西安 710054
针对传统火焰检测模型的检测准确度较低和速度慢等问题,提出一种优化的卷积神经网络和超像素分割算法的视频火焰区域检测方法。首先使用火焰图像数据集对模型进行训练和验证,采用卷积核堆叠替换的方法改进Inception模块的结构;其次采用小卷积核替换的方法改进网络的前端结构,并将Focal-Loss函数作为损失函数以提高模型的泛化能力;然后设计InceptionV1模型的参数复杂度优化实验,生成优化的火焰检测网络结构;最后将超像素分割算法提取的火焰超像素语义信息输入优化的InceptionV1模型中,并进一步执行视频火焰区域的定位检测。实验结果表明,所提方法能够增强视频火焰的非线性特征提取能力,火焰检测准确度高于96%,检测速度较原始模型提升2.66倍。
图像处理 火焰检测 卷积神经网络 卷积核堆叠替换 参数复杂度优化 超像素定位 
激光与光电子学进展
2021, 58(2): 0210004
张政 1徐杨 1,2,*
作者单位
摘要
1 贵州大学大数据与信息工程学院, 贵州 贵阳 550025
2 贵阳铝镁设计研究院有限公司, 贵州 贵阳 550009
针对传统卷积神经网络(CNN)中仅有对单手手势语义进行识别的算法和深度学习手势识别算法中CNN的收敛性差和识别精度低的问题,提出了一种基于两个分类器的自适应单双手手势识别算法以对单手和双手进行识别。该算法的核心是联合两个分类器进行单双手手势识别。首先,采用手数分类器对手势进行分割分组预测,将手势识别转化成部分手势图像识别;其次,采用自适应增强卷积神经网络(AE-CNN)进行手势识别,利用自适应模块分析出现识别误差的原因和反馈模式;最后,在迭代次数和识别结果的基础上进行参数更新。实验结果表明,手数分类器进行手势预测分组的正确概率为98.82%,AE-CNN的收敛性优于CNN和CNN+Dropout,对单手手势的识别率高达97.87%,对基于LSP数据集自建的9类单手手势和10类双手手势的整体模型识别率为97.10%,对复杂背景和不同光照强度下手势的平均识别率为94.00%,并且具有一定的鲁棒性。
图像处理 特征自适应增强 双分类器 单双手势识别 卷积神经网络 
激光与光电子学进展
2021, 58(2): 0210005
邹斌 1,2赵小虎 1,2,*尹智帅 1,2
作者单位
摘要
1 武汉理工大学现代汽车零部件技术湖北省重点实验室, 湖北 武汉 430070
2 武汉理工大学汽车零部件技术湖北省协同创新中心, 湖北 武汉 430070
针对ORB算法特征匹配精度低的缺陷,结合金字塔光流特性,提出一种优化ORB特征匹配的方法。首先,采用区域分块法对待匹配图像进行处理,挑选出最佳匹配子块,缩小无效匹配区域;接着,对子块提取ORB关键字并计算匹配描述子得到粗匹配点对,采用金字塔光流法追踪ORB特征点,求解特征点的运动位移矢量,以此剔除粗匹配部分错误的匹配对;最后,采用随机采样一致算法进一步剔除冗余匹配点,获取更为精准的匹配对。实验结果表明,本文优化的ORB算法可以很好地满足实时性和精度的要求,特征匹配的平均耗时为原ORB算法的87%左右,且平均匹配率达98%以上。
图像处理 特征匹配 区域分块 ORB 光流 随机采样一致算法 
激光与光电子学进展
2021, 58(2): 0210006
作者单位
摘要
中国民航大学天津市智能信号与图像处理重点实验室, 天津 300300
为了更好地对人体动作的长时时域信息进行建模,提出了一种结合时序动态图和双流卷积网络的人体行为识别算法。首先,利用双向顺序池化算法来构建时序动态图,实现视频从三维空间到二维空间的映射,用来提取动作的表观和长时时序信息;然后提出了基于inceptionV3的双流卷积网络,包含表观及长时运动流和短时运动流,分别以时序动态图和堆叠的光流帧序列作为输入,且结合数据增强、模态预训练、稀疏采样等方式;最后将各支流输出的类别判定分数通过平均池化的方式进行分数融合。在UCF101和HMDB51数据集的实验结果表明:与传统双流卷积网络相比,该方法可以有效利用动作的时空信息,识别率得到较大的提升,具有有效性和鲁棒性。
图像处理 双流卷积网络 人体行为识别 时序动态图 数据增强 
激光与光电子学进展
2021, 58(2): 0210007
作者单位
摘要
1 西北民族大学中国民族语言文字信息技术教育部重点实验室, 甘肃 兰州 730030
2 西北民族大学数学与计算机科学学院, 甘肃 兰州 730030
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。
图像处理 藏文古籍文档图像 文本行切分 文字核心区域 扩展生长 
激光与光电子学进展
2021, 58(2): 0210008
作者单位
摘要
陕西科技大学电气与控制工程学院, 陕西 西安 710021
针对现有药房药剂师取药任务繁重、效率低下等问题,设计了基于机器视觉的取药机器人系统,提出了一种基于融合局部特征匹配和Mean Shift算法的药品识别算法,系统整体实现了药品的识别、定位及抓取任务。首先,安装于药架之间的抓药机器人接收上位机发送的药品信息,通过摄像头识别药品,使用AKAZE算法对货架上的药品进行匹配,获取药品坐标后,将匹配的药品抓取放至传送带上;位于取药处的分拣机器人得到上位机发送的药品信息后,通过改进的Mean Shift算法对传送带上的动态药品进行二次识别,将识别到的药品抓取放至取药处,完成整个系统的取药功能。实验证明,以二次分拣为保证,系统能够准确地识别药品,且药品定位信息比较准确,误差较小,可适用于药房药品的抓取。
图像处理 取药机器人 分拣 视觉定位 局部特征 
激光与光电子学进展
2021, 58(2): 0210009
作者单位
摘要
安徽大学电气工程与自动化学院, 安徽 合肥 230601
提出一个新的基于轻量级注意力机制的网络框架。在YOLOv3主干网络的基础上,使用深度卷积和点卷积代替标准卷积设计特征提取网络,加快模型的训练,提高检测的速度,然后引入注意力机制模块进行模型速度和精度的权衡,最后通过增加多尺度提取更多网络层的特征信息,同时使用K-means++ 聚类算法进一步优化网络参数。实验结果表明,该方法可以显著提高人脸检测模型的性能,在Wider Face数据集上可以达到94.08%的准确率和83.97%的召回率,且平均检测时间只需0.022 s,相比原始YOLOv3算法提高了4.45倍。
图像处理 人脸检测 深度学习 轻量级网络 注意力机制 K-means++ 
激光与光电子学进展
2021, 58(2): 0210010
作者单位
摘要
四川大学电子信息学院, 四川 成都 610065
为了缓解传统拜耳型去马赛算法中常出现的拉链和伪影等问题,提出一个新颖的基于深度学习的去马赛克算法。所提算法首先对马赛克图像中的红色、绿色及蓝色通道中的像素进行分解、剔除及组合等操作得到两幅彩色图像,然后将这两幅彩色图像输入到设计的卷积神经网络中,以重建出完整的彩色图像,该网络能充分地利用卷积层所生成的特征信息。实验结果表明,所提算法重建出的完整彩色图像的质量相对较高,并且在一定程度上缓解了拉链和伪影等问题,其客观指标和主观评价都优于对比算法。
图像处理 拜耳 去马赛克 深度学习 彩色滤波阵列 注意力机制 
激光与光电子学进展
2021, 58(2): 0210012
作者单位
摘要
河北工业大学电子信息工程学院, 天津 300401
提出一种共享型轻量级卷积神经网络(CNN),用于自动识别车辆颜色和型号。基础网络采用改进的SqueezeNet,在训练集上比较具有不同“瘦身”程度的SqueezeNet的分类性能。讨论完全共享型网络、部分共享型网络及无共享型网络的特征。实验结果表明,完全共享型轻量级CNN在减少参数量的同时实现了对车辆外观多属性的高精度识别。在开放数据集Opendata_VRID上进行实验,车辆颜色和车型识别的准确率分别达98.5%和99.1%。在一台无GPU配置的个人计算机上,单张图片的识别时间仅为4.42 ms。共享型轻量级CNN大大减少了时间和空间成本,更有利于在资源有限的环境中进行部署。
图像处理 共享型轻量级卷积神经网络 颜色特征 型号特征 改进的SqueezeNet 车辆外观识别 
激光与光电子学进展
2021, 58(2): 0210013
化春键 1,2,*孙康康 1,2陈莹 3
作者单位
摘要
1 江南大学机械工程学院, 江苏 无锡 214122
2 江苏省食品先进制造装备技术重点实验室, 江苏 无锡 214122
3 江南大学物联网工程学院, 江苏 无锡 214122
针对网孔织物图像的对比度低和噪声点多而导致分割结果中存在网孔连在一起和残缺等问题,提出一种基于区域灰度极小值的分割算法以期提高网孔的分割精度。首先利用高斯金字塔缩放和直方图均衡化算法处理图像以增强图像的纹理轮廓和明暗对比度。然后采用一种基于区域灰度极小值的分割算法以解决仅仅依靠灰度值大小而无法正确分割网孔的问题。最后采用一种多图像融合算法以解决基于局部灰度极小值的分割算法中阈值选择困难的问题。选择多种不同光照程度的网孔织物图像进行实验,实验结果表明所提算法的分割效果良好,能够有效地解决分割结果中网孔连在一起和残缺等问题,且网孔织物的分割错误率为0.24%。
图像处理 图像分割 局部极值点 图像融合 网孔织物 图像增强 
激光与光电子学进展
2021, 58(2): 0210014
作者单位
摘要
江南大学物联网工程学院, 江苏 无锡 214122
基于方向梯度直方图(HOG)特征和局部二值模式(LBP)算子的行人检测算法采用滑动窗口搜索策略存在扫描区域过大和计算复杂的问题,存在的这些问题会导致检测速度慢。鉴于此,提出一种行人检测算法。首先,采用选择性搜索算法对目标区域进行定位,并将候选区域的高宽比限制在一定范围内以筛选无效窗口。然后,为了弥补LBP算子在纹理表达上的缺陷,引入完备的局部二值模式(CLBP)算子来提高纹理特征的表达能力。接着,考虑到HOG特征和CLBP算子特征维数过高对分类器的识别能力产生影响,采用主成分分析的方法分别对HOG特征和CLBP算子进行降维,降维后再进行串联融合。最后,引入困难样本的挖掘过程训练支持向量机分离器,这可以使模型训练得更充分,进而降低误检率。在INRIA数据集上仿真结果表明,所提算法在识别率和识别速度上都有一定的提高。
图像处理 选择性搜索 行人检测 完备的局部二值模式 梯度方向直方图 困难样本 
激光与光电子学进展
2021, 58(2): 0210015
作者单位
摘要
1 陆军工程大学训练基地工程装备系, 江苏 徐州 221004
2 北京中科智易科技有限公司, 北京 100084
针对传统拼接技术对图像信息利用率不足的问题,提出一种基于图像与数据双层融合的高光谱图像拼接技术。对于图像层,采用尺度不变特征变换算法对图像进行特征提取,使用欧氏距离确定特征匹配范围,根据坐标转换关系对特征进行匹配,完成图像层的拼接;对于数据层,首先将数据拆分高、低位数据,然后采用加权和法计算数据的新值并对其进行拼接,最后通过位移运算合并高、低位数据,完成数据层的拼接;最后将图像与数据按照BIL方式进行存储,完成图像与数据的双层融合。在某地域进行高光谱图像拼接实验,实验结果表明图像层和数据层的平均拼接精度分别为0.9214和0.9663,说明该技术具有有效性和准确性。
图像处理 高光谱 图像拼接 图像与数据 双层融合 
激光与光电子学进展
2021, 58(2): 0210016
作者单位
摘要
中南林业科技大学计算机与信息工程学院, 湖南 长沙 410004
对于语音的情感识别,针对单层长短期记忆(LSTM)网络在解决复杂问题时的泛化能力不足,提出一种嵌入自注意力机制的堆叠LSTM模型,并引入惩罚项来提升网络性能。对于视频序列的情感识别,引入注意力机制,根据每个视频帧所包含情感信息的多少为其分配权重后再进行分类。最后利用加权决策融合方法融合表情和语音信号,实现最终的情感识别。实验结果表明,与单模态情感识别相比,所提方法在所选数据集上的识别准确率提升4%左右,具有较好的识别结果。
图像处理 情感识别 全卷积神经网络 长短期记忆网络 注意力机制 多模态融合 
激光与光电子学进展
2021, 58(2): 0210017
作者单位
摘要
辽宁工程技术大学软件学院, 辽宁 葫芦岛 125105
针对超分辨率卷积神经网络(SRCNN)卷积层较少、训练时间长、不易收敛且表达和泛化能力受限等问题,提出了一种残差反卷积SRCNN(RD-SRCNN)算法。首先利用不同大小的卷积核进行卷积操作,以更好地提取低分辨率图像中的细节特征;然后将获取的图像特征输入由不同大小卷积核构成的卷积层和指数线性单元激活层组成的残差网络,并通过短路径连接各个特征提取单元,以解决梯度消失、实现特征重用、减少网络冗余;最后,通过加入反卷积层增大感受野,得到清晰的高分辨率图像。实验结果表明,RD-SRCNN算法在视觉和客观评价标准上均取得了较好的效果。
图像处理 反卷积 残差网络 激活函数 卷积神经网络 
激光与光电子学进展
2021, 58(2): 0210018
作者单位
摘要
辽宁工程技术大学电子与信息工程学院, 辽宁 葫芦岛 125105
针对目前指关节纹识别方法鲁棒性差的问题,提出了一种基于非下采样的Shearlet变换(NSST)和Tetrolet能量特征的指关节纹识别方法。首先,采用直方图均衡化调整图像的灰度,以减少光照分布不均对识别系统产生的影响。其次,利用NSST及其逆变换得到去噪后的重构图像,并对其进行Tetrolet变换,建立低频图像的能量曲面。最后,将不同图像的能量曲面作差,得到能量差曲面,进一步计算曲面的方差,并以此为依据对不同指关节纹图像进行分类识别。在HKPU-FKP、IIT Delhi-FK、和HKPU-CFK图库及其噪声图库的实验结果表明,本方法的正确识别率可达98.0392%,最短识别时间为0.0497 s,最低等误率为2.5646%。相比其他方法,本方法可以明显提高指关节纹识别系统的性能,具有可行性和有效性。
图像处理 指关节纹识别 能量曲面 非下采样的Shearlet变换 Tetrolet变换 
激光与光电子学进展
2021, 58(2): 0210019
单宝彦 1,2,3朱振才 1,*张永合 1,3邱成波 1,2,3
作者单位
摘要
1 中国科学院微小卫星创新研究院, 上海 201203
2 中国科学院大学, 北京 100049
3 中国科学院微小卫星重点实验室, 上海 201203
在行星探测任务中,针对尺度不变特征变换(SIFT)算法计算量大,无法同时满足对导航算法准确性和实时性要求的问题,提出了一种基于快速高斯模糊的并行化SIFT算法,即FG-SIFT算法。首先,将算法中构建高斯金字塔的二维高斯核函数分离成两个一维高斯函数,降低算法的计算复杂度。然后,对于每一维高斯函数,使用两个无限脉冲响应滤波器串联进行逼近,进一步减少计算量。最后,利用并行化处理的优势,设计算法各部分的并行化计算方案。仿真结果表明,FG-SIFT算法的计算效率相较于原SIFT算法平均提高了15倍,相较于没有使用快速高斯模糊的SIFT算法,在图形处理器上的运行效率也有近2倍的提高,很大程度上减少了特征点提取的计算时长,提高了算法的实时性。
图像处理 尺度不变特征变换算法 快速高斯模糊 CUDA 实时性 
激光与光电子学进展
2021, 58(2): 0210020
作者单位
摘要
1 广东工业大学信息工程学院, 广东 广州 510006
2 中国人民解放军96630部队, 北京 102206
高光谱图像聚类问题一直是图像处理领域的研究热点。谱聚类算法是最流行的聚类算法之一,但其计算复杂度较大,难以处理大规模的高光谱图像数据。由于二叉树能够较快地选取锚点,因此基于二叉树锚点图,充分利用高光谱图像的光谱和空间特性,可保证聚类性能并降低计算复杂度。然而,该聚类算法一般采用有核的聚类方法,因此不可避免地引入了参数调节。在二叉树锚点选取的基础上,提出了一种基于二叉树锚点的高光谱快速聚类算法,该算法创新性地将二叉树锚点选取和无核聚类方法应用于高光谱图像中。首先,利用二叉树从高光谱数据中选取一些具有代表性的锚点;紧接着构造基于锚点的无核相似图,有效避免了通过人为调节热核参数来构造相似图;然后进行谱聚类分析获得聚类结果;最后,将该算法应用到高光谱图像聚类中。该算法不仅提高了聚类速度,还减少了原有热核参数调节。实验结果表明,与传统的聚类算法相比,所提算法能够在较短的时间内获得更佳的聚类精度。
图像处理 高光谱图像 谱聚类 二叉树 锚点 
激光与光电子学进展
2021, 58(2): 0210021
作者单位
摘要
1 中国民航大学天津市智能信号与图像处理重点实验室, 天津 300300
2 中国民航大学中欧航空工程师学院, 天津 300300
针对传统语义分割算法参数量大、运行慢,不利于违禁品识别技术实际应用的问题,提出一种基于轻量化分割网络的违禁品识别算法。在模型的浅层特征层设计空洞卷积模块来扩大网络的感受野,减少误分类并提升分割精细度。在深层特征层设计非对称卷积模块取代传统单一串联卷积操作,降低计算复杂度。实验结果表明,所提算法在识别精度和速度上取得了均衡的性能,平均交并比(mIoU)达73.18×10 -2,每秒传输帧数(FPS)达27.1。
图像处理 违禁品识别 空洞卷积模块 非对称卷积模块 
激光与光电子学进展
2021, 58(2): 0210022
作者单位
摘要
兰州交通大学电子与信息工程学院, 甘肃 兰州 730070
针对简单线性迭代聚类(SLIC)方法对图像边缘细节处理效果不佳的问题,提出一种参数可控、改进的简化脉冲耦合神经网络模型(PC-MSPCNN)与SLIC结合的彩色图像分割方法。该方法首先改进MSPCNN模型的加权矩阵和连接系数,并增设辅助参数,以提高分割准确度。随后将彩色图像输入至PC-MSPCNN模型中,依据改进模型中输出Y值的分布划分物体的边缘,使分割结果更好地贴合物体的边缘,利用所提出的相似性准则合并散布的碎片,减小后续处理的复杂度;其次,在SLIC度量相似距离的基础上引入PC-MSPCNN中RGB三个通道的内部活动项U值,完成对图像剩余部分的加权融合聚类,改进聚类效果。实验结果表明,本文方法能更精确地贴合图像中物体的边界,大幅减少碎片,有效提高图像的边缘贴合度。
图像处理 图像分割 超像素分割 脉冲耦合神经网络 简单线性迭代聚类 
激光与光电子学进展
2021, 58(2): 0210023
张翠军 1,2赵娜 1,*
作者单位
摘要
1 河北地质大学信息工程学院, 河北 石家庄 050031
2 河北地质大学河北省高校生态环境地质应用技术研发中心, 河北 石家庄 050031
针对GrabCut算法在分割图像时效率低,且容易出现欠分割与过分割的问题,提出了一种基于概率神经网络(PNN)改进的GrabCut(PNN_GrabCut)算法。该算法用PNN模型替换GrabCut算法中的高斯混合模型(GMM)进行t-links权值计算,以提升算法的计算效率;通过构建前景和背景直方图,选取像素值出现频率较高的像素作为PNN模型的训练样本,以提高算法的分割精度。在公开的ADE20K数据集中选取图像进行分割实验,结果表明,PNN_GrabCut算法的分割精度优于其他对比算法,且效率较高。对前景与背景相似度高的图像进行分割实验,结果表明,PNN_GrabCut算法的分割精度明显高于GrabCut算法。
图像处理 概率神经网络 高斯混合模型 图像分割 
激光与光电子学进展
2021, 58(2): 0210024
作者单位
摘要
大连海事大学理学院, 辽宁 大连 116026
针对荧光扩散层析成像中荧光光源的定位误差较大和形态学信息不完整的问题,提出一种基于组稀疏正则化的同时代数重建技术(GSR-SART)算法。该算法利用图像的非局部自相似性和局部稀疏性构造自适应相似组;然后,将相似组作为基本单元,学习自适应字典;最后,采用迭代收缩阈值算法求解目标函数。实验结果表明,所提算法在峰值信噪比和方均根误差的结果上比其他先进算法有较大的提升。
成像系统 荧光扩散层析成像 非局部自相似性 稀疏表示 字典学习 
激光与光电子学进展
2021, 58(2): 0211002
作者单位
摘要
中北大学信息与通信工程学院信息探测与处理山西省重点实验室, 山西 太原 030051
活立木中的腐烂和空洞通常是造成树木倒塌的重要原因,通过检测活立木内部结构来判断木材内部的缺陷。针对此现状,提出基于微波层析成像的活立木内部缺陷检测方法。首先搭建由16个天线组成的微波层析成像系统,在1 GHz的频率下模拟健康木材和两种不同缺陷的木材模型,通过有限元分析软件模拟活立木内部的电场特性,得到用于图像重建的散射场,采用线性反投影图像重建算法重建木材内部的介电常数分布图。然后使用平均结构相似性指数分析重建图像。最后对不同的树干模型和重建图像进行定性和定量分析。仿真结果表明,微波层析成像技术可以利用重建介电常数分布图的可视化效果直接识别缺陷的位置和大小等。
成像系统 微波层析成像 图像重建 活立木 腐烂 
激光与光电子学进展
2021, 58(2): 0211003
作者单位
摘要
1 南京航空航天大学机电学院, 江苏 南京 210016
2 南京景曜智能科技有限公司, 江苏 南京 211100
为提高标定精度,提出一种基于直线空间变换的光平面标定方法。首先利用互相关模板与5点滑动平均法提取激光条纹中心,然后采用正交回归法拟合图像中的光条直线方程。通过平面单应性变换获得靶标面光条直线方程,进一步再将靶标坐标系中的直线方程转换成Plücker矩阵形式。根据位姿转换关系得到相机坐标系下的直线方程,并建立超静定线面共面约束方程组,使用奇异值分解(SVD)求解光平面方程参数。所提方法测量的标准台阶块长度方均根(RMS)为0.065mm,平均误差小于0.030mm,圆柱直径的测量平均误差与RMS小于0.050mm。结果表明,利用光条自身整体信息拟合光平面,所提方法可实现较高的标定精度且标定过程简单,同时避免对每个特征点进行单独求解。
测量 机器视觉 光平面标定 Plücker矩阵; 单应性矩阵 线结构光 图像处理 
激光与光电子学进展
2021, 58(2): 0212001
作者单位
摘要
上海海洋大学信息学院, 上海 201306
立体匹配算法在图像弱纹理区和重复纹理区存在匹配困难、误差大的问题,为此提出一种基于改进代价计算和视差候选策略的立体匹配算法。首先结合改进的Census变换和自适应加权融合的双向梯度信息来计算初始匹配代价,提高代价计算的可靠性。其中:为传统Census变换增加内圈编码,提高邻域信息利用率,同时降低噪声的影响;利用自适应权重函数融合横向和纵向梯度代价,降低物体边缘区域的误匹配率。其次,采用自适应十字交叉窗口进行代价聚合,并通过建立候选视差集和引入邻域视差信息的方法来获取初始视差。最后通过两轮插值策略优化视差。实验结果表明,所提算法能够提高弱纹理区和重复纹理区的匹配效果,在Middlebury中4幅标准立体图像对的平均误匹配率为5.33%。
机器视觉 立体匹配 代价计算 视差计算 Census变换 梯度 
激光与光电子学进展
2021, 58(2): 0215001
作者单位
摘要
兰州交通大学电子与信息工程学院, 甘肃 兰州 730070
针对脉冲耦合神经网络在交通标志分割中准确度不高和参数设置复杂的问题,提出一种参数可调的改进脉冲耦合神经网络(PA-MSPCNN)。通过分析交通标志颜色特征,对图像进行红化预处理,区分出交通标志和环境背景;根据周围神经元对中心神经元的影响,改进MSPCNN模型中的加权矩阵和连接系数;通过分析动态阈值间的关系,增设辅助参数,使动态阈值的调节更加合理。实验结果表明,PA-MSPCNN对交通标志的检测准确率达85%。PA-MSPCNN在减少传统PCNN模型中的参数量同时,能准确分割图像,在光照条件变化、交通标志尺度变化和几何旋转等复杂情况下具有更好的适用性。
机器视觉 图像处理 脉冲耦合神经网络 交通标志 图像分割 
激光与光电子学进展
2021, 58(2): 0215002
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
基于深度学习的目标检测器RetinaNet和Libra RetinaNet均是使用特征金字塔网络融合多尺度特征,但上述两个检测器存在特征融合不充分的问题。鉴于此,提出一种多尺度特征融合算法。该算法是在Libra RetinaNet的基础上进一步扩展,通过建立两条自底向上的路径构建两个独立的特征融合模块,并将两个模块产生的结果与原始预测特征融合,以此提高检测器的精度。将多尺度特征融合模块与Libra RetinaNet结合构建目标检测器并在不同的数据集上进行实验。实验结果表明,与Libra RetinaNet检测器相比,加入模块后的检测器在PASCAL VOC数据集和MSCOCO数据集上的平均精度分别提高2.2个百分点和1.3个百分点。
机器视觉 卷积神经网络 目标检测 特征金字塔 特征融合 
激光与光电子学进展
2021, 58(2): 0215003
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
立体区域卷积神经网络(Stereo R-CNN)算法具有准确、高效的特点,在一定场景下的检测性能较好,但对于远景目标的检测仍有一定的提升空间。为了提升双目视觉算法的车辆检测精度,提出一种改进的Stereo R-CNN算法。该算法将确定性网络(DetNet)作为骨干网络,以增强网络对远景目标的检测;针对左右目视图的潜在关键点,建立了左右视图关键点一致性损失函数,以提高选取潜在关键点的位置精度,进而提高车辆的检测准确性。在KITTI数据集上的实验结果表明,本算法的性能优于Stereo R-CNN,在二维、三维检测任务上的平均精度提升了1%~3%。
机器视觉 三维目标检测 左右关键点一致性 车辆检测 
激光与光电子学进展
2021, 58(2): 0215004
刘莎 1党建武 1,2,*王松 1,2王阳萍 2,3
作者单位
摘要
1 兰州交通大学电子与信息工程学院, 甘肃 兰州 730070
2 甘肃省人工智能与图形图像处理工程研究中心, 甘肃 兰州730070
3 兰州交通大学计算机科学与技术国家级实验教学示范中心, 甘肃 兰州 730070
针对行人重识别中行人检测误差引起的空间错位,基于局部的深度网络模型仅学习相邻局部关系,导致远距离局部相关性缺失,因此,提出了一种结合一阶和二阶空间信息的行人重识别算法。在主干网络上,学习一阶空间掩模对输入图像的空间权值进行微调,以减少背景干扰;通过二阶空间掩模对远距离的依赖关系进行建模,并将局部特征集成到依赖模型中,以获取全局特征表示。局部分支引入DropBlock对抽取的行人特征进行正则化,避免了网络模型过于依赖特定部位特征。训练阶段用标签平滑分类损失和引入正样本中心的三元组损失联合优化整个网络。在Market-1501和DukeMTMC-reID数据集上的实验结果表明,相比其他主流算法,本算法的行人重识别精度更高,且提取的行人特征判别性和鲁棒性更好。
机器视觉 行人重识别 一阶空间掩模 二阶空间掩模 中心三元组损失 
激光与光电子学进展
2021, 58(2): 0215005
作者单位
摘要
辽宁工程技术大学软件学院, 辽宁 葫芦岛 125105
针对相关滤波目标跟踪算法空间正则权重没有与目标建立联系和时间正则项不能自适应更新的问题,提出自适应时空正则化的相关滤波目标跟踪算法。首先,利用初始帧的显著感知参考权重,使自适应空间正则项能够在后续跟踪过程中获取与目标存在联系的空间正则权重。然后,利用相邻两帧响应得分的变化情况计算时间正则化参数的参考值,使自适应时间正则项可以通过变化的正则化参数不断更新。最后,采用交替方向乘子法(ADMM)优化算法,以较少的迭代次数分别求解出滤波器函数、空间正则权重和时间正则化参数。在OTB-2015数据集上进行实验,结果表明本文算法的跟踪性能优于其他对比算法,其中距离精度和成功率分别达到86.4%和65.6%,且本文算法在具有形变、旋转、遮挡和出视野等属性的复杂跟踪场景下更具鲁棒性。
机器视觉 目标跟踪 相关滤波 自适应时空正则化 显著感知 响应得分 
激光与光电子学进展
2021, 58(2): 0215007
作者单位
摘要
重庆邮电大学先进制造工程学院, 重庆 400065
双目立体匹配根据视差原理将平面视觉转化到三维立体视觉,是三维重建的核心步骤之一。针对局部立体匹配算法在深度不连续、弱纹理区域匹配精度低且易受光照、噪声等因素干扰的问题,提出了一种改进的立体匹配算法。首先,在代价计算阶段将改进的Census代价与梯度代价进行融合,并采用引导滤波算法对图像进行多尺度代价聚合;然后,采用赢家通吃算法计算初始视差;最后,采用左右一致性检测、中值滤波进行视差后处理,得到最终的视差图。实验结果表明,本算法在Middlebury2.0测试平台上的平均误匹配率为5.11%,且具有很好的稳健性和实用性。
机器视觉 三维重建 引导滤波 多尺度代价聚合 Census变换 梯度变换 
激光与光电子学进展
2021, 58(2): 0215008
作者单位
摘要
陕西科技大学机电工程学院, 陕西 西安 710021
基于卷积神经网络的深度学习方法对钢轨表面损伤的自动化检测起到非常重要的推动作用,因此提出一种基于卷积神经网络的钢轨表面损伤检测方法。首先,在经典U-Net的收缩路径和扩展路径之间增加一个分支网络,可以辅助U-Net输出理想的分割图。然后,将Type-I RSDDs高速铁路轨道数据集作为检测样本,使用数据增强的手段扩增检测样本后馈入改进的U-Net中进行训练和测试。最后,采用评价指标对所提方法进行评估。实验结果表明,所提方法的检测准确率达到99.76%,相比于其他方法的最高水平提高6.74个百分点,说明所提方法可以显著提高检测准确率。
机器视觉 深度学习 损伤特征识别 数据增强 改进的U-Net图形分割网络 无损检测 
激光与光电子学进展
2021, 58(2): 0215009
作者单位
摘要
1 辽宁工程技术大学测绘与地理科学学院, 辽宁 阜新 123000
2 自然资源部国土卫星遥感应用中心, 北京 100048
针对全卷积神经网络多次下采样操作导致的道路边缘细节信息损失和道路提取不准确的问题,本文提出了多尺度特征融合的膨胀卷积残差网络高分一号影像道路提取方法。首先,通过目视解译的方法制作大量的道路提取标签数据;其次,在残差网络ResNet-101的各个残差块中引入膨胀卷积和多尺度特征感知模块,扩大特征点的感受野,避免特征图分辨率减小和道路边缘细节特征的损失;然后,通过叠加融合和上采样操作将各个尺寸的道路特征图进行融合,得到原始分辨率大小的特征图;最后,将特征图输入Sigmoid分类器中进行分类。实验结果表明:本文方法的提取精度优于经典全卷积神经网络模型,准确率达到了98%以上,有效保留了道路的完整性及其边缘的细节信息。
遥感 道路提取 高分一号影像 残差网络 膨胀卷积 多尺度特征 
激光与光电子学进展
2021, 58(2): 0228001
作者单位
摘要
1 中国科学院空天信息创新研究院数字地球重点实验室, 北京 100094
2 中国科学院大学电子电气与通信工程学院, 北京 100049
3 中国林业科学研究院资源信息研究所, 北京 100091
树种调查一直面临着成本高、效率低、精度不高等问题。利用遥感手段能大大提高树种类型调查的工作效率、节省成本;卷积神经网络(CNN)虽然已经在自然图像分类领域取得了许多突破,但是较少有人将CNN模型用于单木树种分类。基于上述考虑,搭建出CNN模型,并与高分遥感影像相结合,进行单木树种分类。在利用高分影像半自动化构建单木树种遥感影像样本集过程中,采用了影像冠层切片(CSI)圈定、人工标注、数据增强等方法;同时为了训练单木树种遥感影像样本集,对5个CNN模型进行针对性改写。通过对比分析发现:LeNet5_relu和AlexNet_mini都未取得最佳分类效果;GoogLeNet_mini56、ResNet_mini56和DenseNet_BC_mini56分别对不同的树种具有最佳分类效果;DenseNet_BC_mini56总体精度最高(94.14%),Kappa系数最高(0.90),是总体最佳分类模型。该研究证明了CNN在单木树种分类中的有效性,能为森林资源调查提供重要的解决方案。
图像处理 单木树种分类 卷积神经网络 高分遥感影像 深度学习 
激光与光电子学进展
2021, 58(2): 0228002
作者单位
摘要
陕西师范大学计算机科学学院, 陕西 西安 710119
针对环境背景复杂且包含小目标的遥感图像难以进行精准目标检测的问题,在单阶段检测(SSD)模型的基础上,提出了一种基于注意力和特征融合的单阶段目标检测模型,该模型主要由检测分支和注意力分支组成。首先,在检测分支SSD中加入注意力分支,注意力分支的全卷积网络通过逐像素回归得到待检测目标的位置特征;其次,采用对应元素相加的方法对检测分支和注意力分支进行特征融合,获得细节信息和语义信息更丰富的高质量特征图;最后,用软非极大值抑制(Soft-NMS)进行后处理,进一步提高目标检测的准确性。实验结果表明,本模型在UCAS-AOD和NWPU VHR-10数据集上的平均精度均值分别为92.52%和82.49%,相比其他模型,检测效率更高。
图像处理 遥感图像 注意力分支 特征融合 目标检测 
激光与光电子学进展
2021, 58(2): 0228003