期刊基本信息
创刊:
1964年 • 半月刊
名称:
激光与光电子学进展
英文:
Laser & Optoelectronics Progress
主管单位:
中国科学院
主办单位:
中科院上海光机所
出版单位:
中国激光杂志社
主编:
范滇元
执行主编:
邱建荣
副主编:
戴琼海 张龙 张雨东 曹良才
ISSN:
1006-4125
刊号:
CN 31-1690/TN
电话:
021-69918427
邮箱:
地址:
上海市嘉定区清河路390号
邮编:
201800
定价:
120元/期

本期栏目 2020, 57(4)

MORE

激光与光电子学进展 第57卷 第4期

作者单位
摘要
1 合肥工业大学仪器科学与光电工程学院, 安徽 合肥 230009
2 安徽建筑大学机械与电气工程学院, 安徽 合肥 230601
本文针对智能制造领域机器人视觉感知中的三维视觉成像技术进行综述,系统地总结了一些有代表性的机器人视觉成像方法的特点和实际应用中的局限性,内容涉及飞行时间三维成像、点线扫描三维成像、色散共焦成像、结构光投影三维成像、光学偏折成像、单目与多目立体视觉三维成像和光场成像等。绘制了各种视觉成像的图谱,并探讨了机器人手眼系统最佳三维成像方法。
机器视觉 三维成像 手眼系统 结构光投影 立体视觉 
激光与光电子学进展
2020, 57(4): 040001
作者单位
摘要
上海工程技术大学电子电气工程学院, 上海 201620
近年来,深度传感器和三维扫描仪的普及,使三维点云得到了快速发展。点云语义分割作为三维场景理解和分析的关键步骤,受到了研究者的广泛关注。深度学习具有优良的高层语义理解能力,基于深度学习的点云语义分割已成为当前研究的热点。首先,从语义分割的概念出发,简要叙述了点云语义分割的优势和现存的挑战;进而详细介绍了点云分割算法和常见的数据集,重点对点云语义分割领域中基于点排序、特征融合和图卷积神经网络的深度学习方法进行了综述;最后,分析了所述方法的定量结果,并展望了点云语义分割技术未来的发展趋势。
图像处理 三维点云 语义分割 深度学习 特征融合 图卷积神经网络 
激光与光电子学进展
2020, 57(4): 040002
王慧泉 1,2吴念 1赵喆 2韩广 1,2王金海 1,2,*
作者单位
摘要
1 天津工业大学生命科学学院, 天津 300387
2 天津市光电检测技术与系统重点实验室, 天津 300387
扩散光学层析成像(DOT)是一种利用近红外光来探测生物组织光学结构的低成本、无辐射损伤、成像深度深的在体光学功能性成像技术。由于生物组织体自身需满足强散射、低吸收以及成像空间分辨率高等需求,因此DOT重建的逆问题具有严重的病态特性。传统的逆问题解决办法主要是基于代数迭代的重建方法,随着人工智能的发展及大数据时代的到来,深度学习研究掀起了一个新高潮,基于深度学习网络模型的逆问题解决方法逐步被用于DOT重建过程中。通过梳理传统的DOT重建算法,重点综述了最新深度学习用于DOT重建的研究进展,旨在为本领域相关研究团队提供参考。
医用光学 扩散光学层析成像 逆问题 深度学习 
激光与光电子学进展
2020, 57(4): 040003
作者单位
摘要
暨南大学信息科学与技术学院, 广东 广州 510632
采用全搜索算法可以得到运动估计的最优解,但是算法实现需要大量的运算过程。基于此,介绍一种新三步法,通过在第一次搜索时增加内环搜索,并应用中止判别技术,可实现对静止块匹配的加速,快速完成搜索过程。本算法在保证一定精度的前提下减少了搜索次数,大大提高了搜索效率。同时通过对该算法的过程进行描述,对搜索模板等进行分析,采用硬件编程语言完成现场可编程门阵列的软核设计,使用工具软件完成功能仿真。结果表明,实现该算法共占用2177个FPGA逻辑单元和37112 bit块存储器,该软核可快速实现运动向量的获取,完成搜索过程。
图像处理 运动估计 块匹配 新三步法搜索 现场可编程门阵列 
激光与光电子学进展
2020, 57(4): 041001
作者单位
摘要
1 天津大学电气自动化与信息工程学院, 天津 300072
2 大连理工大学工业装备结构分析国家重点实验室, 辽宁 大连116024
提出了一种基于矢量分解和混沌随机相位掩模编码的光学非对称彩色图像加密方法。当输入图像是一幅实值图像时,矢量分解的引入使得第一块相位掩模也能作为密钥,进而使得加密系统成为非对称加密系统。用二维Henon混沌映射生成的两个混沌相位掩模替代双随机相位掩模,将混沌系统的初始值和控制参数作为密钥,增加密钥空间,为加密系统提供更多的安全性。对加密系统的密钥敏感性、图像相邻像素间的相关性、抗剪切攻击性、抗噪声攻击性、抗选择明文攻击性等进行测试,测试结果证明了所提加密系统的可行性和安全性。
图像处理 图像加密 矢量分解 Henon映射 混沌随机相位掩模 
激光与光电子学进展
2020, 57(4): 041002
作者单位
摘要
四川大学电气工程学院, 四川 成都 610065
对传统双边滤波器模型中的灰度标准差和滤波窗口进行改进。首先,用固定大小的正方形窗口通过概率分布函数和最大似然函数计算图中每个像素点的噪声标准差,将全图噪声标准差的中值作为阈值,若某像素点的噪声标准差大于该阈值,则认为该点的窗口内包含图像边缘,用半边旋转窗口法重新计算该点的噪声标准差和滤波窗口;然后,对图像中的每个像素点进行双边滤波,其中,灰度标准差设为该点噪声标准差的2倍;最后,根据区域相似度模型判定强噪声,并利用中值滤波器去除。实验证明,所提算法在不同强度的噪声下均可取得较好的保边滤波效果和强噪声去除效果。
图像处理 双边滤波 去噪 噪声标准差 半边旋转窗口 
激光与光电子学进展
2020, 57(4): 041003
作者单位
摘要
1 邵阳学院信息工程学院, 湖南 邵阳 422000
2 湖南第一师范学院信息科学与工程学院, 湖南 长沙 410205
提出一种基于二维经验模态分解(BEMD)的合成孔径雷达(SAR)目标识别方法。BEMD可以从原始SAR图像提取多层次的二维固态模函数(BIMF),它们可以更好地描述目标的细节信息,因此联合原始SAR图像及其多层次BIMF,可以为后续的分类决策提供更多有益信息。采用支持向量机(SVM)对原始SAR图像以及各个层次的BIMF进行决策,然后基于Bayesian理论对各个SVM输出的结果进行有效融合,从而获得更为稳健的识别结果。基于MSTAR数据集设置几种典型的实验条件,对本文方法进行性能测试,结果验证本文方法相比几类现有SAR目标识别方法更具有性能优势。
图像处理 合成孔径雷达 目标识别 二维经验模态分解 支持向量机 Bayesian决策融合 
激光与光电子学进展
2020, 57(4): 041004
作者单位
摘要
西北师范大学数学与统计学院, 甘肃 兰州 730070
针对现有的红外与可见光图像融合算法存在融合图像的对比度与清晰度降低和细节纹理信息丢失等问题,提出将鲁棒主成分分析(RPCA)、压缩感知(CS)和非下采样轮廓波变换(NSCT)相结合的融合算法。首先对两幅源图像分别进行预增强处理,应用RPCA分解得到相应的稀疏分量和低秩分量;然后对稀疏矩阵利用结构随机矩阵压缩采样,利用高斯梯度-信息反差对比度(GG-DCI)压缩融合,经正交匹配追踪法(OMP)重构;接着对低秩矩阵采用NSCT分解成低频子带和高频子带,低频子带选用区域能量-直觉模糊集(RE-IFS)融合,最高频子带利用最大绝对值规则融合,其他高频子带选用自适应高斯区域方差融合;最后将融合后的稀疏分量和低秩分量叠加得到融合图像。实验结果表明,本文算法相比其他算法能够更好地提高融合图像的对比度和清晰度,保留了丰富的细节纹理信息,客观评价指标也总体优于现有算法,有效提升了红外与可见光图像的融合效果。
图像处理 图像融合 鲁棒主成分分析 非下采样轮廓波变换 高斯梯度-信息反差对比度 区域能量-直觉模糊集 
激光与光电子学进展
2020, 57(4): 041005
作者单位
摘要
火箭军工程大学导弹工程学院, 陕西 西安 710025
在空基对地目标检测背景下,由于对地成像视角单一、目标尺寸随成像高度变化以及背景干扰复杂等,现有深度学习目标检测算法难以取得令人满意的效果。基于此,提出一种重点区域注意力学习机制,用于增强特征图的表达能力,同时缓解复杂背景特征的干扰问题。首先,建立重点区域注意力学习机制,使网络能选择性地关注和利用图像中的目标区域特征;其次,通过设计区域注意和目标检测相耦合的损失函数,实现区域注意损失和目标检测损失的同步优化;最后,利用空对地目标检测数据集进行实验。结果表明,所提算法能有效地关注和利用重点区域的特征信息,减小背景信息的干扰,提高空对地目标检测的精度和抗干扰能力。
图像处理 空对地目标检测 深度学习 背景特征干扰 小目标 重点区域注意力学习 
激光与光电子学进展
2020, 57(4): 041006
作者单位
摘要
河北工业大学人工智能与数据科学学院, 天津 300100
光学遥感图像目标检测一直都是遥感领域研究的热点之一,但现有的检测方法对背景复杂且尺寸较小的目标检测准确率不高。针对以上问题,提出了一种以Mask-RCNN为基础框架的目标检测方法。该算法以ResNet50为特征提取网络并在此基础之上利用特征重用技术来更好地提取目标的语义特征,且针对不同类型的飞机尺寸比例不固定等特点,设计了一组更加合适的候选框尺度集合。实验结果证明,该方法与以往常用的检测算法相比在小物体检测上拥有更高的检测精度。
图像处理 遥感图像 卷积神经网络 目标检测 Mask-RCNN算法 深度学习 
激光与光电子学进展
2020, 57(4): 041007
作者单位
摘要
1 闽南师范大学计算机学院, 福建 漳州 363000
2 闽南师范大学物理与信息工程学院, 福建 漳州 363000
针对最近点迭代算法(ICP)在大数据点云下配准效率低及对配准点云初始位置依赖性强的缺点,提出了一种基于快速点云粗配准与 ICP 算法相结合的方法。根据体素对原始点云进行下采样,结合法向量特征提取关键点,使用快速点特征直方图(FPFH)算法描述关键点;根据局部邻域内的关键点匹配对的向量夹角特性进一步对匹配点对进行精简;对精简后的关键点对集使用随机采样一致性算法(RANSAC)获取内点最多的变换参数,从而完成点云粗配准;最后在粗配准点云的基础上使用 ICP 算法完成精确配准。实验结果表明,本算法在高密集点云上的配准效率和精度均有所提高。
图像处理 体素 关键点 特征提取 点云配准 随机采样一致性算法 
激光与光电子学进展
2020, 57(4): 041008
作者单位
摘要
中国人民公安大学侦查与刑事科学技术学院, 北京 100038
刑事案件现场图作为刑事案件现勘记录的重要组成部分,在法庭科学领域中发挥着重要作用,然而在公安实战中,现场图绘制不规范的情况仍然时有发生。基于此,提出一种基于卷积神经网络的现场图自动分类方法,实现对全国公安机关现场勘验信息系统(简称为现勘系统)中现场图的自动分类核查。首先,利用现勘系统中现场图构建刑事案件现场图数据集,包括64098幅现场图和作为负类的27162张现场照片;然后,在AlexNet的基础上引入Inception结构,提出适用于现场图分类问题的卷积神经网络结构XCTNet;最后,多维度展现XCTNet的性能,并提取出分类错误的图像。实验结果表明:XCTNet在参数量仅为AlexNet的10%的条件下,在测试集上的准确度达到了98.65%,相比较AlexNet提升了3.78个百分点,但对自绘方位示意图的识别精度仍需要进一步提高。
图像处理 计算机视觉 现场图 卷积神经网络 
激光与光电子学进展
2020, 57(4): 041009
作者单位
摘要
新疆大学电气工程学院, 新疆 乌鲁木齐 830047
传统的卷积神经网络目标检测算法需要使用大量的数据来对网络参数进行训练,会花费大量的时间,并且森林火灾数据属于小样本数据。基于此,提出一种基于迁移学习的卷积神经网络森林火灾检测算法,该算法采用迁移学习的方法训练森林火灾检测网络模型。在建立的森林火灾数据集上进行实验,结果表明使用该算法进行森林火灾检测,准确率可达97%,具有准确率高、误报率低、检测时间短等优点,将其应用在森林火灾检测上具有一定的可行性。
图像处理 森林火灾检测 迁移学习 卷积神经网络 目标检测 
激光与光电子学进展
2020, 57(4): 041010
作者单位
摘要
1 江南大学轻工过程先进控制教育部重点实验室, 江苏 无锡 214122
2 无锡信捷电气股份有限公司, 江苏 无锡214122
针对卷积神经网络巨大的计算量和存储量导致其难以应用于嵌入式终端设备的难题,提出了一种基于灰色关联分析的模型裁剪方法。利用基于灰色关联分析的裁剪方法处理经过数据训练后的权重模型文件,获得每个卷积核重要性的量化表示;每次裁剪从模型中删除量化结果值最小的卷积核,从而减少计算量,加快推理速度;对于新产生的模型,通过迭代训练来弥补其性能上的损失。实验结果表明,相比APoZ法、L1法,所提方法在同一推理速度提升下精度提高了5.3%和10.4%,在VGG-16模型上取得了相对于初始模型2.7倍的加速效果,存储量压缩为原来的1/13.5。
图像处理 模型裁剪 深度学习 卷积神经网络 灰色关联分析 模型加速 
激光与光电子学进展
2020, 57(4): 041011
作者单位
摘要
陕西师范大学计算机科学学院, 陕西 西安 710119
针对深度卷积网络在遥感图像上存在小目标漏分、被遮挡目标无法提取、细节缺失等问题,在深度卷积编码-解码网络的基础上提出一种基于多级通道注意力的遥感图像分割方法(SISM-MLCA)。首先在网络编码阶段加入通道注意力机制,通过自我学习的方式获取更为有效的特征,解决遥感图像中目标遮挡问题;其次,在不同尺度上施加通道注意力的特征图融合,使网络提取到丰富的上下文信息,能应对目标尺度的变化,改善小目标难分割的问题。在两个数据集实验上的结果表明:SISM-MLCA具有更高的目标分割准确性,对小目标与被遮挡目标能取得更好的分割结果;在训练数据有限、背景复杂多样、尺度变化较大的遥感图像目标分割中取得了较好的结果,表明SISM-MLCA可应用于复杂的遥感图像目标分割中。
图像处理 神经网络 遥感图像分割 注意力机制 多尺度特征融合 
激光与光电子学进展
2020, 57(4): 041012
作者单位
摘要
1 上海海洋大学工程学院, 上海 210306
2 上海建桥学院机电学院, 上海 210306
3 上海市第六人民医院东院放射介入科, 上海 210306
在C-3D卷积神经网络模型基础上,提出了一种三维可变形卷积神经网络以实现肺结节的检测。在模型的主体结构上,采用了三维可变形卷积和三维可变形池化的操作,解决了传统的方块卷积与池化在应对不规则的肺结节时,无法高效率地收集到肺结节像素点的问题。在模型的输入上,通过调整三维卷积神经网络的输入,实现了卷积神经网络对样本图片的32×32×32像素逐步扫描和识别,在扫描识别的同时进行定位,解决了肺结节定位问题。在模型的输出上,借鉴了全卷积神经网络的思想,将C-3D网络的第一层全连接层改为卷积层,解决训练时内存会溢出的问题。在模型参数上,提出了三种不同学习率和三种优化函数进行精确的实验对比,绘制了不同学习率和优化函数的参数对比图,根据实验结果找到最优的卷积神经网络模型学习率和优化函数参数。对实验结果的分析表明,该方法在受试者工作曲线下面积、分类准确率、召回率、F1值均取得了显著的提高。
图像处理 可变形卷积神经网络 肺结节 池化层 
激光与光电子学进展
2020, 57(4): 041013
作者单位
摘要
中北大学大数据学院, 山西 太原 030051
为了解决基于深度学习的网格分割方法在训练分割分类器过程中时间消耗大的问题,提出了一种基于蚁狮优化的极限学习机的网格分割方法。利用蚁狮优化算法中蚂蚁种群受精英蚁狮与轮盘赌策略的双重影响,迭代更新蚂蚁种群,将蚁狮种群与蚂蚁种群进行降序全排列,取最优的N个更新蚁狮种群,采用最优蚁狮更新精英蚁狮,保持精英蚁狮为最优解,从而优化极限学习机随机生成的输入权值矩阵与隐层偏置。采用改进的极限学习机方法训练得到一个高精度的分割分类器。以普林斯顿数据集中的6类模型进行实验,结果表明,对于Airplane、Ant、Chair、Octopus、Teddy和Fish模型数据集中训练面片数目为200000~300000的模型,所提方法的训练耗时约为1000 s,且获得了较高的分割精确度,最高分割精确度可达99.49%。
图像处理 极限学习机 群体智能 蚁狮优化 网格分割 
激光与光电子学进展
2020, 57(4): 041014
作者单位
摘要
陕西师范大学计算机科学学院, 陕西 西安 710119
针对遥感图像目标密集、尺度不一、存在遮挡等特点,提出一种基于注意力机制的遥感图像分割模型用于目标分割。该模型建立在深度图像分割模型的基础上,提出在高低层特征融合之前采用通道注意力机制对低层特征进行加权处理,增强目标特征并抑制背景特征,提高信息的融合效率。为进一步增强模型对目标特征的响应能力,提出位置注意力机制对解码阶段最后的特征进行处理。最后,将加权融合后的特征图上采样到原图大小并预测像素类别。在两个遥感道路数据集上进行实验并与相关模型进行比较,结果表明所提模型在遥感影像道路提取中性能优异,可应用于复杂的遥感影像目标分割。
图像处理 神经网络 遥感图像 目标分割 注意力机制 
激光与光电子学进展
2020, 57(4): 041015
作者单位
摘要
1 兰州交通大学电子与信息工程学院, 甘肃 兰州 730070
2 兰州财经大学陇桥学院信息工程系, 甘肃 兰州 730101
为了提高复杂背景植物图像识别准确率,提出一种基于卷积神经网络(CNN)有效区域筛选的植物图像识别方法,该方法首先基于图像(花朵、叶片)数据集利用CNN训练一个有效区域筛选模型,使数据集通过该模型筛选后仍能保留花朵、叶片等有效区域;然后经过Mask R-CNN对植物图像数据集进行有效区域的提取,再用有效区域筛选模型筛选能表征植物图像类别的有效区域,接着将此类有效区域以4∶1的比例划分为训练集和测试集,然后送入GoogleNet进行训练,得到基于有效区域的CNN植物图像识别模型MRC-GoogleNet;最后通过该模型得出识别准确率。实验结果和数据表明,与经典CNN植物图像识别模型相比,基于有效区域筛选的识别模型能提取到更为有效的图像特征,有效地提高识别准确率。
图像处理 植物图像识别 复杂背景 卷积神经网络 有效区域筛选 Mask R-CNN 
激光与光电子学进展
2020, 57(4): 041016
王剑峰 1,*王宏伟 1,2,**闫学勤 1,***
作者单位
摘要
1 新疆大学电气工程学院, 新疆 乌鲁木齐830047
2 大连理工大学控制科学与工程学院, 辽宁 大连116024
现有基础矩阵鲁棒估计方法存在精度不高、准确性较低等不足,基于此,提出一种利用多核学习改进密度峰值聚类的基础矩阵估计方法。首先,针对密度峰值算法需要选取参数和无法自动聚类等不足,引入多核学习和γ分布图进行改进;其次,以对极距离为特征,通过多核学习-密度峰值算法剔除匹配数据集中的异常值,得到较优内点集;最后,使用M估计法消除定位噪声误差,对内点子集进行进一步优化处理,并估计最终的基础矩阵。利用INRIA Dataset数据集对所提方法进行验证分析。结果表明:在保证匹配点信息较多的前提下,所提方法提高了基础矩阵的计算精度和准确性。
图像处理 多核学习 密度峰值 γ分布图; 最优内点子集 
激光与光电子学进展
2020, 57(4): 041017
作者单位
摘要
陕西师范大学计算机科学学院, 陕西 西安 710119
传统图像分割方法主要依赖图像光谱、纹理等底层特征,容易受到图像中遮挡和阴影等的干扰。为此,提出一种基于卷积受限玻尔兹曼机的CV(Chan-Vest)图像分割模型,采用生成式模型——卷积受限玻尔兹曼机对目标形状建模并生成目标形状,以此为先验信息对CV模型能量函数增加目标全局形状特征约束,指导图像分割。在训练数据有限、目标形态各异、目标尺度变化较大的遥感影像数据集Satellite-2000和Vaihigen的目标分割中取得了理想的结果。
图像处理 图像分割 形状先验 卷积受限玻尔兹曼机 深度学习 CV模型 
激光与光电子学进展
2020, 57(4): 041018
作者单位
摘要
中北大学信息与通信工程学院, 山西 太原 030051
针对随机散斑图的非正交性所导致的计算鬼成像信噪比低的问题,提出一种基于正交化正弦散斑的计算鬼成像方法。该方法结合矩阵正交特性,将正交的两种倾斜正弦分布图案叠加,以调整频率上限的方式构建出正交化正弦散斑场,并对未知目标进行成像。数值仿真及实验结果表明,与基于高斯散斑图的计算鬼成像相比,本文方法重建的鬼像质量明显提高,其中峰值信噪比增加了4 dB~7 dB,且结构相似性提高了280%。
图像处理 鬼成像 正弦散斑 正交化 频率上限 
激光与光电子学进展
2020, 57(4): 041019
作者单位
摘要
江南大学物联网工程学院模式识别与计算智能工程实验室, 江苏 无锡 214122
针对当前图像显著性检测算法存在的边缘检测不清晰和内部不均匀的问题,提出一种基于无向权重图和多特征传播的图像显著性检测方法。首先以超像素为节点构建无向图,并改进边界超像素的连接方式。在改进图的基础上利用图像颜色、纹理特征与局部对比和中心先验等多种先验知识提取高层特征,并得到基于底层特征的显著图。其次,利用高层特征和显著物体的紧凑性分别计算基于前景和背景种子的显著图并将其融合。最后,将两阶段得到的显著图进行融合得到最终的显著图。在多个公开数据集上,将所提算法与近些年提出的10种算法进行对比实验,结果显示所提算法性能优于所有对比算法。
图像处理 显著性 局部对比 中心先验 紧凑性 
激光与光电子学进展
2020, 57(4): 041020
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
针对目标检测与图像分类任务的差别,以及大多数目标检测器过于依赖分类基础网络的问题,提出一种针对目标检测任务的基础网络。该网络包含初始模块、特征融合模块和混合下采样模块。初始模块能减少输入图片信息的丢失;特征融合模块通过拼接不同卷积层的输出,既能加强网络对不同尺寸目标检测的稳健性,又能对物体检测提供更多的上下文信息,有效提高了检测精确度;在网络的下采样部分引入混合下采样模块,平衡了基础网络对目标的分类和定位能力。实验结果表明,本网络模型在PASCAL VOC 2007和 PASCAL VOC 2012数据集上进行训练后,在PASCAL VOC 2007测试集上的平均精度均值可达81.0%,检测速度可达85 frame/s,本网络在精度和效率上都达到了很好的效果。
图像处理 目标检测 深度学习 基础网络 特征融合 
激光与光电子学进展
2020, 57(4): 041021
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
当前的一阶段回归网络可以通过多分支响应图的融合获得多级信息。然而,现有算法的响应图融合方法主要是基于简单的逐元素相加或相乘运算。基于此,提出一种新的跟踪模型,该模型集成了基于双线性卷积神经网络的新型响应图融合方法,可以获得响应图的位置关联和信息交互,利于更准确地跟踪目标物体。基于OTB2013基准数据库对本文算法进行测试,结果表明,与一流的跟踪算法相比,本文算法已经取得了比较有竞争力的结果。
机器视觉 目标跟踪 回归框架 响应图融合 双线性卷积神经网络 
激光与光电子学进展
2020, 57(4): 041501
作者单位
摘要
1 沈阳建筑大学信息与控制工程学院, 辽宁 沈阳 110168
2 沈阳理工大学自动化与电气工程学院, 辽宁 沈阳 110168
3 东北大学机械工程与自动化学院, 辽宁 沈阳 110168
针对计算机视觉中目标跟踪的问题,提出基于卷积神经网络(CNN)提取深度特征并与边缘特征进行自适应融合的策略来实现视频目标的跟踪算法。卷积神经网络的低层网络可以获取目标的一部分空间结构、形状等特征;高层网络可以获得相对比较抽象的部分语义信息。将VGG16神经网络中第2个卷积层Conv1-2、第4个卷积层Conv2-2和最后一个卷积层Conv5-3提取的深度特征与边缘特征进行特征的自适应融合来实现视频目标跟踪。在OTB100数据集中对本文算法进行实验验证与分析,结果表明,本文算法能够对目标实现更加准确的定位。
机器视觉 目标跟踪 边缘特征 卷积神经网络 特征融合 
激光与光电子学进展
2020, 57(4): 041502
作者单位
摘要
1 大连海事大学信息科学技术学院, 辽宁 大连 116026
2 大连海事大学船舶电气工程学院, 辽宁 大连 116026
针对当前基于单目视觉的室内移动机器人全局定位算法复杂度大等问题,提出一种室内移动机器人双目视觉全局定位方法。双目视觉下,为保证室内移动机器人在运动过程中能够保持稳定的特征提取,提出基于标定板的全局定位方案,以标定板的中心作为移动机器人的定位点。在此基础上,为提高定位的实时性,缩小标定板角点的提取范围,基于高斯混合模型背景减除法和形态学方法实现了对移动机器人运动区域的检测;基于所建立的标定板角点判据,对移动机器人提取的角点进行筛选,得到了标定板四个角点的图像坐标;结合双目相机标定后的内、外参数和全局定位数学模型,实现对移动机器人定位点坐标的计算。通过实验和分析验证了所提方法的可行性和有效性,为室内移动机器人全局视觉定位提供一种新的思路。
机器视觉 双目视觉 室内移动机器人 全局定位 运动区域检测 角点提取 
激光与光电子学进展
2020, 57(4): 041503
作者单位
摘要
哈尔滨工程大学信息与通信工程学院, 黑龙江 哈尔滨 150001
针对模型VDSR(very deep super resolution)中存在的忽略特征通道间的相互联系,不能充分利用各层特征,以及参数量过大,计算复杂度过高等问题,本文提出了一种基于残差通道注意力和多级特征融合的图像超分辨率重建网络结构,通过引入残差通道注意力,自适应校正信道的特征响应,提高了网络的表征能力。网络整体使用递归结构,在每个递归块内实现参数共享,减少了参数数量;多级特征融合的方式可以充分提取图像特征;用分组卷积代替传统卷积,进一步减少了参数数量,并降低了计算复杂度。所提算法在保证图像重建质量的同时,减少了模型的参数量并降低了计算复杂度,在图片放大4倍时,参数量和计算复杂度分别约为VDSR的0.33和0.02。
机器视觉 超分辨率 深度学习 递归结构 分组卷积 残差通道注意力 多级特征融合 
激光与光电子学进展
2020, 57(4): 041504
作者单位
摘要
1 河海大学物联网工程学院, 江苏 常州 213022
2 中国工程物理研究院流体物理研究所, 四川 绵阳 621900
针对目前大多数基于统计先验的图像盲去模糊方法对边缘和细节恢复能力有限的问题,提出一种新的盲去模糊算法。通过降采样对模糊图像进行金字塔分解。在每一层图像上,利用显著性强度先验提取图像的边缘信息,并结合梯度低秩先验抑制图像中的模糊和噪声干扰。在多尺度上由粗到精地交替迭代模糊核和中间潜像,得到最终的准确模糊核。采用非盲去卷积方法复原出清晰图像。此外,针对多尺度迭代时间较长的问题,提出了一种自适应迭代策略,通过评估估计模糊核的相似性来调整迭代次数,有效减少计算成本。实验结果表明,本文算法可以准确地估计出模糊核,有效地抑制噪声影响,且得到的复原图像中含有更丰富的边缘和细节等特征。
机器视觉 盲去模糊 显著性强度 低秩先验 自适应迭代 
激光与光电子学进展
2020, 57(4): 041505
刘玉珍 1张嘉蓉 1,*林森 1,2,3
作者单位
摘要
1 辽宁工程技术大学电子与信息工程学院, 辽宁 葫芦岛 125105
2 中国科学院沈阳自动化研究所机器人学国家重点实验室, 辽宁 沈阳 110016
3 中国科学院机器人与智能制造创新研究院, 辽宁 沈阳 110016
针对单目视觉估计曲面物体位姿时世界坐标不易获得的问题,将双目视觉与合作靶标相结合,提出一种高效的曲面物体位姿估计方法。通过双目相机生成不同位姿下的目标物体点云以便快速提取靶标角点的世界坐标,不同于常用的点云配准位姿估计,本文取对应点坐标差的均值表示平移向量;然后,求取靶标角点所在切面的法向量,组成目标在不同位姿坐标系下的矩阵,从而推导出旋转矩阵。所提方法不仅保证了位姿估计结果的准确性与稳定性,而且算法的运行效率显著提高。实验结果表明,本文方法的运行效率相比ICP算法提高了98.24%,比NDT算法提高了97.58%,具有实际应用价值。
机器视觉 双目视觉 位姿估计 曲面物体 合作靶标 
激光与光电子学进展
2020, 57(4): 041506
作者单位
摘要
1 中国民航大学航空工程学院, 天津 300300
2 天津大学精密测试技术及仪器国家重点实验室, 天津 300072
3 中国民航大学电子信息与自动化学院, 天津 300300
现有线阵CCD内参校准方法往往依赖于畸变参数模型,其标定精度受限于模型内部参数的相关性,因此为提高线阵CCD相机内参校准精度,提出一种采用非参数模型的线阵CCD相机内参校准方法。通过小孔成像模型和垂线法,构建线阵CCD相机成像的非参数模型,直接确定空间特征点与成像点间的映射关系以及理想成像点与实际成像点间的畸变量大小。采用重投影误差作为评价标准,与采用参数模型的内参校准方法作对比实验,实验结果表明,由所提方法得到的重投影误差的均方根、平均值和最大值分别为0.42,0.00,0.95 pixel,均小于由基于参数模型的内参校准方法得到的0.80,-0.10,2.47 pixel。
机器视觉 内参校准 线阵相机 非参数模型 重投影误差 
激光与光电子学进展
2020, 57(4): 041507
作者单位
摘要
江苏科技大学电子信息学院, 江苏 镇江 212000
为了减少目标跟踪过程中漂移情况的发生,提出一种基于高斯约束输出的上下文相关滤波跟踪算法。该方法通过假设跟踪目标的输出响应服从高斯分布,利用高斯分布的性质可以得出约束输出的具体表现形式;再利用约束输出和相关滤波知识可得到一个可迭代的滤波参数;根据设定的约束条件,对跟踪器中的滤波器进行选择性更新。采用OTB-2013评估基准中的50组视频序列验证了所提算法的有效性, 并与其他跟踪算法进行了对比。实验结果表明,所提算法的目标跟踪综合性能明显提升,并且相比于近年来的其他算法也有明显的优势。
机器视觉 目标跟踪 目标漂移 上下文感知 高斯约束输出 
激光与光电子学进展
2020, 57(4): 041508
作者单位
摘要
西安科技大学机械工程学院, 陕西 西安 710054
针对现有目标深度神经网络检测准确度低和实时性差的问题,提出一种面向无人机(UAV)飞控平台的实时道路目标深度神经网络检测方法。该方法结合了YOLOv2和YOLOv3网络的优点,针对YOLOv2检测准确度低、小目标难以检测和YOLOv3实时性差的现状,建立了将残差块引入Darknet-19网络同时采用多尺度特征进行目标检测的道路目标检测模型。提出采用回归(logistic)分类器进行目标类别的预测,以实现对重叠图像的多标签分类。实验结果表明,该方法对UAV飞控平台上分辨率为416 pixel×416 pixel视频图像的检测帧率在20 frames/s以上,平均准确度(mAP)达到82.29%,召回率达到86.7%,基本满足UAV飞控平台道路目标检测对准确性和实时性的要求。
无人机 目标检测 YOLOv2 YOLOv3 深度神经网络 
激光与光电子学进展
2020, 57(4): 041509
作者单位
摘要
天津大学精密测试技术与仪器国家重点实验室, 天津 300072
点云配准是基于RGB-D(RGB-depth)传感器的室内场景重建的关键技术之一。针对稀疏建图中关键帧间的点云配准问题,提出一种基于改进的随机采样一致性(RANSAC)的场景分类点云粗配准算法。首先分别利用几何信息与光度信息进行关键点的检测、描述与匹配,然后由场景分类算法判断场景类别,适应性地结合几何匹配与光度匹配,最后提出一种改进的RANSAC算法,通过有偏重的随机采样与自适应的假设评价,对关键帧间的变换矩阵进行估计。采用公开的RGB-D数据集对整体的点云粗配准算法进行实验验证,并与多种算法进行比较。实验结果表明,该点云粗配准算法能够实现稳健有效的变换矩阵估计,有助于后续的精配准与整体的室内场景重建。
机器视觉 点云配准 随机采样一致性 场景分类 RGB-D传感器 
激光与光电子学进展
2020, 57(4): 041510
陆正杰 1,**李纯辉 1耿国华 1,*周蓬勃 2[ ... ]刘洋 1
作者单位
摘要
1 西北大学信息科学与技术学院, 陕西 西安 710127
2 北京师范大学艺术与传媒学院, 北京 100875
传统三维模型分类方法因依赖文物碎片的整体形状特征,用于对破损严重、细节缺失、形状不规则的文物碎片分类时,时效差、成本高、准确率低。而文物碎片特征点周围的局部曲面深度信息与表面的规律性几何纹理可作为分类的判别特征。据此,提出了一种局部点云信息与显著性多特征描述子,通过提取文物碎片表面的规律性几何特征,并结合旋转投影特征,作为文物碎片的分类判别特征;然后提出相似度度量准则,根据每类特征的度量结果,自适应地计算两种特征的权重,实现分类。使用兵马俑碎片数据集进行实验,结果表明,该方法占用内存小、计算速度快。利用多倍交叉法对结果进行校验,准确率达到74.78%,相较于传统三维模型匹配方法提高了15.64%。
碎片点云分类 多特征描述子 旋转投影 体积积分不变量 
激光与光电子学进展
2020, 57(4): 041511
作者单位
摘要
华北理工大学电气工程学院, 河北 唐山 063210
针对核相关滤波算法中单一特征不能很好地适应跟踪过程中出现的复杂场景,以及算法无法解决目标尺度变化的问题,提出一种多特征融合的尺度自适应相关滤波跟踪算法。首先,在相关滤波算法的框架下,按照特征响应图的可信度来对快速方向梯度直方图 (FHOG)特征和局部二值模式(LBP)特征进行自适应加权融合,实现对目标的定位;其次,在尺度估计环节,利用尺度金字塔来估计目标的尺度大小,使算法对尺度发生变化的目标有很好的适应能力;最后,在OTB-50数据集上进行测试,将本文算法与其他5种跟踪方法进行对比,其精确率和成功率均有所提高,且具有较好的鲁棒性和稳定的跟踪性能。
机器视觉 相关滤波算法 特征融合 尺度自适应 尺度金字塔 
激光与光电子学进展
2020, 57(4): 041512
作者单位
摘要
安徽新华学院信息工程学院信息系统软件研究所, 安徽 合肥 230088
为提高人脸表情分类的识别率和实时性,提出一种基于卷积神经网络(CNN)局部特征融合的人脸表情识别方法。首先,构建CNN模型,学习眼睛、眉毛、嘴巴3个局部区域的局部特征;然后,将局部特征送入到支持向量机(SVM)多分类器中获取各类特征的后验概率;最后,通过粒子群寻优算法优化各特征的最优融合权值,实现正确率最优的决策级融合,完成表情分类。实验表明,本文方法在CK+和JAFFE数据库的平均识别率分别达到了94.56%和97.08%,与其他识别方法相比,本文方法性能优越,能提高算法的识别率和稳健性,同时保证了算法的实时性。
机器视觉 表情识别 卷积神经网络 决策融合 
激光与光电子学进展
2020, 57(4): 041513
作者单位
摘要
1 南京林业大学机械电子工程学院, 江苏 南京 210037
2 南通职业大学机械工程学院, 江苏 南通 226007
相机标定是机器人视觉系统中实现精确定位的重要前提,针对传统相机标定精度不高的问题,提出基于改进粒子群算法的相机标定优化方法。该方法以张正友标定方法获得相机内参初始值,在不同迭代阶段实现对惯性参数非线性自适应调整,以平衡局部和全局搜索能力;对社会和自身学习率采用不同迭代阶段正余弦变化的动态自调整策略,进一步提高全局搜索能力与后期搜索精度;在粒子群快要陷入局部最优时,采用驱散机制扩大粒子群所在空间范围,避免算法过早收敛。实验结果表明,所提相机标定方法与传统标定方法相比具有较高的精度和较好的可重复性。
机器视觉 相机标定 粒子群优化 内参 自适应调整 
激光与光电子学进展
2020, 57(4): 041514
作者单位
摘要
哈尔滨理工大学自动化学院, 黑龙江 哈尔滨 150080
Faster RCNN在小目标的检测方面准确度和鲁棒性性能不够理想。为此,提出一种改进Faster RCNN对马克杯缺陷进行检测,将Faster RCNN和特征金字塔网络(FPN)相结合,增加使用细节化的浅层特征,使其对小目标有更好的检测效果。分别使用改进前后的Faster RCNN在Caffe上进行仿真。结果表明,Faster RCNN检测马克杯缺陷的性能出色,但是遗漏了部分小目标;改进后的Faster RCNN对缺口和划痕缺陷的检测准确率最多提升2.485个百分点,并且在小目标识别方面也有更优异的表现。
机器视觉 深度学习 Faster RCNN 特征金字塔网络 缺陷检测 
激光与光电子学进展
2020, 57(4): 041515
王筝 1,2张飞 1,2,3,*张贤龙 1,2王一山 1,2
作者单位
摘要
1 新疆大学资源与环境科学学院智慧城市与环境建模自治区普通高校重点实验室, 新疆 乌鲁木齐 830046
2 新疆大学绿洲生态教育部重点实验室, 新疆 乌鲁木齐 830046
3 中亚地理信息开发利用国家测绘地理信息局工程技术研究中心, 新疆 乌鲁木齐 830046
针对由噪声引起的遥感影像质量下降,选用7种典型的滤波算子分别对遥感影像进行处理,并结合支持向量机(SVM)的分类方法,分析滤波后影像亮度值的变化,与未经过滤波处理的影像进行分类后精度的对比。结果表明:相对于未经处理的遥感影像,经过滤波处理后的影像在土壤盐渍化信息提取中具有较高的分类精度;其中的高斯高通滤波结合SVM的土壤盐分提取模型的分类精度和Kappa系数由86.7285%和82.21%分别提高到89.6950%和86.20%,其分类效果最佳。滤波运算能抑制噪声、提高影像质量,能有效提高方法的盐渍化监测能力。掌握土壤盐渍化的空间分布特征及时空变化规律,对干旱区及半干旱区土壤盐渍化的防治和缓解、保护脆弱的生态环境都具有现实意义。
遥感 盐渍化 图像分类 滤波 支持向量机 
激光与光电子学进展
2020, 57(4): 042801