期刊基本信息
创刊:
1964年 • 半月刊
名称:
激光与光电子学进展
英文:
Laser & Optoelectronics Progress
主管单位:
中国科学院
主办单位:
中科院上海光机所
出版单位:
中国激光杂志社
主编:
范滇元
执行主编:
邱建荣
副主编:
戴琼海 张龙 张雨东 曹良才
ISSN:
1006-4125
刊号:
CN 31-1690/TN
电话:
021-69918427
邮箱:
地址:
上海市嘉定区清河路390号
邮编:
201800
定价:
120元/期

本期栏目 2020, 57(18)

MORE

激光与光电子学进展 第57卷 第18期

作者单位
摘要
1 浙江大学光电科学与工程学院现代光学仪器国家重点实验室, 浙江 杭州 310027
2 山西大学极限光学协同创新中心, 山西 太原 030006
3 浙江大学宁波技术研究所, 浙江 宁波 315100
由于光学衍射极限的存在,一直以来常规光学显微镜的分辨率被限制在照明光波长的一半左右,这严重限制了生物、材料等研究领域对于更细微结构的观察。共聚焦显微成像技术作为最典型也是最早的点扫描显微技术,凭借其良好的光切片能力和高信噪比成为如今应用最为广泛的光学显微技术。然而由于共聚焦显微成像技术的截止频率有限,分辨率的提升也受到限制。移频技术是将更高频的信息移动到可观察的频率范围,从而提高点扫描显微技术的分辨率。详细介绍了点扫描移频超分辨成像技术的基本原理、优缺点,并对其进行了展望。
显微 点扫描 超分辨成像 移频 非线性 探测器阵列 
激光与光电子学进展
2020, 57(18): 180001
刘颖 1,2,3杨亚良 1,2,*岳献 1,2,3
作者单位
摘要
1 中国科学院自适应光学重点实验室, 四川 成都 610209
2 中国科学院光电技术研究所, 四川 成都 610209
3 中国科学院大学, 北京 100049
光学相干层析血管造影(OCTA)是一种无需注射染料和无创的新兴影像学检查方法,它能以极高的分辨率和灵敏度来显示眼底血管网络,其高达微米级的纵向分辨能力能够定位病变在视网膜和脉络膜中的原发位置。OCTA可以提供与当前金标准相当甚至更好的血管观察效果,尤其是在没有副作用的情况下重复检查。因此,自从OCTA技术问世后,就获得了快速发展,商用化产品已经在临床实践中获得了应用。为了帮助相关人员快速了解这一技术,本文对OCTA技术的原理方法、在眼科学中的应用、产品和临床使用现状、存在不足与展望等进行了介绍。
医用光学 光学相干层析血管造影术 光学相干层析成像术 血管造影术 眼底血管疾病 眼科光学与仪器 
激光与光电子学进展
2020, 57(18): 180002
作者单位
摘要
苏州大学功能纳米与软物质研究院,江苏 苏州 215123
随着光声成像技术和纳米材料的发展,多功能纳米探针的设计和制备在光声成像领域受到了广泛的关注。基于此,主要总结了近年来纳米光声探针在生物医学成像中的应用。根据纳米探针固有的理化性质,将其分成两大类:一类是具有强光吸收性能的光声成像探针,主要包括金基纳米探针、碳基纳米探针、金属硫/硒/碳化物、黑磷、有机小分子吲哚菁绿(ICG)及黑色素等,这类纳米探针通过高通透性和滞留(EPR)效应富集到肿瘤部位,固有的强光吸收性能有利于光声成像指引的光热治疗;另外一类是肿瘤微环境触发的光声成像探针,这些探针本身没有近红外吸收性能,经微环境的酸性pH值、内源双氧水(H2O2)或过表达的谷胱甘肽(GSH)激活后,探针具有很强的近红外吸收性能,实现了肿瘤的光声成像介导光学治疗。将光声成像和光学治疗相结合以实时监测肿瘤治疗效果,有利于推进纳米探针的诊疗一体化。
激光与光电子学进展
2020, 57(18): 180004
作者单位
摘要
1 中国科学院上海技术物理研究所中国科学院智能红外感知重点实验室, 上海 200083
2 中国科学院大学, 北京 100049
使用点源法可以严密检测调制传递函数(MTF),能够有效检验各个方向的MTF值,可用于空间探测相机在轨性能的监测。但点源图像存在噪声,利用传统滤波方法对其进行去噪处理,会存在检测精度不足甚至出现MTF曲线阶跃近似为0的现象,从而影响其对成像质量的评判。因此,根据点源图像光强分布的特点,提出一种基于平缓区均值的点源图去噪方法,并将该方法与传统滤波方法进行定量比较。仿真和实验结果表明:该方法将MTF曲线的检测率提高到90.91%以上,相比于传统滤波方法中效果最好的中值滤波,MTF的检测精度能提高98.73%,同时提高图像的峰值信噪比和结构相似度。
图像处理 图像去噪 点源图 调制传递函数 点源法 
激光与光电子学进展
2020, 57(18): 181001
作者单位
摘要
郑州大学机械工程学院, 河南 郑州 450000
为了能够快速、精确地检测出矩形,综合分析目前存在的矩形检测算法的优缺点,提出了一种快速、高精度的矩形检测算法。所提算法首先采用环形窗口将图像分割为多个感兴趣区域,再提取感兴趣区域的亚像素轮廓,并将亚像素轮廓分割为若干线段,然后利用模糊数学理论对线段的几何和物理特性进行融合计算,最终根据模糊融合得到的判决结果完成矩形的高精度检测和定位。实验结果表明:所提算法的检测速度是基于Hough变换的矩形检测算法的7.4倍,检测最大中心定位误差为(0.507 pixel,0.272 pixel);长度的平均误差为1.034 pixel,宽度的平均误差为1.310 pixel,倾角的平均误差为0.304°,并且能够准确地检测出矩形。所提算法满足工业应用中快速、高精度的要求,且有较强的稳定性。
图像处理 矩形检测 模糊融合 亚像素轮廓 机器视觉 
激光与光电子学进展
2020, 57(18): 181002
作者单位
摘要
西安理工大学机械与精密仪器工程学院,陕西 西安 710048
针对颜色衰减先验去雾算法存在的透射率估计不准确、整体颜色偏暗及去雾效果欠佳等问题,提出一种基于改进动态大气散射系数函数的图像去雾方法。首先,定义大气散射系数,其为一种图像景深与图像景深指数函数乘积形式的函数。其次,利用平均梯度和信息熵相结合的归一化综合评价参数(CEP)对随机选取的非均匀雾图像进行实验,确定动态大气散射系数函数的两个最佳参数分别为1.3和0.5。最后,借助天空区域透射率纠正算法来校正动态大气散射系数函数。实验结果表明,所提方法能够有效地解决原去雾算法存在的问题,从而进一步提升了图像去雾效果。
激光与光电子学进展
2020, 57(18): 181003
作者单位
摘要
重庆邮电大学自动化学院, 重庆 400065
针对现有方法在复杂云层和强杂波的干扰环境下的高虚警率或低检测率的问题,提出一种基于视觉特征融合的机载红外弱小目标检测方法。首先,利用Laplace算法对原始图像进行锐化处理,提取图像的轮廓边缘,并将其叠加到原始图像上,目的是增加真实目标与疑似目标的像素强度。然后,根据目标的梯度特征,采用局部多向梯度方法对处理后图像中的复杂背景和强杂波进行抑制。其次,根据图像的灰度差异特征,采用局部灰度差方法适当地增强目标。最后,将通过视觉特征信息获取的图像融合,突出目标的显著性,并对目标进行自适应阈值处理,实现目标的精准检测。实验结果表明,与其他方法相比,所提方法在信杂比、背景抑制因子及检测率指标上得到显著提升,且具有较低的虚警率。
图像处理 视觉特征 红外弱小目标 目标检测 局部多向梯度 局部灰度差 
激光与光电子学进展
2020, 57(18): 181004
作者单位
摘要
安徽大学电气工程与自动化学院, 安徽 合肥 230601
为了从目标图像上提高直线电机动子位置测量的精度、抗干扰性和实时性,引入了一种基于相关峰精确内插(FICP)的图像位移测量方法,并采用深度学习算法优选出具有强鲁棒性的栅栏图像。首先,控制栅栏条纹的宽度标准差和平均灰度梯度,生成一系列栅栏条纹图像。其次,结合线性调频Z变换和FICP算法计算相邻目标图像的位移值。然后,用位移估计值的均值误差作为评价指标,用深度神经网络建立栅栏图像质量优选模型,筛选出具有强鲁棒性的非周期栅栏图像。最后,利用线扫描相机获取运动过程中的一维栅栏图像信号,并根据棋盘标靶法确定系统的标定系数,得到实际位移值。仿真和实验结果表明,优选出的非周期栅栏图像能有效提高测量精度,证明了本方法的正确性。
位置检测 栅栏图像 图像处理 相关峰精确内插算法 深度神经网络 
激光与光电子学进展
2020, 57(18): 181005
作者单位
摘要
内蒙古科技大学信息工程学院, 内蒙古 包头 014010
交互行为的识别是机器视觉研究领域的热点和难点,针对其识别率低的问题,提出了一种融合深度图像边缘特征、RGB(Red, Green, Blue)图像纹理特征以及光流运动轨迹特征的识别算法。首先,采用Canny算子提取深度图像的边缘特征,采用局部二值模式算子提取RGB图像的纹理特征,采用光流直方图描述图像的动态特征;然后,将提取的边缘特征和纹理特征进行加权融合;最后,利用基于稀疏表示的空间金字塔匹配模型对静态融合特征和光流运动轨迹特征进行编码融合,对交互行为进行识别。基于MSR Action Pairs、SBU Kinect interaction、CAD-60数据集的实验结果表明,本算法的识别效果较好。
图像处理 交互行为识别 特征融合 稀疏编码 
激光与光电子学进展
2020, 57(18): 181006
邬可 1张宝华 1,*吕晓琪 2谷宇 1[ ... ]张明 1
作者单位
摘要
1 内蒙古科技大学信息工程学院, 内蒙古 包头 014010
2 内蒙古工业大学信息工程学院, 内蒙古 呼和浩特 010080
为解决现有基于深度学习的行人重识别算法中网络深度过深,网络层间的特征关系利用率、时间效率低等问题,提出了一种基于压缩激励残差网络(SE-ResNet)与特征融合的改进算法。通过引入压缩激励(SE)模块,在特征通道上对特征进行压缩和激励,然后重新对各通道分配权重,以增强有用特征通道,抑制无用特征通道,降低网络的深度;为提高识别精度和运算效率,将浅层特征与深层特征融合,删除部分特征提取模块,并对卷积核的大小与运行时间、识别精度的关系进行建模,寻找最佳平衡点。实验结果表明,相比ResNet50,本算法的Rank-1提高了4.26个百分点,平均精度均值提高了17.41个百分点。与其他经典算法相比,本算法的识别精度也有不同程度的提高,且鲁棒性较好。
行人重识别 压缩激励残差网络(SE-ResNet) 深度学习 智能交通 
激光与光电子学进展
2020, 57(18): 181007
作者单位
摘要
华南师范大学物理与电信工程学院, 广东 广州 510631
头部姿态估计广泛应用于多个领域,大多基于二维图像,而三维(3D)头部姿态估计与人脸三维重建结合的相关研究较少。利用重建的头部三维信息,可以为估计头部姿态提供更多有效的数据信息,能大大提高头部姿态估计的精确度和准确度。因此,将基于结构光三维重建和3D头部姿态估计相结合,重建人脸三维形貌并实现3D点云可视化。同时提出一种3D头部姿态估计算法,搜索鼻尖和鼻梁,建立空间直角坐标系和人脸本征坐标系,利用人脸的垂直对称性估计头部姿态欧拉角。利用模特人头进行实验,基于结构光三维重建的3D头部姿态估计算法的欧拉角在-25°~25°范围内均可测量,绝对误差的平均值和标准差均小于1°,测量平均值与真实值的线性相关度达99.8%。与基于二维图像的头部姿态估计相比,本文算法具有更高的准确度和鲁棒性。
图像处理 结构光 三维重建 人脸本征坐标系 三维头部姿态估计 
激光与光电子学进展
2020, 57(18): 181008
作者单位
摘要
成都理工大学信息科学与技术学院(网络安全学院), 四川 成都 610051
近几年虽然基于神经网络的超分辨率重建技术发展迅速,但仍然存在不易找到合适尺寸的卷积核、网络层数过深导致收敛缓慢等缺点。为此,提出了一种能多尺度提取特征并包含多重残差的网络模型。低分辨率图像输入网络,通过多个多尺度残差模块,在每个模块进行多尺度特征提取、特征融合,构建残差输出到下一个模块,通过所有模块后再次构建残差,最终经过亚像素卷积输出高分辨率图像。实验结果表明,多重残差的引入使学习的收敛速度更快,多尺度能更好地提取图像特征,使图像在主观和客观度量上都优于其他主流算法。
图像处理 超分辨率 神经网络 多尺度特征 多重残差网络 
激光与光电子学进展
2020, 57(18): 181009
作者单位
摘要
西安邮电大学通信与信息工程学院, 陕西 西安 710121
核可能性C-均值(KPCM)聚类算法将核方法引入可能性聚类中,使其对超球体、含噪声和奇异点的数据能进行有效聚类,但存在可能性聚类的中心重合问题。因此,将β-截集引入KPCM聚类算法中,通过产生聚类核修改部分样本数据的典型值,以改善类间关系。同时,提出了一种基于截集门限的核可能性C-均值(C-KPCM)聚类算法,克服了KPCM聚类算法一致性聚类的缺陷。结合图像的非局部空间信息,利用自适应中值滤波算法可自适应调节滤波半径的特性,产生新的模糊因子,并将其加入C-KPCM聚类算法的目标函数中,提出了基于非局部空间信息的核可能性C-均值聚类算法,增加了强噪声干扰下聚类算法的鲁棒性,仿真结果验证了本算法有效性。
核可能性C-均值聚类算法 截集门限 核空间 非局部均值滤波 
激光与光电子学进展
2020, 57(18): 181010
作者单位
摘要
1 太原理工大学电气与动力工程学院电力系统运行与控制山西省重点实验室, 山西 太原 030024
2 华北电力大学电气与电子工程学院, 北京 102206
基于BOF(Bag of features)图像检索算法对电气设备图像进行分类,首先,通过加速鲁棒特征(SURF)算法寻找特征点位置,构造高维特征描述算子对特征进行描述和统计。然后,利用K-means聚类算法处理特征描述算子,得到独立的视觉词汇并汇总为特定数目的码书。将码书中的特征描述算子进行量化和加权统计,用特征向量直方图表示整个图像。最后,用训练集图像的高维特征向量进行机器学习,对未知图像进行快速准确分类。将自然光条件下拍摄的电气设备图像和电气设备工作状态下的红外图像作为两个实验样本集进行分类测试,结果表明,该算法可对不同图像集实现快速准确分类,准确率可达95.59%。
机器视觉 图像分类 图像检索 特征量化 特征聚类 
激光与光电子学进展
2020, 57(18): 181011
作者单位
摘要
安徽大学电气工程与自动化学院, 安徽 合肥 230601
数字图像相关(DIC)法中初值选取的好坏对图像亚像素位移的搜索效率、算法的收敛速度有着很大的影响。提出了一种基于KAZE特征匹配的数字图像相关法,即KAZE算法。KAZE算法与传统的特征检测算法的区别在于其是通过建立非线性尺度空间来消除噪声与提取特征点,可以有效地避免边界模糊和细节丢失。通过KAZE算法匹配出图像变形前后特征点对坐标,使用仿射变换估计初始变形参数;使用反向组合高斯牛顿法对估计初值进行迭代优化。结果表明,在不损失精度的情况下,该方法相对于传统方法具有更高的搜索效率。
图像处理 数字图像相关 光学测量 反向组合高斯牛顿法 特征匹配 KAZE算法 
激光与光电子学进展
2020, 57(18): 181012
作者单位
摘要
1 昆明理工大学国土资源工程学院, 云南 昆明 650093
2 云南省高校高原山区空间信息测绘技术应用工程研究中心, 云南 昆明 650093
3 云南省国防科技工业局综合研究所, 云南 昆明 650200
为了提高国产合成孔径雷达(SAR)和光学图像的融合性能,采用高分一号、高分二号多光谱图像,高分三号SAR 聚束模式和精细化条带1模式图像,利用变换域和空间域两种不同的融合思想,提出一种非下采样剪切波变换(NSST)方法结合IHS(intensity-hue-saturation)变换和区域性改进脉冲耦合神经网络(PCNN)方法的融合算法(IHS_NSST)。该算法首先对多光谱图像进行IHS变换;其次在NSST分解的子带上,引用区域性的思想,对低频成分采用区域能量平均方法,对高频成分采用改进拉普拉斯能量和(SML)激励的PCNN方法;最终从定性和定量两个方面进行评价,并将所提算法与多种融合方法作比较。结果表明:基于区域性IHS_NSST的融合方法在高分SAR和光学图像融合上有较大的优势;采用该方法大大提升了融合性能,有效减小了光谱失真,较好地保持空间特征信息,提高了国产高分SAR和光学图像的可利用程度。
图像处理 图像融合 国产高分卫星 非下采样剪切波变换 脉冲耦合神经网络 
激光与光电子学进展
2020, 57(18): 181013
作者单位
摘要
1 西安财经大学管理学院, 陕西 西安 710100
2 空军工程大学航空工程学院, 陕西 西安 710038
针对目前单幅雾霾图像复原算法使用单一先验而产生先验盲区的问题,提出一种使用多先验约束的雾霾图像复原算法。首先,提出饱和度先验,使用定义的调节系数简化粗略传递图的求解过程;其次,在马尔科夫随机场模型中,使用颜色衰减先验进行约束并优化调节系数,求解得到精确传递图;接着,利用明暗像素先验得到精准的大气光;最后复原无雾图像。实验结果表明,其他算法与所提算法相比,有效细节强度分别降低了24.9%,51.4%,41.5%,39.3%,色调还原度分别降低了21.4%,24.8%,24.1%,29.5%,由此可知使用所提算法复原图像,图像中的有效细节信息丰富,色调自然,具有较强的适用性。
图像处理 图像复原 饱和度先验 颜色衰减先验 明暗像素先验 
激光与光电子学进展
2020, 57(18): 181014
作者单位
摘要
重庆邮电大学通信与信息工程学院, 重庆 400065
在汽车主动安全性能的研究背景下,对目标检测算法Faster R-CNN(Faster Region-Convolutional Neural Networks)进行改进,并将其应用于交通标志的检测。为此,提出一种多尺度卷积核的ResNeXt模型来设计检测算法的基础网络,并在此基础上采用多维特征融合的策略来满足交通标志小目标检测的需求。针对Faster R-CNN中的区域建议网络(RPN),通过拟合交通标志特征来设计锚框以获取更好的推荐区域,从而进一步降低误检率与漏检率。在TT100K数据集中的实验结果表明,改进后的算法在小目标、多目标和复杂背景等的条件下,交通标志的检测效果优异,平均精度达到了90.83%。
图像处理 交通标志检测 卷积神经网络 卷积核 多维特征融合 锚框 
激光与光电子学进展
2020, 57(18): 181015
作者单位
摘要
苏州大学计算机科学与技术学院, 江苏 苏州 215000
现有的基于卷积神经网络的边缘检测算法,通常可以给出图像中每个像素为边缘的概率,即边缘概率图。针对边缘概率图细化后边缘存在丢失、间断等问题,提出一种基于梯度掩模滤波的边缘细化算法。为了获得高梯度掩模和低梯度掩模,引入基于Canny边缘检测算法的双阈值方法。对于高梯度掩模滤波后的边缘概率图进行增强,并对低梯度掩膜滤波后的边缘概率图进行削弱。最后,对边缘概率图进行非极大值抑制,得到二值的边缘图。实验结果表明,所提的边缘细化算法具有更多的连续边缘,并且更符合单边缘响应准则。
图像处理 边缘检测 边缘细化 梯度掩模 梯度滤波 双阈值法 非极大值抑制 
激光与光电子学进展
2020, 57(18): 181016
作者单位
摘要
1 西安工程大学电子信息学院, 陕西 西安 710048
2 陕西学前师范学院信息工程学院, 陕西 西安 710100
在人机协作缝纫中,实现人机交流互动的前提是机器人对工人的缝纫手势的检测与理解。针对传统算法手势识别率低、小目标手势检测效果差的问题,提出一种基于改进单发检测(SSD)模型的缝纫手势识别方法。首先引入更深的Resnet50残差网络替换原始SSD模型中的VGG16基础网络,改善网络特征提取能力。然后采用基于特征金字塔(FPN)的网络结构进行高低层特征融合,进一步提高了检测精度。实验结果表明,在构建的缝纫手势数据集中,通过对比原始SSD算法及其他算法,发现改进模型的检测精度显著提升;网络中残差连接在提高精度的同时并没有增加模型的参数和复杂程度,每幅图片的平均检测速度为52 frame/s,完全满足缝纫手势的实时检测。
图像处理 缝纫手势 目标检测 SSD 人机协作 特征金字塔 
激光与光电子学进展
2020, 57(18): 181017
作者单位
摘要
江南大学物联网工程学院, 江苏 无锡 214122
针对普通生成模型生成的图片存在细节缺乏、图片模糊等问题,结合变分自编码器(VAE)强大的特征提取能力,使用条件生成对抗网络(CGAN)生成了高质量照片,结果表明,利用该方法基于CUHK student人脸库生成照片,照片的相似性度提高了0.09,达到了0.77。同时在实际应用中,手绘素描由于画家的不同而风格迥异,在训练素描-照片生成过程中使用同一风格的素描会使得输入图像单一。为避免这一问题,通过使用多种素描样式扩展训练数据集,提高了模型通用性,结果表明,相比于未扩展训练集,基于扩展训练集生成的照片的相似性度提高了0.233,达到了0.603。
图像处理 变分自编码器 条件生成对抗网络 素描 
激光与光电子学进展
2020, 57(18): 181018
作者单位
摘要
河北工业大学人工智能与数据科学学院, 天津 300401
针对PointNet模型只针对孤立点提取特征信息,而对邻域结构的信息提取能力不足的问题,提出基于图卷积网络的三维点云分类分割模型GraphPNet。首先将三维点云转换成无向图结构,利用该图结构得到点云的邻域信息,通过将邻域信息与单个点信息融合的方式提高分类与分割的准确率。在分类实验中,本文在ModelNet40数据集上进行训练与测试,并且与3D ShapeNets、VoxNet、PointNet模型的分类精度进行比较,其分类精度优于这些模型。在分割实验中,使用ShapeNet数据集进行训练与测试,并且与PointNet模型等分割模型得到的平均交并比(mIoU)值进行比较,验证了GraphPNet在分割实验中的有效性。
图像处理 分类与分割 深度学习 PointNet 图卷积网络 
激光与光电子学进展
2020, 57(18): 181019
作者单位
摘要
江西理工大学电气工程与自动化学院, 江西 赣州 341000
针对皮肤病变图像分割问题,提出了一种基于多尺度密集块网络(DenseNet)的皮肤病变图像分割算法。首先依次采用形态学闭操作和非锐化滤波器对原始皮肤病变图像进行预处理,得到不含皮肤毛发和血管伪影的细化图像。然后将预处理后的图像输入到分割网络中。该网络基于编码-解码(Encoder-Decoder)架构,运用并行多分支结构和金字塔池化模型两种多尺度特征融合方法,可实现不同感受野下的特征提取。同时,将DenseNet结构融合到编码器中,实现图像特征的复用,利用目标损失与内容损失相结合的LTotal损失函数,进一步提升了图像分割的精度。最后,通过SoftMax分类器得到分割结果并计算相关评估指数。ISBI 2016皮肤病变图像数据集上的实验结果显示,所提算法的逐像素分割精度为95.48%,Dice系数为96.37%,Jaccard指数为93.41%,灵敏度为92.93%,特异性为96.49%,总体性能优于现有算法。所提算法可精确分割皮肤病变区域,能够应用于黑色素瘤计算机辅助诊断系统。
图像处理 图像分割 多尺度特征 深度学习 密集块网络 金字塔池化模型 
激光与光电子学进展
2020, 57(18): 181020
作者单位
摘要
1 西安邮电大学通信与信息工程学院, 陕西 西安 710121
2 西安邮电大学电子工程学院, 陕西 西安 710121
3 西安邮电大学理学院, 陕西 西安 710121
利用图像质量评价算法评价彩色图像时,往往会导致彩色图像色彩信息的损失和整体性的破坏,进而使得评价结果与主观评价结果不一致。由于图像越模糊其包含的高频分量越少,基于四元数傅里叶变换,提出了一种无参考彩色图像质量评价算法。首先,利用四元数矩阵表征彩色图像并对其进行四元数傅里叶变换,得到了彩色图像傅里叶变换的频谱。其次,求出高频分量的阈值。最后,利用频谱中大于阈值的像素数目来对彩色图像质量进行评价。实验结果表明,预测结果具有较好的准确性和单调性,且与人的主观评价结果较匹配。所提算法具有较好的抗噪性,计算复杂度较低,总体性能好于现有算法。
图像处理 图像质量评价 四元数傅里叶变换 彩色图像 高频分量的阈值 
激光与光电子学进展
2020, 57(18): 181021
作者单位
摘要
湘潭大学信息工程学院, 湖南 湘潭 411105
提出一种采用深度卷积神经网络模型对七类病变皮肤镜图像进行分类的方法。使用数据增强方法扩增训练集,提出一种基于ResNet50模型和多分类Focal Loss函数的多分类模型(FL-ResNet50模型),实现皮肤镜图像的多分类。实验结果表明,FL-ResNet50模型的微平均F1值为0.88,优于传统的ResNet50模型。所提方法实现了对七类皮肤镜图像的分类,将图像预处理、特征提取及预测模型学习形成一个完整连续的系统模型,提高了分类性能和效率,具有重要的应用价值。
图像处理 卷积神经网络 皮肤镜图像 图像分类 样本不平衡 数据增强 损失函数 
激光与光电子学进展
2020, 57(18): 181022
作者单位
摘要
西北师范大学物理与电子工程学院, 甘肃 兰州 730070
针对基于模板匹配的目标跟踪算法在目标被遮挡时容易出现跟踪丢失的问题,提出一种改进的结合遮挡判断和Kalman预测器的模板匹配算法。首先使用三帧差分法提取运动目标并计算运动目标区域。然后针对目标是否被遮挡引入Bhattacharyya距离进行判断,当Bhattacharyya距离小于设定的阈值,表明目标没有被遮挡,则使用归一化互相关(NCC)匹配算法对目标进行稳定跟踪,反之则利用Kalman预测器对被遮挡目标的位置和大小进行预测。实验结果表明,所提算法在静态背景下、目标发生遮挡时的跟踪成功率达到71.43%,比单一NCC匹配算法提高了21.43个百分点。
图像处理 目标跟踪 三帧差分法 Bhattacharyya距离 归一化互相关匹配算法 Kalman预测器 
激光与光电子学进展
2020, 57(18): 181023
作者单位
摘要
江南大学物联网工程学院轻工过程先进控制教育部重点实验室, 江苏 无锡 214122
两阶段算法是指第一阶段用一个分类算法,选取距离测试样本近的M类训练样本,第二阶段再用这M类训练样本作为新的训练样本集进行识别。为了加快识别速度,提出一种全新的快速选取M类训练样本的算法。首先,利用k均值聚类算法对训练样本进行处理,把训练样本之间比较近的样本聚合成一个大类,对于一个新的测试样本,只需要计算各大类聚类中心间的距离,选取距离近的若干个大类,每个大类包含若干个原始训练样本的类别,将这些类别的所有训练样本组合起来,构成新的训练样本集,最后利用新的训练样本集,进行第二阶段的识别。在不同的人脸数据库上进行实验验证,结果表明本文算法在识别率略有提高的基础上,可以达到更快的识别速度。
图像处理 稀疏表示 k均值聚类算法 两阶段算法 人脸识别 
激光与光电子学进展
2020, 57(18): 181024
金潓 1,2李新阳 1,*
作者单位
摘要
1 中国科学院光电技术研究所自适应光学重点实验室, 成都 四川 610209
2 中国科学院大学, 北京 100049
目标的特征表达是目标跟踪过程的关键,人工特征相对简单,实时性强,但表征能力不足,在处理快速变化和目标遮挡相关问题时,容易产生跟踪漂移。深度神经网络(DNN)在目标检测和识别任务中的强特征表达能力,使DNN逐渐成为特征提取工具。采用更深层的残差神经网络(ResNet)替代VGG-19网络作为特征提取工具,首先将ResNet-50中的特殊附加层结构和卷积层特征进行融合,得到鲁棒性更强的目标表征特征。然后对特征进行相关滤波操作,根据最大响应值确定目标位置。最后,为扩展算法在局部目标跟踪领域的应用场景,采用基于图形的视觉显著性检测算法提高局部目标的权重值,抑制背景信息,以提升特征层的目标表征能力。
目标跟踪 残差神经网络 特征融合 基于图形的视觉显著性检测算法 
激光与光电子学进展
2020, 57(18): 181025
作者单位
摘要
西安工程大学管理学院, 陕西 西安 710048
为解决挡车工表情因受光照不足、遮挡等问题而导致识别精度过低的问题,构建了一种基于迁移学习的卷积神经网络模型。该模型通过对纱线质量指标的分析,确定了挡车工表情的分类标准,建立了挡车工表情数据集,同时对数据集进行直方图均衡化、Rudin-Osher-Fatemi(ROF)去噪、人脸校正等预处理。在截取挡车工实时眼部数据的基础上,利用迁移学习方法对挡车工表情识别模型进行训练。最后,通过实验验证,结果表明构建的挡车工表情识别模型的识别精度高达98%,有效地解决了因受光照、遮挡等问题而导致挡车工表情无法识别的问题。
图像处理 表情识别 挡车工 眼部数据 
激光与光电子学进展
2020, 57(18): 181026
作者单位
摘要
太原科技大学电子信息工程学院, 山西 太原 030024
散焦结合相关性评价算法是利用四维光场的空间信息和角度信息来完成深度估计,该算法建立的散焦响应函数存在求取二阶导方向有限且二阶导求和能量正负相互抵消的问题,这限制了其在复杂场景中的深度重建精度。针对该问题,对散焦响应函数进行了改进,提出基于能量增强散焦响应的光场深度估计算法。该算法充分考虑了周边像素点对当前位置散焦度的影响,通过增加具有权重差异的二阶导个数和方向来实现散焦响应的能量增强。通过实验验证了所提方法的有效性。针对一些边缘复杂的光场图像,所提算法获取的深度图视觉效果更好;与散焦评价结合相关性评价算法相比,改进算法获得深度图像的均方根误差平均减小3.95%。
图像处理 深度估计 光场 散焦 相关性 能量增强 
激光与光电子学进展
2020, 57(18): 181027
作者单位
摘要
桂林电子科技大学广西制造系统与先进制造技术重点实验, 广西 桂林 541000
针对激光散斑干涉图像在局部高密度噪声和拉线区域中,最小二乘解包裹算法存在过度平滑、迭代次数多和运行时间长等问题,提出一种新的算法。该算法基于散斑干涉图像近似服从周期性的抛物线分布的规律,首先采用两次矩阵变换,对噪声所在的坐标点进行锁定;继而利用掩模技术并结合二维离散余弦变换和Picard迭代方法,对噪声的传播进行抑制,从而获得平滑的图像。实验结果表明:激光散斑干涉测量对局部高密度噪声很敏感,经过平滑优化后,所提算法较传统最小二乘迭代算法具有更少的迭代次数和更短的计算时间,对单根拉线、单个噪声和变形干扰下的干涉测量的识别率高达96%,精度优于传统算法,具有很高的工程应用价值。
成像系统 激光散斑干涉测量 高斯赛德尔迭代 松弛迭代 Picard迭代 高密度区域 
激光与光电子学进展
2020, 57(18): 181101
作者单位
摘要
1 内蒙古科技大学信息工程学院, 内蒙古 包头 014010
2 内蒙古工业大学信息工程学院, 内蒙古 呼和浩特 010051
针对传统跟踪算法在复杂场景下抗遮挡能力和鲁棒性差的问题,提出一种基于深度特征自适应融合的运动目标跟踪算法。考虑到深层特征强鲁棒性和浅层特征高精度的优点,首先利用稀疏自编码器构建深度稀疏特征以提取目标特征,再根据相邻帧之间的关联信息和跟踪置信度对深度特征和纹理信息进行自适应融合以提高跟踪器的性能。为了提高跟踪算法鲁棒性的同时抑制跟踪漂移,当置信度低于设定阈值时,引入改进SURF算法对目标进行定位。实验结果表明:与主流跟踪算法相比,所提算法的跟踪精度高,在遮挡场景中具有良好的鲁棒性,并且能够有效抑制跟踪漂移。
机器视觉 目标跟踪 自适应特征融合 深度稀疏神经网络 自编码 
激光与光电子学进展
2020, 57(18): 181501
作者单位
摘要
上海海洋大学工程学院, 上海 201306
由于受到水面的高反光性和波纹等边缘特征的影响,传统的水面目标识别算法不能很好地识别出目标。为此,提出基于深度学习的水面目标识别算法。首先采集大量的目标样本并对其进行标注,然后根据YOLOv3(You Only Look Once v3)算法的原理对算法的参数和网络结构进行优化,随后采用深度卷积神经网络的方法对目标样本进行训练。采用对目标样本进行数据增强的方式以适应不同环境进而提升算法的鲁棒性,采用相位相关性水岸线识别算法来提高识别速度。最后使用所提算法的网络结构训练所得的权重文件建立水面目标识别系统,该系统可以达到较高的识别率。实验结果验证所提算法的有效性和鲁棒性,对水面目标识别的后续研究有一定的参考价值。
机器视觉 深度学习 目标识别 数据增强 YOLOv3 
激光与光电子学进展
2020, 57(18): 181502
作者单位
摘要
江苏大学汽车与交通工程学院, 江苏 镇江 212013
针对现有的基于车道线宽度的测距方法在弯道时的测距误差,提出一种基于车道线斜率的弯道处车道线横向宽度的估计方法,并推导出基于车道线横向宽度的改进测距模型。随后在同心圆车道线模型下,对现有方法和所提方法的测距误差进行对比,所提方法的测距精度得到明显提高。当车道线曲率为0.01时,在真实距离为50 m内,所提方法的测距误差小于3%;当曲率小于0.005时,在真实距离为100 m内,所提方法的测距误差小于1%。最后基于KITTI数据集验证所提方法在实际道路环境下的测距效果,结果显示,所提方法的平均测距误差在5%以内,显著提高了弯道处的测距精度。
机器视觉 车辆测距 单目视觉 车道线 先进驾驶辅助系统 
激光与光电子学进展
2020, 57(18): 181503
颜贝 1,2,*张礼 1,2张建林 1,2徐智勇 1,2
作者单位
摘要
1 中国科学院光电技术研究所, 四川 成都 610209
2 中国科学院大学, 北京 100049
生成对抗网络(GAN)是解决图像数据获取困难的有效方法,但GAN在训练时难以稳定,生成的图像质量较差。基于此,提出了一种基于残差结构的改进深度卷积GAN图像生成方法。采用残差结构加深网络并结合图像标签信息,以获取真实图像样本的深层次特征,在判别器模型中引入谱约束,提高网络的训练稳定性,从而实现图像数据的有效生成。实验表明,所提方法在生成图像的视觉效果和客观评价上具有更优异的表现。
机器视觉 深度学习 残差结构 生成对抗网络 图像生成 
激光与光电子学进展
2020, 57(18): 181504
作者单位
摘要
大连海事大学信息科学技术学院, 辽宁 大连 116026
肺炎是一种严重威胁人类健康的疾病,及时、准确地检测出肺炎可以尽早帮助患者接受治疗。因此,提出了一种基于YOLOv3改进的Multi branch YOLO检测算法。用多分枝膨胀卷积输出的特征代替YOLOv3中不同层级的特征进行检测,在多分枝卷积神经网络中引入Boosting思想,并使用最大化熵方法优化网络。将每个卷积分枝视为一个弱分类器,通过最大化熵方法使每个分枝学习到相近的检测能力,避免多分枝卷积模型退化成单分枝卷积模型。基于北美放射学会提供的肺部X射线影像进行实验,结果表明,该算法在实验数据集上的检测准确率高于其他目标检测算法。
目标检测 肺炎检测 医学图像 卷积神经网络 
激光与光电子学进展
2020, 57(18): 181505
作者单位
摘要
江南大学江苏省模式识别与计算智能工程实验室, 江苏 无锡 214122
针对传统的双流网络不能有效提取视频序列中的有效帧和帧中的有效区域,而导致识别准确率低的问题,提出了一种基于时空交互注意力模型(STIAM)的人体行为识别算法。首先,利用两个不同的深度学习网络分别提取空间和时间特征;其次,设计一种掩模引导的空间注意力模型,用于计算每一帧上的显著性位置;然后,设计一种光流引导的时间注意力模型,用于定位每个视频中的显著性帧;最后,分别将时间、空间注意力获得的权重与空间特征、时间特征进行加权融合,使模型实现时空交互性。在UCF101和Penn Action数据集上与现有的方法进行比较,实验结果表明,STIAM具有较好的特征提取能力,可以明显提升行为识别的精度。
机器视觉 行为识别 双流网络 注意力 深度学习 交互性 
激光与光电子学进展
2020, 57(18): 181506
作者单位
摘要
兰州交通大学电子与信息工程学院, 甘肃 兰州 730070
针对经典的函数映射方法存在描述符特征单一、映射矩阵约束不强的问题,构建了一种数据驱动强正则化函数映射方法,用于计算三维模型的对应关系。首先,通过前向传播将源模型和目标模型的方向直方图签名(SHOT) 特征描述符输入残差网络进行训练,获得增强的SHOT特征描述符;然后,用基于函数映射的几何约束代替标签;最后,通过反向传播优化描述符的训练过程,实现了无监督数据驱动函数映射对应关系的计算。在FAUST数据集上的实验结果表明,本方法不仅能降低函数映射网络(FMnet)中模糊对应关系矩阵和测地距离矩阵的计算量,且构建的对应关系准确性也优于现有主流方法。
机器视觉 对应关系 函数映射 数据驱动 几何约束 
激光与光电子学进展
2020, 57(18): 181507
作者单位
摘要
江南大学物联网工程学院, 江苏 无锡 214122
现有的三维物体识别和位姿估计方法无法很好地用于散乱堆放物体的场景,尤其是有严重遮挡和混叠的场景。使用基于点对特征的点云匹配和位姿估计算法,针对工业环境中乱序物体的特点,进行了一系列改进,如场景点云法线方向一致性调整、抓取位姿筛选策略调整、旋转对称引起的角度偏差调整,以取得更理想的位姿估计结果。在仿真环境和真实场景下进行了一系列实验,实验结果表明,所采用的算法在乱序物体场景中的位姿估计效果比较理想。
机器视觉 点对特征 点云匹配 位姿估计 散乱堆放 旋转对称物体 
激光与光电子学进展
2020, 57(18): 181508
朱泽 1桑庆兵 1,2,*张浩 1
作者单位
摘要
1 江南大学物联网工程学院, 江苏 无锡 214122
2 江苏省模式识别与计算智能工程实验室, 江苏 无锡 214122
随着视频技术的飞速发展,越来越多的视频应用逐步进入人们的生活中,因此对视频质量的研究很有意义。基于卷积神经网络和循环神经网络强大的特征提取能力并结合注意力机制,提出一种无参考视频质量评价算法。该算法首先利用VGG(Visual Geometry Group)网络提取失真视频的空域特征,然后利用循环神经网络提取失真视频的时域特征,引入注意力机制对视频的空时特征进行重要度计算,根据重要度得到视频的整体特征,最后通过全连接层回归得到视频质量的评价分数。在3个公开视频数据库上的实验结果表明,预测结果与人类主观质量评分具有较好的一致性,与最新的视频质量评价算法相比具有更好的性能。
机器视觉 视频质量评价 卷积神经网络 循环神经网络 注意力机制 
激光与光电子学进展
2020, 57(18): 181509
作者单位
摘要
湖南科技大学机械设备健康维护湖南省重点实验室, 湖南 湘潭 411201
针对现有棋盘格角点检测算法存在精度不足的问题,提出一种基于Hough变换和圆形模板的高精度棋盘格角点检测算法:首先,利用Hough变换和棋盘格直线分布特征获取有效直线,构建棋盘格角点,实现角点的粗略定位;其次,构建圆形模板,使其在粗略定位的角点周围移动,搜索相关点并获取其图像坐标及其观测距离;最后,最小化多个相关点坐标的实际距离与其观测距离的差值并求解,实现角点的精确定位。实验结果表明,本文提出的棋盘格角点方法与现有方法相比,其标定误差明显减少;在光照不理想时,本文方法可以实现精确检测。该方法为实际摄像机高精度标定应用提供了有力依据。
机器视觉 摄像机标定 角点检测 Hough变换 圆形模板 
激光与光电子学进展
2020, 57(18): 181510
雷经发 1,2,3韦旺 1,2李永玲 1,2,*张淼 1,2何玉 1,2
作者单位
摘要
1 安徽建筑大学机械与电气工程学院, 安徽 合肥 230601
2 工程机械智能制造安徽省教育厅重点实验室, 安徽 合肥 230601
3 过程装备与控制工程四川省高校重点实验室, 四川 自贡 643000
液压元件的外形尺寸是否合格直接关系到液压产品的质量及性能。针对液压元件表面弱纹理对测量造成较大干扰的问题,采用向目标场景投射随机斑点的方法来增强液压元件的纹理。组建了双目立体视觉系统,运用新型圆阵列标定板对其进行标定,获取了双目相机的内外参数。针对双目相机采集的数字图像,使用归一化协方差相关算法在极限约束后进行像素匹配,得到视差值,进而得到液压元件相应位置的三维数据。实验结果表明:该系统能够得到较为清晰的点云图,对于液压元件的测量具有较高的识别率和较好的鲁棒性,可以满足弱纹理液压元件在流水线生产中的实时检测。
机器视觉 双目视觉 弱纹理 归一化协方差相关算法 三维重建 
激光与光电子学进展
2020, 57(18): 181511
作者单位
摘要
2福建师范大学光电与信息工程学院医学光电科学与技术教育部重点实验室, 福建 福州 350007
目前市售胶囊内窥镜仅能观察到前方视场,而人体内肠道组织的褶皱和回环会导致大量后方视野出现盲区。设计了一种可以同时对前后方视场进行成像的胶囊物镜,该物镜的前方视场为0°~80°,侧后方视场为50°~80°。该物镜总长为15.6 mm,最大径向直径为8 mm。该物镜搭配OH02A10成像芯片可满足高分辨率(89 lp/mm处的最大截止频率大于0.5)的要求,且具有良好的成像质量。
医用光学 胶囊内窥镜 成像系统 Zemax软件 双视场系统 
激光与光电子学进展
2020, 57(18): 181701
作者单位
摘要
天津大学精密仪器与光电子工程学院, 天津 300072
提出了一种基于融合i-vector特征的长短时记忆(LSTM)循环神经网络模型,用于腹腔镜扶持器语音控制,在小训练样本下实现对特定医生语音中的短时、孤立词指令的识别。该模型以LSTM循环神经网络作为基础模型,以梅尔频率倒谱系数(MFCC)作为输入特征参数,将i-vector特征作为LSTM循环神经网络的深层输入信息,与神经网络中LSTM层后的深层特征信息进行拼接,达到参数融合的目的,实现对特定主刀医生语音指令的准确识别以及对非主刀医生语音指令的拒识别,为腹腔镜操作提供安全智能的语音识别方案。使用自建语音库进行实验,分别验证所提算法对训练库内语音的识别性能以及对训练库外语音的拒识别性能。实验结果表明:与动态时间规整算法(DTW)和混合高斯模型-隐马尔可夫模型(GMM-HMM)相比,所提模型在对训练库内特定人语音指令识别正确率高达99.6%的同时保持着错误接受率为0%,对训练库外语音的平均错误接受率为2.5%,满足腹腔镜扶持器控制的准确性和安全性要求。
医用光学 腹腔镜 i-vector 长短时记忆 特定人语音识别 
激光与光电子学进展
2020, 57(18): 181702
作者单位
摘要
武汉大学电子信息学院, 湖北 武汉 430072
随着合成孔径雷达(SAR)技术的发展,SAR获取的数据量迅速增加,利用SAR图像对目标进行识别时,计算量大、耗时长。为了快速、有效地识别目标,提出了一种基于几何模型的目标快速分类方法。该方法选择二值目标区域和阴影区域为特征,首先利用目标几何模型的光学可见信息进行正向特征预测。然后将实测SAR图像中提取的二值区域与预测得到的二值区域对齐,建立相关性。最后通过融合相似度准则进行判断,实现目标分类,并在MSTAR数据集上验证了该方法的高效性和有效性。由于该方法不涉及耗时的电磁计算,在减小计算量的同时,加快了目标识别速度。
合成孔径雷达 目标识别 二值区域特征 快速分类方法 几何模型 
激光与光电子学进展
2020, 57(18): 182801
作者单位
摘要
1 辽宁工程技术大学电子与信息工程学院, 辽宁 葫芦岛 125100
2 中国科学院海西研究院泉州装备制造研究所, 福建 泉州 362000
传统的高光谱图像分类大多只考虑地物的光谱信息,而忽略了空间信息,现有的空谱联合分类方法难以有效提取空间邻域信息。针对上述问题,提出了一种卷积神经网络和稀疏字典联合学习的算法。现有稀疏编码方法大多仅考虑光谱信息而丢弃空间信息,而所提算法利用卷积神经网络可以有效提取数据深层特征的优势,对高光谱图像同时提取空谱特征,获取高维深层特征;然后再通过字典学习对深层特征进行稀疏编码,以获取用于分类的鉴别特征;最后采用分类器确定分类结果。在实验部分,采用所提算法与现有几种算法在三个公开数据集上进行分类,结果发现:相比于其他算法,所提算法的总体分类精度、平均分类精度和Kappa系数均有所提升。所提方法可以同时提取高光谱数据的空谱特征,具有良好的鲁棒性和判别性,有效地提高了分类的准确率,并且在样本数量小的数据集上表现良好。
遥感 高光谱图像 空谱特征 稀疏编码 卷积神经网络 
激光与光电子学进展
2020, 57(18): 182802
作者单位
摘要
1 河南理工大学测绘与国土信息工程学院, 河南 焦作 454000
2 中国科学院遥感与数字地球研究所, 北京 100094
地物纹理的复杂性,使地物分类一直是遥感领域研究的热点和难点。机载激光技术可以直接获取地物的三维点云信息,影像数据可以提供丰富的波谱信息,因此,结合机载激光点云和航空影像主被动遥感数据对地物进行分类。首先,将三维点云数据转换成网格数据,并利用顶帽变换算子去除噪声点;然后,对网格数据进行区域分割,引入植被区域限制的分水岭算法生成聚类区域;最后,利用模糊证据理论对不同聚类区域进行地物类型识别。用ISPRS数据集中的机载激光点云和航空影像数据作为实验数据,对本方法进行精度评价。结果表明,与基于单点的证据理论分类方法相比,本方法的分类效果较好。
遥感影像 机载激光点云 分水岭算法 证据理论 精度评价 
激光与光电子学进展
2020, 57(18): 182803
作者单位
摘要
华北理工大学电气工程学院, 河北 唐山 063210
对等离子体光斑的灰度特征进行分析。首先,在HSL彩色空间上对原光斑图像的L分量进行主成分提取并结合掩模处理,得到具有高信噪比的有效灰度图。对处理前后单个光斑图像的平均灰度曲线进行分析,发现原光斑图像的灰度曲线包含许多毛刺,而经处理后的曲线更为平滑。其次,对光斑序列样本图像的灰度特征进行提取,发现光斑序列图像的灰度随飞秒激光束往复烧蚀运动呈周期性变化。然后,采用分形插值与小波变换相结合的方法对光斑序列图像的平均灰度特征曲线进行处理,该方法不仅清晰地保留了平均灰度特征曲线的细节信息,而且使该曲线变得更为平滑。最后,对光斑灰度特征与烧蚀加工功率、加工平台运动之间的相关性进行分析,发现之间存在极强的相关性,这对利用光斑灰度指标调节激光功率和反馈微结构的加工深度提供了有意义的依据。
超快光学 飞秒激光 等离子体光斑 小波处理 光斑灰度 
激光与光电子学进展
2020, 57(18): 183201