作者单位
摘要
1 江苏理工学院 机械工程学院,江苏常州2300
2 常州祥明智能动力股份有限公司,江苏常州13011
在QFN芯片封装缺陷检测中,增加图像分割环节可有效提高缺陷检测准确性与检测效率。针对图像分割中传统算法效率低、智能优化算法分割精度低稳定性差的问题,本文提出一种基于改进灰狼优化算法(IGWO)的图像多阈值分割方法。首先,改进原始灰狼优化算法非线性因子,平衡算法搜索效率与挖掘能力;其次,引入反向学习策略提高种群整体质量,引入正弦函数、调整头狼权重以改进灰狼更新策略,增强算法多样性与挖掘能力;然后,提出头狼靠拢与种群变异交替进行的位置更新策略,平衡算法收敛性能与跳出局部最优能力;最后,以Kapur熵为适应度函数,求解最优分割阈值。将本文提出的改进灰狼优化算法的多阈值图像分割方法,与灰狼优化算法(GWO)、基于翻筋斗觅食策略的灰狼优化算法(DSF-GWO)、基于莱维飞行的樽海鞘群优化算法(LSSA)、改进北方苍鹰算法(INGO)的图像分割方法进行实验对比,结果表明:本文方法在分割用时方面,约为DSF-GWO的1/2,INGO的1/4;在分割精度与稳定性方面,在进行QFN芯片缺陷图像的连续30次分割时,本文方法具有最大Kapur熵平均值、最小标准差与最短分割时间。因此本文方法可实现高精度、高稳定性与高效率的QFN芯片图像多阈值分割。
灰狼优化算法 多阈值分割 Kapur熵 QFN Grey Wolf Optimization(GWO) multi-threshold segmentation Kapur entropy Quad Flat No-lead package(QFN) 
光学 精密工程
2024, 32(6): 930
张蕾 1石岩 1,*卢文雍 1徐睿 1[ ... ]占春连 1
作者单位
摘要
1 中国计量大学 光学与电子科技学院,浙江杭州3008
2 浙江视觉智能创新中心有限公司,浙江杭州31115
3 浙江省北大信息技术高等研究院,浙江杭州11215
为了解决结构光三维重建中传统立体匹配存在的特征点匹配错误、匹配缺失和匹配重复等问题,本文将SURF算法中高斯滤波改进为自适应中值滤波结合小波变换,并提出了一种基于OKG算法的二次特征匹配方法。该算法首先使用自适应中值滤波结合小波变换算法对图像进行平滑和降噪处理,再进行初步特征点提取和匹配,然后将构建的尺度空间划分成多个网格,在每个网格内使用FAST算法提取尺度空间特征点,使用ORB算子提取左右图像的特征点,用BRIEF描述子对其进行描述,采用K-D树最近邻搜索法限制特征点选取,通过GMS算法剔除误匹配点。最后,将本文SURF-OKG算法与传统特征匹配算法进行对比分析,并对阶梯块进行三维重建来验证本文算法的有效性。实验结果表明:SURF-OKG算法的正确匹配率为92.47%;对阶梯宽度为40 mm,精度为0.02 mm的阶梯块进行三维重建,实验测得阶梯宽度的误差均值为1.312 mm,最大误差值不超过1.72 mm,基本满足结构光三维重建系统的实验要求。
三维重建 特征点匹配 SURF算法 SURF-OKG算法 阶梯块 3D reconstruction feature point matching Speeded-Up Robust Feature(SURF) algorithm SURF-OKG algorithm step blocks 
光学 精密工程
2024, 32(6): 915
陈敏佳 1,2盖绍彦 1,2,*达飞鹏 1,2俞健 1,2,3,*
作者单位
摘要
1 东南大学 自动化学院,江苏南京20096
2 东南大学 复杂工程系统测量与控制教育部重点实验室,江苏南京10096
3 南京航空航天大学 空间光电探测与感知工业和信息化部重点实验室, 江苏南京211106
为了在严重遮挡以及少纹理等具有挑战性的场景下,准确地估计物体在相机坐标系中的位置和姿态,同时进一步提高网络效率,简化网络结构,本文基于RGB-D数据提出了采用辅助学习的六自由度位姿估计方法。网络以目标物体图像块、对应深度图以及CAD模型作为输入,首先,利用双分支点云配准网络,分别得到模型空间和相机空间下的预测点云;接着,对于辅助学习网络,将目标物体图像块和由深度图得到的Depth-XYZ输入多模态特征提取及融合模块,再进行由粗到细的位姿估计,并将估计结果作为先验用于优化损失计算。最后,在性能评估阶段,舍弃辅助学习分支,仅将双分支点云配准网络的输出利用点对特征匹配进行六自由度位姿估计。实验结果表明:所提方法在YCB-Video数据集上的AUC和ADD-S<2 cm结果分别为95.9%和99.0%;在LineMOD数据集上的平均ADD(-S)结果为99.4%;在LM-O数据集上的平均ADD(-S)结果为71.3%。与现有的其他六自由度位姿估计方法相比,采用辅助学习的方法在模型性能上具有优势,在位姿估计准确率上有较大提升。
六自由度位姿估计 辅助学习 深度图像 三维点云 6-DoF pose estimation auxiliary learning RGB-D image 3D point cloud 
光学 精密工程
2024, 32(6): 901
作者单位
摘要
南京航空航天大学 电子信息工程学院,江苏南京211106
太阳能电池片(Photovoltaic, PV)表面缺陷检测是光伏组件生产中不可或缺的流程。基于机器视觉的自动缺陷检测方法因其高精度、实时性、低成本等优点得到了广泛应用。本文综述了基于机器视觉的太阳能电池片表面缺陷检测方法的研究进展。首先,阐述了太阳能电池片表面成像方式,列举了典型缺陷类型。然后重点分析了基于传统机器视觉算法及基于深度学习算法进行太阳能电池片表面缺陷检测的原理。将传统机器视觉算法分为图像域分析法、变换域分析法进行综述;从无监督学习、有监督学习和弱监督及半监督学习三个方面分别概述了近几年来基于深度学习的太阳能电池片表面缺陷检测的研究现状。对太阳能电池片表面缺陷检测各种典型方法进一步细分归类和对比分析,总结了每种方法的优缺点。随后,介绍了9种太阳能电池片表面缺陷图像数据集及缺陷检测性能评价指标。最后,系统总结了太阳能电池片缺陷检测常见的关键问题及其解决方法,对太阳能电池片表面缺陷检测的未来发展趋势进行了展望。
太阳能电池 缺陷检测 机器视觉 深度学习 检测网络 solar cells defect detection machine vision deep learning detection network 
光学 精密工程
2024, 32(6): 868
作者单位
摘要
1 江苏科技大学 计算机学院, 江苏镇江22000
2 南京大学 计算机软件新技术国家重点实验室, 江苏南京10046
为了提高动态场景RGB-D SLAM中相机位姿精度,基于实例分割与光流算法,提出一种高精度RGB-D SLAM方法。首先,通过实例分割算法检测出场景中的物体,删除非刚性物体并构造语义地图。接着,通过光流信息计算运动残差,检测场景中动态刚性物体,并在语义地图中追踪这些动态刚性物体。然后,删除每一帧中非刚性物体和动态刚性物体上的动态特征点,利用其他稳定的特征点优化相机位姿。最后,通过TSDF模型重建静态背景,并以点云的形式显示动态刚性物体。在TUM和Bonn数据集中测试表明,本文方法与当前最先进的SLAM工作ACEFusion相比相机精度提升约43%。消融实验结果表明,保留动态刚性物体处于静止状态下的特征点对相机位姿估计结果提升约37%。稠密建图实验结果表明,本文方法在动态场景中重建结果优于当前先进的工作,平均重建误差为0.042 m。代码开源在https://github.com/wawcg/dy_wcg
动态场景 同步定位与地图构建 实例分割 光流 dynamic scenes SLAM instance segmentation optical flow 
光学 精密工程
2024, 32(6): 857
作者单位
摘要
1 河北工业大学 人工智能与数据科学学院,天津30030
2 河北省控制工程技术研究中心,天津300130
针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取,导致特征提取不充分的问题,提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息,设计了多尺度特征融合块,其基本单元由自适应双尺度块、多路径渐进式交互块和自适应双维度注意力依次串联组成。首先,自适应双尺度块自主融合两个尺度的特征,获得了更丰富的上下文特征;其次,多路径渐进式交互块以渐进的方式交互自适应双尺度块的输出特征,提高了上下文特征之间的关联性;最后,自适应双维度注意力自主选择不同维度注意力细化输出特征后,提高了输出特征的鉴别力。实验结果表明,在Set5, Set14, BSD100和Urban100测试集上,本文方法在PSNR和SSIM定量指标上相比于其他主流方法相均有提升,尤其对于纹理细节难以恢复的Urban100测试集,本文方法在比例因子为×4时,相较于现有最优方法SwinIR,PSNR和SSIM指标分别提升了0.05 dB和0.004 5;在视觉效果方面,本文的重建图像具有更多的纹理细节。
超分辨率 多尺度特征 注意力机制 自适应权重 渐进式信息交互 super-resolution multi-scale feature attention mechanism adaptive weights progressive information interaction 
光学 精密工程
2024, 32(6): 843
作者单位
摘要
1 西北工业大学 无人系统技术研究院,陕西西安70072
2 中国人民解放军军事科学院 国防科技创新研究院,北京100850
针对室内弱纹理环境下基于点特征的视觉同步定位与建图(Simultaneous Localization and Mapping, SLAM)存在的轨迹漂移等问题,提出了一种融合点线特征的双目视觉SLAM系统,并对线特征的提取与匹配问题展开研究。为了提高线特征的质量,通过长度与梯度抑制、短线合并等方法,进一步改进LSD(Line Segment Detector)线特征提取方法。同时,通过将匹配问题转换为优化问题,并利用几何约束构建代价函数,提出了一种基于几何约束的快速线段三角化方法。实验结果表明,本文所提方法在多个数据集上的表现都优于基于描述子的传统方法,尤其在室内弱纹理场景下,其平均匹配精度达到91.67%,平均匹配时间仅需7.4 ms。基于此方法,双目视觉SLAM系统在弱纹理数据集上与已有算法ORBSLAM2,PL-SLAM的定位误差分别为1.24,7.49,3.67 m,定位精度优于现有算法。
双目视觉 线特征提取 视觉同步定位与建图 特征匹配 binocular vision line features vision simultaneous localization and mapping feature matching 
光学 精密工程
2024, 32(5): 752
作者单位
摘要
广东工业大学 机电工程学院,广东广州510006
针对单可见光或单红外条件下的IC器件表面缺陷对比度不足,缺陷检测精度低的问题,提出多光谱图像融合的IC器件表面缺陷检测方法。针对IC器件可见光与红外图像配准中存在尺度不一致和对比度反转问题,引入拉普拉斯金字塔和特征描述符重组策略改进ORB(Oriented FAST and Rotated BRIEF)图像配准算法。在图像配准的基础上,提出NSST_VP图像融合方法,以非下采样剪切波变换(Non-Subsample Shearlet Transform, NSST)得到红外图像和已配准可见光图像的低频和高频子带,对低频子带采用视觉显著图(Visual Significance Map, VSM)加权融合规则,高频子带则采用自适应脉冲耦合神经网络(PA- Pulse Coupled Neural Network, PA-PCNN)决策融合规则,进而通过NSST逆变换得到高质量多光谱融合图像。最后,将融合图像输入YOLOv8s模型进行检测。实验结果表明,改进ORB的图像配准平均精度为87.8%,比ORB图像配准精度提高了62%,NSST_VP图像融合算法在主观视觉效果和客观评价指标上均有所提高。在缺陷检测实验中,NSST_VP融合方法的均值平均精度(mean Average Precision, mAP)达到83.15%,比单可见光、单红外缺陷图像检测的mAP分别提高了22.97%,28.31%,比双树复小波变换融合、曲线变换融合、非下采样轮廓波变换融合方法的mAP分别提高了13.14%,15.01%,20.35%。
缺陷检测 IC器件 多光谱图像融合 图像配准 非下采样剪切波变换 YOLOv8s defect detection IC device multispectral image fusion image registration non-subsample shearlet transform YOLOv8s 
光学 精密工程
2024, 32(5): 740
作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism 
光学 精密工程
2024, 32(5): 727
周涛 1,2彭彩月 1,2,*杜玉虎 1,2党培 1,2[ ... ]陆惠玲 3
作者单位
摘要
1 北方民族大学 计算机科学与工程学院,宁夏银川75002
2 北方民族大学 图像图形智能处理国家民委重点实验室,宁夏银川75001
3 宁夏医科大学 医学信息与工程学院,宁夏银川750004
针对肺部X射线图像的病灶区域较小、形状复杂,与正常组织间的边界模糊,使得肺炎图像中的病灶特征提取不充分的问题,提出了一个面向特征增强的双残差Res-Transformer肺炎识别模型,设计3种不同的特征增强策略对模型特征提取能力进行增强。设计了组注意力双残差模块(GADRM),采用双残差结构进行高效的特征融合,将双残差结构与通道混洗、通道注意力、空间注意力结合,增强模型对于病灶区域特征的提取能力;在网络的高层采用全局局部特征提取模块(GLFEM),结合CNN和Transformer的优势使网络充分提取图像的全局和局部特征,获得高层语义信息的全局特征,进一步增强网络的语义特征提取能力;设计了跨层双注意力特征融合模块(CDAFFM),融合浅层网络的空间信息以及深层网络的通道信息,对网络提取到的跨层特征进行增强。为了验证本文模型的有效性,分别在COVID-19 CHEST X-RAY数据集上进行消融实验和对比实验。实验结果表明,本文所提出网络的准确率、精确率、召回率,F1值和AUC值分别为98.41%,94.42%,94.20%,94.26%和99.65%。DRT Net能够帮助放射科医生使用胸部X光片对肺炎进行诊断,具有重要的临床作用。
肺炎识别 X射线图像 特征增强 双残差结构 Transformer pneumonia recognition X-ray image feature enhancement dual residual model Transformer 
光学 精密工程
2024, 32(5): 714

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!