作者单位
摘要
1 华中科技大学智能制造装备与技术全国重点实验室,湖北 武汉 430074
2 湖北光谷实验室,湖北 武汉 430074
光刻热点检测是实现集成电路可制造性设计,保障集成电路芯片最终良率的关键。鉴于传统基于深度学习的光刻热点检测方法难以满足先进集成电路制造对检测精度的要求,提出了一种基于改进Yolov5s的检测算法,用于光刻版图热点缺陷的精确检测。通过将坐标注意力机制引入骨干网络,提高了Yolov5s模型对版图图形区域的关注度,进而极大地改善了基于Yolov5s的检测算法的光刻热点检测性能。与此同时,采用Sigmoid线性单元激活函数进一步完善整个神经网络的非线性表达,利用Scylla交并比损失函数更快速地定量评估边界框回归损失,提高了热点检测算法的收敛速度和精度。将ICCAD(The International Conference on Computer-Aided Design)2012竞赛基准、经光学邻近校正优化后的光刻图形作为数据集对所提算法开展性能测试实验,验证了热点检测算法的优异检测精度。实验结果表明,该算法的平均准确率、平均召回率、平均F1-score和均值平均精度分别达到97.7%、98.0%、97.8%和98.4%,显著优于其他光刻热点检测算法,展示了良好的应用前景。
光刻热点检测 改进Yolov5s 检测精度 坐标注意力机制 Sigmoid线性单元激活函数 Scylla交并比损失函数 
激光与光电子学进展
2023, 60(24): 2422001
作者单位
摘要
1 北京交通大学计算机与信息技术学院,北京 100044
2 河北科技大学信息科学与工程学院,河北 石家庄 050018
针对自然场景下鸟类检测任务中存在模型参数量大、计算量高和正负样本严重不平衡的问题,提出了YOLOBIRDS算法。一方面,对特征提取网络模型进行修改,将标准卷积神经网络结构修改为深度可分离残差模型。另一方面,对损失函数进行修改,将目标框大小与位置损失函数由均方误差修改为广义交并比(CIoU),在置信度损失函数中增加正负样本控制参数。实验结果表明,在衡水湖鸟类数据集中,YOLOBIRDS算法的平均精度均值(mAP)达87.12%,比原算法高2.71个百分点;参数个数达12425917,比原算法低79.88%;速度达32.67 frame/s,比原算法高19.98%。采用该算法训练得到的新模型对鸟类检测的精度更高,检测速度更快,对鸟类检测的整体识别率大幅度提高,平衡了正负样本的损失权重。
目标检测 深度可分离残差模型 广义交并比损失函数 YOLOv3算法 
激光与光电子学进展
2022, 59(18): 1815013
作者单位
摘要
中国民航大学电子信息与自动化学院,天津 300300
安检X光图像违禁品尺度多变、姿态各异,为自动识别带来很大的困难。针对该问题,提出了一种基于金字塔卷积和带状池化的X光目标检测算法。首先,以一阶段无锚框目标检测框架CenterNet为基础,引入金字塔卷积,提出金字塔沙漏网络,丰富Hourglass-104特征提取网络的感受野,增强多尺度特征提取能力。其次,带状池化的引入能够捕捉图像上下文全局信息,防止无关区域的信息干扰,兼顾局部细节信息。最后,在训练过程中将预测目标尺度分支的训练损失替换为交并比(IoU)损失函数,进一步提升尺度预测分支的性能。消融实验结果表明,改进后网络的平均精度(mAP50)由86.6%提升为88.3%,准确率有显著提升。
图像处理 X光图像目标检测 深度学习 金字塔卷积 带状池化 交并比损失函数 
激光与光电子学进展
2022, 59(4): 0410017
作者单位
摘要
1 华东交通大学信息工程学院,江西 南昌 330013
2 南昌市第三医院乳腺肿瘤科,江西 南昌 330009
针对基于深度学习的乳腺癌诊断中小肿块和互相遮挡肿块易被漏诊的问题,提出了一种用于乳腺肿块检测的改进型YOLOv3算法。首先,在特征融合模块中添加了自底向上的路径,并采用级联和跨层连接的方式充分利用底层特征信息,提高了小肿块的识别精度;其次,为了筛选出更精确的预测框,避免互相遮挡的肿块出现漏检的情况,在软非极大值抑制(Soft-NMS)算法中引入了距离交并比(DIoU)来抑制冗余的预测框。实验结果表明,所提乳腺肿块检测算法在检测小肿块和互相遮挡的肿块方面有较高的准确率和速度,平均均值精度(mAP@0.5)达到了96.1%,相比于YOLOv3提高了1.8个百分点,且每张钼靶图像的检测时间仅为28 ms。
图像处理 乳腺钼靶图像 YOLOv3 特征融合 距离交并比 软非极大值抑制 目标检测 
激光与光电子学进展
2022, 59(4): 0410003
作者单位
摘要
华东交通大学信息工程学院, 江西 南昌 330013
针对钢轨表面缺陷检测中,钢轨表面图像存在背景不均匀、缺陷尺度变化大且样本数据不足的问题,提出一种基于图像增强与改进Cascade R-CNN的钢轨表面缺陷检测方法。首先,采用改进Retinex算法处理钢轨表面图像,增强缺陷与背景的对比度。然后,采用改进Cascade R-CNN对钢轨表面缺陷进行检测,并应用交并比(IoU)平衡采样、感兴趣区域对齐和完全交并比(CIoU)损失分别解决训练样本IoU分布与困难样本IoU分布不平衡、感兴趣区域池化中取整量化导致的感兴趣区域与提取的特征图不匹配和回归损失Smooth L1对于预测边框回归不准确的问题。最后,采用翻转变换、随机剪裁、亮度变换和生成对抗网络等方法增广钢轨表面缺陷图像数据集,消除样本数据不足导致的网络训练过拟合现象。实验结果表明,该方法以ResNet-50作为特征提取器,平均精度可达98.75%,相对于未改进的Cascade R-CNN提高了2.52%,且检测时间缩短了24.2 ms。
图像处理 钢轨表面缺陷 图像增强 Cascade R-CNN 感兴趣区域对齐 完全交并比 数据增广 
激光与光电子学进展
2021, 58(22): 2212001
张赛强 1,2司绍峰 1,2鲁斌 1,2李庆 2,*[ ... ]戎安心 3
作者单位
摘要
1 中国科学院微电子研究所,北京 100029
2 中国科学院大学,北京 100049
3 湖州市特种设备检测研究院,浙江 湖州 313000
由于鱼眼图像存在几何畸变,导致现有的基于鱼眼图像的行人检测算法存在着检测准确率低以及后处理计算复杂度高的问题。针对上述问题,提出了一种使用旋转边界框的行人检测算法。首先,算法采用无锚框网络结构,使用中心热图预测边界框的中心点,在后处理筛选边界框时无需进行非极大值抑制,避免了旋转框之间交并比计算的引入;其次,设计具有角度和尺度自适应的高斯核函数,用于拟合畸变行人的中心分布,大幅减少了背景特征的干扰,并且平衡了具有不同成像大小的行人在边界框回归过程中的差异;最后,设计角度交并比损失,同时结合交并比损失以及旋转框参数的Ln范数损失,并通过指示函数改善角度正则项与交并比损失回归不一致的问题。在公开数据集上对算法进行了验证,实验结果表明,算法的平均mAP为51.33%,取得了目前最佳的检测结果,检测帧率达到49 fps,与带锚框的检测算法相比,提升了139%,综合性能优于现有的基于鱼眼图像的行人检测算法。
鱼眼图像 行人检测 无锚框 旋转高斯核 角度交并比 Fisheye images Person detection Anchor-free Rotated Gaussian kernel AIoU 
光子学报
2021, 50(10): 1010003
邹梓吟 1,2盖绍彦 1,2,*达飞鹏 1,2,3李昱 1,2
作者单位
摘要
1 东南大学自动化学院, 江苏 南京 210096
2 东南大学复杂工程系统测量与控制教育部重点实验室, 江苏 南京 210096
3 东南大学深圳研究院, 广东 深圳 518063
针对真实场景中因行人相互遮挡难以被精确检测的情况,提出一种基于注意力机制的特征提取增强检测算法。首先,通过添加注意力模块学习特征通道间关系和特征图空间信息,增强对行人目标可视区域的特征提取。其次根据行人数据的实际尺寸,采用k-means++算法对行人标注进行聚类,确定锚框(anchor)大小及比例。利用距离交并比损失函数(DIOULoss)设计检测器的损失函数,使得检测框的回归更关注候选框与真实框的交并比与两框的中心距离。最后使用新设计的非极大值抑制算法(DSoft-NMS)保留更精确的预测框。所提方法在CityPersons和WiderPerson数据集上进行了实验,结果表明该方法在遮挡行人检测方面具有更高的检测精度,同时网络结构简单,方便后续研究。
机器视觉 遮挡行人检测 注意力机制 k-means聚类 交并比 
光学学报
2021, 41(15): 1515001
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
深度神经网络在静态图像领域已取得突破性进展,并逐步扩展到视频识别领域。人体动作识别是视频识别领域的研究热点和难点,因此,提出了一种基于双流快速区域卷积神经网络(Faster RCNN)改进的人体动作识别算法。首先,用RGB(Red,Green,Blue)图像和光流数据作为网络的输入,分别训练Faster RCNN;然后,将训练好后的网络模型进行融合,并引入改进的压缩和激励模块对特征通道进行处理,以突出重要特征;最后,用完全的交并比损失函数作为边框回归损失函数,以优化某些预测框与真实框不能相交等问题。实验结果表明,相比传统的Faster RCNN,本算法在动作识别数据集UCF101上的准确率得到了一定的提高。
机器视觉 双流快速区域卷积神经网络 人体动作识别 压缩与激励 交并比损失函数 
激光与光电子学进展
2020, 57(24): 241506
作者单位
摘要
1 长安大学电子与控制工程学院, 陕西 西安 710064
2 陕西省铁路集团有限公司科技质量部, 陕西 西安 710199
3 西安市西蓝天然气集团公司纪检监察委员会, 陕西 西安 710075
针对传统裂缝图像分割方法不能准确提取混凝土表面裂缝的难题,提出了一种改进的轻量级全局卷积网络的路面裂缝图像分割模型。根据深度卷积网络原理,使用大卷积核对裂缝图像进行分类和定位,针对裂缝特征构建轻量级的语义分割MobileNetv2-GCN模型。实验对比结果表明,该模型在三个公开裂缝数据集上都表现出优越的性能。采用中轴骨架算法提取语义分割后的裂缝骨架,计算裂缝平均宽度的物理值,其实验结果具有较高的准确性,可为公路健康检测提供可靠的数据支持。
图像处理 语义分割 大卷积核 全局卷积网络 平均交并比 骨架提取 
激光与光电子学进展
2020, 57(8): 081011
作者单位
摘要
大连海事大学信息科学技术学院, 辽宁 大连 116026
为了克服核相关滤波(KCF)只根据目标外观模型追踪时准确性低的不足,融入运动模型,计算了检测目标框和预测目标框的交并比(IOU)。通过匈牙利算法,确定了目标间的最优关联。KCF和IOU模型都具有快速响应的特点,因此算法可满足在线处理数据的要求。在公开的2DMOT2015、MOT16数据集上进行实验,将所提方法与其他优秀方法相比,在保证30 frame/s以上处理速度的同时,追踪准确性提高10%以上。
机器视觉 多目标跟踪 核相关滤波 交并比 
激光与光电子学进展
2019, 56(12): 121501

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!