作者单位
摘要
西安建筑科技大学 信息与控制工程学院,陕西西安710055
遥感目标具有较大的尺度差异性,针对其在复杂背景干扰下易导致细粒度级别多尺度特征提取困难、预测部分有效表征较弱的问题,本文基于无锚框思想,提出一种多元特征提取与表征优化的遥感多尺度目标检测方法(Multivariate Feature extraction and Characterization optimization,MFC)。在特征提取部分,设计多元特征提取模块(Multivariate Feature Extraction,MFE)挖掘细粒度级别的多尺度特征,通过分组操作及跨组连接的方式扩大感受野、增强多个特征尺度的组合效应,并联合上下文信息进一步加强对小目标的关注;采用深层聚合结构对深浅层特征进行充分融合,以获得更全面的特征表达。在预测部分,提出一种表征优化策略(Characterization Optimization Strategy,COS),利用椭圆型映射进行标签优化以适应具有较大纵横比的遥感目标,设计坐标像素注意力组合关注多尺度目标通道、位置及像素信息,减少复杂背景干扰,使有效信息得以突出表征。在DIOR,HRRSD,RSOD数据集上进行消融及对比实验,实验结果表明:MFC模型的mAP分别达到了70.9%,90.2%和96.9%,优于大多现有方法,有效改善了误检、漏检问题,适应性和鲁棒性较强。
遥感多尺度目标 无锚框 多元特征 表征优化 注意力 remote sensing of multi-scale targets anchor-free multivariate feature characterization optimization attention 
光学 精密工程
2023, 31(16): 2465
作者单位
摘要
1 天津大学微电子学院,天津 300072
2 飞腾信息技术有限公司,天津 300459
3 天津市成像与感知微电子技术重点实验室,天津 300072
针对现有航摄图像目标检测算法中模型复杂、超参数多、检测精度较低的问题,提出一种面向航摄图像目标检测的轻量级多尺度特征融合网络。该网络采用Anchor-Free思想,通过逐像素预测的方式,减少了与Anchor相关的超参数;利用MobileNetV3作为特征提取网络并使用Ghost瓶颈模块优化多尺度特征融合网络,来降低网络的参数量和计算量;引入可变形卷积来构建可变形感受野模块,提高检测器对航摄图像目标形变的鲁棒性;同时采用标签分配策略SimOTA进行动态样本匹配,以缓解航摄图像目标分布密集、遮挡严重的检测问题。在数据集VisDrone2019-DET和NWPU VHR-10上对所提网络进行评估,检测精度AP50分别达26.6%和94.4%,检测速度分别达59.9 frame/s和79.6 frame/s。与主流目标检测网络相比,所提网络在保持较高检测精度和速度的同时,具有较小的参数量和计算量,更适合应用于机载计算设备。
目标检测 Anchor-Free 可变形感受野块 特征融合 动态样本匹配 
激光与光电子学进展
2023, 60(10): 1010027
作者单位
摘要
1 上海海洋大学 信息学院,上海 201306
2 自然资源部东海信息中心,上海 200136
3 上海电力大学,上海 201306
针对彩色遥感图像上飞机目标体积小、分布密集、背景复杂导致的检测精度低问题,提出了一种改进无锚点的彩色遥感图像任意方向飞机目标检测算法。采用BBAVectors为基准模型,以ResNet50为主干网进行特征提取,在特征金字塔网络FPN后增加一条自上而下的路径扩展网络PANet模块,缩短信息路径并用低层级准确位置信息增强特征金字塔。其次,引入注意力机制CBAM模块,通过抑制噪声和突出目标特征,实现复杂环境下的飞机目标检测精度的提升。在DOTA数据集上分别进行消融实验和对比实验,并使用DOTA_devkit对数据集分别进行0.5以及1倍比例的裁切,提高模型的检测精度。改进后的模型在彩色遥感图像测试数据集上的检测精度达到了90.35%。相较于原模型,检测精度提升了0.82%。实验结果表明,该方法在彩色遥感图像中的飞机检测任务中具有更好的检测效果。
飞机目标检测 任意方向 无锚点 路径扩展 注意力机制 aircraft target detection in any direction anchor free path augmentation attention mechanism 
液晶与显示
2023, 38(3): 409
作者单位
摘要
内蒙古大唐国际托克托发电有限责任公司, 呼和浩特 010206
为了提高车间监控系统智能化程度和工作场景中行人检测精度,提出了一种基于计算机视觉技术的行人检测方法。采用基于高级语义信息的无锚框特征检测技术,将检测任务简化为中心点和尺度的回归预测。特征提取模块通过四阶段降采样卷积网络,得到多尺度的图像特征并融合。头探测模块分成两路卷积,并行处理特征图,获得中心点热力图和尺度信息,输出检测结果。结果表明,在CityPersons数据集R子集上,MR-2达到11.61%,加入偏移量预测分支后MR-2提升了0.6%。这证明了该人员检测方法的性能优良。
目标检测 行人检测 计算机视觉技术 无锚框检测 语义信息 object detection pedestrian detection computer vision technique anchor free detection semantic information 
微电子学
2022, 52(5): 898
作者单位
摘要
天津大学电气自动化与信息工程学院,天津 300072
交通标志检测是自动驾驶系统的一项重要功能,当前先进的交通标志检测器大多采用Anchor-Based网络模型,根据锚框遍历所有潜在的目标位置。为了减少锚框带来的计算开销和过多的超参数设置,提出了一种基于编码-解码结构的Anchor-Free交通标志检测算法。为了增加解码模块的特征表征能力,在解码模块中引入残差增强分支。为了高效地提取和利用多尺度特征,设计了特征融合子网络,提升对多尺度目标的检测能力,并使用Ghost轻量化模块提取多尺度特征图,不显著引进运算量。在Tsinghua-Tencent 100K数据集上进行验证,所提算法实现了92.5%的召回率和90.3%的准确率,模型的参数量和模型大小分别为1.61×107和64.4 Mbit。实验结果表明,与主流目标检测算法相比,所提算法的检测精度较高,计算开销较低,在综合性能上具有优越性。
机器视觉 交通标志检测 Anchor-Free 残差结构 多尺度特征融合 
激光与光电子学进展
2022, 59(24): 2415002
张赛强 1,2司绍峰 1,2鲁斌 1,2李庆 2,*[ ... ]戎安心 3
作者单位
摘要
1 中国科学院微电子研究所,北京 100029
2 中国科学院大学,北京 100049
3 湖州市特种设备检测研究院,浙江 湖州 313000
由于鱼眼图像存在几何畸变,导致现有的基于鱼眼图像的行人检测算法存在着检测准确率低以及后处理计算复杂度高的问题。针对上述问题,提出了一种使用旋转边界框的行人检测算法。首先,算法采用无锚框网络结构,使用中心热图预测边界框的中心点,在后处理筛选边界框时无需进行非极大值抑制,避免了旋转框之间交并比计算的引入;其次,设计具有角度和尺度自适应的高斯核函数,用于拟合畸变行人的中心分布,大幅减少了背景特征的干扰,并且平衡了具有不同成像大小的行人在边界框回归过程中的差异;最后,设计角度交并比损失,同时结合交并比损失以及旋转框参数的Ln范数损失,并通过指示函数改善角度正则项与交并比损失回归不一致的问题。在公开数据集上对算法进行了验证,实验结果表明,算法的平均mAP为51.33%,取得了目前最佳的检测结果,检测帧率达到49 fps,与带锚框的检测算法相比,提升了139%,综合性能优于现有的基于鱼眼图像的行人检测算法。
鱼眼图像 行人检测 无锚框 旋转高斯核 角度交并比 Fisheye images Person detection Anchor-free Rotated Gaussian kernel AIoU 
光子学报
2021, 50(10): 1010003
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
针对交通标志只在图像中占极小的区域且难以准确识别的问题,提出一种基于注意力模型的无锚框交通标志识别算法,利用密集连接网络DenseNet-121作为骨干网络并对特征进行提取。为了解决小型交通标志准确率低的问题,在骨干网络中加入注意力模型,可以对特征图进行空间和通道上的自适应调整,通过加强或抑制特征图中元素的权重可以提升对小型交通标志的识别性能。为了减小编码路径与解码路径间的语义鸿沟,引入残差网络的连接方式并提出一种语义连接路径。为了解决锚框中正负样本不均衡的问题,采用无锚框的检测方式可以定位交通标志的中心点、回归边界框的位置与尺寸信息。对所提算法在TT100K数据集上进行验证,实验结果证明所提算法具有优越性。
图像处理 深度学习 交通标志识别 注意力模型 无锚框 
激光与光电子学进展
2021, 58(16): 1610020
作者单位
摘要
内蒙古科技大学信息工程学院, 内蒙古 包头014010
基于先验框设计(anchor-based)的多类目标检测算法存在超参数多、泛化能力差、正负样本不平衡的问题。针对这些问题,提出一种基于改进无锚(anchor-free)方法的目标检测算法。首先,针对传统算法在多类目标检测任务中难以获得鲁棒的特征表达的问题,构建基于上下文结合的自校准双重注意力模块,通过混合空洞卷积组获取多感受野信息;然后以低维空间嵌入的方式进行自校准获取上下文空间信息;最后将空间信息与通道信息结合,增强算法特征表达能力。针对在多类目标检测任务中由于目标尺度变化大、外观不规则而易引入背景噪声的问题,利用改进的可变卷积,对目标进行自适应采样。在目标检测数据集MSCOCO上的实验结果表明,所提算法能有效提升目标检测精度,优于对比检测算法。
图像处理 目标检测 上下文自校准 双重注意力机制 可变卷积 anchor-free 
激光与光电子学进展
2021, 58(12): 1210013
作者单位
摘要
1 贵州大学现代制造技术教育部重点实验室, 贵州 贵阳 550025
2 贵州大学机械工程学院, 贵州 贵阳 550025
目标检测作为机器视觉中重要任务之一,是人工智能体系中一个具有重要研究价值的技术分支。对于卷积神经网络框架、anchor-based模型和anchor-free模型三个主流的目标检测模型进行梳理。首先,综述了主流卷积神经网络框架的网络结构、优缺点以及相关的改进方法;其次从one-stage和two-stage两个分支对anchor-based类模型进行深入分析,总结了不同目标检测方法的研究进展;从早期探索、关键点和密集预测三部分分析anchor-free类模型。最后对该领域的未来发展趋势进行了思考与展望。
图像处理 深度学习 目标检测 网络框架 anchor-based模型 anchor-free模型 
激光与光电子学进展
2020, 57(12): 120005

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!