付惠琛 1,2高军伟 1,2,*车鲁阳 1,2
作者单位
摘要
1 青岛大学 自动化学院,山东 青岛 266071
2 山东省工业控制技术重点实验室,山东 青岛 266071
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。
图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化 image processing key point detection pose estimation convolutional attention mechanism atrous spatial pyramid pooling 
液晶与显示
2024, 39(2): 217
作者单位
摘要
陕西科技大学 电子信息与人工智能学院,陕西 西安 710021
针对雾霾天气下车牌识别存在的精确度低、漏检等问题,提出了一种基于深度学习的雾霾天气下的车牌号码识别方法。首先用AOD-Net算法对车辆图像进行去雾预处理。然后,基于YOLOv5网络设计一种车牌检测网络ACG_YOLOv5s。ACG_YOLOv5s是在YOLOv5s网络的基础上,融入CBAM注意力机制,提高模型的抗干扰能力;引入自适应特征融合网络ASFF,根据模型自适应学习到的权重赋予网络不同特征层不同比重的权值,从而突出重要特征信息;使用Ghost卷积模块替换传统卷积,在保证模型效果的同时减少了网络训练过程中的参数量。最后通过LPRNet对检测到的车牌图像进行识别。实验结果表明,改进后的ACG_YOLOv5s网络车牌检测准确率达到99.6%,LPRNet识别准确率达96%且内存占比小。实验证明AOD-Net算法和YOLO算法结合可更加有效地检测雾霾天气下车牌图像中的车牌号码。
车牌号码识别 AOD-Net算法 YOLOv5网络 注意力机制 license plate number recognition AOD-Net algorithm YOLOv5 network attention mechanism 
液晶与显示
2024, 39(2): 205
杨泞滔 1,2聂勇 1,2
作者单位
摘要
1 中国科学院水利部成都山地灾害与环境研究所,成都 610299
2 中国科学院大学,北京 100049
冰湖溃决洪水是一种严重的山地自然灾害,威胁着中国高寒区的居民及铁路公路等重要基础设施,自动高效的冰湖遥感制图方法是冰湖灾害评估、监测预警的基础,然而现有自动制图方法在实际冰湖提取应用上难以达到传统人工和半自动冰湖提取方法上的精度,仍需进一步提高。文章在原生U-Net模型基础上,在各桥连接部分融合极化自注意力机制,将输入影像特征分别在空间和通道层保持高分辨率,并通过非线性合成输出细腻的特征,构建了一种改进的U-Net冰湖遥感深度学习制图方法,并将其成功应用在高原铁路关键区。研究结果表明:1)与PSPNet、DeepLabV3+、原生U-Net三种经典模型相比,改进模型在冰湖预测数据集上的各项指标上都有提升,精确率、召回率、交并比和F1值分别达到了0.972 5、0.966 5、0.940 8和0.969 4,相较于原生U-Net网络,精确度、召回率、交并比和F1值分别提高了5.01%、6.05%、10.73%和5.53%;2)基于Landsat-8卫星遥感数据,应用改进模型完成了2013—2022年帕隆藏布和易贡藏布案例区冰湖信息自动高效提取,如2020年冰湖总体精度为98.16%,与参照数据的重叠度达到96.66%,提取的精度满足冰湖灾害评估和监测预警研究需求,可用于铁路等重大工程沿线冰湖灾害防治的实践。
遥感监测 冰湖灾害 深度学习 自注意力机制 U-Net卷积神经网络 remote sensing monitoring glacial lake disaster deep learning self-attention mechanism U-Net 
航天返回与遥感
2024, 45(1): 41
作者单位
摘要
山东建筑大学测绘地理信息学院,济南 250101
精准高效地从高分辨率遥感影像中提取建筑物信息对国土规划和地图制图意义重大,近年来基于卷积神经网络进行建筑物信息提取已经取得了很大的进展,然而在处理高分辨率遥感影像时仍存在影像的高级语义特征利用不够充分,难以获得细节丰富高精度分割影像的问题。文章针对以上问题提出了一种用于建筑物自动提取的深度学习网络结构空洞空间与通道感知网络(Atrous Space and Channel Perception Network,ASCP-Net)。该模型将空洞空间金子塔池化(Atrous Spatial Pyramid Pooling, ASPP)和空间与通道注意力 (Spatial and Channel Attention, SCA)模块融入到编码器-解码器结构中,通过ASPP模块来捕获和聚合多尺度上下文信息,采用SCA模块选择性增强特定位置和通道中更有用的信息,并将高低层特征信息输入解码网络完成建筑物信息的高效提取。在WHU建筑数据集(WHU Building Dataset)上进行实验,结果表明:文章提出的方法总体精度和F1评分分别达到了97.4%和94.6%,相比其他模型能够获得更清晰的建筑物边界,尤其对图像边缘不完整建筑的提取效果较好,有效提升了建筑物提取的精度和完整性。
高分辨率遥感影像 双注意力机制 空洞卷积 建筑物提取 high-resolution remote sensing images dual attention mechanism atrous convolution building extraction 
航天返回与遥感
2024, 45(1): 136
作者单位
摘要
1 黔西南州自然资源管理服务中心,兴义 562400
2 贵州大学矿业学院,贵阳 550025
针对传统喀斯特地区裸岩提取方法成本高、精度低的问题,文章构建了一种基于改进DeepLabV3+的裸岩提取方法。该方法首先在编码器中用CA-DC-MobileNetV3替换DeepLabV3+骨干网络Xception进行特征提取,很大程度上减少了模型的参数量;其次,将编码器提取的特征通过特征金字塔网络和坐标注意力机制进行加强特征提取,以获取更多小目标信息并减少图像细节损失;最后在空洞空间金字塔池化模块将不同空洞率的卷积层进行特征融合,提高信息的利用率。研究结果表明:文章方法在不同场景裸岩提取任务中表现最好,模型参数量约为DeepLabV3+的1/13,交并比、F1分数分别为72.46%、84.03%,上述2个指标相比于DeepLabV3+模型分别提高了4.62和3.19个百分点,并优于其余常用语义分割模型,提高了裸岩提取精度。
裸岩提取 深度学习 语义分割 坐标注意力机制 bare rock extraction deep learning semantic segmentation coordinate attention mechanism 
航天返回与遥感
2024, 45(1): 123
作者单位
摘要
1 西安电子科技大学空间科学与技术学院,西安 710126
2 北京航空航天大学电子信息工程学院,北京 100191
3 北京空间机电研究所先进光学遥感技术北京市重点实验室,北京 100094
4 西安航天天绘数据技术有限公司,西安 710100
针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块,实现多尺度道路信息融合;再引入挤压激励通道注意力机制,增强网络特征表征质量;最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化,以降低模型计算复杂度。在公开数据集上进行了模型性能测试,实验结果表明,文章所提算法的准确率、精确率、召回率、F1分数和平均交并比,相比原始HRNet分别提升了5.35 %、2.15 %、4.1 %、3.15 %和14.34 %,且减少了36.1 %的参数数量;相比其他网络,该算法突出了细小道路的特征,道路预测结果连续性、完整性好,并且模型小易于部署在实时检测设备中,有效改善了道路提取任务中错分和缺失的情况,是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。
道路提取 空间金字塔池化 通道注意力机制 可分离卷积 高分辨率网络 遥感影像 road extraction ASPP channel attention mechanism separable convolution High-Resolution Network remote sensing images 
航天返回与遥感
2024, 45(1): 111
作者单位
摘要
1 河北工业大学 人工智能与数据科学学院,天津30030
2 河北省控制工程技术研究中心,天津300130
针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取,导致特征提取不充分的问题,提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息,设计了多尺度特征融合块,其基本单元由自适应双尺度块、多路径渐进式交互块和自适应双维度注意力依次串联组成。首先,自适应双尺度块自主融合两个尺度的特征,获得了更丰富的上下文特征;其次,多路径渐进式交互块以渐进的方式交互自适应双尺度块的输出特征,提高了上下文特征之间的关联性;最后,自适应双维度注意力自主选择不同维度注意力细化输出特征后,提高了输出特征的鉴别力。实验结果表明,在Set5, Set14, BSD100和Urban100测试集上,本文方法在PSNR和SSIM定量指标上相比于其他主流方法相均有提升,尤其对于纹理细节难以恢复的Urban100测试集,本文方法在比例因子为×4时,相较于现有最优方法SwinIR,PSNR和SSIM指标分别提升了0.05 dB和0.004 5;在视觉效果方面,本文的重建图像具有更多的纹理细节。
超分辨率 多尺度特征 注意力机制 自适应权重 渐进式信息交互 super-resolution multi-scale feature attention mechanism adaptive weights progressive information interaction 
光学 精密工程
2024, 32(6): 843
光电工程
2024, 51(1): 230304
作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
针对无人机视角下航拍图像小目标多且检测困难的问题,提出了一个位置敏感Transformer目标检测(PS-TOD)模型。设计了一个基于位置通道嵌入三维注意力(PCE3DA)的多尺度特征融合(MSFF)模块,即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力,用于加强模型对兴趣区域的特征表达能力,且基于它构造了一个自底向上的跨层MSFF方案,使得融合后的特征语义信息更加丰富;然后,设计了一种新的位置敏感自注意力(PSSA)机制,且以此构造位置敏感Transformer编-解码器,使模型在捕获图像全局上下文信息的长期依赖关系时,也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明,提出模型的AP达到28.8%,与基线模型(DETR)相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测,且改善小目标的检测效果。
目标检测 无人机图像 位置敏感Transformer 多尺度特征融合 注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism 
光学 精密工程
2024, 32(5): 727
作者单位
摘要
1 内蒙古科技大学 信息工程学院,内蒙古包头市0400
2 内蒙古工业大学 信息工程学院,内蒙古呼和浩特010051
U型网络结构的脑肿瘤自动分割方法由于多次卷积和采样操作会造成信息损失,导致分割效果不佳。为解决这一问题,提出了能够利用语义信息流引导上采样特征恢复的特征对齐单元,并在此基础上设计轻量级的双重注意力特征对齐网络(DAFANet)。首先,将特征对齐单元分别引入3D UNet、DMFNet和HDCNet三个经典网络,以验证其有效性和泛化性。其次,在DMFNet基础上构造轻量级的双重注意力特征对齐网络DAFANet,利用特征对齐单元强化上采样过程中的特征恢复,3D期望最大化注意力机制同时作用于特征对齐路径和级联路径,用于重点获取上下文的全程依赖关系。同时使用广义Dice损失函数提升数据不平衡时的分割精度并加快模型收敛。最后,在BraTS2018和BraTS2019公开数据集进行验证,文中所提算法在ET,WT和TC区域的分割精度分别达到80.44%,90.07%,84.57%和78.11%,90.10%,82.21%。相较于当前流行的分割网络,具有对增强肿瘤区域更好的分割效果,更擅长处理细节和边缘信息。
脑肿瘤 图像分割 特征对齐 注意力机制 轻量化 brain tumors image segmentation feature alignment attention mechanism lightweight 
光学 精密工程
2024, 32(4): 565

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!