相同关键词【attention mechanism】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 青岛大学自动化学院，山东青岛 266071

² 山东省工业控制技术重点实验室，山东青岛 266071

人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题，本文提出了一种改进的YOLOv7-POSE算法，并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础，对原始网络模型添加了分类的功能，在Backbone主干网络中引入CA卷积注意力机制，提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核，提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构，提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU，提高了坐标回归的精度。设计了两组对照实验，实验结果证明，改进后的YOLOv7-POSE在验证集上的mAP为95.7%，相比于原始YOLOv7算法提高了4%，各类运动动作识别准确率显著上升，在实际推理中的关键点错检、漏检等情况明显减少，关键点位置估计误差明显降低。

图像处理关键点检测姿态估计注意力机制空洞空间金字塔池化 image processing key point detection pose estimation convolutional attention mechanism atrous spatial pyramid pooling

PDF全文 Full Text

液晶与显示

2024, 39(2): 217

研究论文

基于深度学习的雾霾天气下的车牌号码识别方法

杨云 ^*王静姜佳乐

作者单位

摘要

陕西科技大学电子信息与人工智能学院，陕西西安 710021

针对雾霾天气下车牌识别存在的精确度低、漏检等问题，提出了一种基于深度学习的雾霾天气下的车牌号码识别方法。首先用AOD-Net算法对车辆图像进行去雾预处理。然后，基于YOLOv5网络设计一种车牌检测网络ACG_YOLOv5s。ACG_YOLOv5s是在YOLOv5s网络的基础上，融入CBAM注意力机制，提高模型的抗干扰能力；引入自适应特征融合网络ASFF，根据模型自适应学习到的权重赋予网络不同特征层不同比重的权值，从而突出重要特征信息；使用Ghost卷积模块替换传统卷积，在保证模型效果的同时减少了网络训练过程中的参数量。最后通过LPRNet对检测到的车牌图像进行识别。实验结果表明，改进后的ACG_YOLOv5s网络车牌检测准确率达到99.6%，LPRNet识别准确率达96%且内存占比小。实验证明AOD-Net算法和YOLO算法结合可更加有效地检测雾霾天气下车牌图像中的车牌号码。

车牌号码识别 AOD-Net算法 YOLOv5网络注意力机制 license plate number recognition AOD-Net algorithm YOLOv5 network attention mechanism

PDF全文 Full Text

液晶与显示

2024, 39(2): 205

铁路遥感应用技术

一种改进的深度学习冰湖遥感制图方法及应用

杨泞滔 ^1,2聂勇 ^1,2

作者单位

摘要

¹ 中国科学院水利部成都山地灾害与环境研究所，成都 610299

² 中国科学院大学，北京 100049

冰湖溃决洪水是一种严重的山地自然灾害，威胁着中国高寒区的居民及铁路公路等重要基础设施，自动高效的冰湖遥感制图方法是冰湖灾害评估、监测预警的基础，然而现有自动制图方法在实际冰湖提取应用上难以达到传统人工和半自动冰湖提取方法上的精度，仍需进一步提高。文章在原生U-Net模型基础上，在各桥连接部分融合极化自注意力机制，将输入影像特征分别在空间和通道层保持高分辨率，并通过非线性合成输出细腻的特征，构建了一种改进的U-Net冰湖遥感深度学习制图方法，并将其成功应用在高原铁路关键区。研究结果表明：1）与PSPNet、DeepLabV3+、原生U-Net三种经典模型相比，改进模型在冰湖预测数据集上的各项指标上都有提升，精确率、召回率、交并比和F₁值分别达到了0.972 5、0.966 5、0.940 8和0.969 4，相较于原生U-Net网络，精确度、召回率、交并比和F₁值分别提高了5.01%、6.05%、10.73%和5.53%；2）基于Landsat-8卫星遥感数据，应用改进模型完成了2013—2022年帕隆藏布和易贡藏布案例区冰湖信息自动高效提取，如2020年冰湖总体精度为98.16%，与参照数据的重叠度达到96.66%，提取的精度满足冰湖灾害评估和监测预警研究需求，可用于铁路等重大工程沿线冰湖灾害防治的实践。

遥感监测冰湖灾害深度学习自注意力机制 U-Net卷积神经网络 remote sensing monitoring glacial lake disaster deep learning self-attention mechanism U-Net

PDF全文 Full Text

航天返回与遥感

2024, 45(1): 41

遥感数据处理与应用

融合ASPP与双注意力机制的建筑物提取模型

于明洋徐海青 ^*张文焯徐帅周放亮

作者单位

摘要

山东建筑大学测绘地理信息学院，济南 250101

精准高效地从高分辨率遥感影像中提取建筑物信息对国土规划和地图制图意义重大，近年来基于卷积神经网络进行建筑物信息提取已经取得了很大的进展，然而在处理高分辨率遥感影像时仍存在影像的高级语义特征利用不够充分，难以获得细节丰富高精度分割影像的问题。文章针对以上问题提出了一种用于建筑物自动提取的深度学习网络结构空洞空间与通道感知网络(Atrous Space and Channel Perception Network，ASCP-Net）。该模型将空洞空间金子塔池化（Atrous Spatial Pyramid Pooling, ASPP）和空间与通道注意力（Spatial and Channel Attention, SCA）模块融入到编码器-解码器结构中，通过ASPP模块来捕获和聚合多尺度上下文信息，采用SCA模块选择性增强特定位置和通道中更有用的信息，并将高低层特征信息输入解码网络完成建筑物信息的高效提取。在WHU建筑数据集（WHU Building Dataset）上进行实验，结果表明：文章提出的方法总体精度和F₁评分分别达到了97.4%和94.6%，相比其他模型能够获得更清晰的建筑物边界，尤其对图像边缘不完整建筑的提取效果较好，有效提升了建筑物提取的精度和完整性。

高分辨率遥感影像双注意力机制空洞卷积建筑物提取 high-resolution remote sensing images dual attention mechanism atrous convolution building extraction

PDF全文 Full Text

航天返回与遥感

2024, 45(1): 136

遥感数据处理与应用

基于改进DeepLabV3+的石漠化地区裸岩信息提取

吴永俊 ¹汪泓 ^2,*杨晨 ²

作者单位

摘要

¹ 黔西南州自然资源管理服务中心，兴义 562400

² 贵州大学矿业学院，贵阳 550025

针对传统喀斯特地区裸岩提取方法成本高、精度低的问题，文章构建了一种基于改进DeepLabV3+的裸岩提取方法。该方法首先在编码器中用CA-DC-MobileNetV3替换DeepLabV3+骨干网络Xception进行特征提取，很大程度上减少了模型的参数量；其次，将编码器提取的特征通过特征金字塔网络和坐标注意力机制进行加强特征提取，以获取更多小目标信息并减少图像细节损失；最后在空洞空间金字塔池化模块将不同空洞率的卷积层进行特征融合，提高信息的利用率。研究结果表明：文章方法在不同场景裸岩提取任务中表现最好，模型参数量约为DeepLabV3+的1/13，交并比、F₁分数分别为72.46%、84.03%，上述2个指标相比于DeepLabV3+模型分别提高了4.62和3.19个百分点，并优于其余常用语义分割模型，提高了裸岩提取精度。

裸岩提取深度学习语义分割坐标注意力机制 bare rock extraction deep learning semantic segmentation coordinate attention mechanism

PDF全文 Full Text

航天返回与遥感

2024, 45(1): 123

遥感数据处理与应用

融合空洞空间金字塔池化和注意力的轻量化遥感影像道路提取

刘志恒 ¹岳子腾 ^2,*周绥平 ¹江澄 ³[ ... ]陈雪梅 ⁴

作者单位

摘要

¹ 西安电子科技大学空间科学与技术学院，西安 710126

² 北京航空航天大学电子信息工程学院，北京 100191

³ 北京空间机电研究所先进光学遥感技术北京市重点实验室，北京 100094

⁴ 西安航天天绘数据技术有限公司，西安 710100

针对高分辨率遥感影像中道路形状结构错综复杂，出现窄小型道路提取错误或漏分的问题，提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先，在原始高分辨率网络（HRNet）基础上，通过引入空洞空间金字塔池化模块，实现多尺度道路信息融合；再引入挤压激励通道注意力机制，增强网络特征表征质量；最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化，以降低模型计算复杂度。在公开数据集上进行了模型性能测试，实验结果表明，文章所提算法的准确率、精确率、召回率、F1分数和平均交并比，相比原始HRNet分别提升了5.35 %、2.15 %、4.1 %、3.15 %和14.34 %，且减少了36.1 %的参数数量；相比其他网络，该算法突出了细小道路的特征，道路预测结果连续性、完整性好，并且模型小易于部署在实时检测设备中，有效改善了道路提取任务中错分和缺失的情况，是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。

道路提取空间金字塔池化通道注意力机制可分离卷积高分辨率网络遥感影像 road extraction ASPP channel attention mechanism separable convolution High-Resolution Network remote sensing images

PDF全文 Full Text

航天返回与遥感

2024, 45(1): 111

信息科学

基于多尺度自适应注意力的图像超分辨率网络

周颖 ^1,2,*裴盛虎 ¹陈海永 ^1,2许士博 ¹

作者单位

摘要

¹ 河北工业大学人工智能与数据科学学院，天津30030

² 河北省控制工程技术研究中心，天津300130

针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取，导致特征提取不充分的问题，提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息，设计了多尺度特征融合块，其基本单元由自适应双尺度块、多路径渐进式交互块和自适应双维度注意力依次串联组成。首先，自适应双尺度块自主融合两个尺度的特征，获得了更丰富的上下文特征；其次，多路径渐进式交互块以渐进的方式交互自适应双尺度块的输出特征，提高了上下文特征之间的关联性；最后，自适应双维度注意力自主选择不同维度注意力细化输出特征后，提高了输出特征的鉴别力。实验结果表明，在Set5， Set14， BSD100和Urban100测试集上，本文方法在PSNR和SSIM定量指标上相比于其他主流方法相均有提升，尤其对于纹理细节难以恢复的Urban100测试集，本文方法在比例因子为×4时，相较于现有最优方法SwinIR，PSNR和SSIM指标分别提升了0.05 dB和0.004 5；在视觉效果方面，本文的重建图像具有更多的纹理细节。

超分辨率多尺度特征注意力机制自适应权重渐进式信息交互 super-resolution multi-scale feature attention mechanism adaptive weights progressive information interaction

PDF全文 Full Text

光学精密工程

2024, 32(6): 843

面向道路场景语义分割的移动窗口变换神经网络设计

杭昊黄影平 ^*张栩瑞罗鑫

作者单位

摘要

上海理工大学光电信息与计算机工程学院，上海 200093

语义分割移动窗口变换神经网络注意力机制自动驾驶深度学习 semantic segmentation Swin Transformer attention mechanism autonomous driving deep learning

PDF全文 Full Text

光电工程

2024, 51(1): 230304

信息科学

位置敏感Transformer航拍图像目标检测模型

李大湘辛嘉妮 ^*刘颖

作者单位

摘要

西安邮电大学通信与信息工程学院，陕西西安710121

针对无人机视角下航拍图像小目标多且检测困难的问题，提出了一个位置敏感Transformer目标检测（PS-TOD）模型。设计了一个基于位置通道嵌入三维注意力（PCE3DA）的多尺度特征融合（MSFF）模块，即PCE3DA利用空间与通道信息的相互依赖关系生成三维注意力，用于加强模型对兴趣区域的特征表达能力，且基于它构造了一个自底向上的跨层MSFF方案，使得融合后的特征语义信息更加丰富；然后，设计了一种新的位置敏感自注意力（PSSA）机制，且以此构造位置敏感Transformer编-解码器，使模型在捕获图像全局上下文信息的长期依赖关系时，也可提高模型对目标的位置敏感能力。基于无人机航拍数据集VisDrone的对比实验结果表明，提出模型的AP达到28.8%，与基线模型（DETR）相比提高了4.1%。该模型在复杂背景下能对无人机航拍图像进行精确的目标检测，且改善小目标的检测效果。

目标检测无人机图像位置敏感Transformer 多尺度特征融合注意力机制 object detection unmanned aerial vehicle image position sensitive Transformer multi-scale feature fusion attention mechanism

PDF全文 Full Text

光学精密工程

2024, 32(5): 727

信息科学

语义流引导采样结合注意力机制的脑肿瘤图像分割

宋建丽 ¹吕晓琪 ^1,2,*谷宇 ¹

作者单位

摘要

¹ 内蒙古科技大学信息工程学院，内蒙古包头市0400

² 内蒙古工业大学信息工程学院，内蒙古呼和浩特010051

U型网络结构的脑肿瘤自动分割方法由于多次卷积和采样操作会造成信息损失，导致分割效果不佳。为解决这一问题，提出了能够利用语义信息流引导上采样特征恢复的特征对齐单元，并在此基础上设计轻量级的双重注意力特征对齐网络（DAFANet）。首先，将特征对齐单元分别引入3D UNet、DMFNet和HDCNet三个经典网络，以验证其有效性和泛化性。其次，在DMFNet基础上构造轻量级的双重注意力特征对齐网络DAFANet，利用特征对齐单元强化上采样过程中的特征恢复，3D期望最大化注意力机制同时作用于特征对齐路径和级联路径，用于重点获取上下文的全程依赖关系。同时使用广义Dice损失函数提升数据不平衡时的分割精度并加快模型收敛。最后，在BraTS2018和BraTS2019公开数据集进行验证，文中所提算法在ET，WT和TC区域的分割精度分别达到80.44%，90.07%，84.57%和78.11%，90.10%，82.21%。相较于当前流行的分割网络，具有对增强肿瘤区域更好的分割效果，更擅长处理细节和边缘信息。

脑肿瘤图像分割特征对齐注意力机制轻量化 brain tumors image segmentation feature alignment attention mechanism lightweight

PDF全文 Full Text

光学精密工程

2024, 32(4): 565

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索