付惠琛 1,2高军伟 1,2,*车鲁阳 1,2
作者单位
摘要
1 青岛大学 自动化学院,山东 青岛 266071
2 山东省工业控制技术重点实验室,山东 青岛 266071
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。
图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化 image processing key point detection pose estimation convolutional attention mechanism atrous spatial pyramid pooling 
液晶与显示
2024, 39(2): 217
作者单位
摘要
陕西科技大学 电子信息与人工智能学院,陕西 西安 710021
针对雾霾天气下车牌识别存在的精确度低、漏检等问题,提出了一种基于深度学习的雾霾天气下的车牌号码识别方法。首先用AOD-Net算法对车辆图像进行去雾预处理。然后,基于YOLOv5网络设计一种车牌检测网络ACG_YOLOv5s。ACG_YOLOv5s是在YOLOv5s网络的基础上,融入CBAM注意力机制,提高模型的抗干扰能力;引入自适应特征融合网络ASFF,根据模型自适应学习到的权重赋予网络不同特征层不同比重的权值,从而突出重要特征信息;使用Ghost卷积模块替换传统卷积,在保证模型效果的同时减少了网络训练过程中的参数量。最后通过LPRNet对检测到的车牌图像进行识别。实验结果表明,改进后的ACG_YOLOv5s网络车牌检测准确率达到99.6%,LPRNet识别准确率达96%且内存占比小。实验证明AOD-Net算法和YOLO算法结合可更加有效地检测雾霾天气下车牌图像中的车牌号码。
车牌号码识别 AOD-Net算法 YOLOv5网络 注意力机制 license plate number recognition AOD-Net algorithm YOLOv5 network attention mechanism 
液晶与显示
2024, 39(2): 205
作者单位
摘要
宁夏大学 物理与电子电气工程学院,宁夏 银川 750021
针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能够捕获大量文本的先验知识,实现对上下文信息的深度挖掘;然后在DMGAN模型生成图像的初始阶段和图像细化阶段均加入通道注意力模块,突出重要的特征通道,进一步提升生成图像的语义一致性和空间布局合理性,以及模型的收敛速度和稳定性。实验结果表明,所提出模型在CUB数据集上生成的图像相比原DMGAN模型,IS指标提升了0.47,FID指标降低了2.78,充分说明该模型具有更好的跨模态生成能力。
文本生成图像 XLnet模型 生成对抗网络 通道注意力 text-to-image XLnet model generate adversarial networks attention of channel 
液晶与显示
2024, 39(2): 168
杨泞滔 1,2聂勇 1,2
作者单位
摘要
1 中国科学院水利部成都山地灾害与环境研究所,成都 610299
2 中国科学院大学,北京 100049
冰湖溃决洪水是一种严重的山地自然灾害,威胁着中国高寒区的居民及铁路公路等重要基础设施,自动高效的冰湖遥感制图方法是冰湖灾害评估、监测预警的基础,然而现有自动制图方法在实际冰湖提取应用上难以达到传统人工和半自动冰湖提取方法上的精度,仍需进一步提高。文章在原生U-Net模型基础上,在各桥连接部分融合极化自注意力机制,将输入影像特征分别在空间和通道层保持高分辨率,并通过非线性合成输出细腻的特征,构建了一种改进的U-Net冰湖遥感深度学习制图方法,并将其成功应用在高原铁路关键区。研究结果表明:1)与PSPNet、DeepLabV3+、原生U-Net三种经典模型相比,改进模型在冰湖预测数据集上的各项指标上都有提升,精确率、召回率、交并比和F1值分别达到了0.972 5、0.966 5、0.940 8和0.969 4,相较于原生U-Net网络,精确度、召回率、交并比和F1值分别提高了5.01%、6.05%、10.73%和5.53%;2)基于Landsat-8卫星遥感数据,应用改进模型完成了2013—2022年帕隆藏布和易贡藏布案例区冰湖信息自动高效提取,如2020年冰湖总体精度为98.16%,与参照数据的重叠度达到96.66%,提取的精度满足冰湖灾害评估和监测预警研究需求,可用于铁路等重大工程沿线冰湖灾害防治的实践。
遥感监测 冰湖灾害 深度学习 自注意力机制 U-Net卷积神经网络 remote sensing monitoring glacial lake disaster deep learning self-attention mechanism U-Net 
航天返回与遥感
2024, 45(1): 41
作者单位
摘要
山东建筑大学测绘地理信息学院,济南 250101
精准高效地从高分辨率遥感影像中提取建筑物信息对国土规划和地图制图意义重大,近年来基于卷积神经网络进行建筑物信息提取已经取得了很大的进展,然而在处理高分辨率遥感影像时仍存在影像的高级语义特征利用不够充分,难以获得细节丰富高精度分割影像的问题。文章针对以上问题提出了一种用于建筑物自动提取的深度学习网络结构空洞空间与通道感知网络(Atrous Space and Channel Perception Network,ASCP-Net)。该模型将空洞空间金子塔池化(Atrous Spatial Pyramid Pooling, ASPP)和空间与通道注意力 (Spatial and Channel Attention, SCA)模块融入到编码器-解码器结构中,通过ASPP模块来捕获和聚合多尺度上下文信息,采用SCA模块选择性增强特定位置和通道中更有用的信息,并将高低层特征信息输入解码网络完成建筑物信息的高效提取。在WHU建筑数据集(WHU Building Dataset)上进行实验,结果表明:文章提出的方法总体精度和F1评分分别达到了97.4%和94.6%,相比其他模型能够获得更清晰的建筑物边界,尤其对图像边缘不完整建筑的提取效果较好,有效提升了建筑物提取的精度和完整性。
高分辨率遥感影像 双注意力机制 空洞卷积 建筑物提取 high-resolution remote sensing images dual attention mechanism atrous convolution building extraction 
航天返回与遥感
2024, 45(1): 136
作者单位
摘要
1 黔西南州自然资源管理服务中心,兴义 562400
2 贵州大学矿业学院,贵阳 550025
针对传统喀斯特地区裸岩提取方法成本高、精度低的问题,文章构建了一种基于改进DeepLabV3+的裸岩提取方法。该方法首先在编码器中用CA-DC-MobileNetV3替换DeepLabV3+骨干网络Xception进行特征提取,很大程度上减少了模型的参数量;其次,将编码器提取的特征通过特征金字塔网络和坐标注意力机制进行加强特征提取,以获取更多小目标信息并减少图像细节损失;最后在空洞空间金字塔池化模块将不同空洞率的卷积层进行特征融合,提高信息的利用率。研究结果表明:文章方法在不同场景裸岩提取任务中表现最好,模型参数量约为DeepLabV3+的1/13,交并比、F1分数分别为72.46%、84.03%,上述2个指标相比于DeepLabV3+模型分别提高了4.62和3.19个百分点,并优于其余常用语义分割模型,提高了裸岩提取精度。
裸岩提取 深度学习 语义分割 坐标注意力机制 bare rock extraction deep learning semantic segmentation coordinate attention mechanism 
航天返回与遥感
2024, 45(1): 123
作者单位
摘要
1 西安电子科技大学空间科学与技术学院,西安 710126
2 北京航空航天大学电子信息工程学院,北京 100191
3 北京空间机电研究所先进光学遥感技术北京市重点实验室,北京 100094
4 西安航天天绘数据技术有限公司,西安 710100
针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块,实现多尺度道路信息融合;再引入挤压激励通道注意力机制,增强网络特征表征质量;最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化,以降低模型计算复杂度。在公开数据集上进行了模型性能测试,实验结果表明,文章所提算法的准确率、精确率、召回率、F1分数和平均交并比,相比原始HRNet分别提升了5.35 %、2.15 %、4.1 %、3.15 %和14.34 %,且减少了36.1 %的参数数量;相比其他网络,该算法突出了细小道路的特征,道路预测结果连续性、完整性好,并且模型小易于部署在实时检测设备中,有效改善了道路提取任务中错分和缺失的情况,是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。
道路提取 空间金字塔池化 通道注意力机制 可分离卷积 高分辨率网络 遥感影像 road extraction ASPP channel attention mechanism separable convolution High-Resolution Network remote sensing images 
航天返回与遥感
2024, 45(1): 111
作者单位
摘要
1 河北工业大学 人工智能与数据科学学院,天津30030
2 河北省控制工程技术研究中心,天津300130
针对大多数图像超分辨率重建方法利用单尺度卷积进行特征提取,导致特征提取不充分的问题,提出基于多尺度自适应注意力的图像超分辨率网络。为充分利用各个层次特征中的上下文信息,设计了多尺度特征融合块,其基本单元由自适应双尺度块、多路径渐进式交互块和自适应双维度注意力依次串联组成。首先,自适应双尺度块自主融合两个尺度的特征,获得了更丰富的上下文特征;其次,多路径渐进式交互块以渐进的方式交互自适应双尺度块的输出特征,提高了上下文特征之间的关联性;最后,自适应双维度注意力自主选择不同维度注意力细化输出特征后,提高了输出特征的鉴别力。实验结果表明,在Set5, Set14, BSD100和Urban100测试集上,本文方法在PSNR和SSIM定量指标上相比于其他主流方法相均有提升,尤其对于纹理细节难以恢复的Urban100测试集,本文方法在比例因子为×4时,相较于现有最优方法SwinIR,PSNR和SSIM指标分别提升了0.05 dB和0.004 5;在视觉效果方面,本文的重建图像具有更多的纹理细节。
超分辨率 多尺度特征 注意力机制 自适应权重 渐进式信息交互 super-resolution multi-scale feature attention mechanism adaptive weights progressive information interaction 
光学 精密工程
2024, 32(6): 843
光电工程
2024, 51(1): 230304
Author Affiliations
Abstract
1 School of Biomedical Engineering (Suzhou), Division of Life Sciences and Medicine, University of Science and Technology of China, Hefei, Anhui 230026, P. R. China
2 Suzhou Institute of Biomedical Engineering and Technology, Chinese Academy of Sciences, Suzhou, Jiangsu 215163, P. R. China
3 School of Physical Science and Technology, Suzhou University of Science and Technology, Suzhou, Jiangsu 215009, P. R. China
Structured illumination microscopy (SIM) is a popular and powerful super-resolution (SR) technique in biomedical research. However, the conventional reconstruction algorithm for SIM heavily relies on the accurate prior knowledge of illumination patterns and signal-to-noise ratio (SNR) of raw images. To obtain high-quality SR images, several raw images need to be captured under high fluorescence level, which further restricts SIM’s temporal resolution and its applications. Deep learning (DL) is a data-driven technology that has been used to expand the limits of optical microscopy. In this study, we propose a deep neural network based on multi-level wavelet and attention mechanism (MWAM) for SIM. Our results show that the MWAM network can extract high-frequency information contained in SIM raw images and accurately integrate it into the output image, resulting in superior SR images compared to those generated using wide-field images as input data. We also demonstrate that the number of SIM raw images can be reduced to three, with one image in each illumination orientation, to achieve the optimal tradeoff between temporal and spatial resolution. Furthermore, our MWAM network exhibits superior reconstruction ability on low-SNR images compared to conventional SIM algorithms. We have also analyzed the adaptability of this network on other biological samples and successfully applied the pretrained model to other SIM systems.
Super-resolution reconstruction multi-level wavelet packet transform residual channel attention selective kernel attention 
Journal of Innovative Optical Health Sciences
2024, 17(2): 2350015

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!