作者单位
摘要
宁夏大学 物理与电子电气工程学院,宁夏 银川 750021
针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能够捕获大量文本的先验知识,实现对上下文信息的深度挖掘;然后在DMGAN模型生成图像的初始阶段和图像细化阶段均加入通道注意力模块,突出重要的特征通道,进一步提升生成图像的语义一致性和空间布局合理性,以及模型的收敛速度和稳定性。实验结果表明,所提出模型在CUB数据集上生成的图像相比原DMGAN模型,IS指标提升了0.47,FID指标降低了2.78,充分说明该模型具有更好的跨模态生成能力。
文本生成图像 XLnet模型 生成对抗网络 通道注意力 text-to-image XLnet model generate adversarial networks attention of channel 
液晶与显示
2024, 39(2): 168
作者单位
摘要
1 西安电子科技大学空间科学与技术学院,西安 710126
2 北京航空航天大学电子信息工程学院,北京 100191
3 北京空间机电研究所先进光学遥感技术北京市重点实验室,北京 100094
4 西安航天天绘数据技术有限公司,西安 710100
针对高分辨率遥感影像中道路形状结构错综复杂,出现窄小型道路提取错误或漏分的问题,提出一种基于空洞空间金字塔池化和注意力机制的轻量化遥感影像道路提取方法。首先,在原始高分辨率网络(HRNet)基础上,通过引入空洞空间金字塔池化模块,实现多尺度道路信息融合;再引入挤压激励通道注意力机制,增强网络特征表征质量;最后使用深度可分离卷积方法改进网络残差模块实现模型轻量化,以降低模型计算复杂度。在公开数据集上进行了模型性能测试,实验结果表明,文章所提算法的准确率、精确率、召回率、F1分数和平均交并比,相比原始HRNet分别提升了5.35 %、2.15 %、4.1 %、3.15 %和14.34 %,且减少了36.1 %的参数数量;相比其他网络,该算法突出了细小道路的特征,道路预测结果连续性、完整性好,并且模型小易于部署在实时检测设备中,有效改善了道路提取任务中错分和缺失的情况,是一种适应性更强、分割精度更高、更轻量化的多尺度道路提取算法。
道路提取 空间金字塔池化 通道注意力机制 可分离卷积 高分辨率网络 遥感影像 road extraction ASPP channel attention mechanism separable convolution High-Resolution Network remote sensing images 
航天返回与遥感
2024, 45(1): 111
贾剑利 1,2,3韩慧妍 1,2,3,*况立群 1,2,3韩方正 1,2,3[ ... ]张秀权 1,2,3
作者单位
摘要
1 中北大学计算机科学与技术学院,山西 太原 030051
2 机器视觉与虚拟现实山西省重点实验室,山西 太原 030051
3 山西省视觉信息处理及智能机器人工程研究中心,山西 太原 030051
当前基于深度学习的目标检测算法已较为成熟。然而,基于少量样本检测新类仍具有挑战性,因为少样本条件下的深度学习容易导致特征空间退化。现有工作采用整体微调范式在丰富样本的基类上进行预训练,在此基础上构建新类的特征空间。然而,新类基于多个基类隐式地构造特征空间,其结构较为分散,导致基类与新类之间可分性较差。采用对新类和与其相似的基类进行关联再识别的方法进行少样本目标检测。通过引入动态感兴趣区域头,提升模型对训练样本的利用率,基于二者间的语义相似度,显式地为新类构建特征空间。通过解耦基类和新类的分类分支、添加通道注意力模块及增加边界损失函数,提升二者间的可分性。在标准PASCAL VOC数据集上的实验结果表明,所提方法的nAP50均值较TFA、MPSR及DiGeo分别提升10.2、5.4、7.8。
少样本目标检测 关联和识别 动态感兴趣区域头 通道注意力 边界损失 
激光与光电子学进展
2024, 61(8): 0837015
作者单位
摘要
西安邮电大学 通信与信息工程学院,陕西西安710121
由于卷积操作的局限性,现有的皮肤病变图像分割网络无法对图像中的全局上下文信息建模,导致其无法有效捕获图像的目标结构信息,本文设计了一个融入交叉自注意力编码的U型混合网络,用于皮肤病变图像分割。首先,将设计的多头门控位置交叉自注意力编码器引入到U型网络的最后两个层级中,使其能够在图像中学习语义信息的长期依赖关系,弥补卷积操作全局建模能力的不足;其次,在跳跃连接部分引入一个新的位置通道注意力机制,用于编码融合特征的通道信息并保留位置信息,提高网络捕获目标结构的能力;最后,设计一个正则化Dice损失函数,使网络能够在假阳性和假阴性之间权衡,提高网络的分割结果。基于ISBI2017和ISIC2018数据集的对比实验结果表明,本文网络的Dice分别为91.48%和91.30%,IoU分别为84.42%和84.12%,分割精度在整体上优于其他网络,且具有较低的参数量和计算复杂度,即本文网络能够高效地分割皮肤病变图像的目标区域,可为皮肤疾病辅助诊断提供帮助。
医学图像分割 皮肤病变 交叉自注意力编码 位置通道注意力 medical image segmentation skin lesion cross-self-attention coding position channel attention 
光学 精密工程
2024, 32(4): 609
作者单位
摘要
长春理工大学电子信息工程学院,吉林 长春 130012
针对彩色图像引导的深度图像超分辨率重建算法中存在的纹理转移和深度流失的问题,提出一种基于双特征融合引导的深度图像超分辨率重建网络(DF-Net)。为了充分利用深度和强度特征的关联性,在网络模型的深度恢复重建部分采用双通道融合模块(DCM)和双特征引导重建模块(DGM)。利用输入金字塔结构提取深度信息和强度信息的多尺度特征:DCM基于通道注意力机制对深度特征和强度特征进行通道间的特征融合与增强;DGM将深度、强度特征自适应选择融合后实现重建的双特征引导,增加了深度特征的引导作用,改善了纹理转移和深度流失的问题。实验结果表明,所提方法的峰值信噪比(PSNR)和均方根误差(RMSE)优于RMRF、JBU和Depth-Net等方法,尤其4×超分辨率重建结果的PSNR值比其他方法平均提升6.79 dB,RMSE平均下降0.94,取得了较好的深度图像超分辨率重建效果。
图像处理 图像超分辨率重建 卷积神经网络 深度图像 特征融合 通道注意力 
激光与光电子学进展
2024, 61(8): 0837007
作者单位
摘要
火箭军工程大学 导弹工程学院,陕西 西安 710025
针对现有目标检测算法未考虑无人机群成员之间相互关系,容易出现漏检、误检群成员和未能感知无人机群队形结构特性的问题,提出了一种基于红外探测的无人机群结构特性感知方法。首先,为减少图像中无人机外观特征损失,设计了空间深度-通道注意力模块,该模块结合空间深度转换模块保留判别特征信息的优点和通道注意力关注通道间相关性的特点,提高了检测网络的特征提取能力;其次,为充分利用图像中无人机群成员的位置、边界框大小等结构信息,提出了群成员关系模块,将无人机的结构信息融入到无人机群成员之间的关联信息,提高了检测网络对无人机群成员的检测定位能力。最后,在自建的Drone-swarms Dataset数据集上开展实验验证。实验结果表明:文中提出的无人机群结构特性感知算法的mAP达到了95.9%,较原始YOLOv5算法的mAP提高了约7%,有效提高了无人机群成员的检测精度;同时,检测速度达到59帧/s,实现了无人机群目标的实时检测,进而实现了无人机群队形结构特性的感知。
红外探测 无人机群 群成员结构 通道注意力 群成员关系 infrared detection UAV group group member structure channel attention group member relation 
红外与激光工程
2024, 53(1): 20230429
作者单位
摘要
杭州电子科技大学自动化学院,浙江 杭州 310018
针对基于卷积自编码进行空-谱联合的高光谱解混方法中,过度引入像元光谱之间的空间相关性导致丰度过于平滑的现象,提出一种结合注意力机制的双流卷积自编码高光谱解混方法(DSCU-Net)。首先,利用双流卷积网络分别提取高光谱图像的空间特征和光谱特征;其次,为了确保空间特征和光谱特征之间的平衡性,引入通道注意力机制对提取到的空间特征进行重加权,并对光谱特征和重加权后的空间特征进行融合;最后,使用融合后的特征进行高光谱图像重构,并将重构结果送入解混网络的主干网络中进行光谱解混。通过最小化两次重构误差进行解混网络的训练。为了验证所提方法的性能,在两个真实数据集上进行实验,并对复杂场景下算法的性能表现进行分析。结果表明,DSCU-Net能够有效减少过度引入空间相关性造成丰度过于平滑的现象,具有更好的解混性能。
遥感 高光谱解混 卷积自编码器 通道注意力机制 双流结构 
激光与光电子学进展
2024, 61(4): 0428008
作者单位
摘要
河北经贸大学信息技术学院,河北石家庄 050061
针对红外图像存在细节纹理特征差、对比度低、目标检测效果差等问题,基于 YOLOv4(You Only Look Once version 4)架构提出了一种融合通道注意力机制的多尺度红外目标检测模型。该模型首先通过降低主干特征提取网络深度,减少了模型参数。其次,为补充浅层高分辨率特征信息,重新构建多尺度特征融合模块,提高了特征信息利用率。最后在多尺度加强特征图输出前,融入通道注意力机制,进一步提高红外特征提取能力,降低噪声干扰。实验结果表明,本文算法模型大小仅为 YOLOv4的 28.87%,对红外目标的检测精度得到了明显提升。
红外图像 目标检测 通道注意力机制 infrared image, target detection, YOLOv4, attentio YOLOv4 
红外技术
2023, 45(7): 746
作者单位
摘要
河北工业大学, 天津 300400
红移是星系的基本参数之一。 大量已知星系只有测光图像而并没有光谱, 因此通过测光图像而非光谱来求取红移值具有重要的研究意义。 首先构建了一种基于测光图像估计星系红移的回归网络(GRRnet)。 它和以往的类似方法相比网络层数更深, 而且增加了注意力机制, 使模型能聚焦更为有用的信息。 在GRRnet的基础上, 进一步提出了一种两步走的策略, GRRnet-C-R: 第一步把星系按照红移进行粗分类; 第二步按照分好的类分别进行回归估计, 最后再合并到一起。 这种策略可明显减小测光红移估计的误差。 该工作的数据全部来源于斯隆数字巡天(SDSS)的第十六次数据发布SDSS DR16, 从中选取了96 024个红移小于0.6的星系, 每个星系的相关数据包含g, r, z三个波段的合成图像、 u, g, r, i, z五波段的测光值、 以及被视作标签的光谱红移。 在预处理过程中, 将测光图像剪切成50×50的尺寸, 目的是在保障减少计算量的同时能框选住大部分星系。 由于对比算法NetZ的输入尺寸为64×64, 为了保持输入尺寸一致, 使用cv2.resize函数将图像尺寸更改为64×64。 实验采用了七种评价指标与多种方法进行对比, 结果表明GRRnet-C-R的均方误差(MSE)低至0.001 46, 与随机森林(RF)、 极限梯度提升(XGBoost)和NetZ相比误差分别降低了22.3%、 21.9%和18.0%。 GRRnet-C-R的线性回归决定系数R2达到了0.948, 取得了一个很好的模型拟合效果。 实验结果证明了这种两步走的策略能有效降低测光红移估计的误差, 这为之后的测光红移估计提供了一种新的思路和方法。
红移估计 星系红移回归网络 通道注意力机制 测光图像 两步走策略 Redshift estimation Galaxy redshift regression network Channel attention mechanism Photometric image Two-step strategy 
光谱学与光谱分析
2023, 43(8): 2529
作者单位
摘要
1 重庆大学 光电技术及系统教育部重点实验室,重庆400044
2 重庆科技学院 电气工程学院,重庆401331
针对元学习少样本分类样本特征鉴别能力不足的问题,提出了一种类内-类间通道注意力少样本分类方法(Intra-inter Channel Attention Few-shot Classification, ICAFSC)。ICAFSC在原型网络基础上设计了一个类内-类间通道注意力模块,该模块通过类内-类间距离度量计算通道权重实现特征加权,提高特征对类别的鉴别能力。为了克服直接在元训练阶段学习类内-类间通道注意力模块容易出现过拟合或欠拟合现象的问题,ICAFSC在原型网络的元训练之前增加一个预训练阶段。该阶段设计具有大量标记样本的分类任务,并利用这些任务充分训练类内-类间通道注意力模块,促使该模块达到较优的状态。在原型网络的元训练和元测试阶段,ICAFSC冻结类内-类间通道注意力模块的参数,分别实现少样本分类经验的学习与迁移。在MiniImagenet数据集上分别开展了1-shot和5-shot的少样本分类实验。实验结果表明:本文提出的类内-类间通道注意力少样本分类方法与原型网络相比,在1-shot和5-shot条件下分类准确率分别提高了1.93%和1.15%。
深度学习 少样本分类 元学习 原型网络 通道注意力 deep learning few-shot classification meta-learning prototypical network channel attention 
光学 精密工程
2023, 31(21): 3145

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!