杭州电子科技大学自动化学院,浙江 杭州 310018
针对基于卷积自编码进行空-谱联合的高光谱解混方法中,过度引入像元光谱之间的空间相关性导致丰度过于平滑的现象,提出一种结合注意力机制的双流卷积自编码高光谱解混方法(DSCU-Net)。首先,利用双流卷积网络分别提取高光谱图像的空间特征和光谱特征;其次,为了确保空间特征和光谱特征之间的平衡性,引入通道注意力机制对提取到的空间特征进行重加权,并对光谱特征和重加权后的空间特征进行融合;最后,使用融合后的特征进行高光谱图像重构,并将重构结果送入解混网络的主干网络中进行光谱解混。通过最小化两次重构误差进行解混网络的训练。为了验证所提方法的性能,在两个真实数据集上进行实验,并对复杂场景下算法的性能表现进行分析。结果表明,DSCU-Net能够有效减少过度引入空间相关性造成丰度过于平滑的现象,具有更好的解混性能。
遥感 高光谱解混 卷积自编码器 通道注意力机制 双流结构 激光与光电子学进展
2024, 61(4): 0428008
河北经贸大学信息技术学院,河北石家庄 050061
针对红外图像存在细节纹理特征差、对比度低、目标检测效果差等问题,基于 YOLOv4(You Only Look Once version 4)架构提出了一种融合通道注意力机制的多尺度红外目标检测模型。该模型首先通过降低主干特征提取网络深度,减少了模型参数。其次,为补充浅层高分辨率特征信息,重新构建多尺度特征融合模块,提高了特征信息利用率。最后在多尺度加强特征图输出前,融入通道注意力机制,进一步提高红外特征提取能力,降低噪声干扰。实验结果表明,本文算法模型大小仅为 YOLOv4的 28.87%,对红外目标的检测精度得到了明显提升。
红外图像 目标检测 通道注意力机制 infrared image, target detection, YOLOv4, attentio YOLOv4
红移是星系的基本参数之一。 大量已知星系只有测光图像而并没有光谱, 因此通过测光图像而非光谱来求取红移值具有重要的研究意义。 首先构建了一种基于测光图像估计星系红移的回归网络(GRRnet)。 它和以往的类似方法相比网络层数更深, 而且增加了注意力机制, 使模型能聚焦更为有用的信息。 在GRRnet的基础上, 进一步提出了一种两步走的策略, GRRnet-C-R: 第一步把星系按照红移进行粗分类; 第二步按照分好的类分别进行回归估计, 最后再合并到一起。 这种策略可明显减小测光红移估计的误差。 该工作的数据全部来源于斯隆数字巡天(SDSS)的第十六次数据发布SDSS DR16, 从中选取了96 024个红移小于0.6的星系, 每个星系的相关数据包含g, r, z三个波段的合成图像、 u, g, r, i, z五波段的测光值、 以及被视作标签的光谱红移。 在预处理过程中, 将测光图像剪切成50×50的尺寸, 目的是在保障减少计算量的同时能框选住大部分星系。 由于对比算法NetZ的输入尺寸为64×64, 为了保持输入尺寸一致, 使用cv2.resize函数将图像尺寸更改为64×64。 实验采用了七种评价指标与多种方法进行对比, 结果表明GRRnet-C-R的均方误差(MSE)低至0.001 46, 与随机森林(RF)、 极限梯度提升(XGBoost)和NetZ相比误差分别降低了22.3%、 21.9%和18.0%。 GRRnet-C-R的线性回归决定系数R2达到了0.948, 取得了一个很好的模型拟合效果。 实验结果证明了这种两步走的策略能有效降低测光红移估计的误差, 这为之后的测光红移估计提供了一种新的思路和方法。
红移估计 星系红移回归网络 通道注意力机制 测光图像 两步走策略 Redshift estimation Galaxy redshift regression network Channel attention mechanism Photometric image Two-step strategy 光谱学与光谱分析
2023, 43(8): 2529
1 河北工程大学 数理科学与工程学院,邯郸 056038
2 河北省计算光学成像与光电检测技术创新中心,邯郸 056038
为了避免传统全息重建方法步骤繁杂且重建效果易受噪声干扰等问题,采用一种改进的语义分割U型网络用于全息图超分辨重建工作。首先引入新型的端侧神经网络,用来充分获取更多的图像语义信息,增强网络学习性能; 其次加入深度神经卷积网络的高效通道注意力以提高网络关注全息图中细节信息的能力,进一步提升网络精度,同时采用带泄露修正线性单元作为激活函数,加快网络收敛; 并采用血细胞和鸡血细胞的低分辨率全息图进行训练,取得了超分辨重建强度和位相图。结果表明,改进网络能够快速重建出细节信息丰富、边缘纹理清晰、背景平坦的位相和强度图像,血细胞强度重建图的结构相似性指数和峰值信噪比分别达到0.9613和27.38,同时可对不同尺度的全息图进行重建。该研究为使用深度学习方法提高全息图质量提供了参考。
全息 超分辨重建 通道注意力机制 端侧神经网络 多尺度重建 holography super-resolution reconstruction channel attention mechanism end-side neural network multi-scale reconstruction
福州大学 物理与信息工程学院, 福州 350108
针对处理超高分辨率图像时面临的内存成本和风格迁移过程中过度风格化,提出了一种结合可逆网络的超高分辨率图像的风格迁移方法。该算法采用可逆的Glow模块作为基本单元构建可逆神经网络模块,并将图像分为小块处理; 在风格迁移模块中使用具有通道注意力机制的残差模块和缩略图实例化归一化模块(TIN),以保证各模块风格一致; 提出基于全局-局部的损失计算方式,能够有效地处理局部的结构特征。实验结果表明,相较于当前通用的各种神经风格迁移网络,所提算法不仅能够避免图像在编码和解码过程中的信息丢失问题,而且能以更低的内存成本实现更优的风格迁移。
可逆网络 超高分辨率图像 风格迁移 通道注意力机制 Glow模块 reversible network ultra-high resolution image style transfer channel attention mechanism Glow module
1 天津大学 精密测试技术及仪器国家重点实验室,天津 300072
2 天津大学 微光机电系统技术教育部重点实验室,天津 300072
为构建适用于长时跟踪的重检测模块,受改进二阶段检测网络的GlobalTrack方法的启发,提出了一种高效的对特定模板目标进行端到端重检测的深度网络:首先,为了在大尺度图像上更高效地融合模板特征,通过构造交叉信息增强模块改进深度互相关方法,利用交叉通道注意力信息编码搜索特征和模板特征;此外,采用动态实例交互模块替代传统二阶段网络的RPN(region proposal network)和RCNN(region-based convolutional neural networks)结构,根据模板信息指导检测网络的分类和回归阶段,构建了端到端的稀疏重检测结构。在LaSOT和OxUva长时跟踪数据集上进行对比实验,本文方法相较于原始方法性能提升3%,实时帧率提升173%。实验结果表明,改进后的方法可以在全图范围内更准确、快速地重新检测模板目标。
长时跟踪 二阶段检测 重检测 通道注意力机制 long-term tracking two-stage detection re-detection channel attention mechanism
1 南京邮电大学 电子与光学工程学院,江苏南京20023
2 江苏北方湖光光电有限公司,江苏无锡14035
3 南京邮电大学 自动化学院,江苏南京21002
为了提高基于深度学习的图像降噪效率,提出了一种基于Res2-Unet-SE的多阶段监督深度残差(Multi-stage Supervised Deep Residual,MSDR)降噪神经网络。首先基于该神经网络,将图像降噪分为多阶段处理过程;然后在各处理阶段,将不同分辨率图像块输入到Res2-Unet子网络中获取不同尺度特征信息,并通过通道注意力机制将自适应学习的特征融合信息传递到下阶段;最后将不同尺度特征信息叠加,完成高质量的图像降噪。实验选择BSD400数据集用于训练,通过Set12数据集进行高斯噪声的降噪测试;通过SIDD数据集完成真实噪声的降噪测试。通过与常见的降噪神经网络对比表明,对图像添加σ=15,25,50的高斯噪声时,经本文算法降噪后的图像PSNR比对高斯噪声消除性能较好的DNCNN分别提高0.03 dB,0.05 dB,0.14 dB;在σ=25,50时,相较于MPRNET分别提高了0.02 dB, 0.06 dB。对含真实噪声的图像,经本文算法降噪后的图像PSNR比CBDNET算法提高0.48 dB。实验分析表明,本文算法在图像降噪上具有较高的鲁棒性,不仅能从噪声中有效恢复图像细节,还能充分保持图像的全局依赖关系。
图像降噪 真实噪声 残差网络 通道注意力机制 监督注意力机制 image denoising real noise residual network channel attention mechanism supervisory attention mechanism