作者单位
摘要
西安科技大学 电气与控制工程学院,西安 710054
针对红外与可见光融合图像存在纹理细节不丰富、对比度较低及目标信息损失等问题,提出了一种基于特征优化和生成对抗网络的图像融合算法。首先,设计一种自适应特征优化模块以增强原始图像纹理细节及对比度;然后,为使融合图像保留更多的多模态信息,将生成对抗网络引入到融合框架中。在生成器模型中,考虑到红外与可见光图像成像机理差异,构建了双支路特征提取网络,并设计多尺度密集连接模块以提取异源图像丰富的特征信息;其次,在融合层构造通道和空间注意力模型以增强局部特征之间联系,减小融合图像中目标信息损失;最后,为使融合结果尽可能保留可见光纹理细节的同时又能够较好突出红外目标,构造了双判别器网络结构。为验证所提算法优势,在TNO数据集上进行实验,并与6种经典融合算法进行主观和客观比较。实验结果表明,所提算法无论在主观还是客观评价上均具有明显优势,生成的融合图像纹理细节更为丰富、边缘及目标更加清晰且具有更好的对比度,客观评价指标信息熵、空间频率、相关熵、视觉保真度和梯度信息分别提高了16.11%、65.46%、7.96%、42.67%和33.24%。
图像融合 特征优化 生成对抗网络 多尺度密集连接 注意力模型 Image fusion Feature optimization Generative adversarial network(GAN) Multi-scale dense connections Attention model 
光子学报
2023, 52(12): 1210004
作者单位
摘要
重庆工商大学 机械工程学院 制造装备机构设计与控制重庆市重点实验室,重庆 400067
为改善红外与可见光融合结果与源图像间的部分细节特征丢失问题,充分提取红外与可见光图像中的特征信息,提出了一种改进的双通道深度学习自编码网络进行红外与可见光图像融合。其中,双通道结构由密集连接和残差连接模块级联构成,并设置一种综合像素、结构相似度和梯度特征保留的损失函数,使该编码器结构可以充分提取红外与可见光图像的多层次特征,在融合层采用空间L1范数和注意力机制对级联双通道特征分别进行融合,最后设计对应的解码器对融合特征图像进行重构,获取最终的融合结果。通过与传统算法以及近年最新的深度学习算法进行实验对比,结果表明该方法在主观和客观上都具有优秀的综合性能。
红外与可见光图像融合 双通道网络 残差密集模块 注意力机制 自编码器 Infrared and visible image fusion Dual channel parallel network Residual dense module Attention model Auto-encoder network 
光子学报
2023, 52(11): 1110003
作者单位
摘要
长春理工大学 电子信息工程学院,吉林 长春 130022
成像设备在暗光照环境下会出现对比度不高、图像细节信息丢失、颜色失真等问题,这会对视频监控、智能交通、人脸识别等应用场景产生巨大干扰。为了解决这一问题,本文提出了一种融合了注意力机制的的复合残差网络来实现对低照度图像的增强。该算法首先通过色彩空间上的转换(RGB-HSV)将亮度分量V放入构造的神经网络中,然后神经网络通过融合了注意力机制的多分支结构进行图像浅层特征的提取,接着经过复合残差网络提取深层特征,再经过图像重建得到增强后的V分量,最后通过分量融合实现图像增强。实验结果表明,对比目前国内外主流低照度图像增强算法,所提算法在主观视觉上对图像亮度与对比度有显著提升,在PSNR、SSIM指标上与传统算法的对比结果分别提升了约20%和15%,与深度学习算法的对比结果分别提升约9%和3%,不论是在人工合成的低照度图像还是真实、自然低照度图像中均有良好表现,基本满足图像增强的颜色自然、对比度和鲁棒性高等要求。
低照度图像增强 神经网络 残差网络 注意力模型 HSV色彩空间 low-light image enhancement neural network residual network attention model HSV color space 
液晶与显示
2022, 37(4): 508
作者单位
摘要
1 南京理工大学 理学院, 江苏 南京 210094
2 南京林业大学 信息科学技术学院, 江苏 南京 210037
针对当前行人检测方法计算量大、检测精度低的问题, 基于YOLOv4-tiny提出一种改进的行人检测算法。引入通道注意力和空间注意力模块(CBAM)至CSPDarknet53-tiny网络中, 通过学习图像的位置信息和通道信息得到更加丰富的特征; 在骨干网络CSPDarknet53-tiny之后引入空间金字塔池化模块,能够极大地增加感受野, 分离出最显著的上下文特征;使用CIoU损失函数对算法的多任务联合损失进行了优化。实验分别使用INRIA和WiderPerson中的训练集作为训练模型, INRIA和WiderPerson中的测试集分别作为测试集来验证模型。实验表明, 对比YOLOv4-tiny目标检测模型, 改进后的网络在INRIA测试集中精确度、召回率和平均精度值分别提升了6.23%、3.15%和6.12%; 改进后的网络在WiderPerson测试集中精确度、召回率和平均精度值分别提升了3.65%、3.28%和4.41%。改进后的模型在几乎不影响检测实时性的前提下, 更易于行人特征提取, 提高了检测精度。
深度学习 行人检测 注意力机制 deep learning pedestrian detection YOLOv4-tiny YOLOv4-tiny attention model 
光学技术
2022, 48(1): 80
作者单位
摘要
1 广东工业大学信息工程学院,广东 广州 510006
2 西北农林科技大学信息工程学院,陕西 咸阳 712100
3 国家农业信息化工程技术研究中心,北京 100097
4 北京交通大学交通运输学院,北京 100044
年龄变化是影响人脸识别模型性能的主要原因之一,为解决年龄变化所带来的模型识别率低的问题,提出了一种基于深度学习的跨年龄卷积神经网络模型(CA-CNN)用于跨年龄人脸识别。首先,利用卷积神经网络提取人脸图像中的深度人脸特征;然后,提出一种高效的卷积注意力模块从深度人脸特征中获取年龄特征,并结合多层感知机和多任务监督学习,将深度人脸特征非线性分解为年龄特征和身份特征;最后,为了更好地区分身份特征和年龄特征,提出了一种批核典型相关性分析模块对分解后的身份特征和年龄特征进行相关性分析。经过对抗性学习训练后,相关性最小化,实现了跨年龄人脸识别。所提模型在MORPH Album 2数据集上的rank-1识别准确率达到了99.03%,在CALFM数据集上的人脸验证等错率为9.8%,表明了所提模型的有效性。
机器视觉 人脸识别 深度学习 注意力模型 相关性分析 跨年龄 
激光与光电子学进展
2022, 59(2): 0215001
作者单位
摘要
辽宁科技大学 电子信息工程学院, 辽宁鞍山114000
为了提高图像理解(Image Captioning)的预测性能,设计了一种基于“融合门”的深度神经网络模型。该“融合门”网络模型基于编码器-解码器结构设计,是卷积神经网络与循环神经网络的融合。算法首先将输入图像通过VGGNet-16网络进行卷积,得到对应的4096维输出向量,然后将卷积后的输出向量与标注语句向量合并,作为输入向量进入改进后的“融合门”网络,最后获得新的网络输出结果。上述过程按照时间步逐次迭代,最终完成网络训练。使用权威的CIDEr评价指标来评估该“融合门”网络的预测结果,实验结果表明,该网络的CIDEr值比“Neural Talk”网络的CIDEr值提高10.56%,其他相关的评价指标也有较大幅度提高。该网络结构不但预测指标高,而且其网络参数个数比“注意力机制”网络参数少21.1%,所需要的计算机资源更少,这使得将该网络应用在边缘计算中成为可能,对图像理解成果的推广起到关键作用。
图像理解 长短时记忆网络 卷积神经网络 注意力机制 image captioning Long Short Term Memory (LSTM) convolutional neural network attention model 
光学 精密工程
2021, 29(4): 906
作者单位
摘要
安徽新华学院信息工程学院, 安徽 合肥 230088
大气PM2.5浓度是一种具有较强时序特征的数据, 故目前关于PM2.5浓度的预测多选择RNN、LSTM等序列模型进行。但由于RNN、LSTM等模型对不同时刻输入的数据都采用相同的权重进行计算, 不符合类脑设计, 造成PM2.5浓度预报准确率较低。针对以上问题, 提出一种基于Adam注意力机制的PM2.5预测方法(AT-RNN和AT-LSTM), 该方法首先通过Adam算法寻找RNN或LSTM的最优参数并在Encoder阶段引入注意力机制, 将注意力权重分配给具有时间序列特征的输入, 再进行Decoder解析和预测。通过实验, 对比了BP、RNN、LSTM和AT-RNN、AT-LSTM预测合肥市PM2.5浓度的效果。结果表明, 基于Adam 注意力模型的预测方法准确率优于其它方法, 证明该方法在污染物预测中的有效性。
神经网络 Adam注意力模型 PM2.5 PM2.5 neural networks Adam attention model 
大气与环境光学学报
2021, 16(2): 117
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
针对交通标志只在图像中占极小的区域且难以准确识别的问题,提出一种基于注意力模型的无锚框交通标志识别算法,利用密集连接网络DenseNet-121作为骨干网络并对特征进行提取。为了解决小型交通标志准确率低的问题,在骨干网络中加入注意力模型,可以对特征图进行空间和通道上的自适应调整,通过加强或抑制特征图中元素的权重可以提升对小型交通标志的识别性能。为了减小编码路径与解码路径间的语义鸿沟,引入残差网络的连接方式并提出一种语义连接路径。为了解决锚框中正负样本不均衡的问题,采用无锚框的检测方式可以定位交通标志的中心点、回归边界框的位置与尺寸信息。对所提算法在TT100K数据集上进行验证,实验结果证明所提算法具有优越性。
图像处理 深度学习 交通标志识别 注意力模型 无锚框 
激光与光电子学进展
2021, 58(16): 1610020
作者单位
摘要
华东理工大学 信息科学与工程学院,上海 200237
深度估计是传统的计算机视觉任务,在理解三维场景中起着至关重要的作用。基于单目图像的深度估计任务的困难在于如何提取图像特征中大范围依赖的上下文信息,提出了自适应的上下文聚合网络(adaptive context aggregation network,ACANet)用于解决该问题。该方法基于有监督的自注意力模型(supervised self-attention,SSA),能够自适应地学习任意像素之间的具有任务特性的相似性以模拟连续的上下文信息,并通过模型学习的注意力权重分布用来聚合提取的图像特征。将单目深度估计任务设计为像素级的多分类问题,经过设计的注意力损失函数减少RGB图像和深度图的语义不一致性,通过生成的像素级注意力权重对由位置索引的特征进行全局池化。最后提出一种软性有序推理算法(soft ordinal inference,SOI),充分利用网络的预测置信度,将离散的深度标签转化为平滑连续的深度图,并且提高了准确率(rmse下降了3%)。在公开的单目深度估计基准数据集NYU Depth V2上的实验结果表明:rmse指标为0.490,阈值指标为82.8%,取得了较好的结果,证明了本文提出的算法的优越性。
深度估计 注意力模型 上下文信息 软推理 depth estimation attention model context information soft inference 
应用光学
2020, 41(3): 490
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
深度卷积网络提取的表情特征易受背景、个体身份等因素影响,其与无用特征混合在一起对表情识别造成干扰。针对此问题,提出一种基于注意力模型的面部表情识别算法,该方法基于一个轻量级的卷积神经网络以避免过拟合,通过通道注意力模块和空间注意力模块对特征图元素进行加强或抑制,应用残差学习单元使注意力模型学习到更丰富的特征并获得更好的梯度流。此外,还提出一种面部表情关键区域截取方案,以解决非表情区域的噪声干扰问题。在两个常用的表情数据集CK+和MMI上对所提方法进行了验证,实验结果证明了该方法的优越性。
图像处理 表情识别 面部分析 卷积神经网络 注意力模型 
激光与光电子学进展
2020, 57(12): 121015

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!