作者单位
摘要
西安科技大学 电气与控制工程学院,西安 710054
针对红外与可见光融合图像存在纹理细节不丰富、对比度较低及目标信息损失等问题,提出了一种基于特征优化和生成对抗网络的图像融合算法。首先,设计一种自适应特征优化模块以增强原始图像纹理细节及对比度;然后,为使融合图像保留更多的多模态信息,将生成对抗网络引入到融合框架中。在生成器模型中,考虑到红外与可见光图像成像机理差异,构建了双支路特征提取网络,并设计多尺度密集连接模块以提取异源图像丰富的特征信息;其次,在融合层构造通道和空间注意力模型以增强局部特征之间联系,减小融合图像中目标信息损失;最后,为使融合结果尽可能保留可见光纹理细节的同时又能够较好突出红外目标,构造了双判别器网络结构。为验证所提算法优势,在TNO数据集上进行实验,并与6种经典融合算法进行主观和客观比较。实验结果表明,所提算法无论在主观还是客观评价上均具有明显优势,生成的融合图像纹理细节更为丰富、边缘及目标更加清晰且具有更好的对比度,客观评价指标信息熵、空间频率、相关熵、视觉保真度和梯度信息分别提高了16.11%、65.46%、7.96%、42.67%和33.24%。
图像融合 特征优化 生成对抗网络 多尺度密集连接 注意力模型 Image fusion Feature optimization Generative adversarial network(GAN) Multi-scale dense connections Attention model 
光子学报
2023, 52(12): 1210004
作者单位
摘要
湘潭大学自动化与电子信息学院,湖南 湘潭 411105
非侵入式负荷监测作为家庭用电精细化管理的重要手段,对推进节能减排、实现“双碳”目标具有积极作用。然而,利用原始电压-电流轨迹图像特征很难实现高精度负荷识别。因此,提出了一种基于格拉姆角差场(GADF)图像编码的非侵入式负荷识别方法。首先,对设备采集到的高频稳态数据进行预处理,获得一个完整基波周期电流和电压信号。然后,利用GADF分别对一维电压和电流信号进行图像编码,生成相对应的二维图像。最后,通过叠加融合输入到卷积块注意力模型中完成负荷识别。为了验证所提方法的有效性,利用公共数据集PLAID和WHITED进行实验分析。结果表明,该方法具有很高的识别精度,PLAID数据集平均识别准确率达到99.45%,WHITED数据集平均识别准确率达到99.24%。
图像处理 非侵入式负荷识别 深度学习 卷积块注意力模型 格拉姆角差场 
激光与光电子学进展
2023, 60(24): 2410001
作者单位
摘要
1 西南科技大学信息工程学院, 四川 绵阳 621010
2 西南科技大学特殊环境机器人技术四川省重点实验室, 四川 绵阳 621010
针对红外与可见光图像在融合后容易出现伪影, 小目标轮廓不清晰等问题, 提出一种基于多尺度特征与注意力模型相结合的红外与可见光图像融合算法。通过 5次下采样提取源图像不同尺度的特征图, 再将同一尺度的红外与可见光特征图输入到基于注意力模型的融合层, 获得增强的融合特征图。最后把小尺度的融合特征图进行 5次上采样, 再与上采样后同一尺度的特征图相加, 直到与源图像尺度一致, 实现对特征图的多尺度融合。实验对比不同融合框架下融合图像的熵、标准差、互信息量、边缘保持度、小波特征互信息、视觉信息保真度以及融合效率, 本文方法在多数指标上优于对比算法, 且融合图像目标细节明显轮廓清晰。
图像融合 多尺度特征融合 注意力模型 红外图像 image fusion, multi-scale feature fusion, attentio 
红外技术
2023, 45(2): 143
作者单位
摘要
长春理工大学 电子信息工程学院,吉林 长春 130022
成像设备在暗光照环境下会出现对比度不高、图像细节信息丢失、颜色失真等问题,这会对视频监控、智能交通、人脸识别等应用场景产生巨大干扰。为了解决这一问题,本文提出了一种融合了注意力机制的的复合残差网络来实现对低照度图像的增强。该算法首先通过色彩空间上的转换(RGB-HSV)将亮度分量V放入构造的神经网络中,然后神经网络通过融合了注意力机制的多分支结构进行图像浅层特征的提取,接着经过复合残差网络提取深层特征,再经过图像重建得到增强后的V分量,最后通过分量融合实现图像增强。实验结果表明,对比目前国内外主流低照度图像增强算法,所提算法在主观视觉上对图像亮度与对比度有显著提升,在PSNR、SSIM指标上与传统算法的对比结果分别提升了约20%和15%,与深度学习算法的对比结果分别提升约9%和3%,不论是在人工合成的低照度图像还是真实、自然低照度图像中均有良好表现,基本满足图像增强的颜色自然、对比度和鲁棒性高等要求。
低照度图像增强 神经网络 残差网络 注意力模型 HSV色彩空间 low-light image enhancement neural network residual network attention model HSV color space 
液晶与显示
2022, 37(4): 508
作者单位
摘要
1 广东工业大学信息工程学院,广东 广州 510006
2 西北农林科技大学信息工程学院,陕西 咸阳 712100
3 国家农业信息化工程技术研究中心,北京 100097
4 北京交通大学交通运输学院,北京 100044
年龄变化是影响人脸识别模型性能的主要原因之一,为解决年龄变化所带来的模型识别率低的问题,提出了一种基于深度学习的跨年龄卷积神经网络模型(CA-CNN)用于跨年龄人脸识别。首先,利用卷积神经网络提取人脸图像中的深度人脸特征;然后,提出一种高效的卷积注意力模块从深度人脸特征中获取年龄特征,并结合多层感知机和多任务监督学习,将深度人脸特征非线性分解为年龄特征和身份特征;最后,为了更好地区分身份特征和年龄特征,提出了一种批核典型相关性分析模块对分解后的身份特征和年龄特征进行相关性分析。经过对抗性学习训练后,相关性最小化,实现了跨年龄人脸识别。所提模型在MORPH Album 2数据集上的rank-1识别准确率达到了99.03%,在CALFM数据集上的人脸验证等错率为9.8%,表明了所提模型的有效性。
机器视觉 人脸识别 深度学习 注意力模型 相关性分析 跨年龄 
激光与光电子学进展
2022, 59(2): 0215001
作者单位
摘要
安徽新华学院信息工程学院, 安徽 合肥 230088
大气PM2.5浓度是一种具有较强时序特征的数据, 故目前关于PM2.5浓度的预测多选择RNN、LSTM等序列模型进行。但由于RNN、LSTM等模型对不同时刻输入的数据都采用相同的权重进行计算, 不符合类脑设计, 造成PM2.5浓度预报准确率较低。针对以上问题, 提出一种基于Adam注意力机制的PM2.5预测方法(AT-RNN和AT-LSTM), 该方法首先通过Adam算法寻找RNN或LSTM的最优参数并在Encoder阶段引入注意力机制, 将注意力权重分配给具有时间序列特征的输入, 再进行Decoder解析和预测。通过实验, 对比了BP、RNN、LSTM和AT-RNN、AT-LSTM预测合肥市PM2.5浓度的效果。结果表明, 基于Adam 注意力模型的预测方法准确率优于其它方法, 证明该方法在污染物预测中的有效性。
神经网络 Adam注意力模型 PM2.5 PM2.5 neural networks Adam attention model 
大气与环境光学学报
2021, 16(2): 117
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
针对交通标志只在图像中占极小的区域且难以准确识别的问题,提出一种基于注意力模型的无锚框交通标志识别算法,利用密集连接网络DenseNet-121作为骨干网络并对特征进行提取。为了解决小型交通标志准确率低的问题,在骨干网络中加入注意力模型,可以对特征图进行空间和通道上的自适应调整,通过加强或抑制特征图中元素的权重可以提升对小型交通标志的识别性能。为了减小编码路径与解码路径间的语义鸿沟,引入残差网络的连接方式并提出一种语义连接路径。为了解决锚框中正负样本不均衡的问题,采用无锚框的检测方式可以定位交通标志的中心点、回归边界框的位置与尺寸信息。对所提算法在TT100K数据集上进行验证,实验结果证明所提算法具有优越性。
图像处理 深度学习 交通标志识别 注意力模型 无锚框 
激光与光电子学进展
2021, 58(16): 1610020
作者单位
摘要
华东理工大学 信息科学与工程学院,上海 200237
深度估计是传统的计算机视觉任务,在理解三维场景中起着至关重要的作用。基于单目图像的深度估计任务的困难在于如何提取图像特征中大范围依赖的上下文信息,提出了自适应的上下文聚合网络(adaptive context aggregation network,ACANet)用于解决该问题。该方法基于有监督的自注意力模型(supervised self-attention,SSA),能够自适应地学习任意像素之间的具有任务特性的相似性以模拟连续的上下文信息,并通过模型学习的注意力权重分布用来聚合提取的图像特征。将单目深度估计任务设计为像素级的多分类问题,经过设计的注意力损失函数减少RGB图像和深度图的语义不一致性,通过生成的像素级注意力权重对由位置索引的特征进行全局池化。最后提出一种软性有序推理算法(soft ordinal inference,SOI),充分利用网络的预测置信度,将离散的深度标签转化为平滑连续的深度图,并且提高了准确率(rmse下降了3%)。在公开的单目深度估计基准数据集NYU Depth V2上的实验结果表明:rmse指标为0.490,阈值指标为82.8%,取得了较好的结果,证明了本文提出的算法的优越性。
深度估计 注意力模型 上下文信息 软推理 depth estimation attention model context information soft inference 
应用光学
2020, 41(3): 490
作者单位
摘要
天津大学电气自动化与信息工程学院, 天津 300072
深度卷积网络提取的表情特征易受背景、个体身份等因素影响,其与无用特征混合在一起对表情识别造成干扰。针对此问题,提出一种基于注意力模型的面部表情识别算法,该方法基于一个轻量级的卷积神经网络以避免过拟合,通过通道注意力模块和空间注意力模块对特征图元素进行加强或抑制,应用残差学习单元使注意力模型学习到更丰富的特征并获得更好的梯度流。此外,还提出一种面部表情关键区域截取方案,以解决非表情区域的噪声干扰问题。在两个常用的表情数据集CK+和MMI上对所提方法进行了验证,实验结果证明了该方法的优越性。
图像处理 表情识别 面部分析 卷积神经网络 注意力模型 
激光与光电子学进展
2020, 57(12): 121015
作者单位
摘要
1 上海理工大学 光电信息与计算机工程学院,上海 200093
2 上海理工大学 机械工程学院,上海 200093
3 杭州亿美实业有限公司,浙江 杭州 310000
4 杭州亿美光电科技有限公司,浙江 杭州 310000
人脸关键点定位因受到表情、光照、姿态等的影响,常常会出现大的误差。为了准确地定位到人脸的关键点,提出了一种基于注意力模型的人脸关键点检测算法。先是利用可变型模型(DPM)算法检测出图片中的人脸区域,然后结合残差网络(ResNet)和收缩激励网络(SeNet)对该区域进行人脸关键点定位。实验结果表明,该算法在人脸数据集上获得了较高的准确率,证明了该算法的有效性。
人脸关键点检测 注意力模型 DPM人脸检测 face key point detection attention model DPM face detection 
光学仪器
2020, 42(2): 45

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!