相同关键词【注意力模型】论文列表 -- 中国光学期刊网

作者单位

摘要

西安科技大学电气与控制工程学院，西安 710054

针对红外与可见光融合图像存在纹理细节不丰富、对比度较低及目标信息损失等问题，提出了一种基于特征优化和生成对抗网络的图像融合算法。首先，设计一种自适应特征优化模块以增强原始图像纹理细节及对比度；然后，为使融合图像保留更多的多模态信息，将生成对抗网络引入到融合框架中。在生成器模型中，考虑到红外与可见光图像成像机理差异，构建了双支路特征提取网络，并设计多尺度密集连接模块以提取异源图像丰富的特征信息；其次，在融合层构造通道和空间注意力模型以增强局部特征之间联系，减小融合图像中目标信息损失；最后，为使融合结果尽可能保留可见光纹理细节的同时又能够较好突出红外目标，构造了双判别器网络结构。为验证所提算法优势，在TNO数据集上进行实验，并与6种经典融合算法进行主观和客观比较。实验结果表明，所提算法无论在主观还是客观评价上均具有明显优势，生成的融合图像纹理细节更为丰富、边缘及目标更加清晰且具有更好的对比度，客观评价指标信息熵、空间频率、相关熵、视觉保真度和梯度信息分别提高了16.11%、65.46%、7.96%、42.67%和33.24%。

图像融合特征优化生成对抗网络多尺度密集连接注意力模型 Image fusion Feature optimization Generative adversarial network（GAN） Multi-scale dense connections Attention model

PDF全文 Full Text

光子学报

2023, 52(12): 1210004

图像处理

基于格拉姆角差场图像编码的非侵入式负荷识别方法

符明 ^*段斌

作者单位

摘要

湘潭大学自动化与电子信息学院，湖南湘潭 411105

非侵入式负荷监测作为家庭用电精细化管理的重要手段，对推进节能减排、实现“双碳”目标具有积极作用。然而，利用原始电压-电流轨迹图像特征很难实现高精度负荷识别。因此，提出了一种基于格拉姆角差场（GADF）图像编码的非侵入式负荷识别方法。首先，对设备采集到的高频稳态数据进行预处理，获得一个完整基波周期电流和电压信号。然后，利用GADF分别对一维电压和电流信号进行图像编码，生成相对应的二维图像。最后，通过叠加融合输入到卷积块注意力模型中完成负荷识别。为了验证所提方法的有效性，利用公共数据集PLAID和WHITED进行实验分析。结果表明，该方法具有很高的识别精度，PLAID数据集平均识别准确率达到99.45%，WHITED数据集平均识别准确率达到99.24%。

图像处理非侵入式负荷识别深度学习卷积块注意力模型格拉姆角差场

PDF全文 Full Text

激光与光电子学进展

2023, 60(24): 2410001

基于多尺度和注意力模型的红外与可见光图像融合

黄玲琳 ¹李强 ^1,2,*路锦正 ¹贺贤珍 ¹彭波 ^1,2

作者单位

摘要

¹ 西南科技大学信息工程学院, 四川绵阳 621010

² 西南科技大学特殊环境机器人技术四川省重点实验室, 四川绵阳 621010

针对红外与可见光图像在融合后容易出现伪影, 小目标轮廓不清晰等问题, 提出一种基于多尺度特征与注意力模型相结合的红外与可见光图像融合算法。通过 5次下采样提取源图像不同尺度的特征图, 再将同一尺度的红外与可见光特征图输入到基于注意力模型的融合层, 获得增强的融合特征图。最后把小尺度的融合特征图进行 5次上采样, 再与上采样后同一尺度的特征图相加, 直到与源图像尺度一致, 实现对特征图的多尺度融合。实验对比不同融合框架下融合图像的熵、标准差、互信息量、边缘保持度、小波特征互信息、视觉信息保真度以及融合效率, 本文方法在多数指标上优于对比算法, 且融合图像目标细节明显轮廓清晰。

图像融合多尺度特征融合注意力模型红外图像 image fusion, multi-scale feature fusion, attentio

PDF全文 Full Text

红外技术

2023, 45(2): 143

复合残差网络在低照度图像增强中的技术研究

王兴瑞朴燕 ^*王雨墨

作者单位

摘要

长春理工大学电子信息工程学院，吉林长春 130022

成像设备在暗光照环境下会出现对比度不高、图像细节信息丢失、颜色失真等问题，这会对视频监控、智能交通、人脸识别等应用场景产生巨大干扰。为了解决这一问题，本文提出了一种融合了注意力机制的的复合残差网络来实现对低照度图像的增强。该算法首先通过色彩空间上的转换（RGB-HSV）将亮度分量V放入构造的神经网络中，然后神经网络通过融合了注意力机制的多分支结构进行图像浅层特征的提取，接着经过复合残差网络提取深层特征，再经过图像重建得到增强后的V分量，最后通过分量融合实现图像增强。实验结果表明，对比目前国内外主流低照度图像增强算法，所提算法在主观视觉上对图像亮度与对比度有显著提升，在PSNR、SSIM指标上与传统算法的对比结果分别提升了约20%和15%，与深度学习算法的对比结果分别提升约9%和3%，不论是在人工合成的低照度图像还是真实、自然低照度图像中均有良好表现，基本满足图像增强的颜色自然、对比度和鲁棒性高等要求。

低照度图像增强神经网络残差网络注意力模型 HSV色彩空间 low-light image enhancement neural network residual network attention model HSV color space

PDF全文 Full Text

液晶与显示

2022, 37(4): 508

机器视觉

基于深度学习的跨年龄人脸识别

下载：1315次

孙文斌 ¹王荣 ^2,3,*孙连烛 ⁴林源松 ¹

作者单位

摘要

¹ 广东工业大学信息工程学院，广东广州 510006

² 西北农林科技大学信息工程学院，陕西咸阳 712100

³ 国家农业信息化工程技术研究中心，北京 100097

⁴ 北京交通大学交通运输学院，北京 100044

年龄变化是影响人脸识别模型性能的主要原因之一，为解决年龄变化所带来的模型识别率低的问题，提出了一种基于深度学习的跨年龄卷积神经网络模型（CA-CNN）用于跨年龄人脸识别。首先，利用卷积神经网络提取人脸图像中的深度人脸特征；然后，提出一种高效的卷积注意力模块从深度人脸特征中获取年龄特征，并结合多层感知机和多任务监督学习，将深度人脸特征非线性分解为年龄特征和身份特征；最后，为了更好地区分身份特征和年龄特征，提出了一种批核典型相关性分析模块对分解后的身份特征和年龄特征进行相关性分析。经过对抗性学习训练后，相关性最小化，实现了跨年龄人脸识别。所提模型在MORPH Album 2数据集上的rank-1识别准确率达到了99.03%，在CALFM数据集上的人脸验证等错率为9.8%，表明了所提模型的有效性。

机器视觉人脸识别深度学习注意力模型相关性分析跨年龄

PDF全文 Full Text

激光与光电子学进展

2022, 59(2): 0215001

环境光学检测技术

基于Adam注意力机制的PM_2.5浓度预测方法

张怡文 ^*袁宏武孙鑫吴海龙董云春

作者单位

摘要

安徽新华学院信息工程学院, 安徽合肥 230088

大气PM2.5浓度是一种具有较强时序特征的数据, 故目前关于PM2.5浓度的预测多选择RNN、LSTM等序列模型进行。但由于RNN、LSTM等模型对不同时刻输入的数据都采用相同的权重进行计算, 不符合类脑设计, 造成PM2.5浓度预报准确率较低。针对以上问题, 提出一种基于Adam注意力机制的PM2.5预测方法(AT-RNN和AT-LSTM), 该方法首先通过Adam算法寻找RNN或LSTM的最优参数并在Encoder阶段引入注意力机制, 将注意力权重分配给具有时间序列特征的输入, 再进行Decoder解析和预测。通过实验, 对比了BP、RNN、LSTM和AT-RNN、AT-LSTM预测合肥市PM2.5浓度的效果。结果表明, 基于Adam 注意力模型的预测方法准确率优于其它方法, 证明该方法在污染物预测中的有效性。

神经网络 Adam注意力模型 PM2.5 PM2.5 neural networks Adam attention model

PDF全文 Full Text

大气与环境光学学报

2021, 16(2): 117

图像处理

一种基于注意力模型的无锚框交通标志识别算法

下载：530次

褚晶辉黄浩吕卫 ^*

作者单位

摘要

天津大学电气自动化与信息工程学院, 天津 300072

针对交通标志只在图像中占极小的区域且难以准确识别的问题,提出一种基于注意力模型的无锚框交通标志识别算法,利用密集连接网络DenseNet-121作为骨干网络并对特征进行提取。为了解决小型交通标志准确率低的问题,在骨干网络中加入注意力模型,可以对特征图进行空间和通道上的自适应调整,通过加强或抑制特征图中元素的权重可以提升对小型交通标志的识别性能。为了减小编码路径与解码路径间的语义鸿沟,引入残差网络的连接方式并提出一种语义连接路径。为了解决锚框中正负样本不均衡的问题,采用无锚框的检测方式可以定位交通标志的中心点、回归边界框的位置与尺寸信息。对所提算法在TT100K数据集上进行验证,实验结果证明所提算法具有优越性。

图像处理深度学习交通标志识别注意力模型无锚框

PDF全文 Full Text

激光与光电子学进展

2021, 58(16): 1610020

光电信息获取与处理

基于自适应像素级注意力模型的场景深度估计

陈裕如赵海涛 ^*

作者单位

摘要

华东理工大学信息科学与工程学院，上海 200237

深度估计是传统的计算机视觉任务，在理解三维场景中起着至关重要的作用。基于单目图像的深度估计任务的困难在于如何提取图像特征中大范围依赖的上下文信息，提出了自适应的上下文聚合网络（adaptive context aggregation network，ACANet）用于解决该问题。该方法基于有监督的自注意力模型(supervised self-attention，SSA)，能够自适应地学习任意像素之间的具有任务特性的相似性以模拟连续的上下文信息，并通过模型学习的注意力权重分布用来聚合提取的图像特征。将单目深度估计任务设计为像素级的多分类问题，经过设计的注意力损失函数减少RGB图像和深度图的语义不一致性，通过生成的像素级注意力权重对由位置索引的特征进行全局池化。最后提出一种软性有序推理算法（soft ordinal inference，SOI），充分利用网络的预测置信度，将离散的深度标签转化为平滑连续的深度图，并且提高了准确率（rmse下降了3%）。在公开的单目深度估计基准数据集NYU Depth V2上的实验结果表明：rmse指标为0.490，阈值指标为82.8%，取得了较好的结果，证明了本文提出的算法的优越性。

深度估计注意力模型上下文信息软推理 depth estimation attention model context information soft inference

PDF全文 Full Text

应用光学

2020, 41(3): 490

图像处理

一种基于注意力模型的面部表情识别算法

下载：1342次

褚晶辉汤文豪张姗吕卫 ^*

作者单位

摘要

天津大学电气自动化与信息工程学院, 天津 300072

深度卷积网络提取的表情特征易受背景、个体身份等因素影响,其与无用特征混合在一起对表情识别造成干扰。针对此问题,提出一种基于注意力模型的面部表情识别算法,该方法基于一个轻量级的卷积神经网络以避免过拟合,通过通道注意力模块和空间注意力模块对特征图元素进行加强或抑制,应用残差学习单元使注意力模型学习到更丰富的特征并获得更好的梯度流。此外,还提出一种面部表情关键区域截取方案,以解决非表情区域的噪声干扰问题。在两个常用的表情数据集CK+和MMI上对所提方法进行了验证,实验结果证明了该方法的优越性。

图像处理表情识别面部分析卷积神经网络注意力模型

PDF全文 Full Text

激光与光电子学进展

2020, 57(12): 121015

应用技术

基于注意力模型的人脸关键点检测算法

秦晓飞 ¹盛凯 ²朱玥 ¹杨勇 ¹[ ... ]周坚风 ⁴

作者单位

摘要

¹ 上海理工大学光电信息与计算机工程学院，上海 200093

² 上海理工大学机械工程学院，上海 200093

³ 杭州亿美实业有限公司，浙江杭州 310000

⁴ 杭州亿美光电科技有限公司，浙江杭州 310000

人脸关键点定位因受到表情、光照、姿态等的影响，常常会出现大的误差。为了准确地定位到人脸的关键点，提出了一种基于注意力模型的人脸关键点检测算法。先是利用可变型模型（DPM）算法检测出图片中的人脸区域，然后结合残差网络（ResNet）和收缩激励网络（SeNet）对该区域进行人脸关键点定位。实验结果表明，该算法在人脸数据集上获得了较高的准确率，证明了该算法的有效性。

人脸关键点检测注意力模型 DPM人脸检测 face key point detection attention model DPM face detection

PDF全文 Full Text

光学仪器

2020, 42(2): 45

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索