相同关键词【dilated convolution】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 重庆邮电大学计算机科学与技术学院重庆空间大数据智能技术工程研究中心，重庆 400065

² 昆明理工大学信息工程与自动化学院，云南昆明 650500

高分辨率无人机遥感图像具有极为丰富的语义和地物特征，在语义分割中容易出现目标分割不全、边缘信息缺失、分割精度不足等问题。为了解决上述问题，基于DeepLabV3_plus模型提出改进的DeepLabV3_DHC。首先，利用多种主干网络进行下采样，采集图像的低级特征和高级特征。其次，将原模型的atrous spatial pyramid pooling（ASPP）全部替换成深度可分离混合空洞卷积，同时添加自适应系数，减弱网格效应。之后，抛弃传统上采样的双线性插值法，替换为可学习的密集上采样卷积。最后，在低级特征中串联注意机制。选用多种主干网络进行实验，数据集选用四川省隆昌市地区的部分图像，采用平均交并比和类别平均像素准确率作为评价指标。实验结果表明：所提方法不仅具有较高的分割精度，而且减少了计算量和参数量。

城市无人机遥感图像语义分割深度可分离混合空洞卷积密集上采样注意力机制网格效应

PDF全文 Full Text

激光与光电子学进展

2024, 61(4): 0428005

图像处理与仿真

基于 RGB-T图像的双流残差扩张网络人群计数算法

杨佩龙陈树越杨尚瑜王佳宏

作者单位

摘要

常州大学计算机与人工智能学院, 江苏常州 213164

在人群计数中, 针对尺度变化、行人分布不均以及夜间较差成像条件, 提出了一种基于 RGB-T(RGB-Thermal)图像的多模态人群计数算法, 称为双流残差扩张网络, 它由前端特征提取网络、多尺度的残差扩张卷积模块和全局注意力模块所构成。其中, 前端网络用来提取 RGB特征和热特征, 扩张卷积模块进一步提取不同尺度的行人特征信息, 全局注意力模块用来建立全局特征之间的依赖关系。此外, 还引入了一种新的多尺度差异性损失, 以提高网络的计数性能。为评估该方法, 在 RGBT-CC(RGBT Crowd Counting)数据集和 DroneRGBT数据集上进行了对比实验。实验结果表明, 在 RGBT-CC数据集上与 CMCRL(Cross-modal Collaborative Representation Learning)算法相比该算法的 GAME(0)

人群计数 RGB-T图像扩张卷积全局注意力多尺度差异性损失 crowd counting, RGB-T images, dilated convolution,

PDF全文 Full Text

红外技术

2023, 45(11): 1177

信号与信息处理、计算机与控制

一种基于卷积神经网络的轨道交通场景人群计数模型

杨路辉 ¹湛忠义 ¹潘尚考 ¹刘光杰 ^2,*陆斌 ³

作者单位

摘要

¹ 南京理工大学自动化学院, 江苏南京 210094

² 南京信息工程大学电子与信息工程学院, 江苏南京 210044

³ 南京熊猫信息产业有限公司, 江苏南京 210038

现有的人群计数方法不能够完全适用于轨道交通场景中, 为此, 提出一种基于卷积神经网络的人群计数模型。模型采用 VGG16作为前端网络提取浅层特征, 提出一种基于 Inception结构改进的 M-Inception结构, 结合空洞卷积构成后端网络, 增大感受野, 适应多监控角度下不同尺寸的行人目标; 并提出一种融合行人总数估计损失和密度图损失的加权损失函数。将本文模型与 4种现有模型进行对比实验, 结果表明, 提出的人群计数算法在地铁场景中的平均绝对误差和均方误差仅为 1.46和 2.13, 优于 4种对比模型。考虑到模型的实际应用, 将模型部署到海思嵌入式芯片上, 实测结果表明, 模型可在嵌入式芯片上取得较高的计算速度和准确率, 满足实际应用场景的需求。

人群计数地铁场景空洞卷积嵌入式实现 crowd counting subway scene dilated convolution embedded implementation

PDF全文 Full Text

太赫兹科学与电子信息学报

2023, 21(7): 934

多源图像融合

基于空洞卷积与双注意力机制的红外与可见光图像融合

何乐 ¹李忠伟 ¹罗偲 ^1,*任鹏 ¹隋昊 ²

作者单位

摘要

¹ 中国石油大学（华东）海洋与空间信息学院，山东青岛 266580

² 中国石油大学（华东）计算机科学与技术学院，山东青岛 266580

针对红外与可见光图像融合算法中多尺度特征提取方法损失细节信息，且现有的融合策略无法平衡视觉细节特征和红外目标特征，出了基于空洞卷积与双注意力机制（Dilated Convolution and Dual Attention Mechanism, DCDAM）的融合网络。该网络首先通过多尺度编码器从图像中提取原始特征，其中编码器利用空洞卷积来系统地聚合多尺度上下文信息而不通过下采样算子。其次，在融合策略中引入双注意力机制，将获得的原始特征输入到注意力模块进行特征增强，获得注意力特征；原始特征和注意力特征合成最终融合特征，得在不丢失细节信息的情况下捕获典型信息，同时抑制融合过程中的噪声干扰。最后，解码器采用全尺度跳跃连接和密集网络对融合特征进行解码生成融合图像。通过实验表明，DCDAM比其他同类有代表性的方法在定性和定量指标评价都有提高，体现良好的融合视觉效果。

图像融合空洞卷积多尺度结构密集网络 image fusion, dilated convolution, multiscale stru

PDF全文 Full Text

红外技术

2023, 45(7): 732

图像处理

基于改进深度卷积生成对抗网络的刺绣图像修复

刘羿漩 ¹葛广英 ^2,*齐振岭 ¹李振轩 ¹孙福临 ¹

作者单位

摘要

¹ 聊城大学物理科学与信息工程学院山东省光通信科学与技术重点实验室，山东聊城 252059

² 聊城大学计算机学院，山东聊城 252059

目前中华传统刺绣工艺传承保护问题中的修复任务主要以人工为主，修复过程需要大量的人力、物力。随着深度学习的高速发展，不同类型的刺绣文物损伤可以利用生成对抗网络进行修复。针对上述问题，提出一种基于改进深度卷积生成对抗网络（DCGAN）的刺绣图像修复方法。首先，在生成器部分引入空洞卷积层扩大感受野，并添加卷积注意力机制模块，在通道与空间2个维度增强重要特征的指导作用；在判别器部分增加全连接层数提升网络解决非线性问题的能力；在损失函数部分联合均方误差损失与对抗损失通过网络训练相互博弈的过程实现刺绣图像修复。实验结果表明：引入空洞卷积层与注意力机制提升了网络性能与修复效果，最终得到修复图像的结构相似性高达0.955，能够得到较为自然的刺绣图像修复效果，可以为专家提供纹理、色彩等信息作为参考辅助后续的修复。

非遗文化保护刺绣图像修复生成对抗网络卷积神经网络空洞卷积注意力机制

PDF全文 Full Text

激光与光电子学进展

2023, 60(20): 2010005

医用光学与生物技术

基于特征融合网络的糖尿病视网膜病变分类

下载：578次

赵爽 ¹穆鸽 ¹赵文华 ^2,*马志庆 ²

作者单位

摘要

¹ 山东中医药大学实验室管理处，山东济南 250355

² 山东中医药大学智能与信息工程学院，山东济南 250355

糖尿病视网膜病变是糖尿病最常见也是最严重的并发症之一。为提高对糖尿病视网膜病变严重程度的诊断准确率，进一步为糖尿病视网膜病变治疗的精准用药提供依据，提出一种新型的特征融合网络模型。首先利用轻量化网络EfficientNet-B0提取眼底图像的不同层特征，使用高层特征结合三个不同空洞率的空洞卷积形成多尺度特征。然后引入多尺度通道注意力模块（MS-CAM），赋予高层特征和低层特征新的权重，对高低层特征进行融合，形成最终的特征表征，从而完成对糖尿病视网膜病变严重程度的分类。实验结果表明，所提模型的分类准确率达85.25%，表明其具有较好的可行性，在临床上给医生诊断起到了辅助作用，能更有效地预防糖尿病视网膜病变的进一步恶化。

自动分类糖尿病视网膜病变特征融合网络空洞卷积注意力机制

PDF全文 Full Text

激光与光电子学进展

2023, 60(14): 1417001

研究论文

多局部残差连接注意网络的图像去模糊

陈清江王巧莹 ^*

作者单位

摘要

西安建筑科技大学理学院，陕西西安 710055

针对现有的基于卷积神经网络的图像去模糊算法存在图像纹理细节恢复不清晰的问题，提出了一种基于多局部残差连接注意网络的图像去模糊算法。首先，采用一个卷积层进行浅层特征提取；其次，设计了一种新的基于残差连接和并行注意机制的多局部残差连接注意模块，用于消除图像模糊并提取上下文信息；再次，采用一个基于扩张卷积的成对连接模块进行细节恢复；最后，利用一个卷积层重建清晰图像。实验结果表明：在GoPro数据集上的PSNR (peak signal to noise ratio)和SSIM (structure similarity)分别为31.83 dB、0.9275，在定性和定量两方面都表明所提方法能够有效地恢复模糊图像的纹理细节，网络性能优于对比方法。

卷积神经网络注意机制局部残差连接扩张卷积 convolutional neural network attention mechanism local residual connection dilated convolution

PDF全文 Full Text

应用光学

2023, 44(2): 337

工程应用

引入ECA注意力机制的U-Net语义分割

王瑞绅 ¹宋公飞 ^1,2,3王明 ¹

作者单位

摘要

¹ 南京信息工程大学,a.自动化学院

² b.江苏省大气环境与装备技术协同创新中心, 南京 210000

³ 化工过程先进控制和优化技术教育部重点实验室, 上海 200000

多种应用依赖于数据理解的准确性, 而语义图像分割有效地解决了这个问题, 它为基于像素级别的场景理解提供了必要的上下文信息。鉴于ResNeXt50相比于一般的卷积操作具有更强的特征提取能力, 提出了一种基于ResNeXt50的U-Net网络结构ECAU-Net。在融合过程中, 通过引入超强通道注意力(ECA)模块进一步增强特征表示对场景分割的判别能力。除此之外, 在整体网络结构中引入空洞卷积, 在不改变卷积核大小的情况下扩大图像的感受野范围,从而最大化地提高网络性能。实验结果表明, 在CamVid数据集上, ECAU-Net相较于U-Net在Acc, Acc class, MIoU和FWIoU这4个评价指标上分别提高了2.1%, 8.6%, 8.2%和3.2%。

语义图像分割空洞卷积超强通道注意力模块 semantic image segmentation dilated convolution efficient channel attention module U-Net U-Net

PDF全文 Full Text

电光与控制

2023, 30(1): 92

图像处理

多尺度密集注意力网络用于视网膜血管分割

梁礼明余洁周珑颂陈鑫吴健 ^*

作者单位

摘要

江西理工大学电气工程与自动化学院，江西赣州 341000

针对视网膜血管分割中有标签图像数据有限、血管结构复杂尺度不一且易受病变区域干扰等问题，提出一种多尺度密集注意力网络用于视网膜血管分割。首先，以U-Net架构为基础，引入并行空间和通道挤压激励注意力密集块（scSE-DB）代替传统卷积层，加强特征传播能力，实现了对特征信息的双重校准，使模型能更好地识别血管像素；其次，在网络底端嵌入级联空洞卷积模块，以捕获多尺度血管特征信息，提升网络获取深层语义特征的能力；最后，在公共数据集DRIVE、CHASE_DB1和STARE上进行实验，所提网络的准确率分别为96.50%、96.62%和96.75%，灵敏度分别为84.17%、83.34%和80.39%，特异性分别为98.22%、97.95%和98.67%。所提网络的整体分割性能优于现有多数先进算法。

图像处理视网膜血管分割级联空洞卷积并行空间和通道挤压激励模块注意力密集块

PDF全文 Full Text

激光与光电子学进展

2023, 60(6): 0610011

研究论文

基于人脸结构信息引导的人脸图像修复网络

石浩德 ¹陈明举 ^1,2,*侯劲 ^1,2李兰 ¹

作者单位

摘要

¹ 四川轻化工大学自动化与信息工程学院，四川宜宾 644000

² 四川轻化工大学人工智能四川省重点实验室，四川宜宾 644000

针对人脸图像修复的深度学习网络存在修复后的人脸图像面部语义信息不合理和面部轮廓不协调的问题，提出了一种基于人脸结构信息引导的人脸图像修复网络。首先，采用编码器-解码器网络技术构建人脸结构草图生成网络，并在结构草图生成网络的生成器中加入跳跃连接和引入带膨胀卷积的残差块以生成待修复区域的结构草图。其次，在构建人脸修复网络时，在修复网络生成器中引入注意力机制，让修复网络在修复过程中更多关注待修复区域，并以生成的人脸结构草图为引导从而实现人脸图像面部语义结构和纹理信息的生动修复。最后，在结构草图生成网络的损失函数中引入特征匹配损失进行模型训练，从而约束生成器生成与真实结构草图更相似的结果；在修复网络的损失函数中联合感知损失和风格损失进行模型训练，从而更好地重建待修复区域的人脸图像面部轮廓结构和颜色纹理，使修复后的图像更接近真实图像。对比实验结果表明，在人脸图像数据集中，本文所设计的网络模型的修复性能有较高的提升。

人脸修复解码器-编码器膨胀卷积跳跃连接注意力机制 face inpating encoder-decoder dilated convolution skip connections attention mechanism

PDF全文 Full Text

液晶与显示

2023, 38(2): 245

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索