相同关键词【多尺度卷积】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 石家庄铁道大学信息科学与技术学院，河北石家庄050043

² 河北省电磁环境效应与信息处理重点实验室，河北石家庄050043

遥感图像建筑物高效提取在城市规划、灾害救援、**侦察等领域发挥着重要作用。基于深度学习的建筑物提取方法虽然具有很高的精准度，但通常是由复杂的卷积运算和极大的网络模型实现的，提取速度低，难以满足现实需求。为此，设计了一种遥感图像建筑物快速提取方法。在STTNet模型的特征提取网络中引入多尺度卷积，在同一卷积层内提取多尺度特征，进一步提高模型的特征提取能力。改进空间稀疏特征提取器结构，在带有空间注意力权值的特征图中应用通道注意力，有效学习通道注意力权值，进而解决使用骨干网络输出特征图学习时通道注意力权值浮动的问题。为降低模型参数量，加快模型的运算速度，将STTNet模型由并联结构改为串联结构。INRIA建筑物数据集上的实验表明，本文方法在保证精度和IoU的前提下速度比STTNet提升了18.3%，明显优于主流方法。

遥感图像建筑物提取多尺度卷积稀疏特征提取器 remote sensing image building extraction multi-scale convolution sparse feature extractor

PDF全文 Full Text

光学精密工程

2023, 31(11): 1700

光通信与光信息技术

基于UMnet的数字全息相位解包裹

陈翠茹 ¹王华英 ^1,2赵宝群 ^1,2王学 ^1,2[ ... ]雷家良 ¹

作者单位

摘要

¹ 河北工程大学数理科学与工程学院, 邯郸 056038

² 河北省计算光学成像与光电检测技术创新中心, 邯郸 056038

为了实现高精度的数字全息相位解包裹, 采用基于Unet网络框架中集成MobilenetV3的轻量级深度学习网络, 设计了UMnet网络以实现全息相位的精准解包裹。网络中融和轻量级注意力机制、多尺度卷积来增强网络精度与泛化能力, 同时运用hard-Swish激活函数提高网络学习能力; 运用模拟数据集进行网络训练, 对生成网络模型进行降噪能力测试, 并经过了实际样品全息图的测试验证。结果表明, UMnet比深度学习相位解包裹网络的结构性相似指数值提升了6.6%。UMnet能够简单、快速、高效地实现数字全息相位解包裹。

全息相位解包裹注意力机制多尺度卷积 holography phase unwrapping attention mechanism multi-scale convolution

PDF全文 Full Text

激光技术

2023, 47(1): 73

图像与信号处理

基于YOLOv4的目标检测优化方法

余尧

作者单位

摘要

华中光电技术研究所- 武汉光电国家研究中心, 湖北武汉 430223

针对YOLOv4目标检测网络结构复杂, 参数量以及计算量大等问题, 提出了一种轻量化目标检测算法(YOLOv4-GC)。首先, 使用ghostnet结构替换原始YOLOv4的主干网络, 降低了获取冗余特征图像的计算量, 在SPP与PANet模块中使用深度可分离卷积, 使模型的计算量和参数量比原始YOLOv4分别降低82%和80%; 再结合PyConv多尺度卷积设计出Py-PANet金字塔结构, 提高了模型对于图像特征的提取和融合能力。在Pascal VOC数据集上的实验结果表明, 在保证模型精度的情况下模型的参数量和计算量相比原始有明显降低。

轻量化注意力机制多尺度卷积目标检测 YOLO网络 lightweight neural network cooperative attention mechanism adaptive spatial feature fusion target detection YOLO net

PDF全文 Full Text

光学与光电技术

2022, 20(6): 45

成像光谱

稀疏二阶注意力机制驱动的多尺度卷积遥感图像场景分类网络

倪康 ^1,2赵雨晴 ³陈志 ^1,*

作者单位

摘要

¹ 南京邮电大学计算机学院，南京 210023

² 江苏省大数据安全与智能处理重点实验室，南京 210023

³ 首都经济贸易大学管理工程学院，北京 100070

地面目标尺度信息不同及场景图像复杂的空间分布和纹理信息导致基于CNNs的场景分类算法分类效果欠佳。针对以上问题，从深度特征学习角度出发，提出一种稀疏二阶注意力机制驱动的多尺度卷积神经网络。首先，在主干网之后引入多尺度卷积层以获取地面目标不同尺度信息目标的特征表述，将组卷积嵌入多尺度卷积层以降低计算复杂度；其次，在分析基于一阶和二阶统计量的注意力机制优势之后，提出一种稀疏二阶注意力机制，以增强不同尺度卷积特征的通道信息可判别性。该注意力机制的稀疏性可在确保场景分类性能的同时，有效降低二阶统计量的特征维度；最后，将多尺度卷积层与稀疏二阶注意力机制嵌入端到端网络训练。在AID和NWPU45数据集上的实验表明：本文所提网络可提升场景分类准确率；同时，通过热力图结果对比和消融实验，验证了稀疏二阶注意力机制和所提各网络层的有效性。

遥感图像卷积神经网络特征可判别性多尺度卷积注意力机制 Remote sensing image Convolutional neural networks Feature distinguishability Multi-scale convolution Attention mechanism

PDF全文 Full Text

光子学报

2022, 51(6): 0610004

图像处理

基于注意力机制的多尺度残差U-Net眼底血管分割

下载：757次

赵凤 ¹钟蓓蓓 ^1,*刘汉强 ²

作者单位

摘要

¹ 西安邮电大学通信与信息工程学院（人工智能学院），陕西西安 710121

² 陕西师范大学计算机科学学院，陕西西安 710119

针对现有眼底血管分割方法难以辨别细小血管及交叉处血管分割断裂的问题，提出了一种基于注意力机制的多尺度U型网络。在编码阶段使用改进的残差块结构提取血管深度特征的同时有效解决过拟合问题，接着依次采用多尺度卷积模块和多尺度注意力模块进一步获取深度特征的多尺度特征信息。然后，使用MaxBlurPool进行池化，对数据进行降维并保证平移不变性。此外，在最后一个编码层引入混合注意力机制和并行空洞卷积，前者从通道和空间维度强调需要重点关注的信息，抑制背景区域的干扰；后者用来获取不同大小感受野的特征信息，且不会引入多余参数而导致计算负担。在解码部分，改进跳跃连接方式以抑制噪声的干扰并获得更加丰富的上下文信息。所提算法在公开的眼底数据集上取得了优于其他算法的分割效果。

图像处理图像分割视网膜血管注意力机制多尺度卷积空洞卷积

PDF全文 Full Text

激光与光电子学进展

2022, 59(18): 1810002

机器视觉

基于多尺度前馈结构的单幅图像去雨算法

下载：558次

江智呈 ¹李志伟 ^1,2,*陈晨 ¹周进祥 ¹周武能 ²

作者单位

摘要

¹ 上海工程技术大学电子电气工程学院，上海 201620

² 东华大学信息科学与技术学院，上海 200051

图像中雨纹的存在将增大目标检测和识别的难度，而雨纹通常是图像的高频部分，其中也包含着大量图像细节，如何在去雨的同时保留有用的细节是需要解决的问题。为避免预处理带来去雨次优效果，模拟真实场景下物体成像过程，改进图像复原的通用模型，丰富网络的感受野，更精确去雨的同时增强对比度，提出一种基于多尺度、多层次和多注意力机制的卷积神经网络，通过多卷积的特征跳跃连接补偿卷积过程中细节信息的丢失以及融合不同层级特征信息，在网络分支中提取多尺度特征图，并结合注意力机制形成多个多尺度残差注意力子模块对全局信息在通道维度上进行权值重标定，去冗余的同时增强有用信息，将初级特征与高级特征相融合来学习雨图和无雨图之间的映射关系。考虑到实际情况，真实的雨图无对应的无雨图，所以本文采用合成的数据集来训练，并用合成数据集和真实场景图进行验证。实验结果表明，所提出的网络，无论雨纹的大小和密度，都能取得较好的去雨效果，同时保留了细节信息。

图像去雨注意力机制多尺度卷积神经网络前馈结构

PDF全文 Full Text

激光与光电子学进展

2022, 59(12): 1215001

Research Articles

基于GADF变换和多尺度CNN的哈密瓜表面农药残留可见-近红外光谱判别方法

下载：563次

喻国威 ^1,*马本学 ¹陈金成 ¹党富民 ⁴[ ... ]王刚 ¹

作者单位

摘要

¹ 石河子大学机械电气工程学院, 新疆石河子 832003

⁴ 农业部食品质量监督检验测试中心(石河子), 新疆石河子 832000

针对哈密瓜表面农药残留化学检测方法成本高且具有破坏性等问题, 探索了可见-近红外(Vis-NIR)光谱技术对农药残留定性判别的可行性。以哈密瓜为载体, 百菌清和吡虫啉农药为研究对象, 采集哈密瓜表面无残留、百菌清和吡虫啉残留的可见-近红外漫反射光谱, 利用格拉姆角场(GAF)将一维光谱数据转换为二维彩色图像, 构建GAF图像数据集。设计一种包含Inception结构的多尺度卷积神经网络模型用于哈密瓜表面农药残留种类判别, 包括1层输入层、 3层卷积层、 1层融合层、 1层平坦层、 2层全连接层和1层输出层。模型测试混淆矩阵结果表明, 格拉姆角差场(GADF)变换对哈密瓜表面农药残留的可见-近红外光谱表达能力较强。此外, 构建AlexNet、 VGG-16卷积神经网络(CNN)模型和支持向量机(SVM)、极限学习机(ELM)机器学习模型与提出的多尺度CNN模型进行性能对比。结果表明, 3种CNN模型对哈密瓜表面有无农药残留的判别效果较好, 综合判别准确率均高于SVM和ELM模型。对比3种CNN模型性能, 多尺度CNN模型的性能最佳, 训练耗时为14 s, 综合判别准确率为98.33%。多尺度CNN模型结构利用多种小尺寸滤波器组合(1×1, 3×3和5×5)和并行卷积模块, 能够捕获不同层次和尺度的特征, 通过级联融合模式进行深度特征融合, 提高了模型的特征提取能力。与传统深度CNN模型相比, 在保证计算复杂度不变的情况下, 多尺度CNN模型的精度得到了有效提高。实验结果表明, GADF变换结合多尺度CNN模型可以有效进行光谱数据解析, 利用可见-近红外光谱技术可以实现哈密瓜表面农药残留的定性判别。研究结果为大型瓜果表面农药残留的快速无损检测技术的研发提供了理论参考。

哈密瓜格拉姆角场变换可见-近红外光谱多尺度卷积神经网络农药残留判别 Hami melon Gramian angular fields transformation Visible/near infrared spectroscopy Multi-scale convolutional neural network Pesticide residue discriminant

PDF全文 Full Text

光谱学与光谱分析

2021, 41(12): 3701

光纤光学与光通信

基于端点检测与信号重组的光纤分布式传感信号识别

下载：503次

吴虎孔勇 ^*王振伟丁伟李欢

作者单位

摘要

上海工程技术大学电子电气工程学院，上海 201620

为提高基于相敏光时域反射计的分布式光纤声传感系统对入侵振动事件的识别准确率，提出一种基于端点检测与信号重组的光纤振动信号识别方法。该方法首先使用基于EMD_PCC的去噪方式对信号进行去噪，然后对去噪后的信号进行端点检测，将检测到的振动信号进行振动信号的重组，并提出使用一个双输入多尺度卷积神经网络分别提取振动信号的时域特征与频域特征，最后使用支持向量机进行分类。实验证明该识别方法能快速完成对识别模型的训练，并且能有效识别在实际环境中采集的入侵振动信号，对入侵信号的识别准确率可达94.8%。

分布式光纤传感相敏光时域反射计端点检测多尺度卷积神经网络支持向量机 Distributed fiber optic sensing Phase-sensitive optical time domain reflectometer Endpoint detection Multiscale convolutional neural networks Support vector machines

PDF全文 Full Text

光子学报

2021, 50(11): 1106005

专栏：电磁环境大数据挖掘与利用

基于地空频谱在线学习的地震前电磁异常检测

刘立 ^*王真韩光洁徐政伟

作者单位

摘要

河海大学物联网工程学院, 江苏常州 213000

提出了一种应用于噪声环境下的多尺度卷积神经网络 (CNN)在线地震前电磁异常检测模型。该模型在 CNN强大特征提取能力的基础上, 通过多尺度机制协同长短期地空电磁频谱特征, 多维度、多视角地开展对地震前电磁的异常检测。同时引入自适应变分模态分解 (VMD)降噪方法提取观测信号中的有效信息, 最后配合在线学习策略, 实现对地震前电磁异常模式可能变化的持续学习。仿真结果表明, 多尺度模型在低信噪比下能够保持较高的准确率, 在线学习策略能够有效缩短模型更新时间, 由此证明了模型的有效性。

地震电磁前兆多尺度卷积神经网络多尺度学习在线学习 earthquake electromagnetic precursor multi -scale Convolutional Neural Network multi -scale learning online learning

PDF全文 Full Text

太赫兹科学与电子信息学报

2021, 19(4): 635

医用光学与生物技术

基于FDMU-net的早产儿视网膜图像血管分割

下载：601次

王亮 ¹陈春晓 ^1,*傅雪 ¹王林 ²

作者单位

摘要

¹ 南京航空航天大学自动化学院, 江苏南京 211106

² 上海圣为医疗科技有限公司, 上海 201321

早产儿视网膜病变是一种血管增生性疾病,是导致新生儿视网膜受损或致盲的主要原因之一。通过分割和分析早产儿眼底图像中的血管结构,可以对早产儿视网膜病变进行早期诊断和监测。早产儿视网膜血管较成年人视网膜血管对比度低且存在脉络膜重叠等问题,从而会导致视网膜血管分割准确率不高和敏感度较低等问题。为解决这些问题,在U-net框架下提出FDMU-net新生儿视网膜血管分割模型。该模型融入密集连接层来提高特征利用率,在编码和解码通道拼接过程中,采用多尺度卷积核特征融合方式来提高感受野,并利用血管骨架加权focal loss损失函数来提高网络对模糊样本的分割精度。利用本文提出的FDMU-net模型在DRIVE和STARE两个公开数据集上进行实验,准确率分别达到96.75%和96.85%,敏感度分别达到81.52%和84.84%。在临床早产儿眼底数据集实验中,对比U-net模型、AttentionResU-net模型及多尺度特征融合全卷积神经网络模型,本文提出的FDMU-net模型在准确率和敏感度上有较大的提高,可较好地解决血管丢失及敏感度较低的问题,有效分割出早产儿视网膜血管。

图像处理早产儿眼底图像血管分割密集连接层多尺度卷积核

PDF全文 Full Text

激光与光电子学进展

2021, 58(14): 1417003

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索