作者单位
摘要
1 石家庄铁道大学 信息科学与技术学院,河北石家庄050043
2 河北省电磁环境效应与信息处理重点实验室,河北石家庄050043
遥感图像建筑物高效提取在城市规划、灾害救援、**侦察等领域发挥着重要作用。基于深度学习的建筑物提取方法虽然具有很高的精准度,但通常是由复杂的卷积运算和极大的网络模型实现的,提取速度低,难以满足现实需求。为此,设计了一种遥感图像建筑物快速提取方法。在STTNet模型的特征提取网络中引入多尺度卷积,在同一卷积层内提取多尺度特征,进一步提高模型的特征提取能力。改进空间稀疏特征提取器结构,在带有空间注意力权值的特征图中应用通道注意力,有效学习通道注意力权值,进而解决使用骨干网络输出特征图学习时通道注意力权值浮动的问题。为降低模型参数量,加快模型的运算速度,将STTNet模型由并联结构改为串联结构。INRIA建筑物数据集上的实验表明,本文方法在保证精度和IoU的前提下速度比STTNet提升了18.3%,明显优于主流方法。
遥感图像 建筑物提取 多尺度卷积 稀疏特征提取器 remote sensing image building extraction multi-scale convolution sparse feature extractor 
光学 精密工程
2023, 31(11): 1700
陈翠茹 1王华英 1,2赵宝群 1,2王学 1,2[ ... ]雷家良 1
作者单位
摘要
1 河北工程大学 数理科学与工程学院, 邯郸 056038
2 河北省计算光学成像与光电检测技术创新中心, 邯郸 056038
为了实现高精度的数字全息相位解包裹, 采用基于Unet网络框架中集成MobilenetV3的轻量级深度学习网络, 设计了UMnet网络以实现全息相位的精准解包裹。网络中融和轻量级注意力机制、多尺度卷积来增强网络精度与泛化能力, 同时运用hard-Swish激活函数提高网络学习能力; 运用模拟数据集进行网络训练, 对生成网络模型进行降噪能力测试, 并经过了实际样品全息图的测试验证。结果表明, UMnet比深度学习相位解包裹网络的结构性相似指数值提升了6.6%。UMnet能够简单、快速、高效地实现数字全息相位解包裹。
全息 相位解包裹 注意力机制 多尺度卷积 holography phase unwrapping attention mechanism multi-scale convolution 
激光技术
2023, 47(1): 73
作者单位
摘要
华中光电技术研究所- 武汉光电国家研究中心, 湖北 武汉 430223
针对YOLOv4目标检测网络结构复杂, 参数量以及计算量大等问题, 提出了一种轻量化目标检测算法(YOLOv4-GC)。首先, 使用ghostnet结构替换原始YOLOv4的主干网络, 降低了获取冗余特征图像的计算量, 在SPP与PANet模块中使用深度可分离卷积, 使模型的计算量和参数量比原始YOLOv4分别降低82%和80%; 再结合PyConv多尺度卷积设计出Py-PANet金字塔结构, 提高了模型对于图像特征的提取和融合能力。在Pascal VOC数据集上的实验结果表明, 在保证模型精度的情况下模型的参数量和计算量相比原始有明显降低。
轻量化 注意力机制 多尺度卷积 目标检测 YOLO网络 lightweight neural network cooperative attention mechanism adaptive spatial feature fusion target detection YOLO net 
光学与光电技术
2022, 20(6): 45
倪康 1,2赵雨晴 3陈志 1,*
作者单位
摘要
1 南京邮电大学 计算机学院,南京 210023
2 江苏省大数据安全与智能处理重点实验室,南京 210023
3 首都经济贸易大学 管理工程学院,北京 100070
地面目标尺度信息不同及场景图像复杂的空间分布和纹理信息导致基于CNNs的场景分类算法分类效果欠佳。针对以上问题,从深度特征学习角度出发,提出一种稀疏二阶注意力机制驱动的多尺度卷积神经网络。首先,在主干网之后引入多尺度卷积层以获取地面目标不同尺度信息目标的特征表述,将组卷积嵌入多尺度卷积层以降低计算复杂度;其次,在分析基于一阶和二阶统计量的注意力机制优势之后,提出一种稀疏二阶注意力机制,以增强不同尺度卷积特征的通道信息可判别性。该注意力机制的稀疏性可在确保场景分类性能的同时,有效降低二阶统计量的特征维度;最后,将多尺度卷积层与稀疏二阶注意力机制嵌入端到端网络训练。在AID和NWPU45数据集上的实验表明:本文所提网络可提升场景分类准确率;同时,通过热力图结果对比和消融实验,验证了稀疏二阶注意力机制和所提各网络层的有效性。
遥感图像 卷积神经网络 特征可判别性 多尺度卷积 注意力机制 Remote sensing image Convolutional neural networks Feature distinguishability Multi-scale convolution Attention mechanism 
光子学报
2022, 51(6): 0610004
作者单位
摘要
1 西安邮电大学通信与信息工程学院(人工智能学院),陕西 西安 710121
2 陕西师范大学计算机科学学院,陕西 西安 710119
针对现有眼底血管分割方法难以辨别细小血管及交叉处血管分割断裂的问题,提出了一种基于注意力机制的多尺度U型网络。在编码阶段使用改进的残差块结构提取血管深度特征的同时有效解决过拟合问题,接着依次采用多尺度卷积模块和多尺度注意力模块进一步获取深度特征的多尺度特征信息。然后,使用MaxBlurPool进行池化,对数据进行降维并保证平移不变性。此外,在最后一个编码层引入混合注意力机制和并行空洞卷积,前者从通道和空间维度强调需要重点关注的信息,抑制背景区域的干扰;后者用来获取不同大小感受野的特征信息,且不会引入多余参数而导致计算负担。在解码部分,改进跳跃连接方式以抑制噪声的干扰并获得更加丰富的上下文信息。所提算法在公开的眼底数据集上取得了优于其他算法的分割效果。
图像处理 图像分割 视网膜血管 注意力机制 多尺度卷积 空洞卷积 
激光与光电子学进展
2022, 59(18): 1810002
作者单位
摘要
1 上海工程技术大学电子电气工程学院,上海 201620
2 东华大学信息科学与技术学院,上海 200051
图像中雨纹的存在将增大目标检测和识别的难度,而雨纹通常是图像的高频部分,其中也包含着大量图像细节,如何在去雨的同时保留有用的细节是需要解决的问题。为避免预处理带来去雨次优效果,模拟真实场景下物体成像过程,改进图像复原的通用模型,丰富网络的感受野,更精确去雨的同时增强对比度,提出一种基于多尺度、多层次和多注意力机制的卷积神经网络,通过多卷积的特征跳跃连接补偿卷积过程中细节信息的丢失以及融合不同层级特征信息,在网络分支中提取多尺度特征图,并结合注意力机制形成多个多尺度残差注意力子模块对全局信息在通道维度上进行权值重标定,去冗余的同时增强有用信息,将初级特征与高级特征相融合来学习雨图和无雨图之间的映射关系。考虑到实际情况,真实的雨图无对应的无雨图,所以本文采用合成的数据集来训练,并用合成数据集和真实场景图进行验证。实验结果表明,所提出的网络,无论雨纹的大小和密度,都能取得较好的去雨效果,同时保留了细节信息。
图像去雨 注意力机制 多尺度卷积神经网络 前馈结构 
激光与光电子学进展
2022, 59(12): 1215001
作者单位
摘要
1 石河子大学机械电气工程学院, 新疆 石河子 832003
4 农业部食品质量监督检验测试中心(石河子), 新疆 石河子 832000
针对哈密瓜表面农药残留化学检测方法成本高且具有破坏性等问题, 探索了可见-近红外(Vis-NIR)光谱技术对农药残留定性判别的可行性。 以哈密瓜为载体, 百菌清和吡虫啉农药为研究对象, 采集哈密瓜表面无残留、 百菌清和吡虫啉残留的可见-近红外漫反射光谱, 利用格拉姆角场(GAF)将一维光谱数据转换为二维彩色图像, 构建GAF图像数据集。 设计一种包含Inception结构的多尺度卷积神经网络模型用于哈密瓜表面农药残留种类判别, 包括1层输入层、 3层卷积层、 1层融合层、 1层平坦层、 2层全连接层和1层输出层。 模型测试混淆矩阵结果表明, 格拉姆角差场(GADF)变换对哈密瓜表面农药残留的可见-近红外光谱表达能力较强。 此外, 构建AlexNet、 VGG-16卷积神经网络(CNN)模型和支持向量机(SVM)、 极限学习机(ELM)机器学习模型与提出的多尺度CNN模型进行性能对比。 结果表明, 3种CNN模型对哈密瓜表面有无农药残留的判别效果较好, 综合判别准确率均高于SVM和ELM模型。 对比3种CNN模型性能, 多尺度CNN模型的性能最佳, 训练耗时为14 s, 综合判别准确率为98.33%。 多尺度CNN模型结构利用多种小尺寸滤波器组合(1×1, 3×3和5×5)和并行卷积模块, 能够捕获不同层次和尺度的特征, 通过级联融合模式进行深度特征融合, 提高了模型的特征提取能力。 与传统深度CNN模型相比, 在保证计算复杂度不变的情况下, 多尺度CNN模型的精度得到了有效提高。 实验结果表明, GADF变换结合多尺度CNN模型可以有效进行光谱数据解析, 利用可见-近红外光谱技术可以实现哈密瓜表面农药残留的定性判别。 研究结果为大型瓜果表面农药残留的快速无损检测技术的研发提供了理论参考。
哈密瓜 格拉姆角场变换 可见-近红外光谱 多尺度卷积神经网络 农药残留判别 Hami melon Gramian angular fields transformation Visible/near infrared spectroscopy Multi-scale convolutional neural network Pesticide residue discriminant 
光谱学与光谱分析
2021, 41(12): 3701
作者单位
摘要
上海工程技术大学 电子电气工程学院,上海 201620
为提高基于相敏光时域反射计的分布式光纤声传感系统对入侵振动事件的识别准确率,提出一种基于端点检测与信号重组的光纤振动信号识别方法。该方法首先使用基于EMD_PCC的去噪方式对信号进行去噪,然后对去噪后的信号进行端点检测,将检测到的振动信号进行振动信号的重组,并提出使用一个双输入多尺度卷积神经网络分别提取振动信号的时域特征与频域特征,最后使用支持向量机进行分类。实验证明该识别方法能快速完成对识别模型的训练,并且能有效识别在实际环境中采集的入侵振动信号,对入侵信号的识别准确率可达94.8%。
分布式光纤传感 相敏光时域反射计 端点检测 多尺度卷积神经网络 支持向量机 Distributed fiber optic sensing Phase-sensitive optical time domain reflectometer Endpoint detection Multiscale convolutional neural networks Support vector machines 
光子学报
2021, 50(11): 1106005
作者单位
摘要
河海大学物联网工程学院, 江苏常州 213000
提出了一种应用于噪声环境下的多尺度卷积神经网络 (CNN)在线地震前电磁异常检测模型。该模型在 CNN强大特征提取能力的基础上, 通过多尺度机制协同长短期地空电磁频谱特征, 多维度、多视角地开展对地震前电磁的异常检测。同时引入自适应变分模态分解 (VMD)降噪方法提取观测信号中的有效信息, 最后配合在线学习策略, 实现对地震前电磁异常模式可能变化的持续学习。仿真结果表明, 多尺度模型在低信噪比下能够保持较高的准确率, 在线学习策略能够有效缩短模型更新时间, 由此证明了模型的有效性。
地震电磁前兆 多尺度卷积神经网络 多尺度学习 在线学习 earthquake electromagnetic precursor multi -scale Convolutional Neural Network multi -scale learning online learning 
太赫兹科学与电子信息学报
2021, 19(4): 635
作者单位
摘要
1 南京航空航天大学自动化学院, 江苏 南京 211106
2 上海圣为医疗科技有限公司, 上海 201321
早产儿视网膜病变是一种血管增生性疾病,是导致新生儿视网膜受损或致盲的主要原因之一。通过分割和分析早产儿眼底图像中的血管结构,可以对早产儿视网膜病变进行早期诊断和监测。早产儿视网膜血管较成年人视网膜血管对比度低且存在脉络膜重叠等问题,从而会导致视网膜血管分割准确率不高和敏感度较低等问题。为解决这些问题,在U-net框架下提出FDMU-net新生儿视网膜血管分割模型。该模型融入密集连接层来提高特征利用率,在编码和解码通道拼接过程中,采用多尺度卷积核特征融合方式来提高感受野,并利用血管骨架加权focal loss损失函数来提高网络对模糊样本的分割精度。利用本文提出的FDMU-net模型在DRIVE和STARE两个公开数据集上进行实验,准确率分别达到96.75%和96.85%,敏感度分别达到81.52%和84.84%。在临床早产儿眼底数据集实验中,对比U-net模型、AttentionResU-net模型及多尺度特征融合全卷积神经网络模型,本文提出的FDMU-net模型在准确率和敏感度上有较大的提高,可较好地解决血管丢失及敏感度较低的问题,有效分割出早产儿视网膜血管。
图像处理 早产儿眼底图像 血管分割 密集连接层 多尺度卷积 
激光与光电子学进展
2021, 58(14): 1417003

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!