相同关键词【图像语义分割】论文列表 -- 中国光学期刊网

作者单位

摘要

上海理工大学光电信息与计算机工程学院，上海 200093

图像语义分割需要精细的细节信息和丰富的语义信息，然而在特征提取阶段，连续下采样操作会导致图像中物体的空间细节信息丢失。为解决该问题，提出一种双分支结构语义分割算法，在特征提取阶段既能有效获取丰富的语义信息又能减少物体细节信息的丢失。该算法的一个分支使用浅层网络保留高分辨率细节信息有助于物体的边缘分割，另一个分支使用深层网络进行下采样获取语义信息有助于物体的类别识别，再将两种信息有效融合可以生成精确的像素预测。通过Cityscapes数据集和CamVid数据集上的实验验证，与现有语义分割算法相比，所提算法在较少的参数条件下，获得了较好的分割效果。

图像语义分割双分支结构细节信息语义信息 image semantic segmentation double branch structure detail information semantic information

PDF全文 Full Text

光学仪器

2023, 45(2): 46

图像处理

DECANet：基于改进DeepLabv3+的图像语义分割方法

下载：701次

唐璐 ^1,1,2,2万良 ^1,1,2,">*王婷婷 ^1,1,2,2李树胜 ^1,1,2,2

作者单位

摘要

¹ 贵州大学计算机科学与技术学院，贵州贵阳 550025

² 贵州大学计算机软件与理论研究所，贵州贵阳 550025

在图像的语义分割任务中，不同对象之间像素值存在差异，导致现有的网络模型在图像语义分割过程中丢失图像局部细节信息。针对上述问题，提出一种图像语义分割方法（DECANet）。首先，引入通道注意力网络模块，通过对所有通道的依赖关系进行建模提高网络的表达能力，选择性地学习并强化通道特征，提取有用信息，抑制无用信息。其次，利用改进的空洞空间金字塔池化（ASPP）结构，对提取到的图像卷积特征进行多尺度融合，减少图像细节信息丢失，且在权重参数不改变的情况下提取语义像素位置信息，加快模型的收敛速度。最后，DECANet在PASCAL VOC2012和Cityscapes数据集上的平均交并比分别达81.08%和76%，与现有的先进网络模型相比，检测性能更优，可以有效地捕获局部细节信息，减少图像语义像素分类错误。

图像语义分割注意力机制空洞空间金字塔池化多尺度融合

PDF全文 Full Text

激光与光电子学进展

2023, 60(4): 0410002

机器视觉

多尺度特征对齐聚合的语义分割方法

徐兆忠 ¹彭力 ^1,2,*戴菲菲 ³

作者单位

摘要

¹ 江南大学物联网工程学院物联网技术应用教育部工程研究中心，江苏无锡 214122

² 无锡太湖学院江苏省物联网应用技术重点建设实验室，江苏无锡 214122

³ 台州市产品质量安全监测研究院，浙江台州 318000

卷积神经网络在对图像进行语义分割时，高层特征经过降采样和padding操作和低层特征之间容易产生错位。为了解决高低层特征之间的错位问题，更好地聚合多尺度特征信息，提出了一种带有多尺度特征对齐聚合（MFAA）模块的语义分割方法。MFAA模块采用一种可学习插值策略来学习像素的变换偏移，可以有效缓解不同尺度特征聚合的特征不对齐问题，同时模块内的注意力机制提高了解码器恢复重要细节特征的能力。该方法利用高层特征的语义信息和低层特征的空间信息，通过多个MFAA模块将高低层特征对齐之后聚合到一起，从而实现图像更加精细的语义分割效果。将所提网络结构在语义分割数据集PASCAL VOC 2012上进行了验证，使用ResNet-50作为骨干网络时在验证集上的平均交并比值达到了78.4%。实验结果表明，该方法与几种主流分割方法相比在评价指标方面存在优越性，可以有效提高图像分割的效果。

机器视觉图像语义分割特征对齐多尺度特征注意力机制

PDF全文 Full Text

激光与光电子学进展

2023, 60(2): 0215004

图像处理

基于Deeplab v3+的图像语义分割算法优化研究

下载：971次

孟俊熙张莉 ^*曹洋张乐天宋倩

作者单位

摘要

西安工程大学电子信息学院，陕西西安 710600

针对目前Deeplab v3+模型进行图像语义分割时部分细节损失严重，存在漏分割、误分割现象，在其算法基础上构建了新的语义分割模型N-Deeplab v3+。新模型设计异感受野拼接的空洞空间金字塔池化结构，增强各层级信息间相关性；增设多次跨层特征融合，提升对图像细节的表征力；构建基于注意力机制的特征对齐模块，引导高低级特征对齐并有针对性地强化对重要通道特征的学习，提升模型学习能力。在Cityscapes数据集上的实验结果表明，所提改进方案能够有效提高小尺度目标关注度，缓解目标误分割问题，提升模型语义分割精度。在PASCAL VOC 2012数据集上进一步验证新模型的泛化能力。N-Deeplab v3+模型在Cityscapes数据集和PASCAL VOC 2012数据集上的平均交并比达76.31%和81.97%，较原模型分别提升了1.69个百分点和2.14个百分点。

深度学习图像语义分割 Deeplab v3+ 注意力机制

PDF全文 Full Text

激光与光电子学进展

2022, 59(16): 1610009

光电信息获取与处理

基于深度学习的铸件X射线图像分割研究

下载：532次

曹富强 ¹王明泉 ^1,*张俊生 ²邵亚璐 ¹张雪洋 ¹

作者单位

摘要

¹ 中北大学仪器科学与动态测试教育部重点实验室，山西太原 030051

² 太原工业学院电子工程系，山西太原 030051

针对当前图像分割算法在实现工业铸件内部缺陷分割上精度低且算法不够轻量化的问题，提出一种基于改进DeepLabv3+的工业铸件内部缺陷检测算法Effi-DeepLab。该方法采用EfficientNet中的MBConv来代替原有的Xception模块进行特征提取，使特征提取网络更加高效与轻量化；针对工业铸件内部缺陷尺寸小的问题，重新设计空洞空间金字塔池化（ASPP）层中空洞卷积的扩张率，使得卷积块对小目标具有更高的鲁棒性；在解码端充分利用特征提取阶段的低阶语义信息进行多尺度特征融合，以提高小目标缺陷分割的精度。实验结果表明，在本文使用的汽车轮毂内部缺陷图像数据集中，Effi-DeepLab模型对缺陷的分割准确率和平均交并比（mIoU）分别为93.58%和89.39%，相比DeepLabv3+分别提升了2.65%和2.24%，具有更好的分割效果；此外，还通过实验验证了本文提出算法具有良好的泛化性。

图像语义分割深度学习 DeepLabv3+ 无损检测 image semantic segmentation deep learning DeepLabv3+ non-destructive detection

PDF全文 Full Text

应用光学

2021, 42(6): 1025

图像处理

基于U-Net和胶囊网络的合成孔径雷达图像语义分割

下载：559次

敬绍迪 ¹喻玲娟 ^1,*胡跃虹 ²杨泽洲 ¹[ ... ]谢晓春 ³

作者单位

摘要

¹ 江西理工大学信息工程学院, 江西赣州 341000

² 广州卫富科技开发有限公司, 广东广州 510200

³ 赣南师范大学物理与电子信息学院, 江西赣州 341000

图像语义分割作为一种像素级分类技术,已应用于合成孔径雷达(SAR)图像的解译领域中。U-Net是一种端到端的图像语义分割网络,具有典型的编码-解码结构。其中,编码部分主要由卷积层和池化层组成,可以有效提取图像中的目标特征,但难以获取目标的位置和方向等信息。胶囊网络是一种能够获取目标姿态(位置、大小、方向)等信息的神经网络,因此,提出了一种基于U-Net和胶囊网络的SAR图像语义分割方法。此外,考虑到SAR图像数据集较小的特点,将U-Net的编码部分设计成视觉几何组(VGG16)结构,将预训练的VGG16模型直接迁移至编码部分。为了验证本方法的有效性,在两个极化SAR图像数据集上开展了建筑物目标的分割实验。结果表明,相比U-Net,本方法的精确率、召回率、F1分数和交并比更高,且能减少网络模型的训练时间。

图像处理合成孔径雷达图像语义分割 U-Net 胶囊网络迁移学习

PDF全文 Full Text

激光与光电子学进展

2021, 58(20): 2010009

设计与研究

基于多路径网络的权值调整图像语义分割算法

秦晓飞 ¹何玉帅 ²孙越 ²严浩通 ²林轩 ²

作者单位

摘要

¹ 上海理工大学光电信息与计算机工程学院，上海 200093

² 上海理工大学机械工程学院，上海 200093

为提高图像语义分割准确程度，针对场景解析中类别边缘分辨清晰度，提出了一种基于多路径网络的权值调整图像语义分割算法。通过引入多路径网络和权值调整并对图像场景中的物体类别具有的特征进行分析，提高图像的语义分割的准确程度；通过采用ADE20K数据集进行训练，提高边缘信息的分割效果，使模型具有更好的泛化能力。此算法加快了网络收敛速度。

图像语义分割多路径网络权值调整边缘信息 semantic image segmentation multi-path network weight redistribution edge information

PDF全文 Full Text

光学仪器

2020, 42(1): 46

信息科学

利用卷积神经网络的自动驾驶场景语义分割

王中宇 ^1,*倪显扬 ¹尚振东 ²

作者单位

摘要

¹ 北京航空航天大学仪器科学与光电工程学院, 北京 100191

² 河南科技大学机电工程学院, 河南洛阳 471023

图像语义分割是现代自动驾驶系统的一个必要部分, 因为对汽车周围场景的准确理解是导航和动作规划的关键。为提高自动驾驶场景的图像语义分割准确率, 且考虑到当下流行的基于卷积神经网络的语义分割模型（DeepLab v3+）无法有效地利用注意力信息, 导致分割边界粗糙等问题, 提出一种融合底层像素信息与通道、空间信息的语义分割神经网络。在卷积神经网络中插入注意力模块, 提取出图像语义级别的信息, 通过学习图像的位置信息和通道信息得到更加丰富的特征; 从卷积神经网络输出的各类别得分值计算出单点势能, 且从初步分割图和原图得到成对势能, 以便全连接条件随机场对图像的全部像素进行建模, 并且优化图像的局部细节; 全连接条件随机场通过迭代得到语义分割的最终结果。在CityScapes数据集上进行了测试, 与DeepLab v3+相比较, 改进后的模型分别提高了均交并比和均像素精度等关键指标1.07%和3.34%。它能够更加精细地分割目标, 较好地解决分割边界粗糙, 有效地抑制边界区域分割的过度平滑和不合理孤岛等问题。

自动驾驶图像语义分割卷积神经网络 autonomous driving semantic image segmentation convolutional neural networks DeepLab v3+ DeepLab v3+

PDF全文 Full Text

光学精密工程

2019, 27(11): 2429

图像处理

基于多尺度特征提取和全连接条件随机场的图像语义分割方法

下载：1298次

董永峰 ^1,2杨雨訢 ¹王利琴 ^1,2,*

作者单位

摘要

¹ 河北工业大学人工智能与数据科学学院, 天津 300401

² 河北省大数据计算重点实验室, 天津 300401

针对图像语义分割中图像的上下文信息利用不充分、边缘分割不清等问题,提出一种基于多尺度特征提取与全连接条件随机场的网络模型。分别以多尺度形式将RGB图像和深度图像输入网络,利用卷积神经网络提取图像特征;将深度信息作为补充信息添加到RGB特征图,得到语义粗分割结果;采用全连接条件随机场优化语义粗分割结果,最终得到语义精细分割结果。实验结果表明,所提方法提高了图像语义分割的精度,优化了图像语义分割的边缘,具有实际应用价值。

图像处理图像语义分割卷积神经网络多尺度特征深度学习全连接条件随机场

PDF全文 Full Text

激光与光电子学进展

2019, 56(13): 131007

图像处理

结合图像语义分割的增强现实型平视显示系统设计与研究

下载：948次

安喆 ^*徐熙平杨进华乔杨刘洋

作者单位

摘要

长春理工大学光电工程学院, 吉林长春 130022

为了提高驾驶员在车辆行驶过程中的安全性,设计了一种结合图像语义分割的增强现实型平视显示(AR-HUD)系统。首先,提出一种改进的单发多框检测器网络对道路场景图像进行语义分割,网络前端采用VGG-16提取图像特征,网络后端对获取的特征图进行上采样,从而对特征图进行像素分割。通过对网络的训练,得到场景目标的像素级分类结果,即环境的语义内容信息。随后,通过分析真实场景、光学显示系统、驾驶员之间的关系,将计算机产生的虚拟信息叠加到真实场景,并将显示内容注册到驾驶员视野中,从而提高行车安全。实验结果表明,语义分割算法的准确率能达到77.8%,虚实注册算法处理每帧图像的时间平均为45 ms,约22 frame·s ^-1。

图像处理增强现实图像语义分割虚实注册

PDF全文 Full Text

光学学报

2018, 38(7): 0710004

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索