作者单位
摘要
山东建筑大学测绘地理信息学院,济南 250101
精准高效地从高分辨率遥感影像中提取建筑物信息对国土规划和地图制图意义重大,近年来基于卷积神经网络进行建筑物信息提取已经取得了很大的进展,然而在处理高分辨率遥感影像时仍存在影像的高级语义特征利用不够充分,难以获得细节丰富高精度分割影像的问题。文章针对以上问题提出了一种用于建筑物自动提取的深度学习网络结构空洞空间与通道感知网络(Atrous Space and Channel Perception Network,ASCP-Net)。该模型将空洞空间金子塔池化(Atrous Spatial Pyramid Pooling, ASPP)和空间与通道注意力 (Spatial and Channel Attention, SCA)模块融入到编码器-解码器结构中,通过ASPP模块来捕获和聚合多尺度上下文信息,采用SCA模块选择性增强特定位置和通道中更有用的信息,并将高低层特征信息输入解码网络完成建筑物信息的高效提取。在WHU建筑数据集(WHU Building Dataset)上进行实验,结果表明:文章提出的方法总体精度和F1评分分别达到了97.4%和94.6%,相比其他模型能够获得更清晰的建筑物边界,尤其对图像边缘不完整建筑的提取效果较好,有效提升了建筑物提取的精度和完整性。
高分辨率遥感影像 双注意力机制 空洞卷积 建筑物提取 high-resolution remote sensing images dual attention mechanism atrous convolution building extraction 
航天返回与遥感
2024, 45(1): 136
石甜甜 1,2郭中华 1,2,*闫翔 1,2魏士钦 1,2
作者单位
摘要
1 宁夏大学 物理与电子电气工程学院,宁夏 银川 750021
2 宁夏大学 沙漠信息智能感知重点实验室,宁夏 银川 750021
针对遥感图像水体分割任务,提出了一种多尺度融合注意力模块改进的UNet网络——A-MSFAM-UNet,该方法在GF-2遥感图像水体分割任务中实现了端到端高分辨率遥感图像水体分割。首先,针对以往注意力模块全局池化操作带来的局部信息不敏感问题,设计了一种多尺度融合注意力模块(MSFAM),该模块使用点卷积融合通道全局信息、深度可分离卷积弥补全局池化造成的信息丢失。MSFAM用于UNet跳跃连接后的特征融合部分重新分配特征点权重以提高特征融合效率,增强网络获取不同尺度信息的能力。其次,空洞卷积用于VGG16主干网络扩展感受野,在不损失分辨率的情况下聚合全局信息。结果表明,A-MSFAM-UNet优于其他通道注意力(SENet、ECANet)改进的UNet,在GF-2水体分割数据集上平均交并比(MIoU)、平均像素精度(MPA)和准确率(Acc)分别达到了96.02%、97.98%和99.26%。
遥感图像 注意力模块 深度可分离卷积 特征融合 空洞卷积 remote sensing image attention module depthwise separable convolution feature fusion atrous convolution 
液晶与显示
2023, 38(3): 397
作者单位
摘要
上海理工大学 健康科学与工程学院 生物医学工程系, 上海介入医疗器械工程技术研究中心, 教育部医学光学工程中心, 上海 200093
光学相干层析成像(OCT)广泛应用于眼科, 用于观察视网膜的形态, 对病变区域的检测和诊断评估具有重要意义。由于液体的积聚引发的一系列视网膜疾病, 针对视网膜OCT图像中的液体检测和分割问题, 设计了一种具有全局上下文特征信息的神经网络, 利用多尺度的特征提取与融合的方法, 提出了一种多尺度的并行提取与高度融合的U型网络模型PH-UNet, 这是一种新的用于视网膜OCT图像液体区域分割的深度卷积神经网络。PH-UNet网络通过捕获多尺度的上下文信息, 更好地利用信息提取和融合的方法对视网膜OCT图像中液体区域进行端到端的分割。将提出的模型对MICCAI RETOUCH数据集中三种视网膜液体视网膜内液体(IRF)、视网膜下液体(SRF)和色素上皮脱离(PED)进行分割并与其他经典的分割网络模型进行了比较, 在precision精确率、dice相似系数、mIoU平均交并比三种指标上取得了最佳效果证明了其优越性。
光学相干层析成像 液体分割 空洞卷积 特征融合 多尺度 optical coherence tomography fluid segmentation atrous convolution feature fusion multi-scale 
光学技术
2022, 48(3): 364
作者单位
摘要
东北林业大学 信息与计算机工程学院,黑龙江 哈尔滨 150040
为了高效地对城市景观等复杂场景进行分割解析,本文结合高分辨率网络(HRNet),通过金字塔池化模块(Pyramid pooling module,PPM)补充全局上下文信息,提出了一个高分辨率场景解析网络。首先,以HRNet为基干特征提取网络,并利用空洞可分离卷积改进其大量使用的残差模块,在减少参数量的同时提高了对于多尺度目标的分割能力;其次,利用混合空洞卷积框架设计了多级空洞率,在稠密感受野的同时减小了网格问题的影响;然后,设计了多阶段的连续上采样结构以改进HRNetV2简单的后融合机制;最后,使用改进的可适应不同图像分辨率的金字塔池化模块聚合不同区域的上下文信息获得高质量的分割图。在城市景观数据集(CityScapes)上仅以16.4 Mbit的参数数量实现了83.3% MIOU的精度,在Camvid数据集也取得了良好的效果,实现了更加可靠、准确、低计算量的基于语义分割的场景解析方法。
深度学习 神经网络 语义分割 高分辨率网络 空洞卷积 deep learning neural network semantic segmentation high resolution network atrous convolution 
液晶与显示
2022, 37(12): 1598
作者单位
摘要
1 沈阳理工大学自动化与电气工程学院, 沈阳 110000
2 中共辽宁省委党校, 沈阳 110000
针对传统目标检测算法对航拍影像中的车辆等小目标检测效果差的问题, 提出一种基于改进Faster R-CNN的无人机地物车辆检测算法。该算法在原始Faster R-CNN网络的基础上融合了FPN作为基础网络模型——FFRCNN, 采用ResNet-50代替原始VGG-16作为主要骨干网络进行多特征融合, 使用Focal Loss损失函数改善正负样本不均衡的情况。在改进网络的基础上, 使用空洞卷积将多尺度空间的特征信息进行融合, 提高网络的感受野, 更好地收集图像的上下文信息。实验结果表明, 改进后的检测算法平均精确度达到93.8%, 相较于原FFRCNN网络, 平均精确度提升了19.2%, 具有更好的鲁棒性。
深度学习 空洞卷积 车辆检测 deep learning Faster R-CNN Faster R-CNN Focal Loss Focal Loss atrous convolution vehicle detection 
电光与控制
2022, 29(7): 69
作者单位
摘要
1 西安建筑科技大学信息与控制工程学院,陕西 西安 710055
2 人工智能与数字经济广东省实验室(广州),广东 广州 510320
针对自然场景下混凝土裂缝背景复杂、纹理多变所造成的裂缝分割不准确问题,提出了一种基于特征增强整体嵌套网络裂缝检测算法。首先,在整体嵌套网络,一种深度学习边缘检测网络的基础上,采用多尺度监督机制融合不同尺度混凝土裂缝的预测结果,增强网络对混凝土裂缝线性拓扑结构的表达能力;然后,采用一种卷积-反卷积特征融合模块将混凝土裂缝的反卷积深层语义特征和卷积浅层细节特征有效融合,深层语义特征可以减少复杂背景干扰并提高模糊裂缝区域特征响应,浅层特征可以提高裂缝细节表达能力,进而提高裂缝特征质量;最后,提出了混合空洞卷积边界细化模块,该模块利用残差网络和空洞卷积组细化裂缝边界,从而提高裂缝分割准确性。在数据集Bridge_Crack_Image_Data和Crack Forest Dataset上进行了测试,所提算法的准确率分别达到了92.1%和91.6%,F1分数分别达到了80.2%和91.1%。实验结果表明,所提算法在复杂自然环境下可获得稳定而准确的分割结果,具有较强的泛化性。
图像处理 裂缝检测 VGG16 整体嵌套网络 混合空洞卷积 语义分割 
激光与光电子学进展
2022, 59(10): 1010003
作者单位
摘要
河海大学地球科学与工程学院,江苏 南京 211100
针对ResUNet网络从遥感影像中提取小型和不规则建筑物时存在分割精度低和边界粗糙的问题,提出一种多尺度特征增强的残差U形网络ResUNet+。该网络以ResUNet网络结构为基础,在编码器内添加特征压缩激活模块以提升网络对有效特征的学习能力,在编码网络的最后一层使用空洞空间金字塔池化模块来获取不同尺度的建筑物上下文信息。在两个广泛公开使用的WHU航空图像数据集和INRIA建筑数据集上进行实验,并将其与SE-UNet、DeepLabv3+、DenseASPP和ResUNet语义分割网络进行对比。实验结果表明,ResUNet+在精确率、召回率和F1分数3项精度指标中均表现最优,对测试影像中大小各异和形状不规则的建筑物具有更精确的分割结果。
遥感 建筑物提取 残差网络 空洞卷积 多尺度特征增强 
激光与光电子学进展
2022, 59(8): 0828007
顾清华 1,2,*危发文 1,2郭梦利 1,2江松 1,2阮顺领 1,2
作者单位
摘要
1 西安建筑科技大学资源工程学院,陕西 西安 710055
2 西安市智慧工业感知计算与决策重点实验室,陕西 西安 710055
矿石的粒度大小是评判破碎机破碎效果的重要参考,而图像分割是矿石粒度检测的关键步骤。针对破碎矿石形状复杂、粘连和堆叠以及图像噪声严重而导致图像分割不准确的问题,提出一种基于改进HED(Holistically-Nested Edge Detection)网络模型的破碎矿石图像分割方法。首先,对采集的矿石图像进行双边滤波预处理操作,减少噪声对分割的影响;其次,使用残差可变形卷积块替代普通卷积块以增强模型对不同大小形状矿石的特征提取能力,并利用空洞卷积替代原有的池化层以扩大感受野,保留矿石的全局信息;最后,使用具有底部短连接结构的HED网络框架对矿石进行特征提取,并将提取的特征与低级的细节信息相融合,减少对粘连和堆叠矿石颗粒的欠分割问题。
图像处理 图像分割 矿石粒度 HED网络模型 可变形卷积 空洞卷积 
激光与光电子学进展
2022, 59(2): 0210020
作者单位
摘要
1 哈尔滨理工大学 黑龙江省激光光谱技术及应用重点实验室,黑龙江 哈尔滨 150080
2 中部大学 计算机科学学院,爱知 春日井 487-8501
由于X光安检图像存在背景复杂,重叠遮挡现象严重,危险品摆放方式、形状差异较大等问题,导致检测难度较高。针对上述问题,本文在YOLOv4的基础上,结合空洞卷积对其网络结构进行改进,加入空洞空间金字塔池化(Atrous Space Pyramid Pooling, ASPP)模型,以此增大感受野,聚合多尺度上下文信息。然后,通过K-means聚类方法生成更适合X光安检危险品检测的初始候选框。其中,模型训练时采用余弦退火优化学习率,进一步加速模型收敛,提高模型检测精度。实验结果表明,本文提出的ASPP-YOLOv4检测算法在SIXRay数据集上的mAP达到85.23%。该方法能有效减少X光安检图像中危险品的误检率,提高小目标危险品的检测能力。
X光安检图像 YOLOv4 空洞卷积 空间金字塔池化 余弦退火 X-ray security images YOLOv4 atrous convolution spatial pyramid pooling cosine annealing 
中国光学
2021, 14(6): 1417
作者单位
摘要
1 北京科技大学自动化学院, 北京 100083
2 北京科技大学计算机与通信工程学院, 北京 100083
遥感影像分类是模式识别技术在遥感领域的具体应用,针对普通卷积神经网络处理遥感图像分类遇到的边缘分类不准确、分类精度低等问题,提出了一种基于编码解码器的空洞卷积模型(DeepLab-v3+)的遥感图像分类方法。首先标注卫星图像数据;再利用标注数据集对DeepLab-v3+模型进行训练,该模型能够提取遥感图像中具有较强稳健性的边缘特征;最后获得遥感影像地物分类结果。在遥感数据集上进行分析可知,所提方法比其他分类方法具有更高的分类精度,更稳健的边缘特征,以及更优的分类效果。
遥感 编码解码器 空洞卷积 影像分类 
激光与光电子学进展
2019, 56(15): 152801

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!