精准高效地从高分辨率遥感影像中提取建筑物信息对国土规划和地图制图意义重大,近年来基于卷积神经网络进行建筑物信息提取已经取得了很大的进展,然而在处理高分辨率遥感影像时仍存在影像的高级语义特征利用不够充分,难以获得细节丰富高精度分割影像的问题。文章针对以上问题提出了一种用于建筑物自动提取的深度学习网络结构空洞空间与通道感知网络(Atrous Space and Channel Perception Network,ASCP-Net)。该模型将空洞空间金子塔池化(Atrous Spatial Pyramid Pooling, ASPP)和空间与通道注意力 (Spatial and Channel Attention, SCA)模块融入到编码器-解码器结构中,通过ASPP模块来捕获和聚合多尺度上下文信息,采用SCA模块选择性增强特定位置和通道中更有用的信息,并将高低层特征信息输入解码网络完成建筑物信息的高效提取。在WHU建筑数据集(WHU Building Dataset)上进行实验,结果表明:文章提出的方法总体精度和F1评分分别达到了97.4%和94.6%,相比其他模型能够获得更清晰的建筑物边界,尤其对图像边缘不完整建筑的提取效果较好,有效提升了建筑物提取的精度和完整性。
高分辨率遥感影像 双注意力机制 空洞卷积 建筑物提取 high-resolution remote sensing images dual attention mechanism atrous convolution building extraction
上海理工大学 健康科学与工程学院 生物医学工程系, 上海介入医疗器械工程技术研究中心, 教育部医学光学工程中心, 上海 200093
光学相干层析成像(OCT)广泛应用于眼科, 用于观察视网膜的形态, 对病变区域的检测和诊断评估具有重要意义。由于液体的积聚引发的一系列视网膜疾病, 针对视网膜OCT图像中的液体检测和分割问题, 设计了一种具有全局上下文特征信息的神经网络, 利用多尺度的特征提取与融合的方法, 提出了一种多尺度的并行提取与高度融合的U型网络模型PH-UNet, 这是一种新的用于视网膜OCT图像液体区域分割的深度卷积神经网络。PH-UNet网络通过捕获多尺度的上下文信息, 更好地利用信息提取和融合的方法对视网膜OCT图像中液体区域进行端到端的分割。将提出的模型对MICCAI RETOUCH数据集中三种视网膜液体视网膜内液体(IRF)、视网膜下液体(SRF)和色素上皮脱离(PED)进行分割并与其他经典的分割网络模型进行了比较, 在precision精确率、dice相似系数、mIoU平均交并比三种指标上取得了最佳效果证明了其优越性。
光学相干层析成像 液体分割 空洞卷积 特征融合 多尺度 optical coherence tomography fluid segmentation atrous convolution feature fusion multi-scale
1 沈阳理工大学自动化与电气工程学院, 沈阳 110000
2 中共辽宁省委党校, 沈阳 110000
针对传统目标检测算法对航拍影像中的车辆等小目标检测效果差的问题, 提出一种基于改进Faster R-CNN的无人机地物车辆检测算法。该算法在原始Faster R-CNN网络的基础上融合了FPN作为基础网络模型——FFRCNN, 采用ResNet-50代替原始VGG-16作为主要骨干网络进行多特征融合, 使用Focal Loss损失函数改善正负样本不均衡的情况。在改进网络的基础上, 使用空洞卷积将多尺度空间的特征信息进行融合, 提高网络的感受野, 更好地收集图像的上下文信息。实验结果表明, 改进后的检测算法平均精确度达到93.8%, 相较于原FFRCNN网络, 平均精确度提升了19.2%, 具有更好的鲁棒性。
深度学习 空洞卷积 车辆检测 deep learning Faster R-CNN Faster R-CNN Focal Loss Focal Loss atrous convolution vehicle detection
1 西安建筑科技大学信息与控制工程学院,陕西 西安 710055
2 人工智能与数字经济广东省实验室(广州),广东 广州 510320
针对自然场景下混凝土裂缝背景复杂、纹理多变所造成的裂缝分割不准确问题,提出了一种基于特征增强整体嵌套网络裂缝检测算法。首先,在整体嵌套网络,一种深度学习边缘检测网络的基础上,采用多尺度监督机制融合不同尺度混凝土裂缝的预测结果,增强网络对混凝土裂缝线性拓扑结构的表达能力;然后,采用一种卷积-反卷积特征融合模块将混凝土裂缝的反卷积深层语义特征和卷积浅层细节特征有效融合,深层语义特征可以减少复杂背景干扰并提高模糊裂缝区域特征响应,浅层特征可以提高裂缝细节表达能力,进而提高裂缝特征质量;最后,提出了混合空洞卷积边界细化模块,该模块利用残差网络和空洞卷积组细化裂缝边界,从而提高裂缝分割准确性。在数据集Bridge_Crack_Image_Data和Crack Forest Dataset上进行了测试,所提算法的准确率分别达到了92.1%和91.6%,分数分别达到了80.2%和91.1%。实验结果表明,所提算法在复杂自然环境下可获得稳定而准确的分割结果,具有较强的泛化性。
图像处理 裂缝检测 VGG16 整体嵌套网络 混合空洞卷积 语义分割 激光与光电子学进展
2022, 59(10): 1010003
河海大学地球科学与工程学院,江苏 南京 211100
针对ResUNet网络从遥感影像中提取小型和不规则建筑物时存在分割精度低和边界粗糙的问题,提出一种多尺度特征增强的残差U形网络ResUNet+。该网络以ResUNet网络结构为基础,在编码器内添加特征压缩激活模块以提升网络对有效特征的学习能力,在编码网络的最后一层使用空洞空间金字塔池化模块来获取不同尺度的建筑物上下文信息。在两个广泛公开使用的WHU航空图像数据集和INRIA建筑数据集上进行实验,并将其与SE-UNet、DeepLabv3+、DenseASPP和ResUNet语义分割网络进行对比。实验结果表明,ResUNet+在精确率、召回率和F1分数3项精度指标中均表现最优,对测试影像中大小各异和形状不规则的建筑物具有更精确的分割结果。
遥感 建筑物提取 残差网络 空洞卷积 多尺度特征增强 激光与光电子学进展
2022, 59(8): 0828007
1 西安建筑科技大学资源工程学院,陕西 西安 710055
2 西安市智慧工业感知计算与决策重点实验室,陕西 西安 710055
矿石的粒度大小是评判破碎机破碎效果的重要参考,而图像分割是矿石粒度检测的关键步骤。针对破碎矿石形状复杂、粘连和堆叠以及图像噪声严重而导致图像分割不准确的问题,提出一种基于改进HED(Holistically-Nested Edge Detection)网络模型的破碎矿石图像分割方法。首先,对采集的矿石图像进行双边滤波预处理操作,减少噪声对分割的影响;其次,使用残差可变形卷积块替代普通卷积块以增强模型对不同大小形状矿石的特征提取能力,并利用空洞卷积替代原有的池化层以扩大感受野,保留矿石的全局信息;最后,使用具有底部短连接结构的HED网络框架对矿石进行特征提取,并将提取的特征与低级的细节信息相融合,减少对粘连和堆叠矿石颗粒的欠分割问题。
图像处理 图像分割 矿石粒度 HED网络模型 可变形卷积 空洞卷积 激光与光电子学进展
2022, 59(2): 0210020
1 北京科技大学自动化学院, 北京 100083
2 北京科技大学计算机与通信工程学院, 北京 100083
遥感影像分类是模式识别技术在遥感领域的具体应用,针对普通卷积神经网络处理遥感图像分类遇到的边缘分类不准确、分类精度低等问题,提出了一种基于编码解码器的空洞卷积模型(DeepLab-v3+)的遥感图像分类方法。首先标注卫星图像数据;再利用标注数据集对DeepLab-v3+模型进行训练,该模型能够提取遥感图像中具有较强稳健性的边缘特征;最后获得遥感影像地物分类结果。在遥感数据集上进行分析可知,所提方法比其他分类方法具有更高的分类精度,更稳健的边缘特征,以及更优的分类效果。
遥感 编码解码器 空洞卷积 影像分类 激光与光电子学进展
2019, 56(15): 152801