基于神经网络的遥感图像语义分割方法 下载: 1678次
Semantic Segmentation of Remote Sensing Image Based on Neural Network
王恩德 1,2,3齐凯 1,2,3,4,*李学鹏 1,2,3彭良玉 1,2,3
1 中国科学院沈阳自动化研究所, 辽宁 沈阳 110016
2 中国科学院机器人与智能制造创新研究院, 辽宁 沈阳 110169
3 中国科学院光电信息处理重点实验室, 辽宁 沈阳 110016
4 东北大学信息科学与工程学院, 辽宁 沈阳 110819
图 & 表
图 1. FCN结构示意图
Fig. 1. FCN structural diagram
下载图片 查看原文
图 2. ResNet基本结构单元
Fig. 2. ResNet basic structural unit
下载图片 查看原文
图 3.
ResNet18 结构图
Fig. 3.
Diagram of ResNet18 structure
下载图片 查看原文
图 4. 网络主体结构
Fig. 4. Main structure of network
下载图片 查看原文
图 5. N×N通道结构图
Fig. 5. Diagram of N×N channel structure
下载图片 查看原文
图 6. 双通道不同尺度特征融合图
Fig. 6. Two-channel feature fusion with different scales
下载图片 查看原文
图 7. 位置索引最大池化下采样和上采样
Fig. 7. Downsampling and upsampling of location index max pool
下载图片 查看原文
图 8. 数据集部分图像及其对应的可视化标签
Fig. 8. Partial images of data sets and corresponding visual labels
下载图片 查看原文
图 9. 切割后的部分数据集图像及其可视化标记展示
Fig. 9. Partial data set images and their visual mark display after cutting
下载图片 查看原文
图 10. 部分原图像及经过翻转、旋转后的图像展示
Fig. 10. Partial original images and display of flipped and rotated images
下载图片 查看原文
图 11. 不同分类算法对遥感图像的可视化分类结果
Fig. 11. Visual classification results of remote sensing images by different classification algorithms
下载图片 查看原文
图 12. 通道1、通道1+2、整体结构三种情况的可视化分类结果
Fig. 12. Visual classification results of channel 1, channel 1+2, and overall structure
下载图片 查看原文
表 1所提算法的分类结果混淆矩阵
Table1. Obfuscation matrix of classification results of proposed algorithmpixel
Category | Vegetation | Building | Water | Road | Others |
---|
Vegetation | 9225390 | 3939997 | 187818 | 75047 | 281427 | Building | 783726 | 12505800 | 50563 | 126407 | 290737 | Water | 182936 | 9015 | 2069612 | 6761 | 29298 | Road | 20196 | 50490 | 5049 | 3256576 | 176714 | Others | 83475 | 144690 | 8348 | 41738 | 2672437 |
|
查看原文
表 2不同算法的分类准确率和RKappa
Table2. Classification accuracy and RKappa of different algorithms
Algorithm | Classification accuracy /% | RKappa |
---|
Vegetation | Building | Water | Road | Others | OA |
---|
FCN-8s | 71.88 | 71.43 | 70.09 | 69.97 | 71.23 | 71.30 | 0.6603 | Unet | 80.92 | 80.27 | 80.10 | 79.89 | 80.52 | 80.44 | 0.7522 | SegNet | 83.66 | 83.18 | 82.64 | 82.52 | 83.07 | 83.21 | 0.7810 | Channel 1 | 81.16 | 81.23 | 81.47 | 80.97 | 81.32 | 81.20 | 0.7623 | Channel 1+2 | 89.56 | 89.78 | 89.58 | 89.16 | 89.76 | 89.63 | 0.8406 | Ours | 90.77 | 90.82 | 90.18 | 90.30 | 90.57 | 90.68 | 0.8595 |
|
查看原文
表 3不同算法的卷积核参数、单次前向传播时间和训练时间
Table3. Convolution kernel parameters, single forward propagation time, and training time of different algorithms
Algorithm | Total number of parameters /106 | Forward time /ms | Train time /h |
---|
FCN-8s | 134.3 | 221 | 5.56 | Unet | 23.6 | 56 | 4.72 | SegNet | 29.4 | 78 | 4.88 | Channel 1 | 15.3 | 50 | 4.55 | Channel 1+2 | 30.5 | 108 | 5.06 | Ours | 30.5 | 116 | 2.90 |
|
查看原文
王恩德, 齐凯, 李学鹏, 彭良玉. 基于神经网络的遥感图像语义分割方法[J]. 光学学报, 2019, 39(12): 1210001. Ende Wang, Kai Qi, Xuepeng Li, Liangyu Peng. Semantic Segmentation of Remote Sensing Image Based on Neural Network[J]. Acta Optica Sinica, 2019, 39(12): 1210001.