光学学报, 2020, 40 (19): 1910001, 网络出版: 2020-09-23   

基于双流加权Gabor卷积网络融合的室内RGB-D图像语义分割 下载: 1113次

Indoor RGB-D Image Semantic Segmentation Based on Dual-Stream Weighted Gabor Convolutional Network Fusion
作者单位
1 重庆大学光电技术及系统教育部重点实验室, 重庆 400040
2 重庆大学光电工程学院, 重庆 400040
3 重庆师范大学计算机与信息科学学院, 重庆 401331
图 & 表

图 1. 双流加权Gabor卷积网络融合的RGB-D图像语义分割

Fig. 1. RGB-D image semantic segmentation by double-stream weighted Gabor convolution network fusion

下载图片 查看原文

图 2. WGoFs调制过程

Fig. 2. Modulation process of WGoFs

下载图片 查看原文

图 3. WGoFs卷积过程

Fig. 3. Convolution process of WGoFs

下载图片 查看原文

图 4. 宽残差模块。(a)原始残差模块;(b)宽残差模块1;(c)宽残差模块2

Fig. 4. Wide residual blocks. (a) Original residual block; (b) wide residual block 1; (c) wide residual block 2

下载图片 查看原文

图 5. WRN-WGCN模块结构

Fig. 5. Architecture of WRN-WGCN module

下载图片 查看原文

图 6. 金字塔池化模块

Fig. 6. Pyramid pooling module

下载图片 查看原文

图 7. 本文金字塔池化特征融合模块

Fig. 7. Proposed pyramid pooling feature fusion module

下载图片 查看原文

图 8. 数据集中的彩色图像、深度图像以及语义标签。(a) RGB图像;(b)深度图像;(c)语义标签

Fig. 8. RGB and depth images and their corresponding semantic labels in dataset. (a) RGB images; (b) depth images; (c) semantic labels

下载图片 查看原文

图 9. 训练过程中的损失曲线

Fig. 9. Loss curves in training process

下载图片 查看原文

图 10. 不同尺度数量和方向数量对测试精度的影响。 (a)不同尺度数量下的测试精度;(b)不同方向数量下的测试精度

Fig. 10. Test accuracy versus number of scales and number of directions. (a) Test accuracy under different number of scales; (b) test accuracy under different number of directions

下载图片 查看原文

图 11. NYUDv2数据集上各种方法得到的语义分割结果。(a) RGB;(b) depth;(c) GT;(d) baseline;(e) WRN-CNN;(f) WGCN;(g) PP-Fusion;(h) FCN;(i) SegNet;(j) ours

Fig. 11. Semantic segmentation results obtained by various methods on NYUDv2 dataset. (a) RGB; (b) depth; (c) GT; (d) baseline; (e) WRN-CNN; (f) WGCN; (g) PP-Fusion; (h) FCN; (i) SegNet; (j) ours

下载图片 查看原文

图 12. 采用各种方法在SUN-RGBD数据集上得到的语义分割结果。(a) RGB;(b) depth;(c) GT;(d) baseline;(e) WRN-CNN;(f) WGCN;(g) PP-Fusion;(h) FCN;(i) SegNet;(j) ours

Fig. 12. Semantic segmentation results obtained by various methods on SUN-RGBD dataset. (a) RGB; (b) depth; (c) GT; (d) baseline; (e) WRN-CNN; (f) WGCN; (g) PP-Fusion; (h) FCN; (i) SegNet; (j) ours

下载图片 查看原文

表 1WRN-WGCN结构参数设置

Table1. Structural parameter setting of WRN-WGCN

Group nameOutput feature sizeBlock type
GCConv1N×N3×38
GCConv2N×N3×316×k3×316×k×L
GCConv3N×N3×316×k3×316×k×L
GCConv4(N/2)×(N/2)3×332×k3×332×k×L

查看原文

表 2不同滤波器大小下的模型大小

Table2. Model sizes with different filter sizes

Model nameFilter sizeModel size /MB
Model 15×5163
Model 25×5124
Model 33×3148
Model 43×3117

查看原文

表 3不同分割算法在NYUDv2数据集上的结果对比

Table3. Comparison of results for different segmentation algorithms on NYUDv2 dataset

MethodModuleAcc /%mAcc /%mIoU /%FWIoU /%
WRN-CNNWGCNPP-Fusion
Ours66.350.840.053.1
Variant 158.341.630.145.8
Variant 258.642.431.945.3
Variant 360.848.235.850.4
Variant 463.245.836.446.6
FCN[2]65.445.134.348.6
SegNet[3]56.247.635.150.1

查看原文

表 4不同分割算法在SUN-RGBD数据集上的结果对比

Table4. Comparison of results for different segmentation algorithms on SUN-RGBD dataset

MethodModuleAcc /%mAcc /%mIoU /%FWIoU /%
WRN-CNNWGCNPP-Fusion
Ours58.238.528.242.0
Variant 145.233.721.837.4
Variant 244.834.523.138.6
Variant 354.635.127.337.7
Variant 456.134.626.036.3
FCN[2]49.536.523.735.8
SegNet[3]47.834.626.238.2

查看原文

表 5不同算法的推理时间和空间复杂度对比

Table5. Comparison of reasoning time and space complexity for different algorithms

MethodModuleModel size /MBReasoning time /ms
WRN-CNNWGCNPP-Fusion
Ours11742
Variant 138176
Variant 211535
Variant 318748
Variant 424551
FCN[2]54943
SegNet[3]12658

查看原文

王旭初, 刘辉煌, 牛彦敏. 基于双流加权Gabor卷积网络融合的室内RGB-D图像语义分割[J]. 光学学报, 2020, 40(19): 1910001. Xuchu Wang, Huihuang Liu, Yanmin Niu. Indoor RGB-D Image Semantic Segmentation Based on Dual-Stream Weighted Gabor Convolutional Network Fusion[J]. Acta Optica Sinica, 2020, 40(19): 1910001.

本文已被 2 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!