作者单位
摘要
1 华东理工大学信息科学与工程学院, 上海 200237
2 东华大学信息科学与技术学院, 上海 201620
针对红外图像存在纹理信息不丰富和边缘信息较少导致深度估计精度难以提高的问题,本文设计一种深层神经网络估计红外图像的深度,该网络融合了一个二维(2D)残差神经网络和一个三维(3D)卷积神经网络。传统单幅红外图像的深度估计方法遗漏了帧间信息,容易出现物体轮廓模糊甚至丢失的情况。在2D和3D网络输入端分别加入稠密光流和前后帧图像。进一步将3D卷积网络提取的视频特征与2D残差网络的特征图做权值连接。不同于传统神经网络的全连接层,全卷积层突破了输入图片的尺寸限制。实验结果表明,本文提出的红外图像深度估计方法具有较高的精度,估计出的物体轮廓更清晰完整。
图像处理 红外图像 深度估计 光流信息 残差神经网络 卷积神经网络 
激光与光电子学进展
2018, 55(6): 061010
作者单位
摘要
1 华东理工大学信息科学与工程学院,上海 200237
2 东华大学信息科学与技术学院,上海 201620
对车载红外图像进行深度估计,可应用于车辆的夜间辅助驾驶系统(Driver Assistant Systems,DAS),本文提出了一种新型的神经网络结构来估计红外图像的深度。受景物分类思想的启发,将传统深度估计方法中的回归问题转化为分类问题。首先,对红外图像进行归一化预处理,并将深度图置于自然对数空间对距离进行远近分类。其次,设计了一种新型的金字塔输入残差神经网络(PyramidResidual Neural Networks, PRN),将红外图像以金字塔型结构作为网络输入,网络结构分为粗略特征提取和精细特征提取两部分。最后,将全连接层改为全卷积层,大大减少了网络中的参数个数,降低计算复杂度。金字塔型结构的输入使得网络能够多尺度提取特征,这使得估计出的深度图场景中的对象轮廓比同一网络单一红外图像输入估计出的景物轮廓更清晰。此外,通过计算错误和准确性评价指标,证明本文的提出方法能够很好地估计红外图像的深度,对比实验验证了本文方法更具优势。
深度估计 车载红外图像 金字塔型输入 残差网络 多尺度特征 depth estimation vehicle infrared images pyramid input residual networks multi-scale features 
红外技术
2018, 40(5): 417

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!