深度学习下的计算成像:现状、挑战与未来

左超; 冯世杰; 张翔宇; 韩静; 陈钱

doi:doi:10.3788/AOS202040.0111003

光学学报, 2020, 40 (1): 0111003, 网络出版: 2020-01-06

深度学习下的计算成像:现状、挑战与未来下载： 11289次特邀综述

Deep Learning Based Computational Imaging: Status, Challenges, and Future

论文大纲

左超 ^1,2冯世杰 ^1,2张翔宇 ^1,2韩静 ²陈钱 ^2,*

作者单位

¹ 南京理工大学电子工程与光电技术学院,智能计算成像实验室(SCILab), 江苏南京 210094

² 南京理工大学江苏省光谱成像与智能感知重点实验室, 江苏南京 210094

成像系统计算成像深度学习光学成像光信息处理 imaging systems computational imaging deep learning optical imaging optical information processing

AI 词云图 AI一句话精读 AI短摘要

注：本部分内容由 AI 自动生成，请您知悉。

摘要

近年来,光学成像技术已经由传统的强度、彩色成像发展进入计算光学成像时代。计算光学成像基于几何光学、波动光学等理论对场景目标经光学系统成像再到探测器采样这一完整图像生成过程建立精确的正向数学模型,再求解该正向成像模型所对应的“逆问题”,以计算重构的方式来获得场景目标的高质量图像或者传统技术无法直接获得的相位、光谱、偏振、光场、相干度、折射率、三维形貌等高维度物理信息。然而,计算成像系统的实际成像性能也同样极大程度地受限于“正向数学模型的准确性”以及“逆向重构算法的可靠性”,实际成像物理过程的不可预见性与高维病态逆问题求解的复杂性已成为这一领域进一步发展的瓶颈问题。近年来,人工智能与深度学习技术的飞跃式发展为计算光学成像技术开启了一扇全新的大门。不同于传统计算成像方法所依赖的物理驱动,深度学习下的计算成像是一类由数据驱动的方法,它不但解决了许多过去计算成像领域难以解决的难题,还在信息获取能力、成像的功能、核心性能指标(如成像空间分辨率、时间分辨率、灵敏度等)上都获得了显著提升。基于此,首先概括性介绍深度学习技术在计算光学成像领域的研究进展与最新成果,然后分析了当前深度学习技术在计算光学成像领域面临的主要问题与挑战,最后展望了该领域未来的发展方向与可能的研究方向。

Abstract

In recent years, optical imaging techniques have entered into the era of computational optical imaging from the traditional intensity and color imaging. Computational optical imaging, which is based on geometric optics, wave optics, and other theoretical foundations, establishes an accurate forward mathematical model for the whole image formation process of the scene imaged through the optical system and then sampled by the digital detector. Then, the high-quality reconstruction of the image and other high dimensional information, such as phase, spectrum, polarization, light field, coherence, refractive index, and three-dimension profile, which cannot be directly accessed using traditional methods, can be obtained through computational reconstruction method. However, the actual imaging performance of the computational imaging system is also limited by the “accuracy of the forward mathematical model” and “the reliability of inverse reconstruction algorithm”. Besides, the unpredictability of real physical imaging process and the complexity of solving high dimensional ill-posed inverse problems have become the bottleneck of further development of this field. In recent years, the rapid development of artificial intelligence and deep learning for the technology opens a new door for computational optical imaging technology. Unlike “physical driven” model that traditional computational imaging method is based on, computational imaging based on deep learning is a kind of “data-driven” method, which not only solves many problems considered quite challenge to be solved in this field, but also achieves remarkable improvement in information acquisition ability, imaging functions, and key performance indexes of imaging system, such as spatial resolution, temporal resolution, and detection sensitivity. This review first briefly introduces the current status and the latest progress of deep learning technology in the field of computational optical imaging. Then, the main problems and challenges faced by the current deep learning method in computational optical imaging field are discussed. Finally, the future developments and possible research directions of this field are prospected.

1 引言

视觉是人类获得客观世界信息的主要途径,而人眼受限于视觉性能,在时间、空间、灵敏度等方面均存在局限性。光学成像技术由此应运而生,其利用各种光学成像系统,如显微镜、望远镜等,实现光信息的可视化,同时延伸扩展人眼的视觉特性。然而,一方面,传统光学成像系统因受强度成像机理、探测器技术水平、光学系统设计、成像衍射极限等因素制约,在空间分辨、时间分辨、光谱分辨、信息维度与探测灵敏度等方面仍存在一定局限性,难以满足人们对成像系统功能与性能的进一步需求,以及军民领域日益增长的高分辨、高灵敏度和多维高速成像的应用需求。采用传统光学成像系统的设计思路想要获得成像性能的少量提升,通常意味着硬件成本的急剧增加,甚至难以实现工程化应用。另一方面,光探测器规模尺寸、像元大小、响应灵敏度等均已接近物理极限,很难满足这些极具挑战性的需求。

随着成像电子学的发展,计算机数据处理能力的增强,光场调控、孔径编码、压缩感知、全息成像等光电信息处理技术取得了重大进展;此外,经过成千上万年的发展自然界已经演化出多类能够满足不同生存需求的生物视觉系统,从生物视觉系统中获得灵感无疑可以给新一代光学成像技术的发展带来有益的启示。在此背景下,20世纪90年代中期,光学成像界和图像处理界的许多研究人员不约而同地探索出了一种新型成像模式,即图像形成不再仅仅依赖于光学物理器件,还依赖于前端光学和后端探测信号处理的联合设计。这种技术就是现在广为人知的“计算成像”(Computational Imaging)技术^[1],它将光学调控与信息处理有机结合,为突破上述传统成像系统中的诸多限制性因素提供了新手段与新思路。

计算光学成像是一种通过联合优化光学系统和信号处理来实现特定成像功能与特性的新兴研究领域。其建立在几何光学、波动光学,甚至光量子模型的基础上,采用照明与光学系统调制等方式,建立目标场景与观测图像之间的变换或调制模型,然后利用逆问题求解等数学手段,通过计算反演来进行成像。这种计算成像方法实质上就是在场景和图像之间建立某种特定的联系,这种联系可以是线性的也可以是非线性的。它突破了传统成像技术点对点一一对应的强度直接采样形式,采用了更加灵活的非直接的采样形式,更能充分发挥成像系统中各组件的特点与性能。这种灵活的设计模式可以改变光学测量的性质以获得所需的结果,并平衡物理域和计算域之间图像生成和信息提取所依赖的资源。基于信息论的概念,计算光学成像设计师不仅可以借助于传统光学设计的优势,还可以充分利用物理光学在光信号处理中的潜力来设计成像系统。这种新型的成像方式将有望改变成像系统获取信息的方式,提升其获取信息的能力,增强资源利用,赋予其诸多传统光学成像技术难以获得甚至无法获得的革命性的优势:例如,突破探测器制造工艺、工作条件、功耗成本等因素的限制,有效提高成像质量(信噪比、对比度、动态范围),简化系统(无透镜、小体积、低成本),突破光学系统与图像采集设备的分辨率限制(超像素分辨、超衍射极限),并使其功能(相位、光谱、偏振、光场、相干度、折射率、三维形貌、景深严拓、模糊复原、数字重聚焦、改变观测视角)、性能(空间分辨、时间分辨、光谱分辨、信息维度与探测灵敏度)、可靠性、可维护性等获得显著提高,有助于实现成像设备的高性能、微型化、智能化。

现如今,计算光学成像已发展为一门集几何光学、信息光学、计算光学、计算机视觉、现代信号处理等理论于一体的新兴交叉技术研究领域,成为光学成像领域的一大国际研究重点和热点。然而,隐藏在计算成像华丽外衣之下的是其所必须付出的额外成本与代价:用于进行非传统测量的物理实体器件相关的成本、多次测量产生的时间成本、数据量以及物理模型和校准对处理性能的影响。更重要的是,计算成像技术的实际成像性能极大程度地受限于“正向数学模型的准确性”以及“逆向重构算法的可靠性”,实际物理成像过程中的不可预见性与高维病态逆问题求解的复杂性已成为这一领域进一步发展亟需解决的瓶颈问题。

近几年,DeepMind公司研制的人工智能机器人AlphaGo战胜顶尖围棋棋手李世石^[2]、先进图像分类算法在具有挑战性的数据集ImageNet上的正确率超过人类^[3]等令人振奋消息一个接一个地传来,人工智能已经成为我们身边一个耳熟能详的词汇,国际上也开始迎来这一技术的研究热潮。当下谈到人工智能,“机器学习”、“深度学习”和“神经网络”便是经常浮现在人们脑海里的高频词汇。借助于数学中集合的概念,它们之间的关系可以理解为一种包含关系,也就是“机器学习”包含“深度学习”,“深度学习”包含“神经网络”。深度学习已经成为目前最为热门的一种机器学习方案。深度学习这一名称中的“深度”一词表示其使用的神经网络结构多于四层。一般而言,随着神经网络层数的增加,神经网络的性能会更强,学习的效果也会更佳。

互联网技术的蓬勃发展指引着大数据时代的来临,以数据推动的深度学习技术无疑是大数据时代的算法利器。相比于传统的机器学习技术:首先,深度学习技术可利用不断增多的数据不断提升其性能,而传统机器学习技术无法做到这一点;其次,有别于传统方法需要手动提取特征,深度学习技术是一项全自动的技术,它可以从海量数据中直接抽取特征,并且,对于不同的任务,不再需要设计独特的特征提取器,所有工作都可由深度学习自动完成。这是智能机器逐渐代替人工操作的一个显著体现,因此深度学习技术已成为大数据时代的一项热点技术,无论学术界还是工业界都对这项技术产生了浓厚的兴趣。特别是在计算机视觉领域,深度学习作为近年来兴起的一种“数据驱动”的技术,在图像分类、物体检测及识别等诸多应用上均取得了巨大成功。

自2017年初,深度学习技术逐渐走入计算成像领域研究者的视野,并在短短的两三年内已在数字全息成像^[4-9]、傅里叶叠层成像技术^[10-13]、鬼成像/单像素成像^[14-16]、超分辨显微成像技术^[17-22]、光学相干层析成像(OCT)^[23-27]、散射介质成像^[28-32]、极弱光成像^[33-34]、跨模态染色成像^[35-36]、光栅条纹分析^[37-39]与快速三维成像^[40-42]等成像体制上得以成功应用,取得了一系列令人瞩目的开创性研究成果。令人欣喜的是,对比传统物理模型驱动的计算成像技术,样本数据驱动的深度学习下的计算成像技术发生了思想观念上的根本变革,它不但解决了许多过去计算成像领域难以解决的难题,还在信息获取能力、成像的功能、核心性能指标(如成像空间分辨率、时间分辨率、灵敏度等)上获得了显著提升。如今,以深度学习为主题的计算成像相关方面的论文喷井而出,呈指数式增长趋势。

在此背景下,本文概括性地介绍深度学习技术在计算光学成像领域的研究现状与最新进展。简要讨论计算成像技术与深度学习技术的基本概念,并按照深度学习技术的“目的与动机”或者说“深度学习技术为传统计算成像技术带来了哪些新的要素”进行细分,对现有深度学习计算成像技术的研究现状及其典型应用进行概述。值得注意的是,深度学习是一把“双刃剑”,它给计算成像领域研究带来了惊喜的同时也引入了一系列亟待解决的问题。本文分析了当前深度学习技术在计算光学成像领域面临的主要问题与挑战,这亦是本文重要的组成部分。最后,对深度学习在计算成像领域未来的发展方向与可能的研究方向进行讨论并展望,并给出了总结性评论。

2 深度学习下的计算成像:现状

一个典型的光学成像系统主要由光源、光学镜头组、光探测器三部分组成。其通过将三维场景中目标发出的光线聚焦在光探测器上进行“点对点”成像。然而这种“所见即所得”的成像方式因其单视角、平面投影等因素的限制,导致高维度场景信息存在缺失。除此之外,日益复杂庞大的光学成像系统也限制着其应用场景。为了解决传统光学成像系统所面临的问题,计算成像技术应运而生,其采用“先调制,再拍摄,最后解调”的成像方式。将光学系统(照明、光学器件、光探测器)与数字图像处理算法作为一个整体考虑,并在设计时一同进行综合优化,前端成像元件与后端数据处理二者相辅相成,构成一种“混合光学-数字计算成像系统”,如图1所示。不同于传统光学成像的“所见即所得”,计算成像建立在几何光学、波动光学,甚至光量子模型的基础上,采用照明与光学系统调制等方式,建立目标场景与观测图像之间的变换或调制模型,然后利用逆问题求解等数学手段,通过计算反演来进行成像,以获得场景目标的高质量图像与高维度物理信息。

深度学习下的计算成像:现状、挑战与未来 下载： 11289次特邀综述

1 引言

2 深度学习下的计算成像:现状

图 1. 计算光学成像系统的成像过程

Fig. 1. Imaging process of computational optical imaging system

图 2. 基于“目的与动机”对典型深度学习计算成像技术所作的分类

Fig. 2. Classification of typical deep learning based computational imaging techniques according to their objectives and motivations

2.1 提升传统计算成像技术的信息获取能力

图 3. 使用深度学习进行单帧无透镜相位恢复[4]

Fig. 3. Single-frame lensless phase recovery using deep learning[4]

图 4. 使用深度学习技术进行少图快速FPM成像[10]

Fig. 4. Fast FPM imaging with few images using deep learning technology[10]

图 5. 基于深度学习的条纹分析方法原理与相位重构结果对比[37]。(a)基于深度学习的条纹分析方法原理图; (b)傅里叶变换法重构结果;(c)加窗傅里叶变换法重构结果;(d)深度学习法重构结果;(e) 12步相移法重构结果

图 6. 使用深度神经网络的单像素技术框架[14]

Fig. 6. Framework of single-pixel technique using deep neural network[14]

2.2 降低传统计算成像技术对“正向物理模型”或“逆向重构算法”的过度依赖

图 7. 基于深度学习进行散射介质成像的网络原理图[28]

Fig. 7. Network of deep learning based imaging through scattering medium[28]

图 8. 基于深度学习进行三维衍射层析重建的基本框图[26]

Fig. 8. Basic framework of 3D diffraction tomography reconstruction based on deep learning[26]

图 9. 基于深度学习进行光学衍射层析的网络原理图[27]

Fig. 9. Schematic of network of optical diffraction tomography based on deep learning[27]

图 10. 使用深度神经网络的数字全息离焦距离计算框架[6]

Fig. 10. Framework of defocusing distance calculation in digital holography based on deep neural network[6]

图 11. 针对视网膜光学相干断层图像的边界自动分割原理图[23]

Fig. 11. Schematic of automatic boundary segmentation framework for retinal OCT image[23]

2.3 突破传统计算成像技术所能够达到的功能/性能疆界

图 12. 基于深度学习进行超分辨率成像的网络框架示意图[20]

Fig. 12. Network framework of super-resolution imaging based on deep learning[20]

图 13. 基于深度学习进行STED超分辨率成像的实验结果[17]

Fig. 13. Experimental results of STED super-resolution imaging based on deep learning[17]

图 14. 基于深度学习进行极弱光成像的结果[34]。(a)摄像机输出(ISO 8000);(b)摄像机输出(ISO 409600);(c)由原始数据(a)恢复得到的结果

Fig. 14. Results of imaging using very weak light based on deep learning[34]. (a) Camera output with ISO 8000; (b) Camera output with ISO 409600; (c) recovered result from raw data of Fig. 14(a)

图 15. 基于深度学习进行虚拟染色成像的网络框架示意图[35]

Fig. 15. Network framework of virtual staining imaging based on deep learning[35]

3 深度学习下的计算成像:挑战

3.1 (实测)训练数据的获取与标注成本高

3.2 目标合作度与环境稳定性要求高

3.3 网络结构的选取趋于经验主义

3.4 “调参好比炼丹”式的试错法训练机制

3.5 特定样本训练后的网络缺乏泛化能力

3.6 “深度学习下的计算机视觉”≠“深度学习下的计算成像”

3.7 “深度学习”缺乏“深入理解”的能力

4 深度学习下的计算成像:未来

4.1 搭上深度学习技术发展的顺风车

4.2 物理模型驱动数据与数据驱动物理模型

图 16. 模型驱动的深度学习方法[98]

Fig. 16. Model-driven deep-learning approach[98]

图 17. 物理(左)和图像分类(右)关联的因果层次结构[99]

Fig. 17. Causal hierarchy structure relevant to physics (left) and image classification (right)[99]

4.3 深度学习的可解释性有待进一步探究

图 18. 在熊猫图片中加入轻微随机噪声,CNN模型将图片识别为长臂猿[104]

Fig. 18. After adding slight noise into Panda image, CNN model recognizes image as Gibbon[104]

4.4 脑神经科学启发的思路值得更多的重视

4.5 既要“深度”又要“深入”

图 19. 深度学习与经典理论算法之间的客观公证对比

Fig. 19. Comparison between deep learning and classical theoretical algorithm should be objective

4.6 既要“有所为”又要“有所不为”

图 20. 深度学习被用于预测地震遭到了质疑

Fig. 20. Forecasting earthquake using deep learning hit with rebuttals has been questioned

5 结束语

Article Outline

相关论文

相关资讯

关于本站 Cookie 的使用提示

全站搜索

深度学习下的计算成像:现状、挑战与未来下载： 11289次特邀综述

图 3. 使用深度学习进行单帧无透镜相位恢复^[4]

Fig. 3. Single-frame lensless phase recovery using deep learning^[4]

图 4. 使用深度学习技术进行少图快速FPM成像^[10]

Fig. 4. Fast FPM imaging with few images using deep learning technology^[10]

图 5. 基于深度学习的条纹分析方法原理与相位重构结果对比^[37]。(a)基于深度学习的条纹分析方法原理图; (b)傅里叶变换法重构结果;(c)加窗傅里叶变换法重构结果;(d)深度学习法重构结果;(e) 12步相移法重构结果

图 6. 使用深度神经网络的单像素技术框架^[14]

Fig. 6. Framework of single-pixel technique using deep neural network^[14]

图 7. 基于深度学习进行散射介质成像的网络原理图^[28]

Fig. 7. Network of deep learning based imaging through scattering medium^[28]

图 8. 基于深度学习进行三维衍射层析重建的基本框图^[26]

Fig. 8. Basic framework of 3D diffraction tomography reconstruction based on deep learning^[26]

图 9. 基于深度学习进行光学衍射层析的网络原理图^[27]

Fig. 9. Schematic of network of optical diffraction tomography based on deep learning^[27]

图 10. 使用深度神经网络的数字全息离焦距离计算框架^[6]

Fig. 10. Framework of defocusing distance calculation in digital holography based on deep neural network^[6]

图 11. 针对视网膜光学相干断层图像的边界自动分割原理图^[23]

Fig. 11. Schematic of automatic boundary segmentation framework for retinal OCT image^[23]

图 12. 基于深度学习进行超分辨率成像的网络框架示意图^[20]

Fig. 12. Network framework of super-resolution imaging based on deep learning^[20]

图 13. 基于深度学习进行STED超分辨率成像的实验结果^[17]

Fig. 13. Experimental results of STED super-resolution imaging based on deep learning^[17]

图 14. 基于深度学习进行极弱光成像的结果^[34]。(a)摄像机输出(ISO 8000);(b)摄像机输出(ISO 409600);(c)由原始数据(a)恢复得到的结果

Fig. 14. Results of imaging using very weak light based on deep learning^[34]. (a) Camera output with ISO 8000; (b) Camera output with ISO 409600; (c) recovered result from raw data of Fig. 14(a)

图 15. 基于深度学习进行虚拟染色成像的网络框架示意图^[35]

Fig. 15. Network framework of virtual staining imaging based on deep learning^[35]

图 16. 模型驱动的深度学习方法^[98]

Fig. 16. Model-driven deep-learning approach^[98]

图 17. 物理(左)和图像分类(右)关联的因果层次结构^[99]

Fig. 17. Causal hierarchy structure relevant to physics (left) and image classification (right)^[99]

图 18. 在熊猫图片中加入轻微随机噪声,CNN模型将图片识别为长臂猿^[104]

Fig. 18. After adding slight noise into Panda image, CNN model recognizes image as Gibbon^[104]