基于预处理卷积神经网络提升3D光场显示视觉分辨率的方法
1 引言
3D光场显示技术被认为是实现裸眼3D立体的一种非常有前途的方法。近几十年来,3D光场显示的成像技术取得了惊人的进展,为观众提供了大量机会去了解裸眼3D显示技术。显示设备的分辨率是3D光场显示系统中最重要的因素之一,为了进一步提高3D光场显示的分辨率,人们做了很多努力[1-8]。3D光场显示系统通常由平面(2D)显示设备和控光元件组成。提升分辨率的主要途径有二:一是对背光刷新模组和显示面板进行时分复用[3-4],二是通过空分复用增加二维显示面板的分辨率[5-7]。上述两种方法的本质都是为了提高像素的数量,然而它们都大幅增加了系统的复杂度和制造难度。
除了增加像素数量,还可以通过提高视觉分辨率改进图像质量。目前有很多可行的方案来实现2D显示系统的视觉分辨率提升[9-14]。例如通过紧凑排列多个投影仪,并对其投影区域进行特异化处理,以创造新的视觉像素[10];通过将一对传统显示器分层,构建一个级联的显示器架构,进而产生视觉子像素[11];基于人眼视觉系统的特点,提高预显示内容的刷新频率也可以提供更多的视觉像素[12]。最近有学者提出了新的思路,将提升视觉分辨率的方案应用到了3D显示系统中[15-17]。Zhan等人使用Pancaratnam-Berry偏转器,通过叠加两个偏移的像素格来提升视觉分辨率[15]。高鑫等人设计了一个线性棱镜阵列,将原始体素阵列在对角线上一分为二,以提高视觉分辨率[16]。
前期工作中为提高视觉分辨率需要引入新的光学结构或显示设备。我们提出了一种基于深度学习优化基元图像阵列的3D光场显示方法,该方法不需要引入额外的控光元件就可以提高视觉分辨率。在3D光场显示的成像过程中,由于透镜存在像差,光线经过透镜会形成弥散斑。相邻像素弥散斑之间的混叠区域可被视为新的视觉像素,并作为额外的信息载体。基于这个前提,我们搭建并训练了一个卷积神经网络(CNN),以从高分辨率基元图像阵列(HEIA)中训练得到预处理的基元图像阵列(PEIA)。通过现有的透镜阵列对PEIA进行加载显示,实现了视觉分辨率提高的3D光场显示。在实验中,对现有的透镜阵列进行像差分析,提取其点扩散函数阵列,并用高斯分布近似替代,方便后续网络的搭建。通过使用LEIA和设计的复合透镜阵列,演示了在70°视角下具有更好视觉分辨率的光场显示。
2 基于LEIA提升视觉分辨率
2.1 由透镜像差引起的弥散斑交叠
我们在以前的工作中提出了一个带有透镜阵列、LCD和定向扩散膜的光场显示系统[17]。
其中K1、K2、K3和K4分别表示P1、P2、P3和P4在SP5位置的权重系数。权重系数可以通过分析定向扩散膜上显示的弥散斑强度分布得到。
图 1. 由相邻像素之间交叠区域产生的新视觉像素
Fig. 1. New visual pixels generated by aliasing areas between adjacent pixels
如
其中:*代表卷积运算,VI(x,y)代表视觉像素在定向扩散膜上的强度分布,PI(x,y)代表像素在LCD上的强度分布,h(x,y)表示对应的点扩散函数(PSF)。单一透镜下不同视场角的每个像素的PSF可以被近似看作高斯分布,因此弥散斑的均方根半径(RMS)的2倍可被视为等于高斯分布的半高全宽(FWHM)[18]。根据高斯公式,任意RMS半径弥散斑的PSF可以表示为:
其中:R是RMS半径,μx是沿x轴方向的期望,μy是沿y轴方向的期望。当基元图像(EI)经过透镜时,透镜不同视场角下弥散斑的RMS半径都不相同,与其对应的PSF也不相同。基于
图 2. 像素经过透镜的过程可被视为与高斯核的卷积
Fig. 2. Process of pixel blurring after passing through a lens which can be regarded as convolution with a Gaussian kernel
2.2 基于CNN提升视觉分辨率
为了将交叠区域变成可利用的视觉像素,我们设计了一个用于分辨率增强的CNN,用于从HEIA中获得PEIA。
图 3. 使用CNN实现视觉分辨率增强的3D光场显示过程
Fig. 3. Process of using CNN to realize visual resolution enhanced 3D display
将HEIA输入至CNN,经过CNN的处理,得到分辨率为7 680×4 320(8K)的PEIA。输出的PEIA被加载到LCD面板上,经过透镜阵列的光学变换后,观众可以在定向扩散膜上观察到具有视觉分辨率增强的光场显示3D图像。我们使用16K分辨率的HEIA作为网络输入的原因有二:一是真实物理分辨率与视觉分辨率目前难以通过简单的公式进行衡量,选择横向分辨率乘以2和纵向分辨率乘以2的训练方式与文中所提的两个相邻像素相互交叠产生一个新视觉信息的模型更加契合;二是如果选用更高分辨率的合成图作为输入,将会加剧虚拟相机采集视差图时所带来的时间成本。
为了验证上述的构想,并且考虑到设计制造的难度和光学加工的成本,我们使用了实验室中现有的透镜阵列模组,其基本透镜单元为两个透镜的复合透镜,如
图 5. (a)复合透镜的结构参数;(b)复合透镜在3个视角下的弥散斑分布情况(RMS半径:0°视场角:4 035.04 μm,19.7°视场角:3 843.27 μm,34.6°视场角:4 198.41 μm)。
Fig. 5. (a)Structural parameters of the compound lens;(b)Spot diagrams of the compound lens in three viewing angles(RMS radius:0° viewing angle:4 035.04 μm,19.7° viewing angle:3 843.27 μm,34.6° viewing angle:4 198.41 μm).
3 仿真和实验
我们分别使用标准分辨率图和三维街道场景来验证所提出方法的有效性。如
图 6. 标准分辨率图的仿真结果。(a)未使用优化方法;(b)采用视觉分辨率增强方法。
Fig. 6. Simulation results of standard resolution chart.(a)Without the proposed visual resolution-enhanced method;(b)With the visual resolution-enhanced method.
图 7. 街道场景的仿真结果。(a)高分辨率的原始图像;(b)未优化的仿真图像;(c)使用视觉分辨率增强方法的仿真图像。
Fig. 7. (a)Original image with high resolution;(b)Simulation image without visual resolution-enhanced method;(c)Simulation image with the visual resolution-enhanced method.
在光学实验中,我们展示了一个由定向扩散膜、透镜阵列和LCD组成的光场显示系统。透镜阵列被放置在距离LCD上方8.151 mm处,定向扩散膜被放置在透镜阵列上方180.0 mm处。透镜阵列的规模为53×30,相邻透镜单元之间的中心距离是13 mm。LCD的尺寸为81.28 cm(32 in),分辨率为7 680×4 320。
图 8. 未使用优化方法(a)和采用视觉分辨率增强方法(b)的街道场景的三维光场显示
Fig. 8. 3D light field display for a street scene without the proposed visual resolution-enhanced method(a)and with the visual resolution-enhanced method(b)
4 结论
本文提出了一种基于深度学习提升视觉分辨率的3D光场显示方法。该方法的核心是将弥散斑的交叠区域视为新的视觉像素,并作为额外的信息载体使用。为了将交叠区域转化为可用的视觉像素,构建了一个CNN,从HEIA中获得PEIA。将PEIA加载到LCD上,经过透镜阵列的光学变换和定向扩散膜的扩散作用,为观众提供视觉分辨率增强的3D图像。在实验中,通过利用PEIA和复合透镜阵列,实现了视觉分辨率提高的光场显示。
[10] JAYNESC, RAMAKRISHNAND. Super-resolution composition in multi-projector displays [C]//Proceedings of IEEE Int'l Workshop on Projector-Camera Systems. 2003: 8.
[18] 宋菲君, 陈笑, 刘畅.近代光学系统设计概论[M].北京: 科学出版社, 2019: 63-64.
SONGF J, CHENX, LIUC. Introduction to the Design of Modern Optical Systems [M]. Beijing: Science Press, 2019: 63-64. (in Chinese)
于迅博, 李涵宇, 高鑫, 桑新柱, 颜玢玢, 粟曦雯, 温旭东, 徐斌, 王越笛. 基于预处理卷积神经网络提升3D光场显示视觉分辨率的方法[J]. 液晶与显示, 2022, 37(5): 549. Xun-bo YU, Han-yu LI, Xin GAO, Xin-zhu SANG, Bin-bin YAN, Xi-wen SU, Xu-dong WEN, Bin XU, Yue-di WANG. 3D light field display with improved visual resolution based on pre-processing convolutional neural network[J]. Chinese Journal of Liquid Crystals and Displays, 2022, 37(5): 549.