激光与光电子学进展, 2019, 56 (24): 240001, 网络出版: 2019-11-26   

用于三维显示的全息压缩技术概述 下载: 1611次封面文章

Overview of Holographic-Compression Technology for Three-Dimensional Display
作者单位
昆明理工大学理学院激光研究所, 云南 昆明 650500
摘要
全息技术的应用使得三维显示发展迅速,给人们带来了无与伦比的视觉体验。全息图像、视频的计算和生成过程会产生庞大的数据,这给传输和存储带来了很大困难。为了满足3D显示的高清晰度和实时性要求,全息数据的压缩显得十分重要。由于全息图像与普通图像相比有着截然不同的特性,因此使用现有压缩技术难以达到最佳效果。介绍了全息压缩主要的技术问题,总结了全息数据压缩常用的度量,具体讨论了各国研究团体所提出的全息图像编码量化处理、变换系数化简、全息图国际标准格式优化和新型标准框架开发等前沿技术,并详述了它们各自的优劣,最后对于未来全息压缩技术研究的主要方向进行了展望。
Abstract
The application of holographic technology has enabled three-dimensional (3D) displays to develop rapidly, providing users an unparalleled visual experience. The calculation and generation processes of holographic images and video generate a considerable amount of data, causing great difficulties for transmission and storage. To meet the high-definition and real-time requirements of 3D displays, the compression of holographic data is critical. Since holographic images have distinct characteristics than ordinary images, it is difficult to achieve optimal results using existing compression techniques. This study introduces the main technical challenges of holographic compression and summarizes the commonly used metrics for holographic data compression. The cutting-edge technologies proposed by national research groups related to holographic-image-coding-quantization processing, transform-coefficient simplification, optimization of the international standard hologram format, and development of a new standard framework are discussed in detail, and their respective advantages and disadvantages are detailed. Finally, a future direction for research on holographic-compression technology is proposed.

1 引言

相比于传统的显示技术,三维立体显示能够给使用者带来更加优质的视觉体验。近年来,三维立体显示技术发展迅速,现已被广泛应用于**、通信、娱乐、医学等方面,另外还有许多应用领域值得推广[1-2]

全息技术能够记录物光波的全部振幅和相位信息,并且能完全重建物体或场景的波前信息,是三维显示的最佳选择[3-4]。利用全息技术重建出的三维场景能够提供持续的头部运动视差,适于人眼观察的聚散度和原物场的全部深度信息[5]。数字全息技术[6-8]相比传统全息术能够提供更加充分的观测视角,可以更为便利地显示深度信息。随着数字全息技术的发展和CCD芯片分辨率量级的提高,用于三维实时显示的全息图像的生成、计算、分析和使用也变得更加便利。全息数字化也推动了全息图的计算机生成。计算机生成的全息图[9-10](CGH)可以完全模拟全息的整个记录和重建过程,并能有效避免数字全息中实际拍摄环境对记录过程的影响,因此有关CGH的研究和应用也更加丰富。

与全息用于计量、显微和超分辨等相比,全息应用到三维显示中时,常会遇到一些问题,如:全息图像记录了物场全部的振幅、相位信息,所以全息图像包含了大量的数据,而在三维显示中大景深、多视角场景极多,数据量将更加庞大;对于具有复杂空间结构的三维物体,难以用具体的函数表示其物光波分布,加上数据量巨大,使得计算所有所需视角的波前变得十分复杂;实时性是三维显示的重要指标,而庞大的数据量和复杂的计算使得实时传输和处理变得十分困难,现有的传输带宽难以达到传输需求,而且庞大的数据对存储和处理的硬件设备要求也很高;全功能全息屏幕必须显示水平和垂直视差图像,因此需要极高的分辨率[11]。基于以上几点要求,对全息数据进行压缩处理具有减少三维显示中传输和存储压力、降低运算数据量、减轻硬件依赖性等优点,是解决问题的最好方法之一。近年来,有关全息数据的压缩研究为全息图像及视频的存储、显示和传输提供了许多可行性办法。

近年来的研究将全息数据的压缩方式分为三大类:基于量化、基于变换和基于标准的压缩方式。基于量化的压缩方式主要是针对一些现有的数据压缩方式建立适当的子集,然后对输入的全息数据按子集编码,以此减少全息图的量化等级[12-13]。基于变换的压缩方式主要是使用余弦或小波变换等对全息数据进行压缩,这些变换用于全息数据同样需要进行算法更改,或者只对部分数据进行变换。基于标准的压缩方式则是对诸如JPEG(Joint Photographic Experts Group)等数字图像及MPEG(Moving Picture Experts Group)等视频压缩标准格式进行框架修订、算法改进或者编码字典更新,然后将其用于全息图像压缩或全息数据计算简化。

本文主要对三类全息数据压缩方式进行阐述,并对现有的相关研究进行详细叙述,分析它们各自的效果和适用范围。

2 全息图像压缩技术概述

2.1 常用度量

至今为止国际上还未对全息图像压缩标准给出统一的衡量方式,各国科研人员使用的度量标准也存在一定的差异,因此有必要总结说明一些常用的压缩度量以及失真度量。由于当前全息图像的编码存储方式是基于二维数字图像的,因此许多衡量二维数字图像的标准参数可以直接用于全息图像。

用一串二进制“位”来描述图像是图像压缩的基本原理,压缩位流用C表示。在没有任何压缩时,图像样本值被描述为N1N2B位。定义压缩比r为未压缩尺寸与压缩后尺寸之比,公式可表示为

r=N1N2BC,(1)

式中:N1N2为图像两个方向上的像素数;B为像素深度位。也可以定义与压缩比等价的压缩比特率,用bps(位/样本)表示为

bps=CN1N2(2)

因为位深度大的图像的最低有效位可以舍去,且不会引入很大的视觉失真,所以在有损压缩中,比特率是对图像系统更有意义的性能度量。对于深度信息丰富的全息再现像来说,这是十分可靠的度量方式。

对于全息图像数据压缩过程的失真,必须以适当的方式进行估计。形式上常把原图像x和重建图像 x^之间的失真记为D

最常用的失真度量是均方根误差(MSE,EMS),定义为

EMS=1N1N2N1=0N1-1N2=0N2-1[|x(N1,N2)|-|x^(N1,N2)|]2(3)

作为图像失真度最广泛的使用度量,MSE便于计算,且在涉及平方误差度量的线性优化问题上具有容易处理等特点。

全息图像压缩与数字图像压缩相同,也会使用与均方根误差等价的倒数度量(峰值信噪比PSNR,RPSN)来定义,单位dB,定义式为

RPSN=10lg(2B-1)2EMS(4)

此外,还可以用更加精细的误差衡量标准归一化均方根(NRMS,SNRM)误差来比较重建全息图像和原图像的偏差,表达式为

SNRM=N1=0N1-1N2=0N2-1[|x(N1,N2)|-|x^(N1,N2)|]2N1=0N1-1N2=0N2-1|x(N1,N2)|212(5)

需要指出的是,以上三种失真度量在用于全息图质量评判时,可将振幅和相位分成两部分进行。振幅部分的处理与普通数字图像的处理基本一样,相位部分的处理则是先对相位取对数,转换成实数信息,然后再对其进行度量分析。虽然这种处理方法较为复杂,应用较少,但在振幅相位分离处理的全息三维显示器上可以更精准地显示压缩后全息图再现像的误差。

以上是在全息数据压缩效果衡量标准中用到的几种主要度量方式。

2.2 基于量化的全息压缩方式

实际上,全息数据量化很早就引起了学者们的关注。20世纪70年代,Goodman等[12]首次将量化引入全息相位,研究了傅里叶域相位对恢复函数的影响。在之后的数十年中,量化逐步被用于全息图相位[13-15]、广义迭代[16]、全息图分块[17]、数字全息加密[18]等方面。21世纪初,Chang[19]首次真正将量化用于全息图像的压缩,他们对原始干涉图案进行量化,采用缩小尺寸、二次采样和基于JPEG的技术进行量化。虽然研究结果表明上述方法降低了重建图像的质量和压缩效率,但是其使用的压缩理念却对后来的全息信息压缩研究具有启迪作用。为了便于对全息图像进行编码,对全息图量化时一般采用与无损压缩技术相结合的方式。Naughton等[20]首先研究了各种无损压缩编码用于相移干涉时产生的全息图像的压缩效果,结果发现,在按照振幅-相位分量表示数据流的方式下达到了1.33的平均压缩率,在按照实部-虚部分量表示数据流的方式下使用BW(Burrows-Wheeler)编码可以达到4.66的最佳压缩率。这为全息数字化显示提供了编码条件,在这之后的绝大部分量化压缩全息图研究均是以量化输入数据配合现有压缩技术的方式进行编码的。

使用量化压缩的全息图一般是由相移干涉测量法(PSI)生成的,相移数字全息可以很好地分离再现像的零级和±1级,并且再现像的质量很高,适合作为显示图像。PSI数字全息从小范围角度记录物体的多个视图(如图1所示),而且数字编码后的波前由大量复杂浮点数组成,产生的数据量远高于普通图像,而数据量化刚好可以有效去除相关性较强的浮点数,因此PSI数字全息图比较适合与量化研究相结合[20-23]

图 1. 简化的PSI全息记录和重建框架

Fig. 1. Simplified PSI holographic recording and reconstruction setup

下载图片 查看所有图片

结合量化技术的全息数据压缩主要是通过减少全息量化电平的数量,并基于各种压缩方式的适当子集为输入数据提供编码来实现的[18,24-25]。标量量化和矢量量化是两种常用于数字全息图的量化方式[26]。标量量化(SQ)是把整个动态范围分成若干个子集,每个子集有一个特定值,量化时将子集中的每个元素都映射为那个子集中的特定值。如图2(a)所示,将实轴划分为n个不相交的区域Ln=[abn-1,abn),n∈Z(其中Z为整数集,-¥<ab0<ab1<…<abn<+¥,a为均匀量化步长,bn表示量化块),将 x^n作为Ln的码字,则量化编码器可视为{ab1,ab2,…,abn}到{ x^1, x^2,…, x^n-1}的映射。

矢量量化(VQ)过程与标量量化类似,把输入的一组数据分成许多组,成组地量化编码,即将这些数看成一个k维矢量,然后以矢量为单位逐个量化,其映射可设为Vk→{XY1,X"Y2,…,XYn},其中k为正整数标号,每个标量值Yn都是连续幅度量,X为码矢量。如图2(b)所示,以黑点作为矢量块码字,码率表示为R=(1/m)lb M,其中M= k=0kMk表示量化规模,m为离散长度。以图2(b)中黑点数取12为例,通过上述公式可得码率为1.79 bit/sample。

图 2. 量化模式图。(a)标量量化;(b)矢量量化

Fig. 2. Quantization patterns. (a) Scalar quantization; (b) vector quantization

下载图片 查看所有图片

标量量化又可以细分为均匀和非均匀量化两种模式,均匀量化划分的子集大小基本均匀相等,而非均匀量化则会根据数据分布分配大小不同的子集。均匀量化[27-28]以其简化特性而经常被应用在全息数据量化中。Mills等[28]针对输入数据均匀分布的情况使用均匀量化,通过数值模拟和实验发现,如果数字计算是以8位执行的,则可以以6位量化重建高品质图像。针对数据以非均匀采样方式输入时的问题,Shortt等[29-30]开发出基于k均值聚类的非均匀量化技术用于全息图压缩,通过快速聚类大量数据,可达到40的压缩比。为了进一步提高重建质量,Shortt等[26]在之前研究的基础上设计出了量化直方图。之后,为了提高非均匀量化采样模式的性能,Shortt等[31]又提出将数字全息图像素用均匀量化与改进型非均匀量化相结合的方式直接进行量化,这种有效的非均匀量化技术先对数据作非线性变换,再使用均匀量化器对复平面中间隔固定的采样网格进行非线性变换,然后利用菱形和螺旋型两种网格对输入数据进行采样,使得网格在输入数据密集的区域被压缩(压缩率达到了70),在输入数据稀疏的区域被拉伸。标量量化虽然运行速度较快,但不能完全有效地对数据进行归类,且会使数字全息图中的高频分量流失,导致重建图像的质量和全息图的衍射效率降低。而矢量量化能够有效地分类处理数据集合,所以当其被用于由计算机生成的相移全息图时,矢量量化比标量量化更能有效降低全息信息的比特率[24,32-33]。Xing等[32]提出,首先提取两组有效的全息信息,以减少压缩之前传输的数据量,然后使用数值实验测试LBG-VQ(vector quantization based on LGB algorithm)算法压缩CGSPH(computer generated phase-shifting holograms),得到的PSNR优于AQ(Adaptive Quantization)方式约6 dB。为了得出最佳的矢量量化方式,Cheremkhin等[24]通过对比压缩数字全息图的不同参数,测试了常用的几种标量和矢量量化方式,结果发现,使用标量量化方法会导致数字全息图的高频分量大量损失,进而使得重建图像的质量和全息图的衍射效率降低。相比之下,矢量量化中k-medians具有最高的衍射效率,k-means具有最高的重建质量,且可以在有效压缩大尺寸复杂图像时保持较高的分辨率。

针对深度信息不均匀时无法有效地对不同图案特性进行量化的问题,学者们提出将菲涅耳域结合数据量化用于全息重建时的压缩[23,33-35]。菲涅耳变换是一种小波基函数,可用于相移数字全息图的重建。Darakis等[34]提出使用菲涅耳变换将数字全息复杂的波前分解为子带然后再压缩的方案,将分层树编码中的集合分配与菲涅耳变换系数结合,得到了良好的压缩性能。为了满足三维视觉效果,达到真彩色显示的要求,Tsang等[36-37]提出了基于VQ压缩彩色数字菲涅耳全息图的方法,该方法无需解码,具有较高的抗噪声能力。在此基础上,Tsang等[38]针对这种方法压缩时间长以及大编码块导致全息图像劣化的缺陷,提出了一种结合VQ、抽取因子和BW编码器集成的方法,使压缩速度提高了4倍,在25帧序列的全息图视频中可以实现超过4000的平均压缩比[38]。然而,该压缩过程比较复杂,编解码时间较长,且压缩方式也不具灵活性等。

综上可知:标量量化具有较快的处理速度和很低的资源密集程度等优点,但重建质量不高,且在编码时会造成较高的均方根误差;而矢量量化具有较高的重建质量,并且在编码时可以实现较高的压缩率,然而由于算法的复杂性和大量的迭代,矢量方法的量化速度很低,这对于实时传输和显示来说是十分不利的。此外,绝大部分基于量化的方法都无法有效控制生成数据的大小,不具灵活性,因此虽然量化处理能够满足三维显示图像在高压缩率下的清晰度要求,但实际使用中一般是在全息数据输入阶段进行适当量化。

2.3 基于变换的全息压缩方式

在普通的数字图像压缩中,各种变换方式常被用于压缩图像格式,如JPEG利用离散余弦变换(DCT),JPEG2000利用离散小波变换(DWT)等[39-40]。利用合适的变换方式来处理全息数据也是常用的编码压缩手段,例如离散傅里叶变换(DFT)[20,41-42]、离散余弦变换[43-44]、小波变换等[43-45]。其主要原理是将图像信号压缩成几个主要的变换系数,以减少数据冗余。

DFT公式可表示为

FDFT(μ,ν)=1MNx=0M-1y=0N-1f(x,y)·exp-j2πνyNexp-j2πμxM,(6)

式中:f(x,y)为图像;MN为采样长度;xy为图像空域中的两个方向;μν为两个方向上的频率。

DCT公式可表示为

FDCT(μ,ν)=α(μ)α(ν)x=0M-1y=0N-1f(x,y)·cos2x+12Mcos2y+12N,(7)

式中:α(μ)、α(ν)为变换系数矩阵。

Naughton等[20]将DFT算法编码最先应用于每个块中进行量化,将每个块中的最小DFT系数的固定数量设置为零,这包括对每个8×8 DFT中的值进行排序,并将(64-p)个最低值系数设置为零,再通过减少特定系数的方式达到12.8的最高压缩率,其中92%的DFT系数可以以最小的损失被丢弃,但是全息图像重建质量并不高,其中p是(1,64)范围内的正整数,表示每个块中保留的DFT系数的数量。大阪市立大学的Yang等[46-47]提出了一种用于全息数据处理的菲涅耳变换,这种变换算法可以看作是傅里叶变换的改进,原理上是通过两次傅里叶变换和一次傅里叶逆变换计算得到的。Yang等将菲涅耳变换用于压缩CGH数据,得到了可供全息压缩变换的新方案,并建立了一套完整的压缩-变换-重建系统。在此基础上,北京大学的Zhang等[48]提出将反向传播的神经网络与菲涅耳变换技术相结合,将256 pixel×256 pixel的图像分割成1024个块,利用具有64个输入神经细胞的神经网络进行压缩编码,这种方案可以自适应地处理非线性全息信息,与普通的DCT和DWT相比更稳健。日本大学的Yoshikawa等[42]对全息图像先进行分割,然后使用DCT变换获取全息条纹的局部空间频谱,最后结合运动图像编码,在512 pixel×512 pixel尺寸下得到了压缩率为5的结果。但是,从图像重建的结果中可以看出,DCT变换由于去除了大量的非相关系数,导致重要的深度信息缺损过多,因此DCT变换并不适合用于全息三维显示中的图像压缩。

全息图实际上是具有不同亮度和大量细节的干涉图案,可由大量近似系数描述,因此基于小波变换的方法更适合用于全息图像的压缩。二维离散小波变换可表示为

TDWTx(a0j,kb0)=x(t)ψa0j,kb0*(t)dt,(8)

式中: a0j为离散尺度因子;kb0为离散平移因子;jk为正整数序号;x(t)为输入信号,t为函数变量; ψa0j,kb0*(t)为小波基函数的通用表示。

Kurbatova等[44]将各种常用的小波变换用于数字全息压缩,结果发现,利用coiflet、symlet和Haar的小波变换可以获得最佳的重构质量,Haar小波变换可以得到最高的衍射效率。之后他们又采用基于频域滤波、小波变换、小波系数阈值和量化的处理方法,实现了离轴数字全息图的压缩[49]。他们首先进行零阶和双阶消除,然后采用压缩小波变换得到傅里叶变换频谱的振幅和相位分量,最后通过阈值处理和量化进一步压缩小波系数。得到的结果在衍射级过滤时保存10%的初始信息,并保持80%小波系数的阈值滤波,使压缩率达到了190,且再现像分辨率基本没有降低。

虽然传统的小波变换可以实现较高的压缩比,但NRMS很高,且在高维数据中沿矢量线进行小波变换时会产生冗余。为此,Bang等[45]提出了一种Bandelets与小波变换相结合的全息图压缩方案,该方案首先使用小波变换将全息图数据分为低子带和高子带,然后用Bandelets变换分析通过小波变换所获得的干涉条纹近似信息,确保每个条纹边缘上的像素损失最小,这种方法有效提高了压缩比,且重建误差几乎没有增大。基本原理如图3所示[45]

图 3. Bandelets-小波变换全息图压缩原理[45]

Fig. 3. Theory of Wavelet-Bandelets transform for compression of hologram[45]

下载图片 查看所有图片

基于变换的全息图压缩方式具有极高的去相关性,并且各种变换都有着较为成熟的编码方式,在实际操作中较为方便,有利于三维显示编解码器的搭建。然而仅靠变换的方式虽然能得到较高的压缩比,但均方根误差却很大,所以为了满足清晰度要求,变换算法用于全息图时仍需进行改进。

2.4 基于标准的全息压缩方式

数字图像的标准压缩方法(如JPEG、JPEG2000[50-51]等)用于数字全息图的压缩时,可通过剔除频谱中不必要的谐波来消除图像中的多余信息。然而,如果直接将这些方法用于数字全息就会出现一些问题。首先,全息图的重建图像质量比压缩全息图视觉更重要。其次,数字全息图是干涉图片,全息图中的亮度是非均匀变化的,而数字图像压缩算法最适合用于亮度逐渐变化的图片。再次,全息图是针对波的幅度和相位的配准,但是图像通常仅针对波的强度(振幅)进行配准[11,52]。此外,由于数字全息图在压缩时极易受到散斑噪声的影响,而散斑噪声的存在会使得3D数据的压缩难以简单地利用2D图像的有损压缩标准,同时散斑噪声在压缩时还会保持较高的数据量,这使得压缩结果难以到达较大的压缩率[53]

CGH的出现使得散斑噪声不再是影响全息图质量和数据量的因素,此外CGH具有可以直接与编解码器匹配以及直接契合标准压缩格式的优点,原理如图4所示。然而在生成包含物场的全视角的全息图时,CGH也会产生大量数据,且数值计算模拟光波传播以及重建过程更加复杂,大多数方法只适用于简单的静止图像,不适合用来处理复杂图像或视频图像。因此,对于CGH的数据压缩和算法优化也是研究者们关注的内容。

图 4. 计算机生成全息图原理示意图

Fig. 4. Schematic of hologram generation by computer

下载图片 查看所有图片

2004年,Yeom等[54]将基线JPEG和MPEG等压缩标准用于3D图像信息的压缩。他们将3D积分图像中的元素建模为运动图像中的连续帧,将元素图像之间的高互相关性应用于MPEG-2,在4×105的压缩速率下实现了78的压缩比。针对标准压缩模块在什么阶段使用的问题,Darakis等[55]提出在干涉过程的早期阶段(此时干涉图案仍具有图像外观)执行数据压缩,这时就可以对记录的干涉图像使用JPEG标准格式压缩。数值实验结果表明,当重建对象的图像质量保持在可接受的水平时,获得JPEG和JPEG-2000算法的近似压缩率分别为20和27。虽然标准框架与全息数据的匹配程度尚不紧密,但此研究仍可证明基于标准压缩格式的全息图像、视频压缩技术具有广阔的应用前景。

为了使全息图像与标准图压缩格式充分匹配,利用JPEG2000可以灵活地组合任意变换分解样式,且可以将内核与强大的EBCOT(embedded block coding with optimized truncation)单元进行转换这两特点,Blinder等[11]将方向自适应离散小波变换与非标准分解方案结合起来用于显微离轴全息记录,利用方向自适应小波变换取代经典JPEG2000中的小波变换,设计出了基于JPEG2000的编码器架构,如图5所示[56]。通过实验得到PSNR在0.125~2 pixel深度范围内的平均增益接近5 dB,在无损压缩下使用DADWT Mallat变换组合时可以使平均文件大小降低7.5%。在此基础上,

图 5. 基于JPEG2000的扩展编码器原理[56]

Fig. 5. Schematic of extended encoder based on JPEG2000[56]

下载图片 查看所有图片

他们又提出了增强任意小波分解样式和基于块的定向自适应DWT,实际完成了两个JPEG-2000框架的拓展,得到了累积超过7 dB的增益[57]

除了调用JPEG编码器框架外,也可以使用其他调准格式对全息图像、视频进行处理,并且可以将其直接编写为现有的文件格式进行存储。ISO(International Organization for Standardization)和CCITT(Consultative Committee on International Telegraph and Telephone)多年来推出了多种数字图像及视频通信标准,而由于三维图像、视频复杂程度远高于二维信息,所以用于编码三维信息的标准方式仍需要进行研究考证。Xing等[58-59]在他们的一系列研究中已经充分证明了基于JPEG、AVC(Advanced Video Coding)和HEVC(High Efficiency Video Coding)等编码标准压缩全息图的合理性。由他们的工作中得出的结论表明,相位信息比振幅信息对全息图重建质量的影响更大,通过可分离的向量提升分解可得到两组CGH移位距离信息,其中的差异数据更具有相关性,可以通过联合编码的方式进行有效编码[32,59-60]。他们充分利用数据冗余将立体和光谱数据环境下使用的高效压缩方法——矢量提升方案作为基础,开发出了可有效适应全息数据的联合多尺度分解编码。基于以上研究结果,他们又开发了基于NS-VLS(Nonseparable Vector Lifting Scheme)的不可分离的相移算法[61-62],以便同时利用移位距离信息数据与二维波特性之间的相关性,对两组差分信息进行编码。与之前提出的SEP-VLS相比,该算法在比特率节省和PSNR重建方面分别有10%和0.8 dB的提升。

为了避免CGH复杂的计算,同时节省颜色传输通道,Bell等[53]使用DFP(Digital Fringe Projection)法生成并压缩全息图,使图像上的像素与一个编码的3D几何点之间形成一一对应关系,而且消除了散斑噪声的影响。他们利用结构光三维扫描装置的几何约束来减少需要存储的数据量,由此提出的新编码方法可以在不需要存储条纹信息的情况下恢复几何距离。最后通过实验得到如下结果:当使用PNG(Portable Network Graphics)存储编码的输出图像时,与STL(Standard Template Library)格式相比,实现了大约688∶1的压缩比,RMS误差仅为0.033%;对STL格式实现了3038∶1的压缩比,当编码图像用JPEG格式编码压缩80%时,RMS误差为0.47%;重建时获得了高质量图像。

此外,Kim等[63-65]提出的将查找表法(LUT)与MPEG视频标准压缩编码结合的方案大大降低全息视频的时间冗余,有效减少了帧间编码数据。他们提出了一种基于三个方向上进行运动补偿掩模的新型查找表方法,该方法便于在基于GPU(Graphics Processing Unit)的编程软件上实现,并且能与计算机的存储器结构很好地匹配 [63],提高全息视频帧间的编码效率,在具有12088个对象点的场景下进行测试后可知,在双英伟达GTX Ti显卡上生成了具有1920 pixel×1080 pixel分辨率的39.8 frame菲涅耳CGH图案,为电子全息3D显示器的实际应用和全息视频标准编码提供了可行性保障。图6为该方法用于全息视频高速生成的原理示意图[65]

图 6. 全息视频高速生成的原理图[65]

Fig. 6. Schematic of fast generation of holographic video[65]

下载图片 查看所有图片

由于全息压缩技术没有统一的判断标准,世界各地研究小组的研究成果都缺乏有效的评判标准。为了使研究人员能够正确评估不同的编码器,布鲁塞尔自由大学建立了一个包含一组计算机生成全息图并且具有不同测试全息图内容的开放公共数据库,以提供标准参考全息图[66]。该数据库为全息编码的研究提供了极大便利,其中收录的全息数据被广泛使用[67-69]图7为数据库中使用的用于测试JPEG2000扩展框架的5个全息图[66]

图 7. 5个不同类型的测试用全息图[66]

Fig. 7. Five different types of holograms for testing[66]

下载图片 查看所有图片

结合上述文献内容可以发现,基于JPEG2000、MPEG4的新型框架可以大幅提高全息图的重建质量(重建质量的提高也依赖于改进其中的数据变换算法)。在全息图象及视频的生成和数据运算时,为了提高计算速度,加快数据融合过程,参照精确的码表并采用优化过的帧图像预测方式是现在最优的方法,并且已经证明这些方法可以用于全息视频的生成,这对于三维视频的实时显示也是极其重要的。因此,若想在三维显示中实现清晰完整的视觉体验,并且可以达到实时显示和通信的要求,对于新型框架、数据码表的开发和视频算法的编码是下一步的研究重点。

3 结束语

本文阐述了现有的主要用于三维显示的全息图像及视频压缩技术,并分析了它们各自的优劣之处。基于量化方式通过减少全息数据量化电平数、编码输入数据来实现压缩。其中的标量量化处理速度较快,但重建质量较差,而矢量量化虽然压缩率高,但不利于计算。基于变换的压缩方法可以在获得较高压缩比的同时保持较高的重建质量,但NRMS误差较大。基于标准的压缩方式是当前最为先进的全息压缩方式,具有很高的灵活性,且压缩效果表现很出色。近年来,基于标准的全息压缩技术虽然已经取得了很大成功,但仍有许多模块尚未得到开发应用,且现已得到的研究成果还不能完全应用于实际。此外,近年来热门的深度学习相关算法已经开始用于信号的压缩和编码,如果与标准编码框架结合,可以为全息数据的压缩提供新的研究思路。

未来用于三维显示的全息压缩技术方面的相关研究需要解决的主要问题如下:1)缺少可靠的质量评估方式。现在用于衡量全息数据压缩效果的方式是直接使用数字图像的度量,而全息图像相比于数字图像有着许多不同的特性,因此需要设计出专门用于全息图像的度量方式。此外,各个文献所提出的压缩技术难以进行比较,缺少统一的判断标准和参考数据。2)大多数文献中所提出的技术都适用于结构简单、角度尺寸较小的场景和物体,而实际应用的三维显示具有复杂的场景。现有的全息视频生成和压缩技术大多也只适用于简单物体的运动,帧图像预测也仅能用于单一物体,所以对具有复杂形貌和高景深的物场进行研究是必要的。3)编码技术要求对全息图的各项参数进行统一,如像素大小、全息图尺寸等,并且生成全息图的条件也需要统一,比如记录方式和物理环境等。这些影响全息图特性的参数或生成环境都需要有一个标准,否则在编码时会遇到很大困难。

由于国内在全息数据压缩领域方面的研究较少,在进行相关研究时可能会遇到更多的问题,而今结合国际图像、视频标准对全息进行编码压缩已经成了主流研究方向,因此国内在新型标准框架开发、算法升级、编码与硬件整合以及新型全息图像生成等领域的研究任重道远。

参考文献

[1] Bove V M. Display holography's digital second act[J]. Proceedings of the IEEE, 2012, 100(4): 918-928.

[2] DufauxF, Pesquet-PopescuB, CagnazzoM. Emerging technologies for 3D video: creation, coding, transmission and rendering[M]. UK: John Wiley & Sons, Ltd, 2013.

[3] Javidi B, Ferraro P, Hong S H, et al. Three-dimensional image fusion by use of multiwavelength digital holography[J]. Optics Letters, 2005, 30(2): 144-146.

[4] Onural L, Gotchev A, Ozaktas H M, et al. A survey of signal processing problems and tools in holographic three-dimensional television[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2007, 17(11): 1631-1646.

[5] Dufaux F, Xing Y F, Pesquet-Popescu B, et al. Compression of digital holographic data: an overview[J]. Proceedings of SPIE, 2015, 9599: 95990I.

[6] Schnars U, Jüptner W. Direct recording of holograms by a CCD target and numerical reconstruction[J]. Applied Optics, 1994, 33(2): 179-181.

[7] Yamaguchi I, Zhang T. Phase-shifting digital holography[J]. Optics Letters, 1997, 22(16): 1268-1270.

[8] Cuche E, Bevilacqua F, Depeursinge C. Digital holography for quantitative phase-contrast imaging[J]. Optics Letters, 1999, 24(5): 291-293.

[9] Dallas WJ. Computer-generated holograms[M] ∥Frieden B R. The computer in optical research: Volume 41. Topics in applied physics. [S. l.: s. n.]1980: 291- 366.

[10] Tricoles G. Computer generated holograms: an historical review[J]. Applied Optics, 1987, 26(20): 4351-4360.

[11] Blinder D, Bruylants T, Stijns E, et al. Wavelet coding of off-axis holographic images[J]. Proceedings of SPIE, 2013, 8856: 88561L.

[12] Goodman J W, Silvestri A M. Some effects of Fourier-domain phase quantization[J]. IBM Journal of Research and Development, 1970, 14(5): 478-484.

[13] Dallas W J. Phase quantization: a compact derivation[J]. Applied Optics, 1971, 10(3): 673-674.

[14] Dallas W J. Phase quantization in holograms: a few illustrations[J]. Applied Optics, 1971, 10(3): 674-676.

[15] Dallas W J, Lohmann A W. Phase quantization in holograms-depth effects[J]. Applied Optics, 1972, 11(1): 192-194.

[16] Wyrowski F. Iterative quantization of digital amplitude holograms[J]. Applied Optics, 1989, 28(18): 3864-3870.

[17] Kim M S, Guest C C. Block-quantized binary-phase holograms for optical interconnection[J]. Applied Optics, 1993, 32(5): 678-683.

[18] Nomura T, Okazaki A, Kameda M, et al. Digital holographic data reconstruction with data compression[J]. Proceedings of SPIE, 2001, 4471: 235-242.

[19] Chang HT. Preliminary studies on compressing interference patterns in electronic holography[M] ∥Kuo C J, Tsai M H. Three-dimensional holographic imaging. New York: John Wiley & Sons, Inc., 2002: 99- 117.

[20] Naughton T J, Frauel Y, Javidi B, et al. Compression of digital holograms for three-dimensional object reconstruction and recognition[J]. Applied Optics, 2002, 41(20): 4124-4132.

[21] Yamaguchi I, Matsumura T, Kato J I. Phase-shifting color digital holography[J]. Optics Letters, 2002, 27(13): 1108-1110.

[22] Hamada Y, Sato K, Morimoto M, et al. Recording and reconstruction of 3D color images of practical objects by phase-shifting holography[J]. Proceedings of SPIE, 2006, 6030: 603005.

[23] Darakis E, Naughton T J, Soraghan J J, et al. Measurement of compression defects in phase-shifting digital holographic data[J]. Proceedings of SPIE, 2006, 6311: 63110B.

[24] Cheremkhin P A, Kurbatova E A. Numerical comparison of scalar and vector methods of digital hologram compression[J]. Proceedings of SPIE, 2016, 10022: 1002227.

[25] Xing YF, KaanicheM, Pesquet-PopescuB, et al.Compression of digital holographic data[M] ∥Xing Y F, Kaaniche M, Pesquet-Popescu B, et al. Digital holographic data representation and compression. USA: Academic Press, 2016: 39- 70.

[26] Shortt A E, Naughton T J, Javidi B. Histogram approaches for lossy compression of digital holograms of three-dimensional objects[J]. IEEE Transactions on Image Processing, 2007, 16(6): 1548-1556.

[27] Naughton T J, Javidi B. Compression of encrypted three-dimensional objects using digital holography[J]. Optical Engineering, 2004, 43(10): 2233-2238.

[28] Mills G A, Yamaguchi I. Effects of quantization in phase-shifting digital holography[J]. Applied Optics, 2005, 44(7): 1216-1225.

[29] Shortt A E, Naughton T J, Javidi B. Combined nonuniform quantization and lossless coding of digital holograms of three-dimensional objects[J]. Proceedings of SPIE, 2003, 5243: 81-88.

[30] Shortt A E, Naughton T J, Javidi B. Nonuniform quantization compression techniques for digital holograms of three-dimensional objects[J]. Proceedings of SPIE, 2004, 5557: 30-41.

[31] Shortt A E, Naughton T J, Javidi B. A companding approach for nonuniform quantization of digital holograms of three-dimensional objects[J]. Optics Express, 2006, 14(12): 5129-5134.

[32] Xing YF, Pesquet-PopescuB, DufauxF. Vector quantization for computer generated phase-shifting holograms[C]∥2013 Asilomar Conference on Signals, Systems and Computers, November 3-6, 2013, Pacific Grove, CA, USA. New York: IEEE, 2013: 709- 713.

[33] Naughton T J. McDonald J B, Javidi B. Efficient compression of Fresnel fields for internet transmission of three-dimensional images[J]. Applied Optics, 2003, 42(23): 4758-4764.

[34] Darakis E, Soraghan J J. Use of Fresnelets for phase-shifting digital hologram compression[J]. IEEE Transactions on Image Processing, 2006, 15(12): 3804-3811.

[35] Darakis E, Soraghan J J. Compression of phase-shifting digital holography interference patterns[J]. Proceedings of SPIE, 2006, 6187: 61870Y.

[36] TsangP, Cheung K W K, Poon T C. Low bit-rate compression of computer-generated Fresnel holograms based on vector quantization[C]∥Digital Holography and Three-Dimensional Imaging, May 9-11, 2011, Tokyo, Japan. Washington, D.C.: OSA, 2011: DTuD1.

[37] Tsang P. Cheung K W K, Poon T C. Low-bit-rate computer-generated color Fresnel holography with compression ratio of over 1600 times using vector quantization [Invited][J]. Applied Optics, 2011, 50(34): H42-H49.

[38] Tsang P. Cheung K W K, Poon T C, et al. Demonstration of compression ratio of over 4000 times for each digital hologram in a sequence of 25 frames in a holographic video[J]. Journal of Optics, 2012, 14(12): 125403.

[39] Wallace G K. The JPEG still picture compression standard[J]. Communications of the ACM, 1991, 34(4): 30-44.

[40] SchelkensP, SkodrasA, EbrahimiT. The JPEG 2000 suite[M]. UK: John Wiley & Sons, Ltd, 2009.

[41] Onural L. Digital decoding of in-line holograms[J]. Optical Engineering, 1987, 26(11): 261124.

[42] Yoshikawa H, Tamai J. Holographic image compression by motion picture coding[J]. Proceedings of SPIE, 1996, 2652: 1-9.

[43] Shortt A, Naughton T J, Javidi B. Compression of digital holograms of three-dimensional objects using wavelets[J]. Optics Express, 2006, 14(7): 2625-2630.

[44] Kurbatova E A, Cheremkhin P A, Evtikhiev N N. Methods of compression of digital holograms, based on 1-level wavelet transform[J]. Journal of Physics: Conference Series, 2016, 737(1): 012071.

[45] Bang L T, Ali Z, Quang P D, et al. Compression of digital hologram for three-dimensional object using Wavelet-Bandelets transform[J]. Optics Express, 2011, 19(9): 8019-8031.

[46] Yang G L, Shimizu E. CGH compressed and transmitted and reconstructed system with JPEG baseline processing and Fresnel transforming technique[J]. IEEJ Transactions on Electronics, Information and Systems, 2001, 121(8): 1326-1333.

[47] Yang G L, Shimizu E. Information compressed and transmitted and reconstructed system of CGH with LOCO-I image processing and Fraunhofer transforming technique[J]. IEEJ Transactions on Electronics, Information and Systems, 2000, 120(11): 1520-1527.

[48] ZhangC, Yang GL, Xie HY. Information compression of computer-generated hologram using BP neural network[C]∥Biomedical Optics and 3-D Imaging, April 11-14, 2010, Miami, Florida, United States. Washington, D.C.: OSA, 2010: JMA2.

[49] Cheremkhin P A, Kurbatova E A. Quality of reconstruction of compressed off-axis digital holograms by frequency filtering and wavelets[J]. Applied Optics, 2018, 57(1): A55-A64.

[50] International organization forstandardization ( ISO) /International electrotechnicalcommission ( IEC) .Information technology—digitalcompression and coding of continuous-tone still images: requirements and guidelines: ISO/IEC10918-1:1994[S/OL]. Switzerland: ISO. [2019-04-03]. https:∥www.iso.org/standard/18902.html.

[51] International organization forstandardization ( ISO) /International electrotechnicalcommission ( IEC) .Informationtechnology—JPEG2000image coding system: core coding system: ISO/IEC 15444-1: 2016[S/OL]. Switzerland: ISO. [2019-04-03]. https:∥www.iso.org/standard/70018.html?tdsourcetag=s_pcqq_aiomsg.

[52] YoussefA, HeshmatS. 3D holographic compression methods for real time applications[C]∥2018 International Conference on Innovative Trends in Computer Engineering (ITCE), February 19-21, 2018, Aswan, Egypt. New York: IEEE, 2018: 136- 139.

[53] Bell T, Vlahov B, Allebach J P, et al. Three-dimensional range geometry compression via phase encoding[J]. Applied Optics, 2017, 56(33): 9285-9292.

[54] Yeom S, Stern A, Javidi B. Compression of 3D color integral images[J]. Optics Express, 2004, 12(8): 1632-1642.

[55] Darakis E, Soraghan J J. Compression of interference patterns with application to phase-shifting digital holography[J]. Applied Optics, 2006, 45(11): 2437-2443.

[56] Blinder D, Bruylants T, Ottevaere H, et al. JPEG 2000-based compression of fringe patterns for digital holographic microscopy[J]. Optical Engineering, 2014, 53(12): 123102.

[57] Bruylants T, Blinder D, Ottevaere H, et al. Microscopic off-axis holographic image compression with JPEG 2000[J]. Proceedings of SPIE, 2014, 9138: 91380F.

[58] Xing YF, Pesquet-PopescuB, DufauxF. Compression of computer generated hologram based on phase-shifting algorithm[C]∥European Workshop on Visual Information Processing (EUVIP), June 10-12, 2013, Paris, France. New York: IEEE, 2013: 172- 177.

[59] Xing Y F, Pesquet-Popescu B, Dufaux F. Compression of computer generated phase-shifting hologram sequence using AVC and HEVC[J]. Proceedings of SPIE, 2013, 8856: 88561M.

[60] Xing YF, Pesquet-PopescuB, DufauxF. Comparative study of scalar and vector quantization on different phase-shifting digital holographic data representations[C]∥2014 3DTV-Conference: The True Vision-Capture, Transmission and Display of 3D Video (3DTV-CON), July 2-4, 2014, Budapest, Hungary. New York: IEEE, 2014: 14515719.

[61] Xing Y F, Kaaniche M, Pesquet-Popescu B, et al. Vector lifting scheme for phase-shifting holographic data compression[J]. Optical Engineering, 2014, 53(11): 112312.

[62] Xing Y F, Kaaniche M, Pesquet-Popescu B, et al. Adaptive nonseparable vector lifting scheme for digital holographic data compression[J]. Applied Optics, 2015, 54(1): A98-A109.

[63] Kim S C, Dong X B, Kwon M W, et al. Fast generation of video holograms of three-dimensional moving objects using a motion compensation-based novel look-up table[J]. Optics Express, 2013, 21(9): 11568-11584.

[64] Dong X B, Kim S C, Kim E S. MPEG-based novel look-up table for rapid generation of video holograms of fast-moving three-dimensional objects[J]. Optics Express, 2014, 22(7): 8047-8067.

[65] Kwon M W, Kim S C, Kim E S. Three-directional motion-compensation mask-based novel look-up table on graphics processing units for video-rate generation of digital holographic videos of three-dimensional scenes[J]. Applied Optics, 2016, 55(3): A22-A31.

[66] BlinderD, AharA, SymeonidouA, et al. Open access database for experimental validations of holographic compression engines[C]∥2015 Seventh International Workshop on Quality of Multimedia Experience (QoMEX), May 26-29, 2015, Pylos-Nestoras, Greece. New York: IEEE, 2015: 15260774.

[67] PeixeiroJ, BritesC, AscensoJ, et al. Digital holography: benchmarking coding standards and representation formats[C]∥2016 IEEE International Conference on Multimedia and Expo (ICME), July 11-15, 2016, Seattle, WA, USA. New York: IEEE, 2016: 16266860.

[68] MurgiaF, GiustoD. A database for evaluating the quality of experience in light field applications[C]∥2016 24th Telecommunications Forum (TELFOR), November 22-23, 2016, Belgrade, Serbia. New York: IEEE, 2016: 16603192.

[69] Peixeiro J P, Brites C, Ascenso J, et al. Holographic data coding: benchmarking and extending HEVC with adapted transforms[J]. IEEE Transactions on Multimedia, 2018, 20(2): 282-297.

姜智翔, 桂进斌, 王国庆, 金晓宇. 用于三维显示的全息压缩技术概述[J]. 激光与光电子学进展, 2019, 56(24): 240001. Zhixiang Jiang, Jinbin Gui, Guoqing Wang, Xiaoyu Jin. Overview of Holographic-Compression Technology for Three-Dimensional Display[J]. Laser & Optoelectronics Progress, 2019, 56(24): 240001.

本文已被 6 篇论文引用
被引统计数据来源于中国光学期刊网
引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!