激光与光电子学进展, 2024, 61 (4): 0400006, 网络出版: 2024-02-06  

单像素成像中哈达玛基掩模优化排序前沿进展

Frontier Advances in Optimized Ordering of the Hadamard Basis Patterns Used in Single-Pixel Imaging
俞文凯 1,2,*曹冲 1,2杨颖 1,2王硕飞 1,2
作者单位
1 北京理工大学物理学院,北京 100081
2 北京理工大学先进光电量子结构设计与测量教育部重点实验室,北京 100081
摘要
单像素成像使用一系列空间光调制掩模对目标场景进行单像素亚采样,再根据掩模与测量值之间的关联重构出物体图像。这种间接获取图像的方式之所以能保证重建质量,除了有重构算法的功劳,更关键的是测量掩模的构造。随着压缩感知理论的引入,随机掩模进入人们视野,但它让测量变得盲目,缺乏针对性,而且这种掩模不便于存储和计算,极大限制了空间像素分辨率。哈达玛基掩模因其结构化特征使快速计算成为可能,且方便存储和提取,近年来得到广泛关注,已发展出诸多哈达玛基掩模优化排序方法,这些方法已被证明能大幅降低采样率。本综述系统地梳理了这类方法的设计框架和前沿进展,展望了确定性掩模构造的未来发展趋势,可为后续的研究工作提供有益的借鉴和指导。
Abstract
Single-pixel imaging applies a series of spatial light modulated patterns to subsample the target scene with the assistance of a single-pixel detector, and subsequently reconstructs the object image according to the correlation between patterns and measurements. This indirect image acquisition method ensures reconstruction quality because of the reconstruction algorithm applied, and more crucially, the measurement mask construction. With the introduction of compressed sensing theory, random patterns emerged, but making the measurements blind and lacking specificity. Such patterns fail to facilitate storage and calculation, and thus significantly limit spatial pixel resolution. Recently, Hadamard basis patterns received widespread attention owing to their structured features that enable fast computation and facilitate storage and extraction. Considering this, numerous optimized ordering methods for the Hadamard basis patterns were developed, and proven to significantly reduce the sampling ratios. This study systematically reviews the design frameworks and frontier advances of these methods, and summarizes the future development trends of deterministic pattern construction. Finally, this contribution provides a beneficial reference point including guidance for subsequent research in this specific field.

1 引言

单像素成像(SPI)是计算成像(CI)的一个重要分支,它巧妙通过测量与计算相结合的方式实现了对光场图像信息的间接获取。该技术雏形最早可以追溯至针孔成像、电视机显像、激光点扫描成像等。在器件上,单像素是指仅仅使用一个点探测器或桶探测器(积分所有像元值)来收集携带物体信息的光信号,不但降低了探测成本、提高了光通量(适用于弱光测量),还能做到谱型适应(在非可见波段优势明显)1;在原理上,SPI将光场信息从高维空间映射到低维空间,从而实现对多维信息的智能感知。其实,早在二十世纪六七十年代,Fourier2和Hadamard3-5掩模便已经被引入其中,典型应用为光学成像和光谱编解码,但需要满采样和逆变换作为信息获取的代价。随着科技的发展,SPI迎来新的春天。2008年,单像素相机(SPC)6和计算鬼成像(CGI)7先后被提出,前者立足于信息论角度,后者立足于经典赝热光鬼成像角度(一般采用激光通过毛玻璃来产生赝热光场),它们均采用可编程的空间光调制器(SLM)8来加载一系列调制掩模,以实现对光场的精确编码。需要说明的是:最初的SPC使用的是数字微镜器件(DMD,属于强度型SLM),放置于物体之后,即先成像后调制,该架构也称结构化/计算探测;而CGI使用的是液晶SLM(属于相位型SLM),放置于物体之前,即先调制后成像,该架构也称结构化/计算照明。但从数学测量模型上看:选择强度调制还是相位调制仅存在作用空间的不同,在上述两个系统中可以互通9-10;而SLM置于物体后还是物体前在本质上也是相互等价的11-13。此外,它们均利用掩模与单像素(桶)测量值(对应于物体与调制掩模的点积和,即携带物体信息的总光强)的一一对应关系进行关联计算,采用一系列可互通的算法进行信息解码重构。值得一提的是,SPC原本就建立在压缩感知(CS)理论14基础上,而后CGI也广泛使用CS算法进行图像重构15。CS给信息论带来了一场技术革命,它在已知图像信号本身稀疏或能在某个域下稀疏表示的先验知识的条件下,仅需少量单像素(桶)测量,便可完美重构出原始图像,突破了香农/奈奎斯特采样定理的限制,为SPI提供了得天独厚的优势。亚采样、超分辨、超灵敏、边压缩边采样、缓解存储与传输压力等,使得SPI迅速被应用于荧光显微16-17、激光雷达18-19、水下成像20-21、数字全息22-23、目标跟踪24-28、密钥分发29-31、太赫兹探测32-33等领域。

从信息论角度上看,SPI是典型的编解码架构:空间光调制为编码过程,而根据调制掩模和单像素(桶)测量值之间的对应关系重构图像为解码过程。解码依赖的是算法的重构性能,已发展起来的性能优秀的重构算法34-38非常多,这里不再一一赘述;而编码仰仗的是调制掩模,这是SPI的精髓和灵魂所在。近年来的研究表明,常规所使用的随机调制掩模使测量变得盲目,在每一帧调制中采集到的图像高低频分量较为均衡,在统计上呈现对半分关系,这其实并不符合人眼视觉感知物体的机理和过程。至于为何随机调制掩模在发展初期被广泛使用,原因在于随机调制掩模设计原理简单,通常可通过某种随机分布快速生成,例如高斯分布、伯努利分布、泊松分布、稀疏随机分布等14,而服从这类分布的随机调制掩模符合CS完美重建所需的受限等距特性的条件39-40。但是,这种随机调制掩模也给矩阵存储、传输和计算带来了巨大的困难,在很大程度上限制了高分辨率实时重构的实用化发展,而且随机测量缺乏针对性,在某种意义上违背了智能感知的初衷。为此,人们开始研究具有一定结构化特征的确定性掩模构造。Hadamard基掩模(由Hadamard矩阵的行经重组而形成的掩模)就是很好的选择,Hadamard矩阵本身具有很好的结构化特征和衍生规律,可递归生成,已经存在非常成熟的快速Hadamard变换形式,对于Hadamard行向量(也称基底/基)与图像拉伸后的列向量之间的向量相乘运算举重若轻,而且仅需知晓Hadamard矩阵的具体行号(基序号)便可完成上述操作,极大地方便了矩阵运算和基掩模提取,避免了大规模测量矩阵的存储,这对于高分辨率CS快速重构非常有利。对Hadamard基掩模进行排序看似是回归至几十年前的研究工作,但这里采用了亚采样和凸优化重构,区别非常明显。近年来,对于Hadamard基掩模的优化排序的研究工作遍地开花,世界各地的研究组针对这些优化排序给出了相应的成像质量分析,每种优化排序在特定的条件下卓有成效,但在设计上尚还缺乏统一的认识。总结和分析现阶段的研究进展对于本领域的发展具有重要科学意义。

鉴于此,本文从CS的约束条件出发,系统地梳理确定性掩模构造和Hadamard基掩模排序方法的设计思路和前沿进展,对现存的优化基排序和基内元素重排方法进行合理分类,探究掩模构造和智能感知的本原,讨论和展望确定性掩模构造的未来发展趋势,以期为未来的研究工作开展指明道路和提供有益借鉴。

2 单像素成像对调制掩模的约束条件

测量矩阵由一组调制掩模经重组形成,但并非所有的矩阵都适合作为SPI的测量矩阵。在基于CS的SPI中,要想近乎完美地重构物体图像信息,所采用的测量矩阵需要具备受限等距性质。本小节简要地从数学测量模型中引出这一约束条件,并讨论如何在该约束条件下设计相应的调制掩模。

2.1 单像素成像的数学测量模型

单像素压缩成像的真谛在于稀疏性。若图像信号x本身稀疏,那自然是最好的,但自然图像通常并不天然稀疏,但可以寻找到某个正交或近似正交的稀疏变换基Ψ,使其在该基下可以稀疏展开14,也即自然图像具有可压缩性,这也是常见joint photographic experts group(JPEG)有损压缩保存的图像格式所依仗的基本原理。

假设Ψ=[ψ1,ψ2,,ψN],则x=Ψx'x=i=1Nxi'ψi,其中,x'xΨ下的稀疏表示系数,维度为N×1。这里需要说明的是,信号x为由r×c原始图像矩阵I拉伸而得的列向量,其维度也为N×1N=r×c。既然系数x'为稀疏的,假设其中有K个非零元素或K个系数值相对较大的元素,则可以称x'K稀疏的,也即x'0=limp0K=1MxK'p=supp(x')=i:xi'0,1iNK,其中,范数符号的定义为xp=i=1Nxip1/pp为大于等于0的实数。接下来,为了对x进行测量,需要设计一个M×N测量矩阵A,测量模型如下:

y=Ax+e=AΨx'+e=Φx'+e,

式中:y=[y1,y2,,yM]T,为由一系列单像素(桶)测量值组成的列向量,T为转置符号,M为测量数(在CS中,M远小于N);Φ=AΨ,为联合测量矩阵;e为噪声向量。由于方程数个数远小于未知数个数,求解这样的病态欠定线性方程组时,可以采用贪心算法(l0范数)、l1范数规划、l2范数松弛、全变分(TV)优化(TV范数)等进行求解。其目标函数可以写为以下统一形式:

minx'λx'τ+η2AΨx'-y22,

式中:λη为常数,是用于平衡两个惩罚项的权重;τ涵盖了大于等于0的实数范数和TV范数。还可以根据式(2)建立增广拉格朗日目标函数,利用交替方向乘法(ADMM)来求解该优化问题。需要补充说明的是:TV算符实则是在像素域上对邻近像素的离散梯度进行求和;而测量矩阵A的每一行都可以通过元素重组变换成一帧r×c调制掩模Pi

2.2 单像素成像的受限等距性质

为了检验解的单值性(即有解且唯一),需要引入一个spark函数41,其表达式为σ=sparkΦ,表示在联合测量矩阵Φ中存在至少由σ个线性相关列组成的子集。如果式(1)有一个解x'满足x'0<sparkΦ/2,则这个解必定是最稀疏的。该证明可以采用反证法,根据spark函数的定义,满足Φ零空间(即Φx'=0)的解x'l0范数一般大于等于sparkΦ,假设存在另外一个最优解x,则根据三角不等式有x'0+x0x'-x0sparkΦ,既然已经有了一个最优解x'满足x'0<sparkΦ/2,那么另外一个解x必定存在多于sparkΦ/2个非零元素,与假设矛盾,所以得证。为了满足该条件,要求联合测量矩阵中没有M列是线性相关的,如果要确保解的单值性,解的非零元素个数KM/2。换言之,需要对稀疏表示系数(解)x'进行过采样(外部看起来是对原始信号x进行欠采样),这是CS完美重建的关键。

由于spark函数在计算时需要搜索联合测量矩阵Φ中所有列的子集,比计算矩阵的秩更为复杂。可以转而计算矩阵的互相干性μ作为替代,μΦ=max1i,jn,ijϕiTϕjϕi2ϕj2。通常需要令联合测量矩阵Φ满足1/MμΦ1,也即Φ需为正交矩阵。若采用的是近似正交的随机矩阵,下界需要修正为N-MMN-1。所以,当式(1)有一个解x'满足x'0<121+1μΦ时,则这个解必定是最稀疏的。

上述两个条件都是针对于l0范数最小化而言的,通常l1l2、TV范数能获得更佳的重建效果。这时就需要引入受限等距性质(RIP)39-40,早期也被称为一致不确定性质(UUP)42,即对于所有K稀疏的x',联合测量矩阵Φ需要满足:

1-δKx'22Φx'1+δKx'22,

式中:δK[0,1),为常数。现定义ΦF为从Φ中随机抽出列并按列序号从小到大排列所组成的子矩阵,维度为M×F,其中,F1,2,,NK阶RIP的实质是为了确保所有ΦF接近等距关系。当设计的联合测量矩阵Φ满足RIP条件且测量数M=OKlogN/KO表示阶,为计算复杂度的标识)时,能确保解的唯一性,也就是能确保稀疏解得以完美重构。研究发现,要想直接构造一个满足RIP的测量矩阵或调制掩模是非常困难的一件事,而随机矩阵能以压倒性的概率满足RIP条件,例如高斯分布、伯努利分布、泊松分布、稀疏随机分布的随机矩阵,这也是为何随机矩阵在早期被广泛用作测量矩阵的主要原因。

当仔细观察RIP的本质时,不难发现:该性质本质上是要让联合测量矩阵Φ的所有列组合子矩阵(其列数小于等于K)均近似正交,也即要求联合测量矩阵Φ的列与列之间互不相关(或者近似正交);若将联合测量矩阵Φ拆解成测量矩阵A与稀疏变换矩阵(或全变分算符)Ψ,也即要求A的任意行不能用Ψ的列组合进行线性表示,而Ψ的任意列也不能用A的行组合进行线性表示。通常情况下,稀疏变换矩阵Ψ本身正交或近似正交,因而在设计测量矩阵A时仅需让A近似正交即可。Hadamard矩阵天然正交,行与行之间或列与列之间不能互相表示,其本来就满足RIP条件,非常适合于用作SPI的测量矩阵。此外,由于DMD的微镜仅能绕中轴±12°(或±10°)翻转,所以只能加载01的非负调制掩模,而由0和1所组成的调制掩模的均值必大于0,显然连近似正交性都无法满足,更不能满足RIP条件。所以在掩模构造时一个重要的考虑就是将调制掩模的均值变为0或接近于0,这样才能尽可能地去满足近似正交性。近年来,互补测量43、互补调制44、差分测量45、连续线性微分46方法的提出,让DMD能够等效实现正负调制,弥补了器件上的缺陷。

3 哈达玛基掩模优化排序

Hadamard矩阵是由1和-1元素组成的n阶方阵,记作HnRn×n,满足HnHnT=HnTHn=nIn,其中,In为单位矩阵。所以,1nHn为标准正交矩阵,满足(1nHn)(1nHn)T=(1nHn)T(1nHn)=InHn的行列式det(Hn)=nn/2。只有当n=2或者n是4的整数倍时,Hadamard矩阵才存在。规范化Hadamard矩阵为对称矩阵,其第1行和第1列均为1。Hn的任意一行或者任意一列称为基底/基,并且该矩阵的任意两行或任意两列相互正交,其点积和为0。Hadamard矩阵在信息论、信号处理、光学成像、移动通信等领域应用非常广泛,其基底/基还可用来仿真码分多址中各个用户的扩频波形向量。若将完整的Hadamard矩阵Hn左乘于x,便是对x实施了Hadamard变换,由于Hn的元素只取1和-1,故Hadamard变换也是唯一只使用加减法的标准正交变换。而在SPI中,一般选取Hadamard矩阵的前面连续若干行组成子矩阵,作为测量矩阵,而其中的每一行均可重组为一个调制掩模。

3.1 基于空域的哈达玛基掩模优化排序

下面着重介绍在空域下的Hadamard基掩模的常规排序,并整理本领域在Hadamard基掩模优化排序中已取得的阶段性进展。

3.1.1 自然序

自然序(natural)Hadamard矩阵是最常接触到的Hadamard矩阵3-5,具有通用的递归构造公式,令n=2kk=1,2,则有

Hn=Hn/2Hn/2Hn/2-Hn/2,

其中,

H2=111-1

非规范化的Hadamard矩阵也可写成k个矩阵H2的Kronecker积形式:

Hn=Hn/2H2=H2H2k

对非规范化的Hadamard矩阵进行下三角-对角-上三角(LDU)分解的结果如图1所示。这里以H16为例(图1中第4个矩阵),L16D16U16=H16,其中,L16D16U16分别对应图1中第1、2、3个矩阵,第1个和第3个矩阵中的黑色块表示0,白色块表示1,第2个矩阵中的蓝色背景块表示0,第4矩阵中的黑色块表示-1。从图1可以直观看出,在下三角矩阵和上三角矩阵中的1均呈现出Sierpinski triangle形状,而对角矩阵的对角元恰好为Gould序列中的数值,其中,负号的分布与Thue-Morse序列中的一致。

图 1. 对1个16阶的自然序Hadamard矩阵进行下三角-对角-上三角分解,第1个矩阵为下三角矩阵,第2个矩阵为对角矩阵,第3个矩阵为上三角矩阵,第4个矩阵为16阶自然序Hadamard矩阵,黑点表示矩阵乘法

Fig. 1. Performing lower-diagonal-upper decomposition on a 16-order naturally ordered Hadamard matrix, the first, second, third and fourth matrices are the lower triangular matrix, diagonal matrix, upper triangular matrix, and 16-order naturally ordered Hadamard matrix, respectively, the black dots indicate matrix multiplication

下载图片 查看所有图片

3.1.2 顺序(沃尔什)序

顺序序(sequency)Hadamard矩阵是按自然序Hadamard矩阵中每行的±1符号改变次数的递增次序对行(基底/基)进行重新排列而获得的矩阵,该序通常也被称为沃尔什(Walsh)序。Walsh-Hadamard变换是一种快速矩阵变换,可用于某些信号处理操作的高效实现。这里需要说明的一点是,在有些文献中,也将自然序Hadamard矩阵的每一行称之为Walsh函数,而Walsh-Hadamard快速变换更多是针对顺序序Hadamard矩阵而言,在本综述中为了统一和避免歧义,Walsh序特指顺序序。

若将行内连续1或者连续-1视为连通域块,那么顺序(沃尔什)序即为行内一维连通域个数减1后的递增序。

同样以自然序Hadamard矩阵H16为例,其每行中符号改变次数为0、15、7、8、3、12、4、11、1、14、6、9、2、13、5、10,将H16的行按这些符号改变次数的递增次序排列之后,便得到了顺序序Hadamard矩阵,通过该排列能使每行符号改变次数变得连续且不间断。由自然序Hadamard矩阵变换到顺序序Hadamard矩阵也可采用比特位倒置排列外加Gray码排列的方法获得。

3.1.3 二元(佩利)序

二元序(dyadic)Hadamard矩阵是按二进制(并元)顺序进行排列的矩阵,该序也被称为佩利(Paley)序,它需要使用到Rademacher函数和二进制数。Rademacher函数是非完备的正交函数系,定义为Rn,t=signsin2nπt,其中,sign为符号函数。该序由数学家Paley利用二次剩余理论构建。

以生成的16阶二元序Hadamard矩阵为例,其每行中符号改变次数为0、1、3、2、7、6、4、5、15、14、12、13、8、9、11、10。

自然序、顺序序、二元序Hadamard矩阵之间可以根据生成规律相互转化,它们是Hadamard矩阵早期发展起来的排序,历史悠久,经久不衰。其实,它们都是完备的正交基集合,可以用来表示任意离散函数,就像三角函数(也是完备的正交函数集)可以用来表示Fourier分析中的任意连续函数一样。事实上,它们和三角函数都是希尔伯特空间中单位间隔的平方可积函数的正交基,均为有界函数系统,与Harr或者Franklin系统不同。

3.1.4 随机序

随机序Hadamard矩阵顾名思义是将上述3种序下Hadamard矩阵的行随机打乱而保持列序不变且行内元素位置不变的矩阵。

随机序Hadamard矩阵与随机矩阵相比,存在较大的不同:随机序Hadamard矩阵的行与行、列与列之间相互正交,而唯有均值为0或趋近于0的随机矩阵才能满足近似正交性。此外,随机序Hadamard矩阵在知道打乱顺序之后,可以对行进行快速提取,依然能够方便矩阵乘法转为简单的加减运算,而无需占用过多内存。

3.1.5 俄罗斯套娃序

俄罗斯套娃序(RD)Hadamard矩阵47是由北京航空航天大学的孙鸣捷研究组于2017年提出的,主要基于每个Hadamard矩阵均包含了次低阶Hadamard矩阵的像素缩放版本的原理。其生成步骤较为复杂,如图2所示,具体而言,首先需要将自然序Hadamard矩阵H2k的行重排,分为4个区间,使得其前1/2行恰好为次低阶Hadamard矩阵H2k-1的行(比例缩放为原来的1/2),而其前1/4行(全部落在第一个区间)恰好为次次低阶Hadamard矩阵H2k-2的行(比例缩放为原来的1/4),而其前1/8行恰好为次次次低阶Hadamard矩阵H2k-3的行(比例缩放为原来的1/8),以此类推。这里的比例缩放可以理解为对由行重组后的调制掩模进行像素级缩放。其次,基于Hadamard矩阵的对称性,在Hadamard矩阵的后1/2行里总能找到与第2区间的基掩模恰好是转置关系的基掩模所对应的行,将这些行放置在每一层的第3区间,其余行放置在每一层的第4区间,这样整体形成一个递归关系。基掩模的转置其实可以理解为Hadamard矩阵的行向量按行或者按列重组成基掩模。最后,对每一递归层的每个区间里的基掩模按二维连通域个数递增序进行分组内部排列。这里的二维连通域与前文所述的一维连通域交相呼应,所谓一维连通域是指尚未重组为基掩模的行的内部的连续1或者-1的一维区块,而所谓二维连通域是指基掩模内部上下左右相邻像素为同一像素值所连成的二维区块。从光学相干角度上去理解,调制掩模的连通域区块大小实际对应于调制掩模中散斑相干面积,区块越大则散斑相干面积越大,所以连通域个数的递增实际对应于散斑相干面积的递减。根据上述步骤便能生成俄罗斯套娃序Hadamard矩阵,该过程实则采用了递归分组与组内重排相结合的思想。

图 2. 对16阶自然序Hadamard基掩模进行俄罗斯套娃排序47

Fig. 2. Performing Russian dolls sorting on 16-order naturally ordered Hadamard basis patterns[47]

下载图片 查看所有图片

3.1.6 折纸序

折纸序Hadamard矩阵48于2019年被提出,主要基于对称反翻折、轴对称和部分序调整的思想。具体如图3所示,以4个调制掩模为1组:首先,在第1组中,由1个2×2的全1矩阵出发,作为该组第1个调制掩模,然后对该调制掩模分别进行上下反对折、左右反对折、同时上下左右反对折(所谓反对折是指令对称位置处的元素为对应位置元素的反向/互补副本),获得的掩模即为该组第2、3、4个调制掩模;其次,第2组的第1个调制掩模以整体序列中的第2个调制掩模为模板,将该模板放置于1个横纵坐标像素维度放大2倍的全0矩阵的左上角位置(占据全0矩阵的1/4),再实施上下左右轴对称操作(也即副本轴对称复制),其结果作为该组第1个调制掩模,该组的第2、3、4个调制掩模是通过将该组第1个调制掩模同样进行上下反对折、左右反对折、同时上下左右反对折操作获得的;同样地,第i组的第1个调制掩模是以整体序列的第4i-3个调制掩模为模板生成的,以此类推;鉴于每组的第2个和第3个调制掩模分别采用的是上下和左右反对折,先后次序可互换,存在一种递归规律使得仅需对少量组内的第2个和第3个调制掩模进行位置对,调便可使每组内的调制掩模的二维连通域个数呈现递增关系。经过上述步骤便生成了最终的基于折纸的调制掩模,而这些调制掩模两两正交,由这些完备的调制掩模所组成的测量矩阵恰好构成一种新序排列的Hadamard矩阵,该序便被称为折纸序。该设计思想源于中国古老的折纸艺术,反对折和轴对称可统称为翻折,其实和顺序序中的符号改变有着千丝万缕的联系。该折纸序实际也采用了分组与组内重排相结合的思想,但分组相比俄罗斯套娃序更加精细化,有助于实现精细化精准测量。

图 3. 折纸序生成过程。(a)折纸序的生成规则;(b)按照图3(a)所得到的掩模结果

Fig. 3. Generation process of the origami ordering. (a) Rules for generating origami ordering; (b) the mask results obtained according to Fig. 3 (a)

下载图片 查看所有图片

3.1.7 切蛋糕序

切蛋糕(CC)Hadamard矩阵49同样在2019年提出,是通过直接按照自然序Hadamard基掩模的二维连通域个数递增次序对自然序Hadamard矩阵的行进行重新排列得到的,如图4所示。实验数据表明,采用切蛋糕序Hadamard矩阵能将采样率最高降低至0.2%,压缩效率和性能提升非常显著。该研究工作还给出了顺序序Hadamard基掩模二维连通域个数与基掩模索引(位次)之间的逻辑规律,使得顺序序与自然序可以轻松相互转换,即无需计算基掩模连通域个数便能极速生成切蛋糕序。此外还给出了根据序号快速提取Hadamard基掩模的方法,该方法同样适用于其他序的Hadamard基掩模的快速提取,并提供了基于图论的快速图像重构方法。

图 4. 对16阶自然序Hadamard基掩模进行切蛋糕排序49

Fig. 4. Performing cake-cutting sorting on 16-order naturally ordered Hadamard basis patterns[49]

下载图片 查看所有图片

前文已述,顺序序为自然序Hadamard矩阵的行内一维连通域个数减1后的递增序(其实减1操作对排序无影响,这里仅为了严谨起见),可简称为一维连通域序。那么,切蛋糕序便是自然序Hadamard矩阵的基掩模二维连通域个数的递增序,可简称为二维连通域序。一维连通域序更适合于一维信号处理,二维连通域序则适合于二维光学成像。所以,切蛋糕序与顺序序对于Hadamard矩阵同样重要。

不难发现,切蛋糕序完全摒弃了分组思想,属于直截了当的排序方式。切蛋糕序也符合人眼视觉的感知。当基掩模连通域个数少的时候,意味着对图像低频信息进行采样,当基掩模连通域个数多的时候,意味着对图像高频信息进行采样,调制掩模由粗到细等价于视觉由模糊逐渐变得清晰的过程。在某种程度上,切蛋糕序与小波树自适应压缩成像50-51的思想不谋而合。与切蛋糕序类似的排序还有4连通优化序52

3.1.8 多分辨率管线序

多分辨率管线序Hadamard矩阵53-55是在2020年提出的,它是在俄罗斯套娃序、折纸序和切蛋糕序的基础上演变而来的。首先建立Hadamard管线编码器(PE),它由4个变换规则组成:

HPE:,:,i=HPE:,:,1=+H+H+H+HHPE:,:,2=+H+H-H-HHPE:,:,3=+H-H+H-HHPE:,:,4=+H-H-H+H

式中:i=1,2,3,4。令起始矩阵H11,1,1=1,则H22,2,1=1111H22,2,2=11-1-1H22,2,3=1-11-1H22,2,4=1-1-11。由于第2层的第1个矩阵生成结果为全1矩阵,与上一层的H11,1,1=1仅存在维度上的变化,属于冗余矩阵,需要丢弃,因为它的后续层作用结果同样为扩维版的全1矩阵。所以到第3层,仅需对第2层的后3个矩阵分别作用4次,可得到12个矩阵;到第υ层,则有Hυ(2υ-1,2υ-1,i)i=1,2,3,4,该层能得到3×4υ-2个矩阵。生成矩阵的总数M=1+3×40+3×41+3×42++3×4υ-2=4υ-1=22(υ-1),恰好为Hadamard基掩模的总数。按照此方法生成的掩模经相应维度放大(可通过矩阵直积获得)后便是高阶的Hadamard基掩模,每帧掩模拉伸为行向量拼接在一起便组成了多分辨率管线序Hadamard矩阵,如图5所示。

图 5. 多分辨率管线序Hadamard基掩模的生成过程55。(a)从自然序Hadamard矩阵的行通过重组转为Hadamard基掩模的过程,(a1)~(a4)1×64、4×64、16×64和64×64像素的自然序Hadamard矩阵行转化为基掩模的过程;(b)利用Hadamard管线编码器生成多分辨率管线序Hadamard基掩模的过程

Fig. 5. Generation process of multi-resolution pipeline ordered Hadamard basis patterns[55]. (a) The process of reshaping the rows of naturally ordered Hadamard matrix into the Hadamard basis patterns, (a1)‒(a4) the processes of reshaping the rows of naturally ordered Hadamard matrix of size 1×64, 4×64, 16×64, and 64×64 pixels into the Hadamard basis patterns, respectively; (b) the process of generating multi-resolution pipeline ordered Hadamard basis patterns by applying the Hadamard pipeline encoder

下载图片 查看所有图片

此外,PE也可用来直接生成俄罗斯套娃序。若将俄罗斯套娃序视为从高阶到低阶的递归,那么多分辨率管线序便是从低阶到高阶的演化。而且PE的矩阵操作类似于折纸序中的副本复制、副本反转的操作,有着异曲同工之效。采用与多分辨率管线序Hadamard基掩模类似构造方法的还有Gao-Boole掩模56

3.2 基于频域的哈达玛基掩模优化排序

既然存在Hadamard基掩模的空域优化排序,必然也存在Hadamard基掩模的频域优化排序。下面重点介绍在频域下的Hadamard基掩模优化排序方法和已取得的进展。

3.2.1 离散余弦变换序

离散余弦变换序Hadamard矩阵最早是由中国航天科技集团有限公司量子工程研究中心李明飞研究小组57于2019年提出的,主要对每帧Hadamard基掩模(从任意序出发均可,对排序结果无影响)进行离散余弦变换,求其l1范数作为度量标准,按此度量标准的递增序对Hadamard矩阵的行进行重排,最终形成离散余弦变换序Hadamard矩阵,使得基掩模呈现由低频到高频的顺序排列。值得一提的是,这里的l1范数很显然可以推广到其他范数形式,排序结果仅会出现细微的差别。

3.2.2 小波变换序

小波变换序Hadamard矩阵同样是由李明飞研究小组57于2019年提出的,基于与离散余弦变换序相同的原理,即对每帧Hadamard基掩模(从任意序出发均可)进行小波变换,再求其l1范数作为度量标准,然后按此度量标准的递增序对Hadamard矩阵的行进行重排,最终形成小波变换序Hadamard矩阵,其基掩模同样呈现由低频到高频的顺序排列。范数的选择不局限于l1范数,而小波变换可选择harr、db、sym、coif、bior、rbio、dmey、fk、bl、mb、beyl、vaid、han等小波变换中的任意一种(这份工作只分析了harr和db小波变换),小波层数也可任意。

针对二维调制掩模Pi,若小波变换核是可分离且对称的,分离后的一维变换核是实正交的,那么二维小波变换可写成wPiwT的矩阵形式,w为分离后的一维小波变换矩阵,对Pi左乘w和右乘wT分别对应于列变换和行变换(这与二维离散Fourier变换的行列可分离性类似),通过此法也可计算每帧Hadamard基掩模的小波系数和,即求l1范数。这是重庆大学的杨帆研究小组58于2020年所采用的小波系数度量标准方案。然后,按照小波系数和的递增次序对自然序Hadamard矩阵的行进行重新排列。其实,该方案与李明飞研究小组的小波变换序方案在原理思想上相同,在公式表达上等价,只是换了二维小波的矩阵表示形式。

3.2.3 离散傅里叶变换序

傅里叶变换序Hadamard矩阵与前文所述的离散余弦变换序、小波变换序Hadamard矩阵类似,也是由重庆大学的杨帆研究小组58于2020年提出的,只是将小波变换替换为二维离散Fourier变换。首先,求得每个自然序Hadamard基掩模的离散Fourier变换系数和,也即计算离散Fourier变换系数的l1范数;然后,按照离散Fourier变换系数和的递增次序对自然序Hadamard矩阵的行进行重新排列,以获得傅里叶变换序Hadamard矩阵,如图6所示。

图 6. 对16阶Hadamard基掩模进行二维离散Fourier变换,方格图为Hadamard基掩模,其下方为与之对应的Fourier频谱图59

Fig. 6. Performing two-dimensional discrete Fourier transform on 16-order Hadamard basis patterns, the grid sub-figures are the Hadamard basis patterns and the corresponding Fourier spectrum images are given below them[59]

下载图片 查看所有图片

此外,葡萄牙科英布拉大学的Vaz等59于2022年提出一种改进的傅里叶变换序,称之为标尺递增序(AS)。该序同样基于对每个自然序Hadamard基掩模所做的二维离散Fourier变换,计算其主频率(峰值频率)中心到频域原点(0,0)之间的欧几里得距离。然后,按照该欧几里得距离的递增次序对自然序Hadamard矩阵的行进行重新排列,以获得标尺递增序Hadamard矩阵。计算欧几里得距离的方法非常巧妙,相比于盲目计算离散Fourier变换系数和,更加具有针对性,主要在于灵活利用了Hadamard基掩模在二维离散Fourier变换下其主频聚集为圆斑状在频域空间游走的特征。

3.2.4 全变分序

全变分序Hadamard矩阵同样是由重庆大学的杨帆研究小组60于2020年提出,核心在于将光学变换替换为TV算符,也即计算自然序Hadamard基掩模Pi的TV梯度和,然后按照TV梯度和的递增次序对自然序Hadamard矩阵的行进行重新排列,以获得全变分序Hadamard矩阵。其中,TV算符需要计算基掩模每个像素在横轴和纵轴方向上的像素变化方差,再求和开根号,作为TV梯度。采用全变分序Hadamard矩阵的成像性能与切蛋糕序Hadamard矩阵非常接近,在选择特定待测目标时,全变分序的性能表现略优60

3.2.5 索引序

索引序Hadamard矩阵61与之前的各种变换序不同,通过计算顺序序Hadamard基掩模的行列一维连通域个数(称作行列索引)的乘积或lp范数(前文已定义),作为度量标准,再按该度量标准的递增序对顺序序Hadamard矩阵的行进行重排,最终形成索引序Hadamard矩阵。其核心思想在于,无论顺序序Hadamard矩阵的每一行是按行还是按列重组为基掩模的,该基掩模内的任意一行或任意一列的一维连通域个数均固定不变,可作为固定的行列索引来标识该基掩模的结构化特征。其实,该方法采用任意序Hadamard矩阵作为起始都是无差别的,因为每个基掩模的特征是固定不变的。令行列索引分别为ij,将Hadamard基掩模按行列索引从小到大排列成一个大方阵(与利用Gray序列排列生成的大方阵完全一致,ij的颠倒会导致大方阵的矩阵转置),然后,所采用的度量标准可定义为

fdi,j=ij,d=0id+jd1/d,d0,

式中:d一般为实数,但当d=+时,f+i,j=maxi,j,当d=-时,f-i,j=mini,j。需要说明的是,当d=0时,f0i,j=ij,相当于Hadamard基掩模的行列一维连通域个数的乘积,结果即为二维连通域个数,此时,该序为切蛋糕序。

其实,从原理上看,该索引序也可适用于其他完备的正交基底(例如离散余弦变换基、离散Fourier变换基等)的排序。

3.2.6 灰度共生矩阵对比度序

灰度共生矩阵对比度序是由葡萄牙科英布拉大学的Vaz等59于2022年提出的,如图7所示,主要基于灰度共生矩阵(GLCM)的对比度特征量(即惯性),所以该序也被称为惯性递增序(AI)。我们知道,一幅图像的纹理是由反复在空间位置出现的灰度分布表现出来的,而空间相隔一定距离的两个像素之间必然存在一定灰度关系,而灰度共生矩阵便是用来研究这种灰度空间相关特性的有效手段。为了生成灰度共生矩阵,首先需要将自然序Hadamard基掩模中的-1值替换为0,然后计算第i个01基掩模的灰度共生矩阵,采用0°、45°、90°和135°的4个方向,偏置设为1,再计算该灰度共生矩阵gθ(s,t)的对比度:

图 7. 16阶灰度共生矩阵对比度序(惯性递增序)Hadamard矩阵,该矩阵行序号对应于原始自然序Hadamard矩阵行号59

Fig. 7. 16-order gray-level co-occurrence matrix contrast (ascending inertia) ordered Hadamard matrix, the row indices of this matrix correspond to the row numbers of naturally ordered Hadamard matrix[59]

下载图片 查看所有图片

Ci=14θ=0°135°s=1rt=1cs-t2gθ(s,t)Nθ ,

式中:stgθ(s,t)的像素坐标;Nθgθ(s,t)的像素和。GLCM的对比度是用来度量矩阵中的取值分布和局部变化程度的重要纹理特征量,用在这里能够反映01基掩模的清晰度和纹理的沟纹深浅。对比度值越大,表明纹理的沟纹越深(表现为线条越细),基掩模越精细;对比度值越小,则纹理的沟纹越浅(表现为线条越粗),基掩模越粗放。在计算完所有01基掩模的GLCM对比度之后,再按对比度的递增次序对自然序Hadamard矩阵的行进行重新排列,以获得灰度共生矩阵对比度序Hadamard矩阵。

4 哈达玛基掩模内部像素排列

除了对Hadamard基掩模进行排序外(此时每个基掩模内部不发生改变),还可以进而对基掩模的内部像素进行重排,这其实也是改变由Hadamard矩阵的行到基掩模的像素重组/填充方式。下面具体介绍几种常见的Hadamard基掩模内部像素排列方法。

4.1 行、列主序排列

行主序(row-major order)和列主序(column-major order)是重要的矩阵存储方式,其存储顺序表明矩阵是如何线性存储的。而在哈达玛基掩模像素排序中,行主序和列主序也是经常采用的重要手段,能高效将Hadamard矩阵的行(行元素序列)依次填充入Hadamard基掩模之中:行主序是指以基掩模的行为优先单位,逐行填充排列;列主序是指以基掩模的列为优先单位,逐列填充排列。采用何种主序的填充方式对于基掩模和重构图像需要保持一致。

4.2 Zigzag排列

Zigzag也是一种非常重要的矩阵排列方式,也被称为之字形排列,如图8所示。从初始位置开始,先水平向右滑动一个像素,再沿着反对角线方向左下滑动,当遍历到矩阵左边边缘时则行号加1,接着改为向右上方向滑动,当遍历到矩阵上边缘时列号加1,再接着改为向左下滑动,直至包括反对角线在内的上三角全部遍历完,再根据当前行号和列号索引位置来判断延伸方向。在下三角遍历时,碰到矩阵右边缘则行号加1,再方向转向,碰到矩阵下边缘则列号加1,再方向转向,直至所有位置遍历完。由Hadamard矩阵的行到基掩模的填充就可以采用Zigzag方式。

图 8. Zigzag排列。(a)Zigzag的遍历顺序;(b)由Hadamard基掩模根据每帧掩模的行列索引所组成的大方阵;(c)按照Zigzag遍历在图8(b)中提取到的Hadamard基掩模

Fig. 8. Zigzag alignment. (a) The traversal order of Zigzag; (b) the big square matrix consisting of the Hadamard basis patterns according to the row and column indexes of each pattern; (c) the Hadamard basis patterns extracted from Fig. 8 (b) by using Zigzag traversal

下载图片 查看所有图片

若将Hadamard基掩模按照前文索引序中提及的行列索引排布成(或按照Gray码序列62生成)一个大方阵,则可利用Zigzag对该方阵中的Hadamard基掩模进行提取,形成Zigzag序63,这也是一种非常高效的基掩模优化排序方式。这里作为对前两个章节的技术补充。

4.3 蛇形排列

蛇形排列(也称方形扫描)与Zigzag排列非常类似,只是将斜向游走改变为折向游走,如图9所示。具体而言,从初始位开始,先水平向右游走1个步进单位,再向下游走1个步进单位,而后折返向左游走1个步进单位,若碰到矩阵左边缘则垂直向下游走1个步进单位,接着再向右游走2个步进单位(跨过之前已走的区域),然后垂直向上游走2个步进单位,若碰到矩阵上边缘则改为向右游走1个步进单位,依此类推;若向右行进遇到矩阵右边缘则改为垂直向下行进,若向下行进遇到矩阵下边缘则改为水平向左行进。从排列方式上看,相同掩模采用蛇形排列仅比Zigzag排列略微向右下方扩散一些,对成像结果的影响微乎其微;但不同结构的掩模采用蛇形排列还是Zigzag排列需要具体问题具体分析,结果会有所不同。

图 9. 蛇形排列6264。(a)蛇形遍历顺序;(b)(c)Hadamard基掩模大方阵和Hadamard基掩模蛇形提取方案

Fig. 9. Snake alignment[62,64]. (a) The snake traversal order; (b) (c) the big square matrix and the snake extraction strategy of the Hadamard basis patterns, respectively

下载图片 查看所有图片

类似地,若将Hadamard基掩模按照前文索引序中所提及的行列索引排布成一个大方阵,那么也可利用蛇形排列对该大方阵中的Hadamard基掩模进行提取,形成蛇形排列序6264

4.4 视觉焦点扩散排列

动物的视觉系统其实并不是在所有视觉区域都是等分辨率的,一般会存在聚焦中心,在聚焦中心部分的分辨率最高,中心向周围扩散其分辨率逐步降低。当眼睛扫视视场时,一般会对整个视场进行持续监控,通过眼球转动逐步将视觉中心区域聚焦到感兴趣目标之上,以获得高分辨率辨识。而Hadamard基掩模内部像素的视觉焦点扩散排列65-66便是受到上述原理的启发,在用自然序Hadamard矩阵的某一行对单帧调制掩模矩阵进行填充时,需要先将调制掩模矩阵进行笛卡尔像素规模放大。若以H1024为例,每一行的维度为1×1024,设像素分辨率均匀分布的调制掩模的像素规模为1024(32×32),为了非等像素分辨率填充,那么在低分辨率像素区域中一个像素单元需要占据更多的实际像素,也即调制掩模的像素规模必须扩充,这里不妨扩大4倍,变为4096(64×64)。然后,需要将该扩维矩阵进行网格化划分,分成刚好1024个网格,使得视焦圆形区域的分辨率均为1×1,视焦圆往外的区域根据半径和角度进行不等分辨率划分。当划分结束后,对网格由内向外螺旋编号,按照顺序将自然序Hadamard矩阵的行元素依次填入,直至填满,如图10所示。

图 10. 基于视觉焦点扩散排列的单像素成像66。(a)均匀32×32网格;(b)完备1024阶Hadamard矩阵行按照图10(a)中均匀网络重塑所获得的1024帧Hadamard基掩模;(c)实验上采用了均匀排列掩模的猫图重建结果;(d)空间变分辨率像素网格,包含1024个变化大小的像素元胞,视焦区域像素遵循直角坐标网格,视焦外围像素遵循圆形极坐标网格;(e)根据图10(d)中空间变分辨率网格重组的1024帧Hadamard基掩模例子;(f)对相同场景使用图10(e)中空间变分辨率掩模的重建结果

Fig. 10. Single-pixel imaging based on the diffusion arrangement from visual fovea[66]. (a) a uniform 32×32 grid; (b) 1024 Hadamard basis patterns acquired by reformatting the rows of 1024-order Hadamard matrix onto the uniform grid shown in Fig. 10 (a); (c) the experimentally reconstructed image of a cat by using the spatially uniformly aligned patterns; (d) spatial variable resolution pixel grid, containing 1024 pixel cells of varying sizes, the pixels in the focus area follow a Cartesian grid, while the pixels in the periphery of the focus follow a circular polar grid; (e) examples of 1024 Hadamard basis patterns reshaped onto the spatially variant grid shown in (d); (f) the reconstructed result of the identical scene using the spatially variant patterns shown in Fig. 10 (e)

下载图片 查看所有图片

若采用全采样,可直接通过矩阵求逆重构图像信息;若采用亚采样,则可通过压缩感知算法恢复图像信息。鉴于图像重建过程中处理的都是矩阵,一种方案是根据填充好的调制掩模进行图像重构,但会涉及拓扑形变、大规模矩阵存储与计算;另一种方案是直接根据原始Hadamard基掩模(也即采用原始Hadamard矩阵)进行重构,再将重建像素值按视觉焦点扩散排列填回扩充矩阵,这样既保留了Hadamard矩阵的快速计算能力,又节省了存储空间。

视焦区域也可进行视场扫描,类似于眼球的转动,这样在低分辨率区域通过扫描过程中的交叠能进一步提高该区域的清晰度,这可通过加权平均实现。

视觉焦点扩散排列方法一经提出,就引发了研究者们的广泛关注67-72。值得一提的是,该方法引申出一种基于主成分分析的空域变分辨率优化方案72,即让视焦区域不再是简单横竖网格状分布,而更加具有结构性特征。

5 确定性掩模构造的思考

首先,对前文所涉及的方法进行系统梳理和总结,结果如表1所示。图11为采用不同空域优化排序的16 阶Hadamard 矩阵比较。

图 11. 采用不同空域优化排序的16阶Hadamard矩阵比较。(a)~(f)16阶自然序、顺序序、俄罗斯套娃序、折纸序、切蛋糕序和多分辨率管线序Hadamard矩阵

Fig. 11. Comparison of 16-order Hadamard matrices by using different spatially optimized orders. (a)‒(f) 16-order naturally, sequency, Russian dolls, origami, cake-cutting, multi-resolution pipeline ordered Hadamard matrices, respectively

下载图片 查看所有图片

葡萄牙科英布拉大学的Vaz等73在比较了多种基于空域的Hadamard基掩模优化排序方法的性能之后指出:当采样率为10%时,切蛋糕序的成像性能力压其他空域序,表现最佳;当采样率进一步缩减时,切蛋糕序有着更好的优势;当采样率提升至50%以上时,切蛋糕序与顺序序的成像质量趋于一致。其原因在于顺序序Hadamard矩阵的前一半行呈现出较强的结构特征,会使得重构图像出现伪影和拖影,使得图像模糊,图像质量退化,而切蛋糕序能很好地规避这个问题49;此外,顺序序更适合于一维信号重建。

表 1. Hadamard基掩模优化排序和基内像素排列方法

Table 1. Hadamard basis pattern optimized ordering and within-pattern pixel alignment methods

CategoryMethodDesign ideaFeature description
Space domainNatural orderRecursionOriginal order
Sequency orderNumber of sign changes within each basisIncremental order of the number of 1D connected domains
Dyadic orderRademacher function and binary numbersBased on binary numbers
Random orderRandomly disrupt the basesNot random within each pattern
Russian dolls orderRecursive grouping and inclusionGrouping + 2D connected domains
Origami orderSymmetrical reverse folding,axial symmetry,and partial order adjustmentFiner grouping + 2D connected domains
Cake-cutting orderCounting the number of 2D connected domainsIncremental order of the number of 2D connected domains
Multi-resolution pipeline orderUsing the pipeline encoderEvolution of grouping
Frequency domainDiscrete cosine transform orderPerforming discrete cosine transformTransform + norm
Wavelet transform orderPerforming wavelet transformTransform + norm
Discrete Fourier transform orderPerforming discrete Fourier transformTransform + norm
Total variation orderCalculating total variationTotal variation(norm)
Index orderDesigning index functionIndex function
Gray-level co-occurrence matrix contrast orderUtilizing gray-level co-occurrence matrixTextural feature of basis patterns
Within-pattern pixel alignmentRow-major or column-major alignmentHorizontal and vertical linesIsometric resolution
Zigzag alignmentSlanting linesIsometric resolution
Snake alignmentFolded linesIsometric resolution
Visual fovea diffusion arrangementSpiraling outwards from visual foveaSpatially variant pixel grid with multi-resolution

查看所有表

在基于频域的Hadamard基掩模优化排序中,排序的设计思路都是类似的,即计算Hadamard矩阵行或基掩模的某种特征量,而计算过程可视为一种特定的函数变换或者函数算符。以Hadamard基掩模的灰度共生矩阵为例,可计算的特征量其实并不局限于对比度一种,现存的物理量还有能量、熵、逆方差、相关性等,均可用来表征基掩模的纹理特征,作为度量标准也是合适的。其他的变换也类似,同样存在其他的特征量,求变换系数的lp范数其实是最粗暴直接的方式,缺乏对Hadamard基掩模结构化特征的充分利用。

关于基掩模内部像素排列,本综述仅列举了最广为人知的方法,也最具代表性。其实,基掩模内部像素排列完全可以根据不同应用场景的需要进行特殊设计。行、列主序、Zigzag是最常用的排列重组方式;而眼球聚焦排列从另一个角度验证了基掩模是一个拓扑体,其形变在特殊应用场景中能帮助更好捕捉物体图像信息。

此外,上述许多基掩模排序方法和内部像素排列策略也不仅仅只适用于Hadamard基掩模,同样也可以适用于其他正交基掩模,前文已经给出了相关的例子。例如,对于Fourier基掩模,英国的伦敦帝国理工学院Yuan等74也指出可以根据训练图像的平均谱和单像素(桶)测量值的反馈确定出Fourier基掩模的调制次序,以降低采样率。

目前流行的深度学习技术也可用于SPI中测量矩阵的训练生成75-76,能在一定程度上降低采样率,虽然训练需要耗费大量时间,但是图像重构非常迅速。其缺点在于,通过网络映射训练出来的调制掩模在值分布上往往呈现出流体块状,类似于湍流的团状和絮状,而且在每次训练迭代时需要将测量矩阵强行二值化以适用于DMD的加载,其训练本身不具有太多的物理意义。所以,需要进一步研究物理驱动为主、数据驱动为辅的智能感知方案。

6 总结与展望

基于CS的SPI中的掩模构造需要满足RIP条件,而由掩模所组成的测量矩阵在传输、存储和相关计算方面的困难往往是需要密切关注的重点,在高分辨率实时成像任务中,这些因素对成像性能的影响尤为显著。Hadamard矩阵具有正交性和非常强的结构化特征,能很好满足RIP条件;每帧Hadamard基掩模可通过算法快速提取,免去了巨量数据传输和存储的困扰;而且Hadamard基掩模与目标图像的点积也可轻松转化为加减运算,极大地方便了矩阵计算。因而,Hadamard基掩模与SPI高度契合,掀起了一场研究热潮。

鉴于此,本综述总结梳理了两大类Hadamard基掩模优化排序方法:空域优化排序和频域优化排序,还梳理了Hadamard基掩模内部像素排列方法。

首先,在空域优化排序中,经典的排序有自然序、顺序序、二元序和随机序。其中:顺序序和二元序都是对自然序的衍生排序,前者通过比特位倒置排列和Gray码排列生成,后者则通过Rademacher函数和二进制数生成;而随机序是对行序的随机打乱,与传统的纯随机矩阵有别,具体体现在没有破坏基掩模的正交性,但依然缺乏对目标采样的针对性。近年来发展起来的俄罗斯套娃序、折纸序、切蛋糕序和多分辨率管线序均建立在SPI所需的二维掩模基础上,继承了压缩采样特征。尤其需要指出的是:俄罗斯套娃序采用的是逆向递归生成思想,而多分辨率管线序采用的是正向演化生成思想;顺序序是Hadamard行向量一维连通域个数递增序,而切蛋糕序为Hadamard基掩模二维连通域个数递增序;折纸序与多分辨率管线序中的PE均用到了对低阶Hadamard基掩模的副本复制和反转。从宏观上看,俄罗斯套娃序、折纸序和多分辨率管线序均使用了分组和连通域个数递增相结合的思想,而顺序序和切蛋糕序实质上均采用了贪心算法,即直接对连通域个数进行排序。连通域个数变多,等效于连通域/散斑变小,实际上就是让调制掩模分辨率/精度由粗变细。为了达到全局最优,在未来的研究中需要综合考虑分组和多分辨率,充分利用Hadamard基结构化特征,从掩模构造角度提高感知的智能性。

其次,在频域优化排序中,主要介绍了离散余弦变换序、小波变换序、离散傅里叶变换序、全变分序、索引序和灰度共生矩阵对比度序。前3种为变换序,即采用某种矩阵变换,然后计算泛函作为度量标准进行排序。全变分序与前3种序不同,它没有计算矩阵变换,而是直接计算Hadamard基掩模的全变分梯度(等效于泛函),并将其作为度量标准进行排序。索引序则设计了一个函数来对由Hadamard行列索引所生成的Hadamard基掩模大方阵进行索引排序,实现从低频到高频的采样。该索引函数可以是关于Hadamard行列索引的任意一般函数f(i,j),包括了单项式形式、多项式形式、幂次形式、对数形式、函数变换形式、泛函形式等,可以衍生出无数变体。灰度共生矩阵对比度序直接计算Hadamard基掩模的灰度共生矩阵对比度,并以此作为度量标准进行排序,其成像效果与切蛋糕序接近,在高采样率下表现略好。所以,这些序都是从频率角度出发,通过计算某个参数进行贪心排序的。

再次,在Hadamard基掩模内部像素排列中,行列主序最为常见,Zigzag和蛇形排列次之,它们都是将Hadamard行向量的元素按某种规则填充入像素网格以形成基掩模矩阵的,在基掩模矩阵中每个相同分辨率的像素元胞对应Hadamard行向量中的一个元素,这一填充过程其实就是矩阵存储。而在视觉焦点扩散排列中,填充次序变为从视焦向外螺旋扩散次序,在被填入元素的掩模矩阵中的每个元胞根据所在的视觉区域划分不同分辨率,在视焦区域的分辨率越高,在视焦周围区域的分辨率越低,这更加契合人眼对物体的感知,提供了很好的基掩模内部像素排列范例。

综合考虑当下技术瓶颈和研究现状,本综述分析总结了未来SPI确定性掩模构造的发展趋势,以供本领域学者借鉴和参考。

1)空域优化排序向着多尺度结构化特征发展。Hadamard基掩模空域优化排序需要更多地考虑Hadamard矩阵的结构化特征,深入研究其结构规律,提出新型衍生规律。科研工作者可以从Gray码出发研究二进制,发展掩模构造方法。在排序过程中,需要充分考虑分组和连通域个数递增策略,两者同样重要,需要将两者有机结合起来。空域优化排序的未来研究趋势必然向着空间多尺度(多层级)结构化掩模构造方向发展,这一发展规律同样适用于其他正交基掩模的排序。

2)频域优化排序向着多维度特征量交叉融合发展。Hadamard基掩模频率优化排序在引入频率算子时,算子选择过于单一,排序粗暴。而基掩模的频率特征量有许多个,在具体排序时,可以将多维度的特征量进行综合考量,建立完善的加权度量标准,以丰富排序的维度,将频域贪心排序变为全局最优排序。

3)基掩模内部像素排列向着空时变分辨率发展。Hadamard基掩模内部像素排列由空间定分辨率到变分辨率,可以换来视觉聚焦效果,这是历史发展的必然。而内部像素排列实为矩阵存储方式,矩阵存储除了二维存储还有三维存储、多维存储,其中,三维存储便是扩展至空时维度,即在二维掩模基础上增加纵向时域维度的排列。因此,我们预测Hadamard基掩模内部像素排列将向着空时变分辨率发展。

参考文献

[1] Yu W K, Liu X F, Yao X R, et al. Single-photon compressive imaging with some performance benefits over raster scanning[J]. Physics Letters A, 2014, 378(45): 3406-3411.

[2] BracewellR N. The Fourier transform and its applications[M]∥McGraw-Hill series in electrical engineering, networks and systems. 2nd ed. New York: McGraw-Hill, 1986.

[3] Pratt W K, Kane J, Andrews H C. Hadamard transform image coding[J]. Proceedings of the IEEE, 1969, 57(1): 58-68.

[4] Sloane N J A, Harwit M. Masks for Hadamard transform optics, and weighing designs[J]. Applied Optics, 1976, 15(1): 107-114.

[5] Swift R D, Wattson R B, Decker J A,, et al. Hadamard transform imager and imaging spectrometer[J]. Applied Optics, 1976, 15(6): 1595-1609.

[6] Duarte M F, Davenport M A, Takhar D, et al. Single-pixel imaging via compressive sampling[J]. IEEE Signal Processing Magazine, 2008, 25(2): 83-91.

[7] Shapiro J H. Computational ghost imaging[J]. Physical Review A, 2008, 78(6): 061802.

[8] 马宇轩, 孟照魁, 黄宏旭, 等. 高速结构光器件及其在光学成像与测量中的应用[J]. 光学学报, 2022, 42(17): 1723001.

    Ma Y X, Meng Z K, Huang H X, et al. High-speed structured optical devices and their applications in optical imaging and measurement[J]. Acta Optica Sinica, 2022, 42(17): 1723001.

[9] 吴自文, 邱晓东, 陈理想. 关联成像技术研究现状及展望[J]. 激光与光电子学进展, 2020, 57(6): 060001.

    Wu Z W, Qiu X D, Chen L X. Current status and prospect for correlated imaging technique[J]. Laser & Optoelectronics Progress, 2020, 57(6): 060001.

[10] Zhang Z B, Ma X, Zhong J G. Single-pixel imaging by means of Fourier spectrum acquisition[J]. Nature Communications, 2015, 6: 6225.

[11] 邵晓鹏, 刘飞, 李伟, 等. 计算成像技术及应用最新进展[J]. 激光与光电子学进展, 2020, 57(2): 020001.

    Shao X P, Liu F, Li W, et al. Latest progress in computational imaging technology and application[J]. Laser & Optoelectronics Progress, 2020, 57(2): 020001.

[12] Edgar M P, Gibson G M, Padgett M J. Principles and prospects for single-pixel imaging[J]. Nature Photonics, 2019, 13(1): 13-20.

[13] Gibson G M, Johnson S D, Padgett M J. Single-pixel imaging 12 years on: a review[J]. Optics Express, 2020, 28(19): 28190-28208.

[14] Donoho D L. Compressed sensing[J]. IEEE Transactions on Information Theory, 2006, 52(4): 1289-1306.

[15] Katz O, Bromberg Y, Silberberg Y. Compressive ghost imaging[J]. Applied Physics Letters, 2009, 95(13): 131110.

[16] Studer V, Bobin J, Chahid M, et al. Compressive fluorescence microscopy for biological and hyperspectral imaging[J]. Proceedings of the National Academy of Sciences of the United States of America, 2012, 109(26): E1679-E1687.

[17] Pian Q, Yao R Y, Sinsuebphon N, et al. Compressive hyperspectral time-resolved wide-field fluorescence lifetime imaging[J]. Nature Photonics, 2017, 11(7): 411-414.

[18] Howland G A, Dixon P B, Howell J C. Photon-counting compressive sensing laser radar for 3D imaging[J]. Applied Optics, 2011, 50(31): 5917-5920.

[19] Zhao C Q, Gong W L, Chen M L, et al. Ghost imaging lidar via sparsity constraints[J]. Applied Physics Letters, 2012, 101(14): 141123.

[20] Wu H D, Zhao M, Li F Q, et al. Underwater polarization-based single pixel imaging[J]. Journal of the Society for Information Display, 2020, 28(2): 157-163.

[21] 杨莫愁, 吴仪, 冯国英. 水下鬼成像的研究进展[J]. 光学学报, 2022, 42(17): 1701003.

    Yang M C, Wu Y, Feng G Y. Research progress on underwater ghost imaging[J]. Acta Optica Sinica, 2022, 42(17): 1701003.

[22] Clemente P, Durán V, Tajahuerce E, et al. Compressive holography with a single-pixel detector[J]. Optics Letters, 2013, 38(14): 2524-2527.

[23] 张华, 曹良才, 金国藩, 等. 基于压缩感知算法的无透镜数字全息成像研究[J]. 激光与光电子学进展, 2020, 57(8): 080001.

    Zhang H, Cao L C, Jin G F, et al. Progress on lensless digital holography imaging based on compressive holographic algorithm[J]. Laser & Optoelectronics Progress, 2020, 57(8): 080001.

[24] Li X H, Deng C J, Chen M L, et al. Ghost imaging for an axially moving target with an unknown constant speed[J]. Photonics Research, 2015, 3(4): 153-157.

[25] Shi D F, Yin K X, Huang J, et al. Fast tracking of moving objects using single-pixel imaging[J]. Optics Communications, 2019, 440: 155-162.

[26] Jiao S M, Sun M J, Gao Y, et al. Motion estimation and quality enhancement for a single image in dynamic single-pixel imaging[J]. Optics Express, 2019, 27(9): 12841-12854.

[27] Sun S A, Gu J H, Lin H Z, et al. Gradual ghost imaging of moving objects by tracking based on cross correlation[J]. Optics Letters, 2019, 44(22): 5594-5597.

[28] Deng Q W, Zhang Z B, Zhong J G. Image-free real-time 3-D tracking of a fast-moving object using dual-pixel detection[J]. Optics Letters, 2020, 45(17): 4734-4737.

[29] Yu W K. Cryptographic key distribution over a public network via variance-based watermarking in compressive measurements[J]. Applied Optics, 2019, 58(19): 5294-5300.

[30] Yu W K, Wei N, Li Y X, et al. Multi-party interactive cryptographic key distribution protocol over a public network based on computational ghost imaging[J]. Optics and Lasers in Engineering, 2022, 155: 107067.

[31] Yu W K, Yang Y, Li Y X, et al. Multi-party cryptographic key distribution protocol over a public network based on a quick-response code[J]. Sensors, 2022, 22(11): 3994.

[32] Chan W L, Charan K, Takhar D, et al. A single-pixel terahertz imaging system based on compressed sensing[J]. Applied Physics Letters, 2008, 93(12): 121105.

[33] Watts C M, Shrekenhamer D, Montoya J, et al. Terahertz compressive imaging with metamaterial spatial light modulators[J]. Nature Photonics, 2014, 8(8): 605-609.

[34] Chen S S, Donoho D L, Saunders M A. Atomic decomposition by basis pursuit[J]. SIAM Journal on Scientific Computing, 1998, 20(1): 33-61.

[35] PatiY C, RezaiifarR, KrishnaprasadP S. Orthogonal matching pursuit: recursive function approximation with applications to wavelet decomposition[C]∥Proceedings of 27th Asilomar Conference on Signals, Systems and Computers, November 1-3, 1993, Pacific Grove, CA, USA. New York: IEEE Press, 2002: 40-44.

[36] Daubechies I, Defrise M, De Mol C. An iterative thresholding algorithm for linear inverse problems with a sparsity constraint[J]. Communications on Pure and Applied Mathematics, 2004, 57(11): 1413-1457.

[37] Wang Y L, Yang J F, Yin W T, et al. A new alternating minimization algorithm for total variation image reconstruction[J]. SIAM Journal on Imaging Sciences, 2008, 1(3): 248-272.

[38] 宗岩峰, 郑淮斌, 吴鑫伟, 等. 基于时序控制的赝热光鬼成像系统[J]. 光学学报, 2023, 43(7): 0711001.

    Zong Y F, Zheng H B, Wu X W, et al. Sequence-controlled pseudothermal optical ghost imaging system[J]. Acta Optica Sinica, 2023, 43(7): 0711001.

[39] Candès E J, Tao T. Decoding by linear programming[J]. IEEE Transactions on Information Theory, 2005, 51(12): 4203-4215.

[40] Candès E J. The restricted isometry property and its implications for compressed sensing[J]. Comptes Rendus Mathematique, 2008, 346(9/10): 589-592.

[41] EladM. Sparse and redundant representations: from theory to applications in signal and image processing[M]. New York: Springer, 2010.

[42] Candès E J, Tao T. Near-optimal signal recovery from random projections: universal encoding strategies?[J]. IEEE Transactions on Information Theory, 2006, 52(12): 5406-5425.

[43] Yu W K, Liu X F, Yao X R, et al. Complementary compressive imaging for the telescopic system[J]. Scientific Reports, 2014, 4: 5834.

[44] Yu W K, Yao X R, Liu X F, et al. Compressive moving target tracking with thermal light based on complementary sampling[J]. Applied Optics, 2015, 54(13): 4249-4254.

[45] Yu W K, Yao X R, Liu X F, et al. Compressive microscopic imaging with “positive-negative” light modulation[J]. Optics Communications, 2016, 371: 105-111.

[46] Li Y X, Yu W K, Leng J A, et al. Pseudo-thermal imaging by using sequential-deviations for real-time image reconstruction[J]. Optics Express, 2019, 27(24): 35166-35181.

[47] Sun M J, Meng L T, Edgar M P, et al. A Russian Dolls ordering of the Hadamard basis for compressive single-pixel imaging[J]. Scientific Reports, 2017, 7: 3464.

[48] Yu W K, Liu Y M. Single-pixel imaging with origami pattern construction[J]. Sensors, 2019, 19(23): 5135.

[49] Yu W K. Super sub-Nyquist single-pixel imaging by means of cake-cutting Hadamard basis sort[J]. Sensors, 2019, 19(19): 4122.

[50] Yu W K, Li M F, Yao X R, et al. Adaptive compressive ghost imaging based on wavelet trees and sparse representation[J]. Optics Express, 2014, 22(6): 7133-7144.

[51] Dai H D, Gu G H, He W J, et al. Adaptive video compressed sampling in the wavelet domain[J]. Optics & Laser Technology, 2016, 81: 90-99.

[52] Wu H, Zhao G P, Wang R Z, et al. Computational ghost imaging system with 4-connected-region-optimized Hadamard pattern sequence[J]. Optics and Lasers in Engineering, 2020, 132: 106105.

[53] MundyJ L, JoynsonR E. Pipeline Walsh-Hadamard transformations: US3956619[P]. 1976-05-11.

[54] Fan C P, Yang J F. Fixed-pipeline two-dimensional Hadamard transform algorithms[J]. IEEE Transactions on Signal Processing, 1997, 45(6): 1669-1674.

[55] Zhou C, Zhao X W, Huang H Y, et al. Multi-resolution single-pixel imaging via Hadamard ‘pipeline’ coding[J]. Applied Physics B, 2020, 126(10): 163.

[56] Gao Z H, Li M H, Zheng P X, et al. Single-pixel imaging with Gao-Boole patterns[J]. Optics Express, 2022, 30(20): 35923-35936.

[57] 李明飞, 阎璐, 杨然, 等. 基于Hadamard矩阵优化排序的快速单像素成像[J]. 物理学报, 2019, 68(6): 064202.

    Li M F, Yan L, Yang R, et al. Fast single-pixel imaging based on optimized reordering Hadamard basis[J]. Acta Physica Sinica, 2019, 68(6): 064202.

[58] Yu X, Yang F, Gao B, et al. Deep compressive single pixel imaging by reordering Hadamard basis: a comparative study[J]. IEEE Access, 2020, 8: 55773-55784.

[59] Vaz P G, Gaudêncio A S, Ferreira L F R, et al. Re-ordering of Hadamard matrix using Fourier transform and gray-level co-occurrence matrix for compressive single-pixel imaging in low resolution images[J]. IEEE Access, 2022, 10: 46975-46985.

[60] Yu X, Stantchev R I, Yang F, et al. Super sub-Nyquist single-pixel imaging by total variation ascending ordering of the Hadamard basis[J]. Scientific Reports, 2020, 10: 9338.

[61] 袁梓豪, 赵琳琳, 李明飞, 等. 一种对Hadamard测量基进行排序的方法: CN111130556A[P]. 2020-05-08.

    YuanZ H, ZhaoL L, LiM F, et al. A method for reordering the Hadamard measurement basis: CN111130556A[P]. 2020-05-08.

[62] Ben-Artzi G, Hel-Or H, Hel-Or Y. The gray-code filter kernels[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(3): 382-393.

[63] López-García L, Cruz-Santos W, García-Arellano A, et al. Efficient ordering of the Hadamard basis for single pixel imaging[J]. Optics Express, 2022, 30(8): 13714-13732.

[64] Ma H Y, Sang A J, Zhou C, et al. A zigzag scanning ordering of four-dimensional Walsh basis for single-pixel imaging[J]. Optics Communications, 2019, 443: 69-75.

[65] Thiele S, Arzenbacher K, Gissibl T, et al. 3D-printed eagle eye: compound microlens system for foveated imaging[J]. Science Advances, 2017, 3(2): e1602655.

[66] Phillips D B, Sun M J, Taylor J M, et al. Adaptive foveated single-pixel imaging with dynamic supersampling[J]. Science Advances, 2017, 3(4): e1601782.

[67] Zhang K Y, Cao J, Hao Q, et al. Modeling and simulations of retina-like three-dimensional computational ghost imaging[J]. IEEE Photonics Journal, 2019, 11(1): 6900713.

[68] Zhai X, Cheng Z D, Hu Y D, et al. Foveated ghost imaging based on deep learning[J]. Optics Communications, 2019, 448: 69-75.

[69] Gao Z Q, Cheng X M, Zhang L F, et al. Compressive ghost imaging in scattering media guided by region of interest[J]. Journal of Optics, 2020, 22(5): 055704.

[70] Cao J E, Zhou D, Zhang F H, et al. A novel approach of parallel retina-like computational ghost imaging[J]. Sensors, 2020, 20(24): 7093.

[71] Hua J Y, Hua E K, Zhou F B, et al. Foveated glasses-free 3D display with ultrawide field of view via a large-scale 2D-metagrating complex[J]. Light: Science & Applications, 2021, 10: 213.

[72] Cao J E, Zhou D, Zhang Y Q, et al. Optimization of retina-like illumination patterns in ghost imaging[J]. Optics Express, 2021, 29(22): 36813-36827.

[73] Vaz P G, Amaral D, Ferreira L F R, et al. Image quality of compressive single-pixel imaging using different Hadamard orderings[J]. Optics Express, 2020, 28(8): 11666-11681.

[74] Yuan Y L A, Feng J, Jiao S M, et al. Adaptive and dynamic ordering of illumination patterns with an image dictionary in single-pixel imaging[J]. Optics Communications, 2021, 481: 126527.

[75] Higham C F, Murray-Smith R, Padgett M J, et al. Deep learning for real-time single-pixel video[J]. Scientific Reports, 2018, 8: 2369.

[76] Barbastathis G, Ozcan A, Situ G H. On the use of deep learning for computational imaging[J]. Optica, 2019, 6(8): 921-943.

俞文凯, 曹冲, 杨颖, 王硕飞. 单像素成像中哈达玛基掩模优化排序前沿进展[J]. 激光与光电子学进展, 2024, 61(4): 0400006. Wenkai Yu, Chong Cao, Ying Yang, Shuofei Wang. Frontier Advances in Optimized Ordering of the Hadamard Basis Patterns Used in Single-Pixel Imaging[J]. Laser & Optoelectronics Progress, 2024, 61(4): 0400006.

引用该论文: TXT   |   EndNote

相关论文

加载中...

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!