单像素成像中哈达玛基掩模优化排序前沿进展
1 引言
单像素成像(SPI)是计算成像(CI)的一个重要分支,它巧妙通过测量与计算相结合的方式实现了对光场图像信息的间接获取。该技术雏形最早可以追溯至针孔成像、电视机显像、激光点扫描成像等。在器件上,单像素是指仅仅使用一个点探测器或桶探测器(积分所有像元值)来收集携带物体信息的光信号,不但降低了探测成本、提高了光通量(适用于弱光测量),还能做到谱型适应(在非可见波段优势明显)[1];在原理上,SPI将光场信息从高维空间映射到低维空间,从而实现对多维信息的智能感知。其实,早在二十世纪六七十年代,Fourier[2]和Hadamard[3-5]掩模便已经被引入其中,典型应用为光学成像和光谱编解码,但需要满采样和逆变换作为信息获取的代价。随着科技的发展,SPI迎来新的春天。2008年,单像素相机(SPC)[6]和计算鬼成像(CGI)[7]先后被提出,前者立足于信息论角度,后者立足于经典赝热光鬼成像角度(一般采用激光通过毛玻璃来产生赝热光场),它们均采用可编程的空间光调制器(SLM)[8]来加载一系列调制掩模,以实现对光场的精确编码。需要说明的是:最初的SPC使用的是数字微镜器件(DMD,属于强度型SLM),放置于物体之后,即先成像后调制,该架构也称结构化/计算探测;而CGI使用的是液晶SLM(属于相位型SLM),放置于物体之前,即先调制后成像,该架构也称结构化/计算照明。但从数学测量模型上看:选择强度调制还是相位调制仅存在作用空间的不同,在上述两个系统中可以互通[9-10];而SLM置于物体后还是物体前在本质上也是相互等价的[11-13]。此外,它们均利用掩模与单像素(桶)测量值(对应于物体与调制掩模的点积和,即携带物体信息的总光强)的一一对应关系进行关联计算,采用一系列可互通的算法进行信息解码重构。值得一提的是,SPC原本就建立在压缩感知(CS)理论[14]基础上,而后CGI也广泛使用CS算法进行图像重构[15]。CS给信息论带来了一场技术革命,它在已知图像信号本身稀疏或能在某个域下稀疏表示的先验知识的条件下,仅需少量单像素(桶)测量,便可完美重构出原始图像,突破了香农/奈奎斯特采样定理的限制,为SPI提供了得天独厚的优势。亚采样、超分辨、超灵敏、边压缩边采样、缓解存储与传输压力等,使得SPI迅速被应用于荧光显微[16-17]、激光雷达[18-19]、水下成像[20-21]、数字全息[22-23]、目标跟踪[24-28]、密钥分发[29-31]、太赫兹探测[32-33]等领域。
从信息论角度上看,SPI是典型的编解码架构:空间光调制为编码过程,而根据调制掩模和单像素(桶)测量值之间的对应关系重构图像为解码过程。解码依赖的是算法的重构性能,已发展起来的性能优秀的重构算法[34-38]非常多,这里不再一一赘述;而编码仰仗的是调制掩模,这是SPI的精髓和灵魂所在。近年来的研究表明,常规所使用的随机调制掩模使测量变得盲目,在每一帧调制中采集到的图像高低频分量较为均衡,在统计上呈现对半分关系,这其实并不符合人眼视觉感知物体的机理和过程。至于为何随机调制掩模在发展初期被广泛使用,原因在于随机调制掩模设计原理简单,通常可通过某种随机分布快速生成,例如高斯分布、伯努利分布、泊松分布、稀疏随机分布等[14],而服从这类分布的随机调制掩模符合CS完美重建所需的受限等距特性的条件[39-40]。但是,这种随机调制掩模也给矩阵存储、传输和计算带来了巨大的困难,在很大程度上限制了高分辨率实时重构的实用化发展,而且随机测量缺乏针对性,在某种意义上违背了智能感知的初衷。为此,人们开始研究具有一定结构化特征的确定性掩模构造。Hadamard基掩模(由Hadamard矩阵的行经重组而形成的掩模)就是很好的选择,Hadamard矩阵本身具有很好的结构化特征和衍生规律,可递归生成,已经存在非常成熟的快速Hadamard变换形式,对于Hadamard行向量(也称基底/基)与图像拉伸后的列向量之间的向量相乘运算举重若轻,而且仅需知晓Hadamard矩阵的具体行号(基序号)便可完成上述操作,极大地方便了矩阵运算和基掩模提取,避免了大规模测量矩阵的存储,这对于高分辨率CS快速重构非常有利。对Hadamard基掩模进行排序看似是回归至几十年前的研究工作,但这里采用了亚采样和凸优化重构,区别非常明显。近年来,对于Hadamard基掩模的优化排序的研究工作遍地开花,世界各地的研究组针对这些优化排序给出了相应的成像质量分析,每种优化排序在特定的条件下卓有成效,但在设计上尚还缺乏统一的认识。总结和分析现阶段的研究进展对于本领域的发展具有重要科学意义。
鉴于此,本文从CS的约束条件出发,系统地梳理确定性掩模构造和Hadamard基掩模排序方法的设计思路和前沿进展,对现存的优化基排序和基内元素重排方法进行合理分类,探究掩模构造和智能感知的本原,讨论和展望确定性掩模构造的未来发展趋势,以期为未来的研究工作开展指明道路和提供有益借鉴。
2 单像素成像对调制掩模的约束条件
测量矩阵由一组调制掩模经重组形成,但并非所有的矩阵都适合作为SPI的测量矩阵。在基于CS的SPI中,要想近乎完美地重构物体图像信息,所采用的测量矩阵需要具备受限等距性质。本小节简要地从数学测量模型中引出这一约束条件,并讨论如何在该约束条件下设计相应的调制掩模。
2.1 单像素成像的数学测量模型
单像素压缩成像的真谛在于稀疏性。若图像信号
假设
式中:
式中:
2.2 单像素成像的受限等距性质
为了检验解的单值性(即有解且唯一),需要引入一个spark函数[41],其表达式为
由于spark函数在计算时需要搜索联合测量矩阵
上述两个条件都是针对于
式中:
当仔细观察RIP的本质时,不难发现:该性质本质上是要让联合测量矩阵
3 哈达玛基掩模优化排序
Hadamard矩阵是由1和-1元素组成的
3.1 基于空域的哈达玛基掩模优化排序
下面着重介绍在空域下的Hadamard基掩模的常规排序,并整理本领域在Hadamard基掩模优化排序中已取得的阶段性进展。
3.1.1 自然序
自然序(natural)Hadamard矩阵是最常接触到的Hadamard矩阵[3-5],具有通用的递归构造公式,令
其中,
非规范化的Hadamard矩阵也可写成
对非规范化的Hadamard矩阵进行下三角-对角-上三角(LDU)分解的结果如
图 1. 对1个16阶的自然序Hadamard矩阵进行下三角-对角-上三角分解,第1个矩阵为下三角矩阵,第2个矩阵为对角矩阵,第3个矩阵为上三角矩阵,第4个矩阵为16阶自然序Hadamard矩阵,黑点表示矩阵乘法
Fig. 1. Performing lower-diagonal-upper decomposition on a 16-order naturally ordered Hadamard matrix, the first, second, third and fourth matrices are the lower triangular matrix, diagonal matrix, upper triangular matrix, and 16-order naturally ordered Hadamard matrix, respectively, the black dots indicate matrix multiplication
3.1.2 顺序(沃尔什)序
顺序序(sequency)Hadamard矩阵是按自然序Hadamard矩阵中每行的±1符号改变次数的递增次序对行(基底/基)进行重新排列而获得的矩阵,该序通常也被称为沃尔什(Walsh)序。Walsh-Hadamard变换是一种快速矩阵变换,可用于某些信号处理操作的高效实现。这里需要说明的一点是,在有些文献中,也将自然序Hadamard矩阵的每一行称之为Walsh函数,而Walsh-Hadamard快速变换更多是针对顺序序Hadamard矩阵而言,在本综述中为了统一和避免歧义,Walsh序特指顺序序。
若将行内连续1或者连续-1视为连通域块,那么顺序(沃尔什)序即为行内一维连通域个数减1后的递增序。
同样以自然序Hadamard矩阵
3.1.3 二元(佩利)序
二元序(dyadic)Hadamard矩阵是按二进制(并元)顺序进行排列的矩阵,该序也被称为佩利(Paley)序,它需要使用到Rademacher函数和二进制数。Rademacher函数是非完备的正交函数系,定义为
以生成的16阶二元序Hadamard矩阵为例,其每行中符号改变次数为0、1、3、2、7、6、4、5、15、14、12、13、8、9、11、10。
自然序、顺序序、二元序Hadamard矩阵之间可以根据生成规律相互转化,它们是Hadamard矩阵早期发展起来的排序,历史悠久,经久不衰。其实,它们都是完备的正交基集合,可以用来表示任意离散函数,就像三角函数(也是完备的正交函数集)可以用来表示Fourier分析中的任意连续函数一样。事实上,它们和三角函数都是希尔伯特空间中单位间隔的平方可积函数的正交基,均为有界函数系统,与Harr或者Franklin系统不同。
3.1.4 随机序
随机序Hadamard矩阵顾名思义是将上述3种序下Hadamard矩阵的行随机打乱而保持列序不变且行内元素位置不变的矩阵。
随机序Hadamard矩阵与随机矩阵相比,存在较大的不同:随机序Hadamard矩阵的行与行、列与列之间相互正交,而唯有均值为0或趋近于0的随机矩阵才能满足近似正交性。此外,随机序Hadamard矩阵在知道打乱顺序之后,可以对行进行快速提取,依然能够方便矩阵乘法转为简单的加减运算,而无需占用过多内存。
3.1.5 俄罗斯套娃序
俄罗斯套娃序(RD)Hadamard矩阵[47]是由北京航空航天大学的孙鸣捷研究组于2017年提出的,主要基于每个Hadamard矩阵均包含了次低阶Hadamard矩阵的像素缩放版本的原理。其生成步骤较为复杂,如
图 2. 对16阶自然序Hadamard基掩模进行俄罗斯套娃排序[47]
Fig. 2. Performing Russian dolls sorting on 16-order naturally ordered Hadamard basis patterns[47]
3.1.6 折纸序
折纸序Hadamard矩阵[48]于2019年被提出,主要基于对称反翻折、轴对称和部分序调整的思想。具体如
图 3. 折纸序生成过程。(a)折纸序的生成规则;(b)按照图3(a)所得到的掩模结果
Fig. 3. Generation process of the origami ordering. (a) Rules for generating origami ordering; (b) the mask results obtained according to Fig. 3 (a)
3.1.7 切蛋糕序
切蛋糕(CC)Hadamard矩阵[49]同样在2019年提出,是通过直接按照自然序Hadamard基掩模的二维连通域个数递增次序对自然序Hadamard矩阵的行进行重新排列得到的,如
图 4. 对16阶自然序Hadamard基掩模进行切蛋糕排序[49]
Fig. 4. Performing cake-cutting sorting on 16-order naturally ordered Hadamard basis patterns[49]
前文已述,顺序序为自然序Hadamard矩阵的行内一维连通域个数减1后的递增序(其实减1操作对排序无影响,这里仅为了严谨起见),可简称为一维连通域序。那么,切蛋糕序便是自然序Hadamard矩阵的基掩模二维连通域个数的递增序,可简称为二维连通域序。一维连通域序更适合于一维信号处理,二维连通域序则适合于二维光学成像。所以,切蛋糕序与顺序序对于Hadamard矩阵同样重要。
不难发现,切蛋糕序完全摒弃了分组思想,属于直截了当的排序方式。切蛋糕序也符合人眼视觉的感知。当基掩模连通域个数少的时候,意味着对图像低频信息进行采样,当基掩模连通域个数多的时候,意味着对图像高频信息进行采样,调制掩模由粗到细等价于视觉由模糊逐渐变得清晰的过程。在某种程度上,切蛋糕序与小波树自适应压缩成像[50-51]的思想不谋而合。与切蛋糕序类似的排序还有4连通优化序[52]。
3.1.8 多分辨率管线序
多分辨率管线序Hadamard矩阵[53-55]是在2020年提出的,它是在俄罗斯套娃序、折纸序和切蛋糕序的基础上演变而来的。首先建立Hadamard管线编码器(PE),它由4个变换规则组成:
式中:i=1,2,3,4。令起始矩阵
图 5. 多分辨率管线序Hadamard基掩模的生成过程[55]。(a)从自然序Hadamard矩阵的行通过重组转为Hadamard基掩模的过程,(a1)~(a4)1×64、4×64、16×64和64×64像素的自然序Hadamard矩阵行转化为基掩模的过程;(b)利用Hadamard管线编码器生成多分辨率管线序Hadamard基掩模的过程
Fig. 5. Generation process of multi-resolution pipeline ordered Hadamard basis patterns[55]. (a) The process of reshaping the rows of naturally ordered Hadamard matrix into the Hadamard basis patterns, (a1)‒(a4) the processes of reshaping the rows of naturally ordered Hadamard matrix of size 1×64, 4×64, 16×64, and 64×64 pixels into the Hadamard basis patterns, respectively; (b) the process of generating multi-resolution pipeline ordered Hadamard basis patterns by applying the Hadamard pipeline encoder
此外,PE也可用来直接生成俄罗斯套娃序。若将俄罗斯套娃序视为从高阶到低阶的递归,那么多分辨率管线序便是从低阶到高阶的演化。而且PE的矩阵操作类似于折纸序中的副本复制、副本反转的操作,有着异曲同工之效。采用与多分辨率管线序Hadamard基掩模类似构造方法的还有Gao-Boole掩模[56]。
3.2 基于频域的哈达玛基掩模优化排序
既然存在Hadamard基掩模的空域优化排序,必然也存在Hadamard基掩模的频域优化排序。下面重点介绍在频域下的Hadamard基掩模优化排序方法和已取得的进展。
3.2.1 离散余弦变换序
离散余弦变换序Hadamard矩阵最早是由中国航天科技集团有限公司量子工程研究中心李明飞研究小组[57]于2019年提出的,主要对每帧Hadamard基掩模(从任意序出发均可,对排序结果无影响)进行离散余弦变换,求其l1范数作为度量标准,按此度量标准的递增序对Hadamard矩阵的行进行重排,最终形成离散余弦变换序Hadamard矩阵,使得基掩模呈现由低频到高频的顺序排列。值得一提的是,这里的l1范数很显然可以推广到其他范数形式,排序结果仅会出现细微的差别。
3.2.2 小波变换序
小波变换序Hadamard矩阵同样是由李明飞研究小组[57]于2019年提出的,基于与离散余弦变换序相同的原理,即对每帧Hadamard基掩模(从任意序出发均可)进行小波变换,再求其l1范数作为度量标准,然后按此度量标准的递增序对Hadamard矩阵的行进行重排,最终形成小波变换序Hadamard矩阵,其基掩模同样呈现由低频到高频的顺序排列。范数的选择不局限于l1范数,而小波变换可选择harr、db、sym、coif、bior、rbio、dmey、fk、bl、mb、beyl、vaid、han等小波变换中的任意一种(这份工作只分析了harr和db小波变换),小波层数也可任意。
针对二维调制掩模
3.2.3 离散傅里叶变换序
傅里叶变换序Hadamard矩阵与前文所述的离散余弦变换序、小波变换序Hadamard矩阵类似,也是由重庆大学的杨帆研究小组[58]于2020年提出的,只是将小波变换替换为二维离散Fourier变换。首先,求得每个自然序Hadamard基掩模的离散Fourier变换系数和,也即计算离散Fourier变换系数的l1范数;然后,按照离散Fourier变换系数和的递增次序对自然序Hadamard矩阵的行进行重新排列,以获得傅里叶变换序Hadamard矩阵,如
图 6. 对16阶Hadamard基掩模进行二维离散Fourier变换,方格图为Hadamard基掩模,其下方为与之对应的Fourier频谱图[59]
Fig. 6. Performing two-dimensional discrete Fourier transform on 16-order Hadamard basis patterns, the grid sub-figures are the Hadamard basis patterns and the corresponding Fourier spectrum images are given below them[59]
此外,葡萄牙科英布拉大学的Vaz等[59]于2022年提出一种改进的傅里叶变换序,称之为标尺递增序(AS)。该序同样基于对每个自然序Hadamard基掩模所做的二维离散Fourier变换,计算其主频率(峰值频率)中心到频域原点(0,0)之间的欧几里得距离。然后,按照该欧几里得距离的递增次序对自然序Hadamard矩阵的行进行重新排列,以获得标尺递增序Hadamard矩阵。计算欧几里得距离的方法非常巧妙,相比于盲目计算离散Fourier变换系数和,更加具有针对性,主要在于灵活利用了Hadamard基掩模在二维离散Fourier变换下其主频聚集为圆斑状在频域空间游走的特征。
3.2.4 全变分序
全变分序Hadamard矩阵同样是由重庆大学的杨帆研究小组[60]于2020年提出,核心在于将光学变换替换为TV算符,也即计算自然序Hadamard基掩模
3.2.5 索引序
索引序Hadamard矩阵[61]与之前的各种变换序不同,通过计算顺序序Hadamard基掩模的行列一维连通域个数(称作行列索引)的乘积或lp范数(前文已定义),作为度量标准,再按该度量标准的递增序对顺序序Hadamard矩阵的行进行重排,最终形成索引序Hadamard矩阵。其核心思想在于,无论顺序序Hadamard矩阵的每一行是按行还是按列重组为基掩模的,该基掩模内的任意一行或任意一列的一维连通域个数均固定不变,可作为固定的行列索引来标识该基掩模的结构化特征。其实,该方法采用任意序Hadamard矩阵作为起始都是无差别的,因为每个基掩模的特征是固定不变的。令行列索引分别为i和j,将Hadamard基掩模按行列索引从小到大排列成一个大方阵(与利用Gray序列排列生成的大方阵完全一致,i和j的颠倒会导致大方阵的矩阵转置),然后,所采用的度量标准可定义为
式中:d一般为实数,但当
其实,从原理上看,该索引序也可适用于其他完备的正交基底(例如离散余弦变换基、离散Fourier变换基等)的排序。
3.2.6 灰度共生矩阵对比度序
灰度共生矩阵对比度序是由葡萄牙科英布拉大学的Vaz等[59]于2022年提出的,如
图 7. 16阶灰度共生矩阵对比度序(惯性递增序)Hadamard矩阵,该矩阵行序号对应于原始自然序Hadamard矩阵行号[59]
Fig. 7. 16-order gray-level co-occurrence matrix contrast (ascending inertia) ordered Hadamard matrix, the row indices of this matrix correspond to the row numbers of naturally ordered Hadamard matrix[59]
式中:
4 哈达玛基掩模内部像素排列
除了对Hadamard基掩模进行排序外(此时每个基掩模内部不发生改变),还可以进而对基掩模的内部像素进行重排,这其实也是改变由Hadamard矩阵的行到基掩模的像素重组/填充方式。下面具体介绍几种常见的Hadamard基掩模内部像素排列方法。
4.1 行、列主序排列
行主序(row-major order)和列主序(column-major order)是重要的矩阵存储方式,其存储顺序表明矩阵是如何线性存储的。而在哈达玛基掩模像素排序中,行主序和列主序也是经常采用的重要手段,能高效将Hadamard矩阵的行(行元素序列)依次填充入Hadamard基掩模之中:行主序是指以基掩模的行为优先单位,逐行填充排列;列主序是指以基掩模的列为优先单位,逐列填充排列。采用何种主序的填充方式对于基掩模和重构图像需要保持一致。
4.2 Zigzag排列
Zigzag也是一种非常重要的矩阵排列方式,也被称为之字形排列,如
图 8. Zigzag排列。(a)Zigzag的遍历顺序;(b)由Hadamard基掩模根据每帧掩模的行列索引所组成的大方阵;(c)按照Zigzag遍历在图8(b)中提取到的Hadamard基掩模
Fig. 8. Zigzag alignment. (a) The traversal order of Zigzag; (b) the big square matrix consisting of the Hadamard basis patterns according to the row and column indexes of each pattern; (c) the Hadamard basis patterns extracted from Fig. 8 (b) by using Zigzag traversal
若将Hadamard基掩模按照前文索引序中提及的行列索引排布成(或按照Gray码序列[62]生成)一个大方阵,则可利用Zigzag对该方阵中的Hadamard基掩模进行提取,形成Zigzag序[63],这也是一种非常高效的基掩模优化排序方式。这里作为对前两个章节的技术补充。
4.3 蛇形排列
蛇形排列(也称方形扫描)与Zigzag排列非常类似,只是将斜向游走改变为折向游走,如
图 9. 蛇形排列[62,64]。(a)蛇形遍历顺序;(b)(c)Hadamard基掩模大方阵和Hadamard基掩模蛇形提取方案
Fig. 9. Snake alignment[62,64]. (a) The snake traversal order; (b) (c) the big square matrix and the snake extraction strategy of the Hadamard basis patterns, respectively
类似地,若将Hadamard基掩模按照前文索引序中所提及的行列索引排布成一个大方阵,那么也可利用蛇形排列对该大方阵中的Hadamard基掩模进行提取,形成蛇形排列序[62,64]。
4.4 视觉焦点扩散排列
动物的视觉系统其实并不是在所有视觉区域都是等分辨率的,一般会存在聚焦中心,在聚焦中心部分的分辨率最高,中心向周围扩散其分辨率逐步降低。当眼睛扫视视场时,一般会对整个视场进行持续监控,通过眼球转动逐步将视觉中心区域聚焦到感兴趣目标之上,以获得高分辨率辨识。而Hadamard基掩模内部像素的视觉焦点扩散排列[65-66]便是受到上述原理的启发,在用自然序Hadamard矩阵的某一行对单帧调制掩模矩阵进行填充时,需要先将调制掩模矩阵进行笛卡尔像素规模放大。若以
图 10. 基于视觉焦点扩散排列的单像素成像[66]。(a)均匀32×32网格;(b)完备1024阶Hadamard矩阵行按照图10(a)中均匀网络重塑所获得的1024帧Hadamard基掩模;(c)实验上采用了均匀排列掩模的猫图重建结果;(d)空间变分辨率像素网格,包含1024个变化大小的像素元胞,视焦区域像素遵循直角坐标网格,视焦外围像素遵循圆形极坐标网格;(e)根据图10(d)中空间变分辨率网格重组的1024帧Hadamard基掩模例子;(f)对相同场景使用图10(e)中空间变分辨率掩模的重建结果
Fig. 10. Single-pixel imaging based on the diffusion arrangement from visual fovea[66]. (a) a uniform 32×32 grid; (b) 1024 Hadamard basis patterns acquired by reformatting the rows of 1024-order Hadamard matrix onto the uniform grid shown in Fig. 10 (a); (c) the experimentally reconstructed image of a cat by using the spatially uniformly aligned patterns; (d) spatial variable resolution pixel grid, containing 1024 pixel cells of varying sizes, the pixels in the focus area follow a Cartesian grid, while the pixels in the periphery of the focus follow a circular polar grid; (e) examples of 1024 Hadamard basis patterns reshaped onto the spatially variant grid shown in (d); (f) the reconstructed result of the identical scene using the spatially variant patterns shown in Fig. 10 (e)
若采用全采样,可直接通过矩阵求逆重构图像信息;若采用亚采样,则可通过压缩感知算法恢复图像信息。鉴于图像重建过程中处理的都是矩阵,一种方案是根据填充好的调制掩模进行图像重构,但会涉及拓扑形变、大规模矩阵存储与计算;另一种方案是直接根据原始Hadamard基掩模(也即采用原始Hadamard矩阵)进行重构,再将重建像素值按视觉焦点扩散排列填回扩充矩阵,这样既保留了Hadamard矩阵的快速计算能力,又节省了存储空间。
视焦区域也可进行视场扫描,类似于眼球的转动,这样在低分辨率区域通过扫描过程中的交叠能进一步提高该区域的清晰度,这可通过加权平均实现。
视觉焦点扩散排列方法一经提出,就引发了研究者们的广泛关注[67-72]。值得一提的是,该方法引申出一种基于主成分分析的空域变分辨率优化方案[72],即让视焦区域不再是简单横竖网格状分布,而更加具有结构性特征。
5 确定性掩模构造的思考
首先,对前文所涉及的方法进行系统梳理和总结,结果如
图 11. 采用不同空域优化排序的16阶Hadamard矩阵比较。(a)~(f)16阶自然序、顺序序、俄罗斯套娃序、折纸序、切蛋糕序和多分辨率管线序Hadamard矩阵
Fig. 11. Comparison of 16-order Hadamard matrices by using different spatially optimized orders. (a)‒(f) 16-order naturally, sequency, Russian dolls, origami, cake-cutting, multi-resolution pipeline ordered Hadamard matrices, respectively
葡萄牙科英布拉大学的Vaz等[73]在比较了多种基于空域的Hadamard基掩模优化排序方法的性能之后指出:当采样率为10%时,切蛋糕序的成像性能力压其他空域序,表现最佳;当采样率进一步缩减时,切蛋糕序有着更好的优势;当采样率提升至50%以上时,切蛋糕序与顺序序的成像质量趋于一致。其原因在于顺序序Hadamard矩阵的前一半行呈现出较强的结构特征,会使得重构图像出现伪影和拖影,使得图像模糊,图像质量退化,而切蛋糕序能很好地规避这个问题[49];此外,顺序序更适合于一维信号重建。
表 1. Hadamard基掩模优化排序和基内像素排列方法
Table 1. Hadamard basis pattern optimized ordering and within-pattern pixel alignment methods
|
在基于频域的Hadamard基掩模优化排序中,排序的设计思路都是类似的,即计算Hadamard矩阵行或基掩模的某种特征量,而计算过程可视为一种特定的函数变换或者函数算符。以Hadamard基掩模的灰度共生矩阵为例,可计算的特征量其实并不局限于对比度一种,现存的物理量还有能量、熵、逆方差、相关性等,均可用来表征基掩模的纹理特征,作为度量标准也是合适的。其他的变换也类似,同样存在其他的特征量,求变换系数的
关于基掩模内部像素排列,本综述仅列举了最广为人知的方法,也最具代表性。其实,基掩模内部像素排列完全可以根据不同应用场景的需要进行特殊设计。行、列主序、Zigzag是最常用的排列重组方式;而眼球聚焦排列从另一个角度验证了基掩模是一个拓扑体,其形变在特殊应用场景中能帮助更好捕捉物体图像信息。
此外,上述许多基掩模排序方法和内部像素排列策略也不仅仅只适用于Hadamard基掩模,同样也可以适用于其他正交基掩模,前文已经给出了相关的例子。例如,对于Fourier基掩模,英国的伦敦帝国理工学院Yuan等[74]也指出可以根据训练图像的平均谱和单像素(桶)测量值的反馈确定出Fourier基掩模的调制次序,以降低采样率。
目前流行的深度学习技术也可用于SPI中测量矩阵的训练生成[75-76],能在一定程度上降低采样率,虽然训练需要耗费大量时间,但是图像重构非常迅速。其缺点在于,通过网络映射训练出来的调制掩模在值分布上往往呈现出流体块状,类似于湍流的团状和絮状,而且在每次训练迭代时需要将测量矩阵强行二值化以适用于DMD的加载,其训练本身不具有太多的物理意义。所以,需要进一步研究物理驱动为主、数据驱动为辅的智能感知方案。
6 总结与展望
基于CS的SPI中的掩模构造需要满足RIP条件,而由掩模所组成的测量矩阵在传输、存储和相关计算方面的困难往往是需要密切关注的重点,在高分辨率实时成像任务中,这些因素对成像性能的影响尤为显著。Hadamard矩阵具有正交性和非常强的结构化特征,能很好满足RIP条件;每帧Hadamard基掩模可通过算法快速提取,免去了巨量数据传输和存储的困扰;而且Hadamard基掩模与目标图像的点积也可轻松转化为加减运算,极大地方便了矩阵计算。因而,Hadamard基掩模与SPI高度契合,掀起了一场研究热潮。
鉴于此,本综述总结梳理了两大类Hadamard基掩模优化排序方法:空域优化排序和频域优化排序,还梳理了Hadamard基掩模内部像素排列方法。
首先,在空域优化排序中,经典的排序有自然序、顺序序、二元序和随机序。其中:顺序序和二元序都是对自然序的衍生排序,前者通过比特位倒置排列和Gray码排列生成,后者则通过Rademacher函数和二进制数生成;而随机序是对行序的随机打乱,与传统的纯随机矩阵有别,具体体现在没有破坏基掩模的正交性,但依然缺乏对目标采样的针对性。近年来发展起来的俄罗斯套娃序、折纸序、切蛋糕序和多分辨率管线序均建立在SPI所需的二维掩模基础上,继承了压缩采样特征。尤其需要指出的是:俄罗斯套娃序采用的是逆向递归生成思想,而多分辨率管线序采用的是正向演化生成思想;顺序序是Hadamard行向量一维连通域个数递增序,而切蛋糕序为Hadamard基掩模二维连通域个数递增序;折纸序与多分辨率管线序中的PE均用到了对低阶Hadamard基掩模的副本复制和反转。从宏观上看,俄罗斯套娃序、折纸序和多分辨率管线序均使用了分组和连通域个数递增相结合的思想,而顺序序和切蛋糕序实质上均采用了贪心算法,即直接对连通域个数进行排序。连通域个数变多,等效于连通域/散斑变小,实际上就是让调制掩模分辨率/精度由粗变细。为了达到全局最优,在未来的研究中需要综合考虑分组和多分辨率,充分利用Hadamard基结构化特征,从掩模构造角度提高感知的智能性。
其次,在频域优化排序中,主要介绍了离散余弦变换序、小波变换序、离散傅里叶变换序、全变分序、索引序和灰度共生矩阵对比度序。前3种为变换序,即采用某种矩阵变换,然后计算泛函作为度量标准进行排序。全变分序与前3种序不同,它没有计算矩阵变换,而是直接计算Hadamard基掩模的全变分梯度(等效于泛函),并将其作为度量标准进行排序。索引序则设计了一个函数来对由Hadamard行列索引所生成的Hadamard基掩模大方阵进行索引排序,实现从低频到高频的采样。该索引函数可以是关于Hadamard行列索引的任意一般函数
再次,在Hadamard基掩模内部像素排列中,行列主序最为常见,Zigzag和蛇形排列次之,它们都是将Hadamard行向量的元素按某种规则填充入像素网格以形成基掩模矩阵的,在基掩模矩阵中每个相同分辨率的像素元胞对应Hadamard行向量中的一个元素,这一填充过程其实就是矩阵存储。而在视觉焦点扩散排列中,填充次序变为从视焦向外螺旋扩散次序,在被填入元素的掩模矩阵中的每个元胞根据所在的视觉区域划分不同分辨率,在视焦区域的分辨率越高,在视焦周围区域的分辨率越低,这更加契合人眼对物体的感知,提供了很好的基掩模内部像素排列范例。
综合考虑当下技术瓶颈和研究现状,本综述分析总结了未来SPI确定性掩模构造的发展趋势,以供本领域学者借鉴和参考。
1)空域优化排序向着多尺度结构化特征发展。Hadamard基掩模空域优化排序需要更多地考虑Hadamard矩阵的结构化特征,深入研究其结构规律,提出新型衍生规律。科研工作者可以从Gray码出发研究二进制,发展掩模构造方法。在排序过程中,需要充分考虑分组和连通域个数递增策略,两者同样重要,需要将两者有机结合起来。空域优化排序的未来研究趋势必然向着空间多尺度(多层级)结构化掩模构造方向发展,这一发展规律同样适用于其他正交基掩模的排序。
2)频域优化排序向着多维度特征量交叉融合发展。Hadamard基掩模频率优化排序在引入频率算子时,算子选择过于单一,排序粗暴。而基掩模的频率特征量有许多个,在具体排序时,可以将多维度的特征量进行综合考量,建立完善的加权度量标准,以丰富排序的维度,将频域贪心排序变为全局最优排序。
3)基掩模内部像素排列向着空时变分辨率发展。Hadamard基掩模内部像素排列由空间定分辨率到变分辨率,可以换来视觉聚焦效果,这是历史发展的必然。而内部像素排列实为矩阵存储方式,矩阵存储除了二维存储还有三维存储、多维存储,其中,三维存储便是扩展至空时维度,即在二维掩模基础上增加纵向时域维度的排列。因此,我们预测Hadamard基掩模内部像素排列将向着空时变分辨率发展。
[1] Yu W K, Liu X F, Yao X R, et al. Single-photon compressive imaging with some performance benefits over raster scanning[J]. Physics Letters A, 2014, 378(45): 3406-3411.
[2] BracewellR N. The Fourier transform and its applications[M]∥McGraw-Hill series in electrical engineering, networks and systems. 2nd ed. New York: McGraw-Hill, 1986.
[3] Pratt W K, Kane J, Andrews H C. Hadamard transform image coding[J]. Proceedings of the IEEE, 1969, 57(1): 58-68.
[4] Sloane N J A, Harwit M. Masks for Hadamard transform optics, and weighing designs[J]. Applied Optics, 1976, 15(1): 107-114.
[5] Swift R D, Wattson R B, Decker J A,, et al. Hadamard transform imager and imaging spectrometer[J]. Applied Optics, 1976, 15(6): 1595-1609.
[6] Duarte M F, Davenport M A, Takhar D, et al. Single-pixel imaging via compressive sampling[J]. IEEE Signal Processing Magazine, 2008, 25(2): 83-91.
[7] Shapiro J H. Computational ghost imaging[J]. Physical Review A, 2008, 78(6): 061802.
[8] 马宇轩, 孟照魁, 黄宏旭, 等. 高速结构光器件及其在光学成像与测量中的应用[J]. 光学学报, 2022, 42(17): 1723001.
[9] 吴自文, 邱晓东, 陈理想. 关联成像技术研究现状及展望[J]. 激光与光电子学进展, 2020, 57(6): 060001.
[10] Zhang Z B, Ma X, Zhong J G. Single-pixel imaging by means of Fourier spectrum acquisition[J]. Nature Communications, 2015, 6: 6225.
[11] 邵晓鹏, 刘飞, 李伟, 等. 计算成像技术及应用最新进展[J]. 激光与光电子学进展, 2020, 57(2): 020001.
[12] Edgar M P, Gibson G M, Padgett M J. Principles and prospects for single-pixel imaging[J]. Nature Photonics, 2019, 13(1): 13-20.
[13] Gibson G M, Johnson S D, Padgett M J. Single-pixel imaging 12 years on: a review[J]. Optics Express, 2020, 28(19): 28190-28208.
[14] Donoho D L. Compressed sensing[J]. IEEE Transactions on Information Theory, 2006, 52(4): 1289-1306.
[15] Katz O, Bromberg Y, Silberberg Y. Compressive ghost imaging[J]. Applied Physics Letters, 2009, 95(13): 131110.
[16] Studer V, Bobin J, Chahid M, et al. Compressive fluorescence microscopy for biological and hyperspectral imaging[J]. Proceedings of the National Academy of Sciences of the United States of America, 2012, 109(26): E1679-E1687.
[17] Pian Q, Yao R Y, Sinsuebphon N, et al. Compressive hyperspectral time-resolved wide-field fluorescence lifetime imaging[J]. Nature Photonics, 2017, 11(7): 411-414.
[18] Howland G A, Dixon P B, Howell J C. Photon-counting compressive sensing laser radar for 3D imaging[J]. Applied Optics, 2011, 50(31): 5917-5920.
[19] Zhao C Q, Gong W L, Chen M L, et al. Ghost imaging lidar via sparsity constraints[J]. Applied Physics Letters, 2012, 101(14): 141123.
[20] Wu H D, Zhao M, Li F Q, et al. Underwater polarization-based single pixel imaging[J]. Journal of the Society for Information Display, 2020, 28(2): 157-163.
[21] 杨莫愁, 吴仪, 冯国英. 水下鬼成像的研究进展[J]. 光学学报, 2022, 42(17): 1701003.
[22] Clemente P, Durán V, Tajahuerce E, et al. Compressive holography with a single-pixel detector[J]. Optics Letters, 2013, 38(14): 2524-2527.
[23] 张华, 曹良才, 金国藩, 等. 基于压缩感知算法的无透镜数字全息成像研究[J]. 激光与光电子学进展, 2020, 57(8): 080001.
[25] Shi D F, Yin K X, Huang J, et al. Fast tracking of moving objects using single-pixel imaging[J]. Optics Communications, 2019, 440: 155-162.
[26] Jiao S M, Sun M J, Gao Y, et al. Motion estimation and quality enhancement for a single image in dynamic single-pixel imaging[J]. Optics Express, 2019, 27(9): 12841-12854.
[27] Sun S A, Gu J H, Lin H Z, et al. Gradual ghost imaging of moving objects by tracking based on cross correlation[J]. Optics Letters, 2019, 44(22): 5594-5597.
[28] Deng Q W, Zhang Z B, Zhong J G. Image-free real-time 3-D tracking of a fast-moving object using dual-pixel detection[J]. Optics Letters, 2020, 45(17): 4734-4737.
[29] Yu W K. Cryptographic key distribution over a public network via variance-based watermarking in compressive measurements[J]. Applied Optics, 2019, 58(19): 5294-5300.
[30] Yu W K, Wei N, Li Y X, et al. Multi-party interactive cryptographic key distribution protocol over a public network based on computational ghost imaging[J]. Optics and Lasers in Engineering, 2022, 155: 107067.
[31] Yu W K, Yang Y, Li Y X, et al. Multi-party cryptographic key distribution protocol over a public network based on a quick-response code[J]. Sensors, 2022, 22(11): 3994.
[32] Chan W L, Charan K, Takhar D, et al. A single-pixel terahertz imaging system based on compressed sensing[J]. Applied Physics Letters, 2008, 93(12): 121105.
[33] Watts C M, Shrekenhamer D, Montoya J, et al. Terahertz compressive imaging with metamaterial spatial light modulators[J]. Nature Photonics, 2014, 8(8): 605-609.
[34] Chen S S, Donoho D L, Saunders M A. Atomic decomposition by basis pursuit[J]. SIAM Journal on Scientific Computing, 1998, 20(1): 33-61.
[35] PatiY C, RezaiifarR, KrishnaprasadP S. Orthogonal matching pursuit: recursive function approximation with applications to wavelet decomposition[C]∥Proceedings of 27th Asilomar Conference on Signals, Systems and Computers, November 1-3, 1993, Pacific Grove, CA, USA. New York: IEEE Press, 2002: 40-44.
[36] Daubechies I, Defrise M, De Mol C. An iterative thresholding algorithm for linear inverse problems with a sparsity constraint[J]. Communications on Pure and Applied Mathematics, 2004, 57(11): 1413-1457.
[37] Wang Y L, Yang J F, Yin W T, et al. A new alternating minimization algorithm for total variation image reconstruction[J]. SIAM Journal on Imaging Sciences, 2008, 1(3): 248-272.
[38] 宗岩峰, 郑淮斌, 吴鑫伟, 等. 基于时序控制的赝热光鬼成像系统[J]. 光学学报, 2023, 43(7): 0711001.
[39] Candès E J, Tao T. Decoding by linear programming[J]. IEEE Transactions on Information Theory, 2005, 51(12): 4203-4215.
[40] Candès E J. The restricted isometry property and its implications for compressed sensing[J]. Comptes Rendus Mathematique, 2008, 346(9/10): 589-592.
[41] EladM. Sparse and redundant representations: from theory to applications in signal and image processing[M]. New York: Springer, 2010.
[42] Candès E J, Tao T. Near-optimal signal recovery from random projections: universal encoding strategies?[J]. IEEE Transactions on Information Theory, 2006, 52(12): 5406-5425.
[43] Yu W K, Liu X F, Yao X R, et al. Complementary compressive imaging for the telescopic system[J]. Scientific Reports, 2014, 4: 5834.
[44] Yu W K, Yao X R, Liu X F, et al. Compressive moving target tracking with thermal light based on complementary sampling[J]. Applied Optics, 2015, 54(13): 4249-4254.
[45] Yu W K, Yao X R, Liu X F, et al. Compressive microscopic imaging with “positive-negative” light modulation[J]. Optics Communications, 2016, 371: 105-111.
[46] Li Y X, Yu W K, Leng J A, et al. Pseudo-thermal imaging by using sequential-deviations for real-time image reconstruction[J]. Optics Express, 2019, 27(24): 35166-35181.
[47] Sun M J, Meng L T, Edgar M P, et al. A Russian Dolls ordering of the Hadamard basis for compressive single-pixel imaging[J]. Scientific Reports, 2017, 7: 3464.
[48] Yu W K, Liu Y M. Single-pixel imaging with origami pattern construction[J]. Sensors, 2019, 19(23): 5135.
[49] Yu W K. Super sub-Nyquist single-pixel imaging by means of cake-cutting Hadamard basis sort[J]. Sensors, 2019, 19(19): 4122.
[50] Yu W K, Li M F, Yao X R, et al. Adaptive compressive ghost imaging based on wavelet trees and sparse representation[J]. Optics Express, 2014, 22(6): 7133-7144.
[51] Dai H D, Gu G H, He W J, et al. Adaptive video compressed sampling in the wavelet domain[J]. Optics & Laser Technology, 2016, 81: 90-99.
[52] Wu H, Zhao G P, Wang R Z, et al. Computational ghost imaging system with 4-connected-region-optimized Hadamard pattern sequence[J]. Optics and Lasers in Engineering, 2020, 132: 106105.
[53] MundyJ L, JoynsonR E. Pipeline Walsh-Hadamard transformations: US3956619[P]. 1976-05-11.
[54] Fan C P, Yang J F. Fixed-pipeline two-dimensional Hadamard transform algorithms[J]. IEEE Transactions on Signal Processing, 1997, 45(6): 1669-1674.
[55] Zhou C, Zhao X W, Huang H Y, et al. Multi-resolution single-pixel imaging via Hadamard ‘pipeline’ coding[J]. Applied Physics B, 2020, 126(10): 163.
[56] Gao Z H, Li M H, Zheng P X, et al. Single-pixel imaging with Gao-Boole patterns[J]. Optics Express, 2022, 30(20): 35923-35936.
[57] 李明飞, 阎璐, 杨然, 等. 基于Hadamard矩阵优化排序的快速单像素成像[J]. 物理学报, 2019, 68(6): 064202.
Li M F, Yan L, Yang R, et al. Fast single-pixel imaging based on optimized reordering Hadamard basis[J]. Acta Physica Sinica, 2019, 68(6): 064202.
[58] Yu X, Yang F, Gao B, et al. Deep compressive single pixel imaging by reordering Hadamard basis: a comparative study[J]. IEEE Access, 2020, 8: 55773-55784.
[59] Vaz P G, Gaudêncio A S, Ferreira L F R, et al. Re-ordering of Hadamard matrix using Fourier transform and gray-level co-occurrence matrix for compressive single-pixel imaging in low resolution images[J]. IEEE Access, 2022, 10: 46975-46985.
[60] Yu X, Stantchev R I, Yang F, et al. Super sub-Nyquist single-pixel imaging by total variation ascending ordering of the Hadamard basis[J]. Scientific Reports, 2020, 10: 9338.
[61] 袁梓豪, 赵琳琳, 李明飞, 等. 一种对Hadamard测量基进行排序的方法: CN111130556A[P]. 2020-05-08.
YuanZ H, ZhaoL L, LiM F, et al. A method for reordering the Hadamard measurement basis: CN111130556A[P]. 2020-05-08.
[62] Ben-Artzi G, Hel-Or H, Hel-Or Y. The gray-code filter kernels[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(3): 382-393.
[63] López-García L, Cruz-Santos W, García-Arellano A, et al. Efficient ordering of the Hadamard basis for single pixel imaging[J]. Optics Express, 2022, 30(8): 13714-13732.
[64] Ma H Y, Sang A J, Zhou C, et al. A zigzag scanning ordering of four-dimensional Walsh basis for single-pixel imaging[J]. Optics Communications, 2019, 443: 69-75.
[65] Thiele S, Arzenbacher K, Gissibl T, et al. 3D-printed eagle eye: compound microlens system for foveated imaging[J]. Science Advances, 2017, 3(2): e1602655.
[66] Phillips D B, Sun M J, Taylor J M, et al. Adaptive foveated single-pixel imaging with dynamic supersampling[J]. Science Advances, 2017, 3(4): e1601782.
[67] Zhang K Y, Cao J, Hao Q, et al. Modeling and simulations of retina-like three-dimensional computational ghost imaging[J]. IEEE Photonics Journal, 2019, 11(1): 6900713.
[68] Zhai X, Cheng Z D, Hu Y D, et al. Foveated ghost imaging based on deep learning[J]. Optics Communications, 2019, 448: 69-75.
[69] Gao Z Q, Cheng X M, Zhang L F, et al. Compressive ghost imaging in scattering media guided by region of interest[J]. Journal of Optics, 2020, 22(5): 055704.
[70] Cao J E, Zhou D, Zhang F H, et al. A novel approach of parallel retina-like computational ghost imaging[J]. Sensors, 2020, 20(24): 7093.
[71] Hua J Y, Hua E K, Zhou F B, et al. Foveated glasses-free 3D display with ultrawide field of view via a large-scale 2D-metagrating complex[J]. Light: Science & Applications, 2021, 10: 213.
[72] Cao J E, Zhou D, Zhang Y Q, et al. Optimization of retina-like illumination patterns in ghost imaging[J]. Optics Express, 2021, 29(22): 36813-36827.
[73] Vaz P G, Amaral D, Ferreira L F R, et al. Image quality of compressive single-pixel imaging using different Hadamard orderings[J]. Optics Express, 2020, 28(8): 11666-11681.
[74] Yuan Y L A, Feng J, Jiao S M, et al. Adaptive and dynamic ordering of illumination patterns with an image dictionary in single-pixel imaging[J]. Optics Communications, 2021, 481: 126527.
[75] Higham C F, Murray-Smith R, Padgett M J, et al. Deep learning for real-time single-pixel video[J]. Scientific Reports, 2018, 8: 2369.
[76] Barbastathis G, Ozcan A, Situ G H. On the use of deep learning for computational imaging[J]. Optica, 2019, 6(8): 921-943.
Article Outline
俞文凯, 曹冲, 杨颖, 王硕飞. 单像素成像中哈达玛基掩模优化排序前沿进展[J]. 激光与光电子学进展, 2024, 61(4): 0400006. Wenkai Yu, Chong Cao, Ying Yang, Shuofei Wang. Frontier Advances in Optimized Ordering of the Hadamard Basis Patterns Used in Single-Pixel Imaging[J]. Laser & Optoelectronics Progress, 2024, 61(4): 0400006.