基于T分布混合模型的多光谱人脸图像配准 下载: 1045次
1 引言
图像融合技术能够分析提取多光谱图像传感器的互补信息,从而合成一幅能详尽表达复杂目标场景信息的准确图像。由于图像融合过程更切合人眼的视觉特性,对于研究目标检测和识别方法具有重要的意义,因此被广泛应用于遥感图像处理、医学影像分析、**目标检测、视频安防监控等领域[1-3]。人脸识别作为一种有效的非接触式生物识别手段,一直以来都是模式识别领域的研究热点。鉴于可见光与红外图像反映的人脸特征信息不同,例如:可见光图像分辨率高,可以提供丰富的人脸细节信息;而红外图像具有较高的热对比度,不易受到外界环境光照、姿态及伪装等因素对人脸识别性能的影响,因此将可见光与红外图像融合应用到人脸识别领域是目前人脸识别技术的发展趋势[4]。然而,快速准确地实现异源图像的配准是多传感器图像融合成功的前提,也是决定图像融合技术发展的关键环节[5]。
目前,异源图像如红外和可见光图像的配准方法可以分为两种。第一种方法是建立双波段共轴光路系统,利用分束器让同一个窗口输入的双波段光线分别在不同传感器上成像[6],这种通过搭建同轴光路的硬件配准方法虽然精度高,但是光学系统结构复杂,成本高,体积大,不具有普遍适用性。第二种方法是先建立双波段旁轴光路系统,再利用后续的图像配准算法补偿平行光路系统带来的视差,这种方法虽然没有前者配准精度高,但是光学系统结构简单,成本低廉,体积小,更适合应用于实际目标检测和场景识别领域[7]。针对第二种通过后续软件进行图像校正的配准方法,目前常用的策略是将图像配准视为一个概率密度估计问题,并采用高斯混合模型(GMM)建模对图像变换关系进行求解。2010年Boughorbel等[8]提出一种基于高斯场准则刚性图像配准方法。随后,Myronenko等[9]提出一种基于高斯统计模型的一致性点漂移算法(CPD),该算法正则化配准图像点集中的位置偏移场,使之遵从运动一致性原理(MCT),可以解决刚性以及非刚性图像配准问题,对于噪声、离群点具有一定的抑制能力。2015年Ma等[10]在Boughorbel刚性配准模型基础上加入正则项,将Boughorbel刚性配准模型扩展为非刚性配准模型。此外,为加快可见光和红外人脸图像的配准速度,Tian等[11]提出一种仅利用人脸面部外围轮廓信息进行刚性配准的方法。考虑到高斯分布只能描述具有高斯特征的图像数据,不能准确地描述具有重尾特征的图像数据,而Student's-T分布自身具有重尾的特点,可通过自由度控制分布曲线形态及尾部厚度,能够适应不同类型的图像数据需要。Gerogiannis等[12]选用Student's-T分布代替高斯分布实现刚性图像的配准。Zhou等[13]参照CPD算法,在Student's-T分布混合模型的基础上加入变形场,提出一种基于Student's-T分布的非刚性图像配准方法,但是该算法在图像配准中只考虑了特征点的空间约束信息,并没有考虑特征点的局部形状特征。2017年Maiseli等[14]总结了近些年来图像配准技术的研究现状及发展趋势,指出充分利用Student's-T分布对噪声和离群点不敏感的优势进行建模,将会是非刚性图像配准技术的一个发展方向。
本文综合考虑特征点的空间几何结构和局部形状特征两方面信息,解决非刚性人脸图像的配准过程中存在的问题,在基于特征的图像配准方法框架基础上,提出一种由粗到细的可见光和红外人脸图像配准方法。该方法首先利用基于内部距离的形状上下文(IDSC)描述子作为局部特征信息,建立图像特征点的初始匹配关系;然后将非刚性点集的配准过程转化为Student's-T分布概率密度函数的参数估计问题;最后通过最大化观测数据的Student's-T分布后验概率求解点集的空间变换模型,并利用薄板样条插值方法实现可见光和红外人脸图像的配准。实验结果表明,该方法可以实现可见光和红外人脸图像的精确配准,具有较强的稳健性。
2 算法描述
2.1 基于特征的人脸图像配准基本框架
与基于区域的图像配准方法不同,基于特征的图像配准方法首先提取两幅图像的显著特征以形成特征点集,然后确立模板点集与目标点集之间的对应关系,并估计图像间空间坐标的变换参数,从而实现图像配准。
特征提取的目的是在图像中尽可能多地提取一些显著性或辨识度较高的点。例如,针对可见光和红外图像两种不同的成像模式,常用的包含纹理信息的灰度或颜色特征并不适用于表示异源图像的共有信息,而是采用特定的显著性结构特征(如角点,强边缘、具有高曲率的点、直线交叉点、结构性轮廓)来表示异源图像的共同信息。其中,Canny边缘检测采用双阈值检测图像的强、弱边缘,具有信噪比高、边界点定位性能好、边缘的误检率低等优点,因此使用Canny算子提取可见光和红外人脸图像显著性特征。提取到图像的轮廓边界后,在轮廓上均匀采样就可以得到可见光和红外图像对应的模板点集和目标点集。
图 1. 基于特征的可见光和红外人脸图像配准流程
Fig. 1. Infrared and visible face image registration process based on feature maps
特征匹配的目的是建立模板点集与目标点集的正确对应关系,并估计一个变换函数将模板点集对齐到目标点集。一般来说,如果两个点集表示相似的形状,那么对应点将会有相似的领域结构信息,可以用直方图来描述这种局部特征。然而,仅依赖相邻像素间的局部特征只能得到粗略的配准,还需要结合特征点之间的空间位置约束信息进一步提高配准精度。因此,针对可见光和红外人脸图像配准关键问题,本文提出一种基于局部特征和Student's-T混合模型(SMM)的图像配准方法,该方法分为以下两个步骤: 1)利用IDSC信息作为点集局部特征描述子,建立点集间的初始配准关系;2)采用Student's-T分布构建包含点集空间位置相关性的概率统计模型,剔除初始配准点集中的噪声和离群点,实现可见光和红外图像特征点集间的精确配准。
2.2 基于局部特征描述子的初始配准
形状上下文(SC)[15]是一种常用的基于形状轮廓的局部特征描述算法,其本质是把轮廓边界采样点中该点相对于其他特征点的角度及距离的统计直方图作为轮廓上每个点的形状上下文信息。而IDSC[16]是在SC算法的基础上引入对连接、部分结构不敏感的内部距离来取代采样点间的欧氏距离,与传统的SC算法相比,IDSC算法对目标存在结构上或者关联上的失真以及非刚性变形具有良好的稳健性,因此采用IDSC算法作为局部特征描述子来建立点集间的初始配准。其中,内部距离可以理解为在形状内部两点间的最短距离,如果连接两点之间的线段都位于特征形状的内部,则两点之间的内部距离就等于欧氏距离。如果连接两点之间的线段不全位于特征形状内部,则内部距离实际上是各个采样点之间欧氏距离的代数和,可以利用Bellman-Ford最短路径算法来计算任意两点之间的最短路径。
对于每个采样点,计算该点到其余点的内部距离和角度,从而得到一个基于距离和角度分割的二维统计直方图,称之为每个采样点的IDSC局部特征描述子。设
从
式中:
2.3 基于空间位置约束的精确配准
为进一步提高图像特征点集的配准精度,在图像配准过程中还需考虑特征点的空间位置分布信息。高斯混合模型作为一种常用的聚类方法,广泛应用于图像的分割和配准领域[9]。但是由于高斯分布属于轻尾分布,噪声和离群点的存在会对模型参数估计的结果有较大影响,因此需要一种更稳健的概率模型来尽量减少这种影响。与高斯分布相比,Student's-T分布属于重尾分布,具有较好的稳健性,更适合处理数据集中、存在噪声和离群点等少概率事件的情况[17]。如
图 2. IDSC人脸轮廓特征提取示意图。(a)人脸轮廓采样点构成的Bellman-Ford最短路径图;(b)标记的4个采样点;(c)对应的IDSC特征直方图
Fig. 2. Diagrams of face silhouette feature extraction based on IDSC. (a) Bellman-Ford shortest path graph built using face silhouette landmark points; (b) four marked points; (c) their IDSC feature histograms
图 3. 不同自由度下的Student's-T分布曲线
Fig. 3. Student's T distribution for various degrees of freedom
假设目标点集和模板点集分别表示为
式中:
为了方便计算多元SMM的极大似然估计,需要引入观测数据
则完全数据的对数似然函数ln
其中
利用期望最大化算法(EM)求解(5)式参数集合
1) E-步求期望,根据(2)式,利用当前的混合参数值
计算完全数据的对数似然函数
辅助函数
式中:
式中:
式中:
2) M-步求期望最大化,通过最大化辅助函数
式中:
对
式中:
交替执行上述E-步和M-步,更新后验概率
3 实验结果与讨论
为验证本文图像配准方法的有效性,在Inter© CoreTM i5-4590 CPU@3.3 GHz、4 GB内存的PC机上,基于MATLAB R2014a(8.3)软件在仿真点集数据和真实人脸图像上进行了图像配准实验。将基于局部特征和T分布混合模型的图像配准算法( L-SMM)与高斯混合模型加形状上下文特征图像配准算法(RPM-GMM[10])和SMM[13]等处于领先水平的非刚性点集配准算法进行比较分析。
3.1 仿真数据集
采用文献[
18]中的数据集进行点集配准仿真,考虑到汉字“福”的模型比较复杂,具有连接、部分结构更符合人脸特征的特点,因此选择数据集中的汉字“福”的形状点集进行配准仿真。
图 5. 汉字福仿真点集配准结果。(a)~(c)配准前的点集; (d)~(f)本文算法的配准结果;(g)~(i) 3种配准算法的召回率曲线
Fig. 5. Registration results on synthetic Chinese character point sets. (a)-(c) Point sets before registration; (d)-(f) registration results of proposed algorithm; (g)-(i) recall curves of three registration algorithms
3.2 真实人脸图像配准
在真实图像数据仿真中,采用公开的红外/可见光人脸图像数据库UTK-IRIS进行多光谱人脸图像配准仿真。该数据库包含了不同光照、不同姿态、不同表情以及不同种族的红外/可见光人脸图像。从数据集中随机抽取了部分个体的人脸图像(Charles, Heo, Gribok,Sharon)进行配准仿真,每个测试个体包含不同角度和光照强度下拍摄的多光谱人脸图像,配准结果如
考虑到L-SMM与RPM-GMM算法配准效果相差不明显,从棋盘格图像无法直观地比较优劣,因此采用Recall曲线作为实际多光谱人脸图像配准精度的定量评测标准,在
图 6. UTK-IRIS数据集下可见光和红外人脸图像配准结果。(a)(b)原始的可见光和红外图像;(c)人脸边缘图;(d)(e)可见光和红外图像变形叠加后生成的棋盘格图像
Fig. 6. Visible and infrared face registration results in UTK-IRIS database. (a)(b) Original visible and infrared images; (c) face edge maps; (d)(e) checkerboards of warping visible image into and infrared image
在
表 1. 各配准算法的平均匹配误差和运行时间比较
Table 1. Comparison of average matching errors and running time with different registration algorithms
|
图 7. 不同个体的多光谱人脸图像数据集的定量比较结果。(a) Charles;(b) Heo;(c) Gribok;(d) Sharon
Fig. 7. Quantitative result comparison of multispectral face image pairs of different individuals. (a) Charles; (b) Heo; (c) Gribok; (d) Sharon
由
此外,为了检验本文算法在实际应用场景下的配准效果,利用比利时Xenics红外相机和大恒图像公司水星系列彩色工业相机构建了一套简易的多光谱成像系统。
图 8. 自行采集的可见光和红外人脸图像配准和融合结果。(a)原始可见光图像;(b)原始红外图像;(c)棋盘格图像;(d)融合图像
Fig. 8. Visible and infrared face image registration and fusion results captured by ourselves. (a) Original visible images; (b) original infrared images; (c) checkerboard images; (d) fusion images
4 结论
提出了一种基于局部特征和Student's-T混合模型的多光谱人脸图像配准方法,即在图像配准过程中采用IDSC描述子与Student's-T分布混合概率密度函数相结合的策略,降低了多光谱人脸图像中出现非刚性形变、噪声及离群点等因素对配准结果的影响,并通过仿真和实测实验验证了所提方法的有效性。通过可见光和红外人脸图像数据的定性和定量评测,与2种处于领先水平的非刚性图像配准方法相比,所提方法在平均匹配误差和运算效率方面都具有一定的优势,可为后续多光谱人脸图像融合和全天候检测识别研究提供精度保证。鉴于图像配准最终目的是提升多光谱图像融合质量,因此在后续的研究工作中,将结合多种图像融合算法对所提图像配准方法精度进行全面、科学的评价,并扩大测试样本在自主构建的多光谱人脸数据集中进行系统测试。
[1] 丁文杉, 毕笃彦, 何林远, 等. 基于剪切波变换和邻域结构特征的红外与可见光图像融合[J]. 光学学报, 2017, 37(10): 1010002.
[2] 刘先红, 陈志斌. 基于多尺度方向引导滤波和卷积稀疏表示的红外与可见光图像融合[J]. 光学学报, 2017, 37(11): 1110004.
[3] Pal AR, SinghaA. A comparative analysis of visual and thermal face image fusion based on different wavelet family[C]//2017 International Conference on Innovations in Electronics, Signal Processing and Communication (IESC), April 6-7, 2017, Shillong, India. New York: IEEE, 2017: 8071895.
[5] 刘晓春, 钟涛, 于起峰, 等. 基于局部频率信息和单纯型-模拟退火的异源图像配准[J]. 光学学报, 2013, 33(6): 0615002.
[6] 林青, 金伟其, 郭宏, 等. 可见光/长波红外共聚焦窗口望远物镜设计[J]. 光学学报, 2012, 32(9): 0922005.
[19] Zhan L C, Zhuang Y, Huang L D. Infrared and visible images fusion method based on discrete wavelet transform[J]. Journal of Computers, 2017, 28(2): 57-71.
Article Outline
李巍, 董明利, 吕乃光, 娄小平. 基于T分布混合模型的多光谱人脸图像配准[J]. 光学学报, 2019, 39(7): 0710001. Wei Li, Mingli Dong, Naiguang Lü, Xiaoping Lou. Multispectral Face Image Registration Based on T-Distribution Mixture Model[J]. Acta Optica Sinica, 2019, 39(7): 0710001.