基于快速仿射模板匹配和改进仿射迭代最近点算法的人脸稳健精确仿射配准 下载: 803次
1 引言
人脸配准是指找到两幅人脸图像之间最佳的空间几何变换,使得这两幅人脸图像在空间域上达到几何位置的对应。人脸配准是计算机视觉的关键技术之一,在人脸识别[1-3]、姿势预测[4]和目标跟踪[5-6]等研究领域发挥了重要作用。
近年来,人脸配准在理论和实践上都取得了很大的进步。然而,基于单一匹配模板的人脸仿射配准问题仍未被广泛探索,导致这种情况的原因是仿射变换对人脸局部外形改变较大,也大大增加了人脸配准的难度。
对于一幅模板人脸图像,目前人脸仿射配准方法大致可以分为两类:直接匹配的方法和基于特征的方法。一方面,可以使用直接匹配的方法解决人脸仿射配准问题,其中最流行的是仿射迭代最近点(AICP)算法[7-9],该算法通过最小化两幅人脸形状之间的均方根误差(RMSE),直接求解两幅人脸图像之间最佳的仿射变换,然而由于AICP算法缺乏形状约束,其仿射配准结果容易陷入局部最小值问题。Baker等[10]提出了一种基于两帧差分的光流估计算法,该算法通过寻找两幅人脸图像之间的参数光流映射,直接最小化两幅人脸图像的配准误差,然而其参数优化过程是基于梯度下降的,对初始值十分敏感。Yang等[11]在光流估计算法的基础上,提出了一种基于单个模板的人脸配准方法,该方法建立了一个非线性人脸变换模型,将人脸形状参数转换到一个更紧凑的空间,提高了人脸配准的精度,然而这种方法只适用于中性表情的人脸模板。Dekel等[12]提出了一种基于互最近邻搜索的稳健图像配准方法,但是该方法难以解决旋转和尺度变换下的人脸配准问题。最近,Korman等[13]提出了一种新颖的图像配准方法,称为快速仿射模板匹配(Fast-match)算法,该算法通过建立仿射变换网络并最小化人脸模板仿射映射后产生的绝对误差和(SAD),可以找到一个最佳的人脸仿射变换,然而由于该算法仅关注两幅人脸图像之间的颜色相似性,而忽略了形状错配率,因此导致人脸仿射配准的精度较低。
另一方面,可以使用基于特征的方法[14-16]解决人脸仿射配准问题,包括尺度不变特征变换(SIFT)[17]、加速稳健特征(SURF)[18]、方向梯度直方图(HoG)[19]和面向快速旋转的BRIEF(ORB)[20]等算法。这些算法使用局部特征建立模板人脸图像和目标人脸图像之间的对应关系,只要给定足够的对应特征点,就可以计算出模板人脸图像和目标人脸图像之间的仿射变换。然而这些算法依赖于在每幅人脸图像中独立地检测到相同的特征点,并且要求这些特征点的描述符具有仿射不变性。
本文提出了一种基于单一匹配模板的人脸仿射配准方法。首先,为了克服人脸仿射变换而产生的局部形变,引入颜色特征来平衡模板人脸图像和目标人脸图像之间的颜色相似性和形状错配率。其次,在Fast-match算法配准框架的基础上,提出了一种基于颜色特征的人脸粗搜索算法。最后,利用人脸粗搜索算法得到的仿射变换作为初始约束,建立了上步仿射约束下的人脸形状精确配准(FSFR)算法。
2 人脸仿射配准理论
提出了一种基于颜色特征的人脸粗搜索算法,然后以人脸粗搜索算法得到的仿射变换作为初始约束,建立了上步仿射约束下的FSFR算法。
2.1 基于颜色特征的人脸粗搜索算法
人脸粗搜索的目标是寻找一个最佳的仿射变换
图 1. 两种相似性度量点集采样方法。 (a)本文方法;(b)Fast-match算法
Fig. 1. Two similarity measure point set sampling methods. (a) Proposed method; (b) Fast-match algorithm
此时,模板人脸图像和目标人脸图像对应位置的像素SAD可以表示为
式中
基于颜色特征的人脸粗搜索算法采用迭代更新的方法,从仿射变换集合
1) 在形状点集{
2) 利用(1)式计算每一个仿射变换
式中
3) 更新精度因子
式中
4) 合并所有扩充后的子仿射变换集合,得到新的仿射变换集合
重复上述步骤,直到
2.2 FSFR算法
由于最相似的颜色通常不代表最相似的形状,人脸粗搜索阶段得到的仿射变换
式中
式中
1) 根据
2) 根据对应关系
由于每次迭代的步骤1可以通过k-d树[22-23]或基于Delaunay三角分解的最近点搜索算法[24-25]完成,因此FSFR算法的关键是求解每次迭代的步骤2。将(8)式重写为
令d
将
则目标函数
令
则(12)式可被进一步化简为
为了最小化目标函数
将仿射矩阵
直到
3 实验结果与分析
为了验证本文算法的稳健性和精确性,选择Stereo人脸数据库[26]和麻省理工学院生物和计算学习中心(MIT-CBCL)人脸数据库[27]进行实验。设置了3组人脸仿射配准实验:第一组实验研究了FSFR算法的配准性能;第二组实验研究了噪声干扰对FSFR算法配准精度的影响;第三组实验研究了约束系数
3.1 实验设置
首先从Stereo人脸数据库和MIT-CBCL人脸数据库中,各分别选择3对具有局部形变和视角变换的人脸图像。接着对每对图像中的目标人脸图像进行旋转和尺度变换,旋转和尺度变换共有9种组合方式:旋转0°、旋转45°、旋转90°、旋转135°、旋转180°、缩小为0.5倍、扩大为1.5倍、旋转45°并缩小为0.5倍、旋转45°并扩大为1.5倍。这样,可以得到54对包含旋转和尺度变换的人脸图像。为了更好地比较人脸仿射配准结果,为所有人脸图像都手动标注了42个人脸特征点,并利用这些人脸特征点来验证最终仿射变换(
基于这些人脸特征点,定义人脸仿射配准误差(FARE)为
式中
3.2 FSFR算法的配准性能
第一组实验研究了FSFR算法的配准性能,选择54对包含旋转和尺度变换的人脸图像进行人脸形状的精确配准实验。不同人脸配准算法的仿射配准结果如
由
表 1. 不同人脸配准算法的仿射配准结果
Table 1. Affine registration results for different face registration algorithms
|
图 3. 不同人脸配准算法的部分仿射配准效果图。(a)旋转90°;(b)旋转0°;(c)缩小为一半;(d)旋转45°并扩大为1.5倍
Fig. 3. Partial affine registration effect graphs for different face registration algorithms. (a) Rotate 90°; (b) Rotate 0°; (c) shrink to the half; (d) Rotate 45° and expand to 1.5 times
图 4. 不同人脸配准算法的部分仿射配准结果
Fig. 4. Partial affine registration results for different face registration algorithms
由
3.3 噪声干扰对FSFR算法配准精度的影响
第二组实验研究了噪声干扰对FSFR算法配准精度的影响。选择第19对人脸图像进行仿射配准实验。在实验中,分别在目标人脸图像上加入方差为0.01,0.05,0.1,0.2,0.4,0.6,0.8和1的高斯噪声。
表 2. 不同高斯噪声干扰下各人脸配准算法的人脸仿射配准误差结果
Table 2. Face affine registration error results for different face registration algorithms with different Gaussian noise interferences
|
由
在
3.4 约束系数对FSFR算法配准精度的影响
第三组实验研究了约束系数
图 5. 不同高斯噪声干扰下FSFR算法的人脸仿射配准效果图。 (a)模板人脸图像;(b)方差为0.01;(c)方差为0.05;(d)方差为0.1;(e)方差为0.2;(f)方差为0.4;(g)方差为0.6;(h)方差为0.8;(i)方差为1.0
Fig. 5. Face affine registration effect graphs of FSFR algorithm with different Gaussian noise interferences. (a) Template face image; (b) variance of 0.01; (c) variance of 0.05; (d) variance of 0.1; (e) variance of 0.2; (f) variance of 0.4; (g) variance of 0.6; (h) variance of 0.8; (i) variance of 1.0
图 6. 不同约束系数下FSFR算法的人脸仿射配准误差曲线
Fig. 6. Face affine registration error curves of FSFR algorithm with different constraint coefficients
由
图 7. 不同约束系数下FSFR算法的人脸仿射配准效果图。(a) α=0; (b) α=0.5; (c) α=1; (d) α=1.5; (e) α=2; (f) α=2/k
Fig. 7. Face affine registration effect graphs of FSFR algorithm with different constraint coefficients. (a) α=0; (b) α=0.5; (c) α=1; (d) α=1.5; (e) α=2; (f) α=2/k
4 结论
提出了一种基于单一匹配模板的人脸仿射配准理论。首先,为了综合考虑两幅人脸图像的颜色相似性和形状错配率,提出了一种基于颜色特征的人脸粗搜索算法。接着,以人脸粗搜索算法得到的仿射变换为初始约束,建立了前步仿射约束下的FSFR算法。实验结果表明,本文算法成功解决了旋转、尺度变换和噪声干扰下人脸形状难以配准的问题。与传统的人脸配准算法相比,本文算法的稳健性和精确性都有了很大提高。在后续工作中,本文算法将被扩展为3D人脸配准算法,并且应用到三维人脸重建中。
[2] 周亮基, 李庆武, 霍冠英, 等. 基于NSCT和仿生模式的人脸图像识别方法[J]. 激光与光电子学进展, 2015, 52(3): 031001.
周亮基, 李庆武, 霍冠英, 等. 基于NSCT和仿生模式的人脸图像识别方法[J]. 激光与光电子学进展, 2015, 52(3): 031001.
[4] YeM, Wang XW, Yang RG, et al. Accurate 3D pose estimation from a single depth image[C]. International Conference on Computer Vision, 2011, 24( 4): 731- 738.
YeM, Wang XW, Yang RG, et al. Accurate 3D pose estimation from a single depth image[C]. International Conference on Computer Vision, 2011, 24( 4): 731- 738.
[5] Chen C L, Jian B L. Infrared thermal facial image sequence registration analysis and verification[J]. Infrared Physics & Technology, 2015, 69: 1-6.
Chen C L, Jian B L. Infrared thermal facial image sequence registration analysis and verification[J]. Infrared Physics & Technology, 2015, 69: 1-6.
[6] Sariyanidi E, Gunes H, Cavallaro A. Robust registration of dynamic facial sequences[J]. IEEE Transactions on Image Processing, 2017, 26(4): 1708-1722.
Sariyanidi E, Gunes H, Cavallaro A. Robust registration of dynamic facial sequences[J]. IEEE Transactions on Image Processing, 2017, 26(4): 1708-1722.
[7] HoJ, Yang MH, RangarajanA, et al. A new affine registration algorithm for matching 2D point sets[C]. IEEE Workshop on Applications of Computer Vision, 2007: 25.
HoJ, Yang MH, RangarajanA, et al. A new affine registration algorithm for matching 2D point sets[C]. IEEE Workshop on Applications of Computer Vision, 2007: 25.
[8] 韦盛斌, 王少卿, 周常河, 等. 用于三维重建的点云单应性迭代最近点配准算法[J]. 光学学报, 2015, 35(5): 0515003.
韦盛斌, 王少卿, 周常河, 等. 用于三维重建的点云单应性迭代最近点配准算法[J]. 光学学报, 2015, 35(5): 0515003.
[9] 周文振, 陈国良, 杜珊珊, 等. 一种聚类改进的迭代最近点配准算法[J]. 激光与光电子学进展, 2016, 53(5): 051202.
周文振, 陈国良, 杜珊珊, 等. 一种聚类改进的迭代最近点配准算法[J]. 激光与光电子学进展, 2016, 53(5): 051202.
[10] Baker S, Matthews I. Lucas-Kanade 20 years on: a unifying framework[J]. International Journal of Computer Vision, 2004, 56(3): 221-255.
Baker S, Matthews I. Lucas-Kanade 20 years on: a unifying framework[J]. International Journal of Computer Vision, 2004, 56(3): 221-255.
[11] Yang Y, Liu Y H, Liu J Y. Automatic face image annotation based on a single template with constrained warping deformation[J]. IET Computer Vision, 2013, 7(1): 20-28.
Yang Y, Liu Y H, Liu J Y. Automatic face image annotation based on a single template with constrained warping deformation[J]. IET Computer Vision, 2013, 7(1): 20-28.
[12] DekelT, OronS, RubinsteinM, et al. Best-buddies similarity for robust template matching[C]. IEEE Conference on Computer Vision and Pattern Recognition, 2015: 2021- 2029.
DekelT, OronS, RubinsteinM, et al. Best-buddies similarity for robust template matching[C]. IEEE Conference on Computer Vision and Pattern Recognition, 2015: 2021- 2029.
[13] KormanS, ReichmanD, TsurG, et al. Fast-match: fast affine template matching[C]. IEEE Conference on Computer Vision and Pattern Recognition, 2013: 2331- 2338.
KormanS, ReichmanD, TsurG, et al. Fast-match: fast affine template matching[C]. IEEE Conference on Computer Vision and Pattern Recognition, 2013: 2331- 2338.
[14] CristinacceD, Cootes TF. Feature detection and tracking with constrained local models[C]. British Machine Vision Conference, 2006: 929- 938.
CristinacceD, Cootes TF. Feature detection and tracking with constrained local models[C]. British Machine Vision Conference, 2006: 929- 938.
[15] LiangL, XiaoR, WenF, et al. Face alignment via component-based discriminative search[C]. 10th European Conference on Computer Vision, 2008: 72- 85.
LiangL, XiaoR, WenF, et al. Face alignment via component-based discriminative search[C]. 10th European Conference on Computer Vision, 2008: 72- 85.
[16] GrittiT, Shan CF, JeanneV, et al. Local features based facial expression recognition with face registration errors[C]. 8th IEEE International Conference on Automatic Face & Gesture Recognition, 2008: 1- 8.
GrittiT, Shan CF, JeanneV, et al. Local features based facial expression recognition with face registration errors[C]. 8th IEEE International Conference on Automatic Face & Gesture Recognition, 2008: 1- 8.
[17] Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision, 2004, 60(2): 91-110.
Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International Journal of Computer Vision, 2004, 60(2): 91-110.
[18] BayH, Tuytelaars T, van Gool L. SURF: speeded up robust features[C]. 9th European conference on Computer Vision, 2006: 404- 417.
BayH, Tuytelaars T, van Gool L. SURF: speeded up robust features[C]. 9th European conference on Computer Vision, 2006: 404- 417.
[19] DalalN, TriggsB. Histograms of oriented gradients for human detection[C]. IEEE Conference on Computer Vision and Pattern Recognition, 2005: 886- 893.
DalalN, TriggsB. Histograms of oriented gradients for human detection[C]. IEEE Conference on Computer Vision and Pattern Recognition, 2005: 886- 893.
[20] RubleeE, RabaudV, KonoligeK, et al. ORB: an efficient alternative to SIFT or SURF[C]. IEEE International Conference on Computer Vision, 2012: 2564- 2571.
RubleeE, RabaudV, KonoligeK, et al. ORB: an efficient alternative to SIFT or SURF[C]. IEEE International Conference on Computer Vision, 2012: 2564- 2571.
[21] RostenE, DrummondT. Machine learning for high-speed corner detection[C]. 9th European Conference on Computer Vision, 2006: 430- 443.
RostenE, DrummondT. Machine learning for high-speed corner detection[C]. 9th European Conference on Computer Vision, 2006: 430- 443.
[22] NuchterA, LingemannK, HertzbergJ. Cached k-d tree search for ICP algorithms[C]. 6th International Conference on 3-D Digital Imaging and Modeling, 2007: 419- 426.
NuchterA, LingemannK, HertzbergJ. Cached k-d tree search for ICP algorithms[C]. 6th International Conference on 3-D Digital Imaging and Modeling, 2007: 419- 426.
[23] Dasgupta S, Sinha K. Randomized partition trees for nearest neighbor search[J]. Algorithmica, 2015, 72(1): 237-263.
Dasgupta S, Sinha K. Randomized partition trees for nearest neighbor search[J]. Algorithmica, 2015, 72(1): 237-263.
[24] Chen H, Lin T. An algorithm to build convex hulls for 3D objects[J]. Journal of the Chinese Institute of Engineers, 2006, 29(6): 945-952.
Chen H, Lin T. An algorithm to build convex hulls for 3D objects[J]. Journal of the Chinese Institute of Engineers, 2006, 29(6): 945-952.
[25] Alexander C. Delineating tree crowns from airborne laser scanning point cloud data using Delaunay triangulation[J]. International Journal of Remote Sensing, 2009, 30(14): 3843-3848.
Alexander C. Delineating tree crowns from airborne laser scanning point cloud data using Delaunay triangulation[J]. International Journal of Remote Sensing, 2009, 30(14): 3843-3848.
[26] FransensR, Strecha C, van Gool L. Parametric stereo for multi-pose face recognition and 3d-face modeling[C]. 2nd International Conference on Analysis and Modeling of Faces and Gestures, 2005: 109- 124.
FransensR, Strecha C, van Gool L. Parametric stereo for multi-pose face recognition and 3d-face modeling[C]. 2nd International Conference on Analysis and Modeling of Faces and Gestures, 2005: 109- 124.
[27] Rowley H A, Baluja S, Kanade T. Neural network-based face detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(1): 23-38.
Rowley H A, Baluja S, Kanade T. Neural network-based face detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1998, 20(1): 23-38.
Article Outline
吴礼洋, 熊磊, 杜少毅, 毕笃彦, 方挺. 基于快速仿射模板匹配和改进仿射迭代最近点算法的人脸稳健精确仿射配准[J]. 光学学报, 2018, 38(2): 0210004. Liyang Wu, Lei Xiong, Shaoyi Du, Duyan Bi, Ting Fang. Robust and Precise Affine Registration for Faces Based on Fast Affine Template Matching and Modified Affine Iterative Closet Point Algorithm[J]. Acta Optica Sinica, 2018, 38(2): 0210004.