具有活体检测功能的手背静脉身份识别方法研究 下载: 995次
1 引言
随着信息技术的高速发展,个人信息的安全问题越来越受到关注。传统的身份识别方法例如磁卡、身份证等由于识别信息容易被伪造或丢失已不能确保身份的唯一性、真实性,无法满足市场的需求。生物特征识别技术是一项新兴的身份识别技术,指纹、人脸、虹膜和静脉是最常用的生物特征[1]。指纹识别[2]技术具有识别精度高、设备成本低、应用最广泛等特点,但手指的湿度和磨损程度都会降低识别精度。人脸识别[3]技术具有无侵害、非接触、用户体验好等特点。虹膜识别[4]技术的识别精度和安全系数最高,但其设备要求高、价格高。静脉识别技术[5]是近几十年提出的生物特征识别技术,研究表明,静脉特征独一无二,双胞胎、同一个人的左右手的静脉特征都存在很大的差异。静脉识别技术[6]具有非接触、装置简单、价格低等特点,且静脉位于皮肤之下,皮肤磨损、积灰也不会影响识别结果,使得静脉识别技术成为研究热点。
静脉识别包括图像获取、图像预处理、特征提取和特征分类四个步骤,特征提取的目的是保证同类物体在特征空间中具有高度一致性,不同类别物体具有可分性[7],有效的特征提取方法是提高系统识别精度和降低系统复杂性的前提。清华大学的林喜荣等[8]将静脉的端点和交叉点作为静脉特征,得到了95.4%的识别率。Hong等[9]将静脉的长度和节点作为静脉特征进行识别。Ladoux等[10]采用尺度不变特征变换(SIFT)算子提取手掌静脉图像中的静脉角点进行掌静脉识别。这些方法简单直观且有效,但是获得的信息量比较少,且容易受到局部形变、噪声和伪特征点的影响。因此,研究者们进一步提出了全局特征提取的方法:北方工业大学的王一丁等[11]采用分块局部二值模式(PLBP)的方法提取静脉特征,得到了98.77%的匹配率;中国科学技术大学的刘超等[12]利用改进的局部二值模式(LBP)算法进行特征提取,得到了99.33%的准确率。全局特征提取能获得丰富的特征信息从而取得较好的识别结果,而且能克服图像分割、细化等处理的缺点,但是该方法提取的特征维数很高、信息重叠严重,系统运算较复杂。主成分分析(PCA)[13]是经典的数据处理算法,可用来降低向量维数,去除特征向量中重叠的、冗余的信息,提高系统的运行速度。马氏距离(MD)[14]是多元数据中离群点检测的一种有效方法,可去除由于环境及人为因素而产生的异常样本,提高系统的识别精度。近年来,随机森林(RF)算法和支持向量机(SVM)算法在很多领域中被用于分类识别。RF算法[15]是一种组合分类器,相比传统的模式识别算法具有更强的泛化能力和鲁棒性。然而,RF算法也有缺点,过度的森林模型导致模型冗余,降低了分类效率,因此,需要优化RF模型的决策树个数。SVM[16]是一种有监督的机器学习算法,在小样本、非线性、高维数据空间的模式识别问题上表现出很强的优势,但是SVM中的正则化参数c与高斯核参数σ对模型的复杂度、预测准确度具有很大的影响,因此有必要对c和σ进行优化。
静脉虽然是一种高安全性的生物特征,但也存在被假体攻击的风险:2015年,王一丁[17]将纸质打印的手背静脉图像在NCUT-LFDHV手背静脉数据库上进行测试,结果有超过20%的打印的手背静脉图像被认为是真实手背静脉并通过了系统测试。因此,在静脉识别系统中加入活体检测方法是必不可少的,而现有的静脉识别系统中,要求被检测对象在规定位置做出规定的手势来实现活体检测,但是手势可通过视频伪装从而达不到活体检测的目的[18]。Marasco等[19]利用手指表面的导电特性、温度和排汗现象进行活体检测,结果表明该方法可行,但需要增加复杂的研究设备,价格昂贵,操作困难。
鉴于上述背景,本文旨在研究一种具有活体检测功能且可以防止假冒的高精准静脉身份识别方法。利用自主研制的静脉图像获取装置,通过连续采样的方式获取手背静脉图像和脉搏信息,并对活体检测方法及模式识别算法进行研究和评价。通过离散傅里叶变换(DFT)判断所获得的脉搏信息的周期性和心率个数,以此作为活体检测的依据,并探究此方法的可行性;然后以70个个体的1400个样本为研究对象,采用PCA和马氏距离对高维特征向量进行降维并剔除异常样本,旨在降低训练模型的复杂度并提高识别精度;最后建立经过随机法和网格寻优法优化参数的随机森林和支持向量机两种模式识别方法,并分析判别模型对手背静脉进行快速、高精度识别的可行性。
2 实验
2.1 实验仪器和样本
实验仪器为自主搭建的便携式静脉捕获装置,该装置根据静脉能够吸收较多的近红外光从而形成高对比度的静脉图的原理,以850 nm的LED阵列作为照射光源[20],光源的最大输出功率为10 W(可调),在LED前放置了漫射板,使出射的光更均匀;以一台近红外CCD相机作为捕获静脉图像的探测器,相机的分辨率可调,且最高采集速度为30 frame/s。
实验样本为70个个体的人体手背,其中20~30岁且体重为90~110斤的个体数为45,40~70岁且体重为90~120斤的个体数为15,20~30岁且体重为120~160斤的个体数为10。手背静脉图像采集条件和过程如下:为了避免环境光、温度、湿度对实验结果产生影响,实验全程在恒温恒湿的光学暗室中进行,确保实验条件的稳定性和一致性。CCD相机的采集速度设置为10 frame/s,LED的功率设置为8.6 W,每个个体进行两次拍摄实验:第一次拍摄的10张静脉图像作为训练集,经过30 min后,进行第二次拍摄实验,第二次拍摄的10张静脉图像作为预测集,共得到1400张静脉图像,
图 1. 由自主搭建装置拍摄得到的不同个体的静脉近红外图像
Fig. 1. Vein near infrared images of different individuals captured by self-developed setup
2.2 活体检测方法
为了消除假体攻击的安全隐患,本文提出了基于脉搏波的周期性和人体心率个数的活体检测方法。等间隔连续采集静脉图像,以一段时间内采集到的图片数(即采样数)为横坐标,将静脉图像的所有像素点的灰度值总和的平均值作为脉搏信息的强度,并以此为纵坐标,得到脉搏信息的强度随采样数或者时间的变化曲线。由于LED强度漂移、CCD相机的热噪声等,导致获得的脉搏信息存在基线漂移。采用自适应偏最小二乘算法进行基线校正[21],然后将脉搏信号减去该信号的均值去除直流分量,最后采用离散傅里叶变换判断信号的周期性并计算心率个数。
图 2. 活体检测的过程与结果。(a)(b)活体与假体的脉搏信号经过基线校正后的结果;(c)(d)去除直流分量后的活体与假体的脉搏信号;(e)(f)活体与假体脉搏信号的离散傅里叶变换结果
Fig. 2. Processes and results of liveness detection. (a)(b) Results of baseline correction of the pulse signals of the living body and the prosthesis; (c)(d) pulse signals of the living body and the prosthesis after removing the direct current component; (e)(f) discrete Fourier transform results of pulse signals of the living body and the prosthesis
2.3 活体静脉图像的预处理
经过活体检测判断为活体后,为了减小手背放置位置和环境因素的影响,需要对活体静脉图像进行预处理。由于每个个体在不同时间内放置手背的位置不同,而位置的变动会影响识别结果,本文采用旋转平移校正法消除位置变动的影响[23],使得同一个测试者在不同时间内拍摄的多张静脉图像都处在相同的位置。然后以坐标为[200 160 300 310]的矩形框裁剪图片,得到只包含手背静脉部分的感兴趣区域(ROI)图像。此外,为了减小光照不均匀的影响,对ROI图像进行灰度值归一化处理,并采用均值滤波和中值滤波去除高斯噪声和椒盐噪声[24]。最后采用对比度受限的自适应直方图均衡化(CLAHE)[25]对上述ROI图像进行对比度增强,预处理的结果如
图 3. 图像预处理的结果。(a)经过旋转平移位置校正的结果;(b)获取的ROI图像;(c)经过CLAHE增强的图像
Fig. 3. Results of image preprocessing. (a) Result of position correction after rotation and translation; (b) ROI image acquisition; (c) CLAHE for image enhancement
3 分析与讨论
3.1 采用主成分分析降维和马氏距离去除异常值
经过预处理得到高对比度的ROI图像后,采用文献[ 12]提出的PLBP提取静脉特征,经PLBP[26]提取的静脉特征的维数达到103数量级,导致分类算法的复杂度过高,而且由于实验过程的多变性,样本中可能存在异常样本,降低了模型的预测准确度。因此,采用PCA[13]和MD[14]来降低静脉特征向量的维数并去除样本集中的异常样本。
本实验对1400个1690维的静脉特征向量进行了主成分分析,
表 1. PCA的前150个成分的累积贡献率
Table 1. Cumulative contribution rate of the first 150 components of PCA
|
3.2 采用随机森林判别模型分析
随机森林算法[15]的基本思想是先通过Bootstrap 重采样算法选出有差异的多个样本作为训练集,然后运用回归树算法(CART)构建单棵决策树,再利用Bagging机制生成包含多棵决策树的随机森林,最后将每棵决策树的分类结果取投票结果作为随机森林输出结果。对训练集中的每一个人体手背设定一个类别,即对70个人体手背赋予1~70的特征值,然后以随机选择决策树数目的方法建立随机森林进行训练,决策树个数与对应随机森林模型的训练错误率之间的关系如
将每个个体第一次拍摄得到的10张静脉照片的特征向量作为训练集,第二次拍摄得到的10张静脉照片的特征向量作为预测集,即训练集700张,预测集700张。将训练集代入RF模型中进行训练,然后将预测集数据代入训练好的RF判别模型进行身份识别,RF模型的识别结果如
图 6. 随机森林模型的识别结果。(a)未经过预处理的识别结果;(b)经过预处理的识别结果
Fig. 6. Recognition results of random forest model. (a) Recognition results without preprocessing; (b) recognition results after preprocessing
3.3 采用支持向量机判别模型分析
支持向量机[16]的基本思想是寻求两类样本的最优分类面,最优分类面要将两类样本正确分开,且要满足分类间隔最大,通过优化正则化参数c与高斯核参数σ,能够降低模型的误差,增强模型的泛化能力,其中c是惩罚因子,通过控制对错分样本的惩罚程度,实现在错分样本的比例与算法复杂度之间的折中;σ影响模型的预测准确度,太小会造成过拟合,太大会造成欠拟合。本文采用网格搜索法和十折交叉验证对SVM参数进行优化,优化结果如
图 7. 网格搜索法优化支持向量机参数c和g
Fig. 7. Support vector machine parameters c and g optimized by grid search method
将每个个体第一次拍摄得到的10张静脉照片的特征向量作为训练集,第二次拍摄得到的10张静脉照片的特征向量作为预测集,即训练集700张,预测集700张。将训练集代入SVM模型中进行训练,得到SVM训练模型,然后将预测集代入训练好的SVM模型进行身份识别,SVM模型的识别结果如
图 8. 支持向量机模型的识别结果。(a)未经过预处理的识别结果;(b)经过预处理的识别结果
Fig. 8. Recognition results of SVM model. (a) Recognition results without preprocessing; (b) recognition results after preprocessing
表 2. 本文方法的实验结果比较
Table 2. Comparison of experimental results of proposed method
|
表 3. 本文方法与相关研究方法的结果比较
Table 3. Comparison of results of proposed method and related methods
|
4 结论
本文采用自主研制的静脉图像获取装置,建立了具有活体检测功能的手背静脉身份识别方法。脉搏波的周期性和心率个数是人体特有的特性,通过DFT判别脉搏信号的周期性并计算心率个数,有效区分了活体和假体。在此基础上,使用PCA将1690维的静脉特征向量降低为150维,通过马氏距离去除5个异常样本,采用随机法和网格寻优法优化了RF模型和SVM模型的参数。其中,SVM模型对训练集和预测集的识别率分别为100%和99.86%,相比于未去除异常样本的预测集,识别率提高了0.44%。RF模型对700个150维的特征向量的识别率为99.28%,相比于未经过预处理的预测集,识别率提高了1.01%,识别时间缩短了1.551 s。结果表明,经过参数优化的SVM模型和RF模型,能够实现快速、高精度的手背静脉识别,但是在小样本情况下,SVM具有更好的识别结果。
[2] 王曙光. 指纹识别技术综述[J]. 信息安全研究, 2016, 2(4): 343-355.
Wang S G. A survey of fingerprint recognition technology[J]. Journal of Information Security Research, 2016, 2(4): 343-355.
[3] 景晨凯, 宋涛, 庄雷, 等. 基于深度卷积神经网络的人脸识别技术综述[J]. 计算机应用与软件, 2018, 35(1): 223-231.
[4] 韩民, 彭玉华, 张顺利, 等. 基于经验模态分解的虹膜识别[J]. 光学学报, 2010, 30(2): 364-368.
[5] 陶志勇, 胡亚磊, 林森. 基于改进AlexNet的手指静脉识别[J]. 激光与光电子学进展, 2020, 57(8): 081005.
[6] Jain T, Kumar R. A study of vein recognition system[J]. Acta Informatica Malaysia, 2019, 3(1): 13-15.
[8] 林喜荣, 庄波, 苏晓生, 等. 人体手背血管图像的特征提取及匹配[J]. 清华大学学报(自然科学版), 2003, 43(2): 164-167.
[10] Ladoux PO, RosenbergerC, DorizziB. Palm vein verification system based on SIFT matching[M]. Heidelberg: Springer, 2009: 1290- 1298.
[11] 王一丁, 曹希. 利用手背静脉特征进行身份识别的研究[J]. 高技术通讯, 2014, 24(6): 632-642.
[12] 刘超, 王容川, 许晓伟, 等. 基于改进LBP的手指静脉识别算法[J]. 计算机仿真, 2019, 36(1): 381-386.
[13] 周栋, 曹杰, 姜雅慧, 等. 基于主成分分析的散斑设计方法[J]. 激光与光电子学进展, 2020, 57(20): 201104.
[14] 刘娜, 魏秀丽, 高闽光, 等. 基于衰减全反射-傅里叶变换红外光谱技术的气溶胶中水溶性无机离子定量分析方法研究[J]. 光谱学与光谱分析, 2015, 35(12): 3364-3368.
[15] 马娟娟, 潘泉, 梁彦, 等. 基于改进Grassberger熵随机森林分类器的目标检测[J]. 中国激光, 2019, 46(7): 0704011.
[16] 徐天扬, 杨娟, 孙晓荣, 等. 中红外光谱法结合支持向量机快速鉴别蜂蜜品种[J]. 激光与光电子学进展, 2018, 55(6): 063003.
[17] 王一丁. 手背静脉身份识别技术[M]. 北京: 科学出版社, 2015: 191- 210.
Wang YD. Identification technology of dorsal hand vein[M]. Beijing: Science Press, 2015: 191- 210.
[20] 吴微, 苑玮琦, 林森, 等. 手掌静脉识别典型波长选择[J]. 光学学报, 2012, 32(12): 1211002.
[21] 郑咏梅, 张铁强, 张军, 等. 平滑、导数、基线校正对近红外光谱PLS定量分析的影响研究[J]. 光谱学与光谱分析, 2004, 24(12): 1546-1548.
[22] Yin Y.Method and device for identity authentication: US10614201[P].2020-04-07.
[24] 刘铁根, 王云新, 李秀艳, 等. 基于手背静脉的生物特征识别系统[J]. 光学学报, 2009, 29(12): 3339-3343.
[26] Qian X M, Hua X S, Chen P, et al. PLBP: an effective local binary patterns texture descriptor with pyramid representation[J]. Pattern Recognition, 2011, 44(10/11): 2502-2515.
[27] 袁臣虎, 刘铁根, 李秀艳. 基于kNN-SVM的手背静脉虹膜和指纹融合身份识别[J]. 光电工程, 2013, 40(4): 101-105.
Article Outline
陈秀莲, 黄梅珍, 富雨超. 具有活体检测功能的手背静脉身份识别方法研究[J]. 光学学报, 2021, 41(6): 0610002. Xiulian Chen, Meizhen Huang, Yuchao Fu. Recognition Method of Dorsal Hand Vein with Liveness Detection Function[J]. Acta Optica Sinica, 2021, 41(6): 0610002.