基于激光诱导击穿光谱的茶叶品种快速分类 下载: 1409次
1 引言
作为我国的传统饮品,茶叶越来越受到人们的喜爱,已成为世界三大饮品之一。中国是茶的故乡[1],地理环境非常适宜茶树的生长,茶树品种繁多,采制经验丰富。我国人民在长期的制茶过程中积累了丰富的经验,创造出了精湛的制茶工艺,产生了众多茶叶品种,一般根据茶多酚的氧化聚合程度由浅入深地将茶叶归纳为6大类,即绿茶、黄茶、白茶、青茶、黑茶和红茶。传统对茶叶品种的识别以专家感官评审为主,人为因素对茶叶品种的精确判定有较大的影响。 因此有必要研究出一种快速、精确、可靠的茶叶种类识别方法。
激光诱导击穿光谱(LIBS)具有检测速度快、无需样品处理、对样品损伤小等特点,近年来已经越来越多地被应用到物质检测领域,如水体污染[2]、土壤分析[3]、工业评估[4]、食品安全[5]、环境监测[6]、考古文物[7]、医药分析[8]等。目前,国内外利用 LIBS 检测技术快速评价产品质量和快速分类待测样品(如茶叶、药品、塑料产品[9])已经成为 LIBS领域实际应用的热点。Wang等[10]利用LIBS技术结合判别分析(DA)法对铁观音、龙井、普洱等6种茶叶进行识别,训练集识别准确率达98%,测试集识别准确率达95.33%。饶刚福等[11]基于LIBS技术,采用不同光谱预处理方法结合DA、径向基函数网络(RBF) 和反向传播网络(MLP)进行建模,实现了对铁观音、碧螺春、普洱等7种茶叶的高准确率识别。Zhang等[12]将LIBS技术与偏最小二乘判别分析(PLS-DA)法相结合,对龙井、铁观音、金豪等6种茶叶进行识别,训练集识别准确率达100%,测试集识别准确率达99.77%。蒋帆等[13]采用高光谱分析技术结合支持向量机(SVM)对机炒龙井茶等级进行识别,训练集识别准确率达98%,测试集识别准确率达95.33%。
以上研究表明,茶叶品种的快速识别具有一定的可行性。目前,LIBS技术在茶叶种类识别中的研究主要分为3个方面:1)针对我国六大茶类不同类别的茶进行识别;2)采用不同的光谱预处理方法提高分类准确率;3)将机器学习中的不同算法应用于模型建立,实现高准确率识别。上述已报道研究可实现对不同种类茶叶的较高识别率的区分,但对同一种类中不同品种茶叶的区分还不全面,识别率也较低。本文在传统光谱预处理中加入了峰位漂移函数修正,结合主成分分析提取特征量并利用支持向量机进行建模,尝试对不同种类和同一种类中不同品种的茶叶进行同时快速分类识别,获得了准确率更高的判别模型,具有更广的应用范畴。三大品类包括典型的绿茶、白茶和红茶,交叉检验准确率为98.3%,分别对红茶、绿茶和白茶每个品类中的5个不同品种进行识别,交叉检验准确率分别为100%、97.6%和95.2%。
2 实验过程
2.1 实验装置
实验中,采用的空间光路如
2.2 样品制备
实验中选取市面上常见且具有代表性的绿茶[西湖龙井(XHLJ)、碧螺春(BLC)、日照绿茶(RZGT)、大佛龙井(DFLJ)、山东绿茶(SDGT)]、红茶[祁门红茶(QM)、暖阳红茶(NY)、坦洋工夫红茶(TYGF)、阿萨姆红茶(Assam)、金骏眉(JJM)]、白茶[白牡丹(BMD)、寿眉(SM)、野茶(Wild)、白露茶(BL)、贡眉(GM)]三大类、15种茶叶制成样品。根据以往的实验经验,样品的干燥性、研磨均匀性和密度等物理特性对光谱信号有很大的影响。为了减小其他因素对光谱的影响,需要对茶叶样品进行必要的预处理,然后再进行测定。这15种样品首先需要用吹风机烘干,然后置于80 ℃的恒温干燥箱5 h,再用玛瑙研钵研磨1 h,获得质地均匀的茶叶粉末,最后用15 MPa的机械粉末压片机将样品压制成厚度为2 mm、直径为10 mm的小圆饼。
2.3 茶叶识别模型的构建
实验中采用支持向量机的方法构建分类模型[15]。模型建立过程中通过选取不同的核函数,调整支持向量个数,优化惩罚参数
3 结果与分析
3.1 光谱数据的预处理
本实验中通过多次脉冲打样进行光谱采集并对光谱进行平均的方法来降低激光能量波动或仪器误差带来的光谱信号的波动。对每种茶叶样品分别进行多次打点并采集数据,每种样品收集250组光谱数据,通过对每5组数据求平均获得1幅光谱,每种茶叶样品对应50幅光谱,15种茶叶共对应750幅光谱。
图 2. 白牡丹茶的LIBS光谱。(a)原始光谱;(b)去除背景后的光谱
Fig. 2. LIBS spectra of BMD tea. (a) Original spectrum; (b) spectrum after removing background
由于基体效应和实验误差的存在,同一样品在不同测试点得到的光谱会出现峰位漂移的情况。峰位最大值在两次光谱测量中对应的像素点出现差别,出现约为1 pixel的漂移,对应的波长漂移量为光谱分辨率单位,即0.1 nm[17]。为方便处理,先将背景消除的光谱数据进行寻峰处理,找出每组光谱中的特征峰的峰值强度和对应波长并记录,然后用峰位漂移函数对漂移峰进行修正[17]。
本实验中光谱仪探测波长范围为190~720 nm,
图 4. 白牡丹茶的LIBS光谱图。(a)波长范围为200~430 nm;(b)波长范围为430~720 nm
Fig. 4. LIBS spectra of BMD tea. (a) Wavelength range of 200-430 nm; (b) wavelength range of 430-720 nm
3.2 主成分分析降维并提取特征量
主成分分析是把多个特征映射为少数几个综合特征的一种统计分析方法,以快速处理数据。在对绿茶、红茶和白茶三种品类的分类研究中,不同品类的样本集是由该品类下5种不同茶叶各随机抽取20幅光谱数据组成,对获得的光谱数据峰位漂移函数进行修正和归一化后,再进行主成分分析降维[18],将全谱变换为多个主成分[19]。
图 5. 主成分对原始数据的解释率。(a)每个主成分的解释率;(b)主成分的累积解释率
Fig. 5. Rate of interpretation of principal component to original data. (a) Rate of interpretation of each principal component; (b) cumulative interpretation rate of principal components
前3个主成分的累积解释率为76.98%,
图 6. 前3个主成分的三维散点图
Fig. 6. Three-dimensional scatter plot of first three principal components
对绿茶(西湖龙井、碧螺春、日照绿茶、大佛龙井、山东绿茶)、红茶(祁门、暖阳、坦洋工夫、金骏眉、阿萨姆)和白茶(寿眉、野茶、白露茶、贡眉、白牡丹)各5个不同品种分别进行PCA降维以提取特征量,3种情况下提取的10个主成分累积解释率分别为91.75%、90.79%和92.48%,5种绿茶和白茶的三维散点图分别有少部分散点重叠,5种红茶的三维散点图显示出很好的聚类效果。
3.3 分类结果
支持向量机在解决小样本、非线性及高维模式识别中表现出许多特有的优势,非常适合文中判别模型的建立。在PCA降维之后,提取前10个主成分构建特征空间,在特征空间下需要选取训练集和测试集,文中采用小样本的5-折交叉验证法,即将样本随机分为5个包,每次将其中一个包作为测试集、剩下4个包作为训练集进行训练,将5次结果的正确率(或差错率)平均值作为对算法精度的估计。
白茶、红茶、绿茶的分类结果如
表 1. 基于SVM模型的3种茶的分类结果
Table 1. Classification results of three kinds of tea based on SVM model
|
表 2. 基于SVM模型的5种绿茶的分类结果
Table 2. Classification results of five kinds of green tea based on SVM model
|
表 3. 基于SVM模型的5种红茶的分类结果
Table 3. Classification results of five kinds of black tea based on SVM model
|
表 4. 基于SVM模型的5种白茶的分类结果
Table 4. Classification results of five kinds of white tea based on SVM model
|
4 结论
通过采集15种茶叶在190~720 nm波长范围的LIBS光谱信息,采用窗口平移平滑法去除背景和峰位漂移函数修正的光谱预处理结合主成分分析,运用SVM对茶叶进行建模,红茶、绿茶、白茶的识别率分别为100%、99%和96%,平均识别率为98.3%;5种红茶的识别率均为100%;5种绿茶的识别率分别为94%、100%、98%、100%和96%,平均识别率为97.6%;5种白茶的识别率分别为100%、100%、100%、80%和96%,平均识别率为95.2%;这说明采用一定的光谱预处理方法结合支持向量机建模,在以上情况下可以实现对茶叶品类和品种较高识别率的快速分类。
[1] 于振宇, 舒源. 4):[J]. . 泰山景区建立茶文化与道教文化体验馆的研究. 中国市场, 2016, 106: 108.
Yu Z Y. 4):[J]. Shu Y. Study on the establishment of tea culture, Taoist culture experience museum in Taishan Scenic area. China Market, 2016, 106: 108.
[2] 武进, 吴跃进, 范爽, 等. 结合自动聚焦系统的共线双脉冲激光诱导击穿光谱信号稳定性研究[J]. 中国激光, 2018, 45(7): 0711003.
[3] 王金梅, 颜海英, 郑培超, 等. 基于激光诱导击穿光谱定量检测土壤中营养元素的研究[J]. 中国激光, 2017, 44(11): 1111002.
[4] 谷艳红, 李颖, 田野, 等. 基于LIBS技术的钢铁合金中元素多变量定量分析方法研究[J]. 光谱学与光谱分析, 2014, 34(8): 2244-2249.
[5] 何秀文, 黄林, 刘木华, 等. 激光诱导击穿光谱对大米中镉元素的检测分析[J]. 应用激光, 2014, 34(1): 72-75.
[7] 阎宏涛, 昌征. 激光诱导击穿光谱分析法及其在彩绘文物分析与表征中的应用[J]. 文博, 2009( 6): 229- 233.
Yan HT, ChangZ. The laser-induced breakdown spectroscopy and its application in the polychrome cultural relics[J]. Relics and Museology, 2009( 6): 229- 233.
[8] 刘晓娜, 吴志生, 乔延江. LIBS 快速评价产品质量属性的研究进展及在中药的应用前景[J]. 世界中医药, 2013, 8(11): 1269-1272.
[9] 孙倩倩, 杜敏, 郭连波, 等. 塑料激光诱导击穿光谱技术快速分类应用研究[J]. 光谱学与光谱分析, 2017, 37(7): 2205-2209.
[11] 饶刚福, 黄林, 何秀文, 等. 基于激光诱导击穿光谱的茶叶品种识别模型对比[J]. 激光与光电子学进展, 2018, 55(2): 023002.
[12] Zhang H Y, Zhu Q B, Huang M, et al. Automatic determination of optimal spectral peaks for classification of Chinese tea leaves using laser-induced breakdown spectroscopy[J]. International Journal of Agricultural and Biological Engineering, 2018, 11(3): 154-158.
[13] 蒋帆, 乔欣, 郑华军, 等. 基于高光谱分析技术的机炒龙井茶等级识别方法[J]. 农业工程学报, 2011, 27(7): 343-348.
[15] 杨志辉. 基于机器学习算法在数据分类中的应用研究[D]. 太原: 中北大学, 2017: 14- 15.
Yang ZH. Research on application of machine learning algorithm in data classification[D]. Taiyuan: North University of China, 2017: 14- 15.
[16] 杨崇瑞. 激光诱导击穿光谱数据处理方法研究[D]. 北京: 北京交通大学, 2014: 20- 21.
Yang CR. Study of the spectral data processing in laser induced breakdown spectroscopy technology[D]. Beijing: Beijing Jiaotong University, 2014: 20- 21.
[18] 陈佩. 主成分分析法研究及其在特征提取中的应用[D]. 西安: 陕西师范大学, 2014: 7- 10.
ChenP. Study on principal component analysis and its application in feature extraction[D]. Xi'an:Shaanxi Normal University, 2014: 7- 10.
Article Outline
徐向君, 王宪双, 李昂泽, 何雅格, 柳宇飞, 何锋, 郭伟, 刘瑞斌. 基于激光诱导击穿光谱的茶叶品种快速分类[J]. 中国激光, 2019, 46(3): 0311003. Xiangjun Xu, Xianshuang Wang, Angze Li, Yage He, Yufei Liu, Feng He, Wei Guo, Ruibin Liu. Fast Classification of Tea Varieties Based on Laser-Induced Breakdown Spectroscopy[J]. Chinese Journal of Lasers, 2019, 46(3): 0311003.