改进粒子群算法优化SVR的LIBS钢液元素定量分析 下载: 975次
1 引言
钢铁作为重要的建筑材料,其元素含量直接影响钢材的性能。在钢材冶炼中需将铁矿石、焦炭和助燃剂等从炉顶加入,待温度达到1300~1500 ℃时,物料熔化为液相,将漂浮在铁水上的熔渣通过排渣口排出,再利用激光诱导击穿光谱(LIBS)技术检测钢液中的各元素含量,实现对钢液各元素的在线检测和控制。该过程既有利于生产过程的调整以保证生产质量,又有利于提高生产效率。LIBS是一种通过探测激光诱导等离子体特征光谱、由分析线的位置及信号强度获取物质成分和含量的物质成分快速分析技术[1-2]。LIBS分析无需预先制样,具有在线快速、远程非接触、多元素同时测量分析的优势,近年来在工业冶金、材料分析和生物医学等诸多领域展现了突出的研究价值和广阔的应用前景[3-6]。
经过近20年的发展,多种LIBS设备结合分析算法可实现对固、液、气等物质的检测,在对钢液成分分析方面,国内外研究者进行了很多方面的研究。Clegg等[7]利用最小二乘法(PLS)对18种不同的类火星岩石样品进行了分类与分析,这为火星漫游者探测岩石的LIBS装置打下了坚实的基础。杨友良等[8]建立了基于粒子群算法优化的支持向量机(SVM)模型,经主成分降维后得到均方根误差(RMSE)为0.599%,相对标准偏差(RSD)为8.26%,该模型的分析性能较传统的定标方法有一定提高。谷艳红等[9]利用支持向量机定量分析土壤中的Cr元素含量,在训练集上得到的拟合相关系数为0.998,在测试集上得到的预测相对误差均在2.57%以内;该方法优于多元线性回归分析法,有效提高了定量分析的稳定性和精度。
为了在线准确监控钢液中各种元素的含量,需将漂浮在钢液上的熔渣排出,再利用LIBS技术精准检测钢液各元素含量。本文应用主成分分析法筛选出4种代表性因素。针对钢液中Mn、Ni、Cr和Si四种元素,利用随机抽取的光谱数据训练并建立定标模型;针对模型参数,利用Cat-fish 粒子群优化(PSO)算法选出最优值参数,构建支持向量回归(SVR)预测模型。为验证模型的有效性,选用普通SVR预测作为对比模型,以检验其适用性和有效性。
2 实验系统
本实验在大气环境下进行,用于实验的LIBS系统结构如
表 1. 钢样组成元素含量
Table 1. Element composition of steel samples%
|
实验样品为国家标准合金样品,
3 理论背景
3.1 数据预处理
1) 数据归一化
由于钢液中Fe元素含量最高,在同一钢样中Fe元素含量的变化很小,可以忽略不计,待测元素含量少而多种影响因素会引起特征光谱的波动,增大了待测元素含量检测误差,因此,需要对特征谱线强度波动进行归一化处理。在400~430 nm光谱区间内10种钢样Fe元素在404.873 nm和406.536 nm附近的两条特征线最明显,将两条特征线强度均值作为内标强度进行归一化,可以在一定程度上减小光谱信号波动带来的影响。在同一样本的第i组测量中,设归一化处理后的光谱强度、原始光谱强度和Fe元素平均光谱强度的特征线数据分别为Xi、xi和
2) 主成分提取
影响光谱数据的因素太多,若将全部光谱数据作为输入,会给模型的建立带来诸多干扰,不能达到理想的训练效果。针对影响光谱数据的因素,本文应用主成分分析法(PCA)对全部数据信息进行降维,该方法适合这种因素关联度比较高的情况,在不失真的前提下,筛选出代表整个因素集性质的少数因素。
设有n个样本z1,z2,…,zn,每个样本有m个属性,现将m个属性映射减少到k个。
初始矩阵标准化:
式中:i=1,2,…,n;j=1,2,…,m;zij为数据集中第i个样本的第j个属性;
标准化矩阵的相关矩阵R为
式中:rij=
累计贡献率M为
式中:λi、λj为特征值。
3.2 支持向量回归
支持向量回归是以统计学理论为基础,依照有限样本信息,确保在学习和泛化能力良好的条件下,将输入信息非线性转换到高维空间的决策函数,从而实现线性回归,以达到最理想的学习效果[10]。SVR预测在解决小样本的“维数灾难”问题中相较于其他机器学习算法有明显的优势[11]。本文所使用的SVR目标函数为[12]
式中:MSV为支持向量集;αi'为拉格朗日乘子;i'为第i组实验数据;I″i'为支持向量;I为输入向量;b为常数;klibs为径向基函数,可表示为[12]
式中:γ为Gamma核函数。(6)式的约束条件为:
从(5)和(6)式可以看出:C值过大,则容易出现过拟合;C值过小,则容易出现欠拟合;C值的选择直接影响预测模型的精度和泛化能力。合理选择γ的核参数g是建立支持向量机模型的关键,因此需要优化筛选SVR预测模型参数。
3.3 PSO算法
为提高分析预测精度,可以利用PSO算法对SVR预测模型的参数进行筛选。当参数的最优解为值域空间的一个粒子时,其速度和位置的更新公式分别为[13]
式中:i表示第i个搜索粒子;g为核参数;Pid(k)和Pgd(k)分别为个体和种群全局极值的位置;ω为惯性因子;rand(·)为[0,1]内的随机数;c1和c2为非负值学习因子。
但PSO算法在实际应用中有早收敛现象,其粒子适应度不能达到最优值的要求,
因此需要跳出局部来寻找全局最优解。为了提高PSO算法的适用范围,通过Cat-fish效应[14],即利用一个粒子去改变粒子群在局部最优位置的停滞状态,改进(7)式,得到Cat-fish PSO算法的速度更新公式为
式中:f1·rand(·)和f2·rand(·)为算子,定义为
式中:ep和eg分别为个体最优值偏差和全局最优值偏差;ebp和ebg分别为局部最优值偏差的阈值和全局最优值偏差的阈值。Cat-fish PSO算法以均方差作为粒子适应度值,若当前值的偏差小于偏差阈值时,算子最优值搜索范围跳出局部,在全局继续进行搜索。
综上所述,对影响光谱数据的因素进行分析并进行归一化处理,应用主成分分析法筛选具有代表性的主要因素,并以钢液中Mn、Ni、Cr和Si四种元素含量作为训练集进行训练并建立模型,再利用Cat-fish PSO算法优化SVR预测模型的参数,最终建立钢液元素含量预测模型,流程图如
4 结果与分析
4.1 影响因素选取
首先针对光谱数据采集的9种影响因素(峰值强度、积分强度、信背比、内标元素校正、脉冲触发延时、聚焦透镜到钢液的距离、光谱寻峰、有效谱图筛选和高温热辐射)进行预处理,再对采集样本进行理化分析,并应用SPSS软件对样本的9种腐蚀因素进行主成分分析,结果见
4.2 SVR参数优化
对SVR参数进行优化,算法的基本参数设置为:参数搜索区间C∈[0,500],核参数g的搜索范围为[0,100],粒子群规模N=30,最大迭代次数K=200,惯性因子ω=0.9-0.5k/K,k为当前迭代次数,c1=c2=2,f1=1,f2=4,偏差阈值 ebp=0.01,ebg=0。在上述条件下,PSO算法需要通过104次寻优获得最优C值为25.639,核参数g为0.225。
表 2. 各影响因素累计方差贡献率
Table 2. Cumulative variance contribution of each influencing factor
|
表 3. 主成分的特征向量
Table 3. Eigen vectors of principal components
|
4.3 结果分析
实验对10个样本4种元素重复测量30次,共获得300组数据,将主成分分析得到的峰值强度、积分强度、信背比和内标元素校正4个因素作为SVR的输入,结合最优参数值,在经过归一化预处理后的300组数据中,随机抽取200组作为训练集,利用Libsvm3.1软件进行训练及数据分析得到定标模型,最后用剩余100组数据作为测试集来验证模型的预测效果。同时为验证模型的有效性,选用PSO优化的SVR预测作为对比模型,为了评估预测模型的整体表现,需要通过决定系数R2、均方根误差RMSE和相对标准偏差RSD三个指标作为参考来评价回归预测模型的准确性,衡量回归预测模型的重复性,各个指标的计算公式如下[14-18]:
式中:Yi为第i个样本的预测均值;
从
表 4. 测试集回归预测结果
Table 4. Regression prediction results for test set
|
5 结论
利用激光诱导击穿光谱在二维位移台上的移动实现对钢液表面不同位置的激发检测,对得到的光谱数据进行归一化预处理,通过主成分分析筛选出代表性因素,将得到的峰值强度、积分强度、信背比和内标元素校正4个因素作为输入信息。针对钢液中Mn、Ni、Cr和Si 4种元素,训练并建立定标模型,利用Cat-fish PSO算法并通过95次寻优找到了最优值参数。该方法能够避免陷入局部极值的问题,并且寻优次数远低于PSO算法,简化了编程计算过程。最后用测试集来验证模型的预测效果,实验结果表明,Cat-fish PSO-SVR的R2大于0.95,RSD均值为3.53%,RMSE在1.5%以内。采用Cat-fish PSO-SVR模型得到的结果均优于普通SVR预测模型。Cat-fish PSO-SVR能够快速精确检测出元素含量,为LIBS在线准确定量分析钢液元素提供了借鉴性较高的优化算法。
[2] 林永增, 姚明印, 陈添兵, 等. 激光诱导击穿光谱检测赣南脐橙种植土壤的Cu和Cr[J]. 激光与光电子学进展, 2013, 50(5): 053002.
[3] 李敏, 朱心勇, 徐媛, 等. 应用LIBS技术定量检测湖水样品中的铜[J]. 激光与光电子学进展, 2013, 50(1): 013001.
[4] 李乘, 姚关心, 杨新艳, 等. 液相基质激光诱导击穿光谱的关键实验参数优化[J]. 激光与光电子学进展, 2019, 56(7): 073002.
[5] 李俊香, 杨友良, 孟凡伟, 等. 用于LIBS钢液在线定量分析的基体校正方法[J]. 激光与光电子学进展, 2013, 50(3): 031406.
[6] 冯为蕾, 王福娟, 曾万祺, 等. 应用于LIBS的CCD光谱测量系统[J]. 激光与光电子学进展, 2013, 50(1): 013002.
[7] Clegg S M, Sklute E, Dyar M D, et al. Multivariate analysis of remote laser-induced breakdown spectroscopy spectra using partial least squares, principal component analysis, and related techniques[J]. Spectrochimica Acta Part B: Atomic Spectroscopy, 2009, 64(1): 79-88.
[8] 杨友良, 王鹏, 马翠红. 基于粒子群优化支持向量机的LIBS钢液Mn元素定量分析[J]. 激光与光电子学进展, 2015, 52(7): 073004.
[9] 谷艳红, 赵南京, 马明俊, 等. LIBS技术结合多元校正定标检测土壤中的Cr[J]. 光谱学与光谱分析, 2016, 36(6): 1893-1898.
[10] 徐红敏, 王海英, 梁瑾, 等. 支持向量机回归算法及其应用[J]. 北京石油化工学院学报, 2010, 18(1): 62-66.
Xu H M, Wang H Y, Liang J, et al. Support vector machine regression algorithm and its application[J]. Journal of Beijing Institute of Petro-Chemical Technology, 2010, 18(1): 62-66.
[11] 陈果, 周伽. 小样本数据的支持向量机回归模型参数及预测区间研究[J]. 计量学报, 2008, 29(1): 92-96.
Chen G, Zhou J. Research on parameters and forecasting interval of support vector regression model to small sample[J]. Acta Metrologica Sinica, 2008, 29(1): 92-96.
[12] 郭水霞, 王一夫, 陈安. 基于支持向量机回归模型的海量数据预测[J]. 计算机工程与应用, 2007, 43(5): 12-14, 32.
Guo S X, Wang Y F, Chen A. Prediction on huge database on the regression model of support vector machine[J]. Computer Engineering and Applications, 2007, 43(5): 12-14, 32.
[14] 易文周. 混沌鲶鱼粒子群优化和差分进化混合算法[J]. 计算机工程与应用, 2012, 48(15): 54-58, 87.
Yi W Z. Hybrid algorithm of chaotic catfish particle swarm optimization and differential evolution[J]. Computer Engineering and Applications, 2012, 48(15): 54-58, 87.
[15] 修俊山, 刘世明, 王琨琨, 等. 基于激光诱导击穿光谱技术的铜铟镓硒纳米薄膜的分析探测研究[J]. 中国激光, 2018, 45(12): 1211002.
[16] 胡丽, 赵南京, 刘文清, 等. 基于多元校正的水体Pb元素LIBS定量分析[J]. 光学学报, 2015, 35(6): 0630001.
[17] 贾尧, 赵南京, 刘文清, 等. 基于LIBS技术的水体重金属连续在线检测方法[J]. 中国激光, 2018, 45(6): 0611001.
[18] BekefiG. Radiation processes in plasmas[M]. New York: Wiley, 1966.
杨友良, 王禄, 马翠红. 改进粒子群算法优化SVR的LIBS钢液元素定量分析[J]. 激光与光电子学进展, 2020, 57(5): 053002. Youliang Yang, Lu Wang, Cuihong Ma. Quantitative Analysis of Liquid Steel Element in LIBS Using SVR Improved by Particle Swarm Optimization[J]. Laser & Optoelectronics Progress, 2020, 57(5): 053002.