作者单位
摘要
1 中国海洋大学信息科学与工程学院, 山东 青岛 266100
2 云南中烟工业有限责任公司技术中心, 云南 昆明 650024
近红外光谱分析以其简便、 快速、 高效、 低成本、 绿色环保等优点, 已广泛应用于诸多领域。 然而, 近红外光谱同时存在变量维度高、 多重共线性、 包含冗余信息和高频噪声等问题, 直接构建预测模型不但增加建模复杂度, 同时也会影响模型的预测性能和泛化能力, 因此提出一种基于改进和声搜索算法(HS)的光谱特征变量选择方法。 HS常用于解决特征变量优化选择问题。 在应用和声搜索算法进行最优光谱变量选择时, 首先通过偏最小二乘(PLS)载荷系数计算各光谱点的特征贡献度, 作为和声搜索算法改进的扰动权重。 算法优选光谱特征变量过程中, 引入变量特征贡献度作为激励因子, 采用随机遍历和激励因子共同作用的方式生成初始解向量。 产生新和声向量时, 应用变量特征贡献度作为惩罚项, 通过加入平衡因子使选择参数随迭代次数而动态调整, 从而适应光谱变量的搜索, 增强搜索过程的遍历性和种群的多样性。 为验证本算法的有效性, 以烟叶样品烟碱、 总糖、 总氮三个指标的近红外光谱PLS建模应用为例, 对采集的原始光谱进行预处理后, 应用该方法对光谱变量进行优选, 根据变量被选择的累积频次分别计算不同变量个数的模型预测性能, 通过校正均方根误差(RMSEC)随变量增加的变化趋势确定最终选择的光谱特征变量。 在训练集上分别建立各指标的PLS模型, 应用测试集测试模型性能, 并与全光谱、 无信息变量消除法(UVE)和粒子群算法(PSO)进行比较。 实验结果显示, 应用该算法所选变量建立的烟碱、 总糖和总氮三个模型的决定系数(R2)分别为0.921 1, 0.925 7和0.941 2, 预测均方根误差(RMSEP)分别为0.102 3, 1.034 6和0.053 1, 与其他方法相比, 光谱特征变量更少, 同时R2和RMSEP值更优。 由此表明, 改进的和声搜索算法能有效筛选特征光谱, 降低建模复杂度, 提升模型预测性能和泛化能力。
近红外光谱 特征变量 和声搜索算法 载荷系数 偏最小二乘法 Near infrared spectroscopy Feature variables Harmonhy search algorithm Loading factor Partial least squares 
光谱学与光谱分析
2020, 40(6): 1869
作者单位
摘要
中国农业大学工学院, 国家农产品加工技术装备研发分中心, 北京 100083
为了探讨利用二维相关可见/近红外光谱法优选猪肉挥发性盐基氮(TVB-N)特征变量的可行性, 以贮藏时间为外扰, 研究了不同新鲜程度猪肉样本的二维相关光谱特性。 首先, 获取56个猪肉样本在贮藏1~14 d的400~1 000 nm范围的可见/近红外反射光谱, 经过标准正态变量变换(SNV)处理后, 基于全波段光谱建立TVB-N的偏最小二乘回归(PLSR)模型。 然后, 依据TVB-N实测值, 从中挑选出10个具有一定浓度梯度的样本(贮藏时间分别为0, 36, 72, 108, 144, 180, 216, 252, 288和324 h), 利用一阶导数对光谱进行预处理后, 根据不同样本之间的光谱差异, 选取7个波段用于二维相关光谱解析。 分析各个波段的二维相关同步谱和自相关谱, 从7个波段范围内共选取23个变量作为不同贮藏时间下与TVB-N相关的敏感波长, 并建立简化的PLSR模型。 相较于全波段光谱数据所建模型, 模型效果有所改善, 预测集决定系数R2p由0.792 1上升至0.865 8, 误差从3.658 2 mg·(100 g)-1下降至3.246 0 mg·(100 g)-1。 表明基于二维相关光谱对猪肉TVB-N特征变量进行优选的思路是可行的, 该方法能够从全光谱数据中筛选出与目标物质相关的敏感变量, 这也为近红外光谱特征波长选择提供了一个新的方法。
二维相关光谱 可见/近红外光谱 挥发性盐基氮 特征变量 Two-dimensional correlation spectrum Visible/near-infrared spectroscopy Total volatile basic nitrogen Feature variables 
光谱学与光谱分析
2018, 38(7): 2094

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!