作者单位
摘要
中国农业大学理学院, 北京 100193
随着人们对近红外光谱分析技术了解的深入, 人们发现通过剔除近红外光谱中的冗余变量不仅可以简化近红外光谱分析模型, 提高模型的可解读性, 通常还可以提高模型的预测效果及稳健性。 变量选择的有效性已经在各种近红外光谱应用体系中得到了广泛的验证, 发展成为了近红外光谱分析建模过程中一个越来越重要的步骤。 为此, 化学计量学家们近些年来开发了大量原理不同的新型变量选择算法, 基于各种原理的衍生算法也层出不穷。 为了让近红外光谱分析研究人员能够较为迅速地对这些算法的特点有所认识,  对目前常见的各种变量选择算法的算法原理和优缺点进行了梳理。 根据各种算法依据的原理不同, 将目前近红外光谱领域常见的变量选择算法大致分为基于偏最小二乘模型参数, 基于智能优化算法, 基于连续投影策略, 基于模型集群分析策略和基于变量区间等五类。 在梳理的过程中, 我们发现变量选择算法的发展趋势目前主要集中在以下两点: 第一, 算法的复杂程度不断提高; 第二, 不同变量选择算法之间的联用开始逐渐增多。 此外, 作者结合自身在应用变量选择算法时的体会和思考, 还总结了变量选择算法在应用层面上存在的一些问题。 例如光谱预处理方法对变量选择算法使用效果的影响, 以及部分算法存在的稳定性较差, 选择变量的可靠性存疑等。
近红外光谱 变量选择算法 综述 Near infrared spectroscopy Variable selection Review 
光谱学与光谱分析
2017, 37(4): 1048
作者单位
摘要
1 职业安全健康北京市重点实验室, 北京市劳动保护科学研究所, 北京 100054
2 中国农业大学理学院, 北京 100193
莠去津是一种广泛使用的除草剂, 我国是其原药的主要生产国家。 为加强工作场所莠去津暴露浓度的检测力度, 保障职业接触工人身体健康, 研究开发工作场所莠去津浓度的现场快速检测方法具有重要现实意义。 利用自行组装的便携式近红外光谱仪, 采集了实验室配置的浓度为10~1 000 mg·L-1的莠去津溶液样本光谱, 并比较了多元散射校正、 变量标准化、 一阶导数方法、 二阶导数方法及其组合等光谱预处理方法, 竞争自适应重加权采样变量选择法和遗传算法等变量选择方法, 偏最小二乘算法和支持向量机等回归方法对近红外光谱模型分析精度的影响。 研究发现一阶导数是最佳光谱预处理方法; 遗传算法优选的光谱变量表现优于竞争自适应重加权采样变量选择法; 支持向量机模型表现优于偏最小二乘模型。 基于遗传算法选择的16个光谱变量建立的支持向量机模型分析精度最高, 其定标决定系数、 验证决定系数、 定标均方差、 预测均方差和相对分析误差(成分浓度的标准偏差与预测均方差的比值)分别为1, 0.99, 17.54 mg·L-1, 25.42 mg·L-1和11.43, 有望应用于工作场所莠去津浓度的实际检测中。 该研究探讨了近红外光谱法检测工作场所莠去津浓度的可行性, 相关结果对于未来类似工作的开展具有重要参考价值。
近红外光谱 莠去津 化学计量学 遗传算法 Near-infrared Spectroscopy Atrazine Chemometrics Genetic Algorithm 
光谱学与光谱分析
2017, 37(3): 755

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!