姚坤杉 1孙俊 1陈晨 2徐敏 1[ ... ]周鑫 1
作者单位
摘要
1 江苏大学电气信息工程学院, 江苏 镇江 212013
2 江苏科技大学经济管理学院, 江苏 镇江 212100
三七是一种传统的中药材, 具有较高的药用价值。 目前市场上中药售假的现象屡见不鲜, 许多不法商贩将三七支根或剪口粉末假冒主根粉末销售, 严重损害了消费者的利益。 利用高光谱技术结合多元分析方法实现三七不同部位粉末的快速无损鉴别。 通过高光谱成像系统分别采集了三七剪口、 须根和主根粉末在400~1 000 nm范围内的高光谱图像, 共300个样本。 采用Savitzky-Golay(SG)平滑结合标准变量变换(SNV)的方法对高光谱数据进行去噪和消除因散射引起的光谱差异。 为了移除光谱变量中的重迭和冗余信息, 利用竞争自适应重加权采样(CARS)算法和本文提出的一种考虑了变量间交互作用的二进制竞争自适应重加权采样(BCARS)算法进行特征波长选择。 最后分别建立了基于全光谱、 CARS和BCARS特征波长的支持向量机(SVM)和极端梯度提升(XGBoost)分类模型。 结果表明, BCARS-XGBoost模型的分类效果最优, 训练集和测试集的分类准确率分别为100%和99.33%。 与CARS相比, BCARS所选择的特征波长数量较少, 有助于多光谱系统和便携式仪器的开发。 利用高光谱技术结合BCARS-XGBoost模型鉴别三七不同部位粉末是可行的。
高光谱 三七 极端梯度提升 特征波长选择 Hyperspectral imaging Panax notoginseng XGBoost Feature wavelength selection 
光谱学与光谱分析
2023, 43(7): 2027
作者单位
摘要
1 黑龙江八一农垦大学工程学院, 黑龙江 大庆 163319
2 黑龙江八一农垦大学电气与信息学院, 黑龙江 大庆 163319
润滑油是农业机械正常作业的必要物资, 农业机械发动机工作的动力性、 安全性、 经济性以及寿命与润滑油状况有着紧密联系。 污染浓度作为油液的综合评价指标, 常规的实验室检测耗时长、 成本高, 所以开发高效的润滑油污染浓度检测技术具有重要意义。 提出了一种基于近红外光谱技术的农机润滑油污染浓度的检测方法, 同时针对随机蛙跳(RF)特征波长选择算法中迭代次数大, 结果再现性低等缺点, 提出了一种迭代保留信息变量的随机蛙跳(IRIV-RF)特征波长选择算法。 该算法一方面利用迭代保留信息变量(IRIV)算法提取出强信息变量和弱信息变量, 将其作为RF算法中的初始变量集, 消除初始变量集的随机性对结果再现性的影响。 另一方面通过对变量按被选概率值由大到小正向排序后, 从首个波长开始依次增加一个波长建立偏最小二乘回归(PLSR)模型, 选择交叉验证均方根误差(RMSECV)值最小时的变量子集为特征波长, 消除RF算法所提取的特征波长数量的不确定性。 利用近红外光谱仪采集自行配制的101份不同污染浓度的农机润滑油原始光谱数据, 选用三种不同的预处理方法分别对原始光谱进行处理, 确定最佳的预处理方法为变量标准化(SNV)。 在此基础上通过RF, IRIV和IRIV-RF三种算法分别对全谱进行特征波长选择, 并建立PLSR模型。 通过对全谱-PLSR, RF-PLSR, IRIV-PLSR以及IRIV-RF-PLSR模型的预测精度进行比较, 结果表明, 经过IRIV-RF算法提取特征波长后所建立的PLSR模型预测精度最高, 预测相关系数(Rp)为0.965 7, 预测均方根误差(RMSEP)为9.0584, 显著提升了预测精度与运行效率, 降低模型复杂程度。 IRIV-RF是一种有效的特征波长选择算法, 研究证明了近红外光谱联合改进的IRIV-RF算法检测农机润滑油污染浓度的可行性, 为鉴定润滑油品质提供了一种新的思路。
特征波长选择 随机蛙跳 迭代信息保留变量 农机润滑油 污染浓度 近红外光谱 Feature wavelength selection Random frog Iteratively retains informative variables Agricultural lubricating oil Pollution concentration Near-infrared spectroscopy 
光谱学与光谱分析
2022, 42(11): 3482
作者单位
摘要
黑龙江八一农垦大学电气与信息学院, 黑龙江 大庆 163319
在近红外光谱的建模预测分析中, 数据的冗余及共线性会严重影响模型的预测精度和稳健性。 特征波长选择是提高定量分析预测精度的一种有效方法。 随机蛙跳(RF)是一种依据不同的变量具有不同的被选择可能性的特征波长选择算法, 近年来在特征波长提取方面展现良好的性能。 该方法通过多次迭代, 计算每个变量被选择的概率, 以优选概率高的变量为特征波长。 但由于其初始变量集V0的产生是随机的, 具有较大的不确定性, 可能会包含无用或干扰信息, 难以保证初始信息的有效性, 使得迭代次数过大, 运行时间过长。 故而提出一种改进的联合区间随机蛙跳(Si-RF)特征波长选择算法, 通过联合区间偏最小二乘法(SiPLS)对全谱进行变量初选, 此时得到的波长对目标变量变化最为敏感, 将其作为RF的初始变量子集, 以解决RF运行时间较长、 效率较低的问题。 另一方面, RF在选择特征波长时, 选择被选概率值大于阈值的变量为特征波长, 但对概率值阈值的设定无理论依据, 易受人为因素影响。 通过对变量按被选概率值降序排列后逐次增加一个波长建立多元线性回归(MLR)模型, 以验证均方根误差(RMSEV)值最低时的变量子集为特征波长, 以找到预测精度最高点所包含的波长, 提高预测精度。 针对上述两点进行改进, 将其应用于一组土壤样本近红外光谱数据集, 进行特征波长选择后, 建立MLR模型, 与RF-MLR及全谱-PLSR模型的预测精度进行比较。 结果表明: RF经过10 000次迭代, 优选出10个波长点, 建立的MLR模型的预测均方根误差(RMSEP)为1.6276; 而改进后Si-RF只需进行1 000次迭代, 优选出17个波长点, 其MLR模型的RMSEP减小到0.818 4, 大大提升了预测精度, 提高运行效率。 相较于全谱, 也极大的提高了预测精度, 简化模型的复杂度, 证明改进的Si-RF是一种有效的特征波长选择算法。
近红外光谱 特征波长选择 多元校正 随机蛙跳 联合区间偏最小二乘 Near-infrared spectroscopy Feature wavelength selection Multivariate calibration Random frog Synergy interval partial least squares 
光谱学与光谱分析
2020, 40(11): 3451

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!