作者单位
摘要
1 东北林业大学机电工程学院, 黑龙江 哈尔滨 150040
2 常州大学计算机与人工智能学院, 江苏 常州 213164
木材抗拉强度是评价木材力学性质的重要指标。 针对近红外光谱建模中样本数据量小、 波长信息冗余所导致预测模型精度低的问题, 提出一种基于模型集群分析MC-UVE-IVSO波长优选的木材抗拉强度建模方法。 以桦木为例, 选取150个桦木样本作为实验对象, 首先使用900~1 700 nm波段的近红外光谱仪采集试件光谱数据, 并采用力学试验机获得相应的抗拉强度真值; 然后对采集的光谱数据运用多元散射校正(MSC)、 一阶求导和卷积平滑(SG)相结合的方法进行预处理, 完成光谱平滑滤波; 分别采用变量组合集群分析算法(VCPA)、 蒙特卡罗无信息变量消除法(MC-UVE)、 迭代变量子集优化算法(IVSO)及MC-UVE-IVSO组合优化算法进行波长筛选, 并对比优选波长结果; 最后在优选近红外波长基础上, 建立桦木抗拉强度的偏最小二乘预测模型(PLS)。 实验结果表明: 基于MC-UVE-IVSO算法优选波长的PLS模型, 光谱变量数由512减小到98, 优选波长占总波长的19%, 其预测决定系数R2为0.94, 预测均方根误差RMSEP为7.50, 性能偏差比RPD为3.16, 相比于全波段、 MC-UVE、 VCPA、 MC-UVE-VCPA与IVSO相应的R2(0.92、 0.93、 0.82、 0.87、 0.93)、 RMSEP(17.91、 11.7、 14.91、 12.12、 8.47)和RPD(2.81、 2.91、 2.25、 2.28、 2.78)均有不同程度提升; 通过统计特征波长所建立的预测模型箱形图, 进一步证明了MC-UVE-IVSO算法在处理多变量波长的稳定性。 实验结果表明, MC-UVE方法可以消除与建模不相关的多数变量, 而IVSO算法能有效搜索出最优变量子集, 基于MC-UVE-IVSO的光谱优选算法提升了木材抗拉强度预测模型的准确性和稳定性, 为木材近红外光谱的无损、 快速与精准检测提供了一定的理论基础。
木材抗拉强度 近红外光谱 集群分析 蒙特卡罗无信息变量消除 迭代变量子集优化 Wood tensile strength Near-infrared spectroscopy Model population analysis Monte Carlo uninformative variable elimination Iterative variable subset optimization 
光谱学与光谱分析
2023, 43(8): 2488
作者单位
摘要
1 江苏大学食品与生物工程学院, 江苏 镇江 212013
2 2. Department of Molecular Cell Physiology, Kyoto Prefectural University of Medicine, Kyoto 602-8566, Japan
近红外光谱因为具有小成本、 易操作、 低耗时等优点, 所以广泛用于食品领域。 作为一种间接的检测方法, 近红外光谱检测需要建立光谱和浓度之间的统计模型。 但是, 一种条件下建立的模型在另一种检测条件下会失效。 针对此问题, 重新建模可以加以解决, 但是重新建立光谱与浓度之间的模型非常繁琐耗时。 此时, 模型转移可以在避免重新建模的情况下, 通过光谱校正, 保证预测精度。 在模型转移中, 已经建立好模型的光谱称为主光谱(A), 不用建立模型, 而只用主光谱模型预测的光谱称为从光谱 (B)。 模型转移方法的步骤是, 先在校正集中选择一些样本作为主光谱的转移集(At), 然后选择从光谱中浓度和At相同的光谱, 以此作为从光谱的转移集(Bt)。 通过AtBt构建模型转移矩阵。 最后将需要校正的从光谱(Bv)乘以上述的转移矩阵中, 即可获得校正后的从光谱(Bnew)。 此时, Bnew就可以用主光谱的模型来直接预测。 在模型转移中, 转移集样本的选择对模型校正至关重要。 目前, 转移集的样本通常从光谱之间的距离而非模型转移误差获得。 但是, 转移误差对模型转移结果的验证至关重要, 故该研究出了基于集群分析的集群优化法(ER)并将其用于优化KS方法产生的转移集样本。 ER先用随机方法建立转移集的多个子集合, 并计算每个子集合的转移误差。 然后, 对某一个样本, 计算包含这个样本的子集合转移误差均值。 最后, 选择转移误差均值较低的样本作为新转移集样本进行模型转移。 以玉米数据测试了ER算法。 结果显示, 对于典型相关分析-有信息成分提取法(CCA-ICE)、 直接校正法(DS)、 分段直接校正法(PDS)、 光谱空间转化法(SST)这些常见的模型转移方法, 相比于KS样本选择方法, ER方法可以找出重要的转移集样本, 进而显著降低模型转移误差。
模型转移 集群分析 样本选择 偏最小二乘 近红外光谱 Calibration transfer Model population analysis Sample selection Partial least squares Near-infrared spectrum 
光谱学与光谱分析
2022, 42(4): 1323
作者单位
摘要
1 中国农业大学现代精细农业系统集成研究教育部重点实验室, 北京 100083
2 Center for Precision & Automated Agricultural System, Washington State University, Pullman WA 99350, USA
为了探究马铃薯作物叶绿素吸收特征, 充分解析光谱特征波长变量, 建立高精度叶绿素含量检测模型。 在马铃薯发棵期(M1)、 块茎形成期(M2)、 块茎膨大期(M3)和淀粉积累期(M4)4 个关键生长期, 利用ASD便携式光谱仪采集80个样本区的314组作物冠层反射率数据, 并同步采集叶片测定叶绿素含量。 在光谱数据预处理之后, 分析了马铃薯不同生长期的光谱反射率变化特征。 利用基于模型集群思想的蒙特卡洛无信息变量消除(MC-UVE)、 随机蛙跳(RF)、 竞争自适应重加权采样(CARS)三种算法筛选叶绿素特征波长, 建立叶绿素含量检测PLS模型。 对4个生长期的314个样本, 采用SPXY算法分别按照3∶1的比例划分, 得到建模集240个样本、 验证集74个样本。 利用MC-UVE, RF, CARS三种算法筛选叶绿素特征波长, 讨论迭代次数(N)和特征变量个数(LV)对MC-UVE和RF算法、 迭代次数(N)对CARS算法筛选特征波长结果的影响, 对迭代次数设置6个梯度, 分别为N=50, 100, 500, 1 000, 5 000和10 000; 对特征变量数设置4个梯度, 分别为LV=15, 20, 25和30。 以PLSR模型的验证集结果为评价指标, 分析迭代次数(N)和特征变量数(LV)的最优参数组合。 最后基于MC-UVE, RF和CARS算法筛选得到的最佳特征波长建立叶绿素检测PLSR模型, 分别记为MC-UVE-PLSR, RF-PLSR, CARS-PLSR。 结果表明, CARS, RF和MC-UVE三种算法的迭代次数(N)、 特征变量数(LV)参数最佳组合分别为: (1)MC-UVE: 迭代次数N=50 特征变量数LV=30; (2)RF: 迭代次数N=500、 特征变量数LV=30; (3)CARS: 迭代次数N=100。 对比在最佳特征波长建立的MC-UVE-PLSR, RF-PLSR, CARS-PLSR叶绿素含量检测, 发现RF-PLSRRR模型的性能最优, R2v为0.786, RMSEV为3.415 mg·L-1; MC-UVE-PLS模型性能次之, R2v为0.696, RMSEV为4.072 mg·L-1; CARS-PLS模型的性能最差, R2v为0.689, RMSEV为4.183 mg·L-1。 以上结果说明: 在筛选马铃薯叶绿素特征波长方面RF算法优于MC-UVE和CARS, 得到的特征波长能够较全面地反映与马铃薯叶绿素相关的物质信息。
马铃薯 叶绿素检测 模型集群 光谱变量筛选 偏最小二乘(PLS) Potato Chlorophyll detection Model population analysis Band selection Partial least square(PLS) 
光谱学与光谱分析
2020, 40(7): 2259
作者单位
摘要
云南省农业科学院药用植物研究所, 云南 昆明 650200
食药植物玛咖富含多种营养成分, 极具药用价值。 采用近红外漫反射光谱, 对采自秘鲁及云南共139份玛咖样品进行产地鉴别。 采用多元信号校正结合二阶导数和Norris平滑预处理光谱, 利用光谱标准偏差初步选择光谱波段(7 500~4 061 cm-1), 结合主成分-马氏距离(principal component analysis-mahalanobis distance, PCA-MD)筛选出适宜的主成分数为5。 基于所筛选的光谱波段及主成分数, 利用“模群迭代奇异样本诊断”方法剔除2个异常样品后, 分别采用竞争自适应重加权法(competitive adaptive reweighted sampling, CARS)、 蒙特卡洛-无信息变量消除法(monte carlo-uninformative variable elimination, MC-UVE)、 遗传算法(genetic algorithm, GA)和子窗口重排(subwindow permutation analysis, SPA)四种方法筛选光谱变量信息, 利用模型集群分析(model population analysis, MPA)思想对所筛选的光谱变量信息进行评价。 结果显示, RMSECV(SPA)>RMSECV(CARS)>RMSECV(MC-UVE)>RMSECV(GA), 分别为2.14, 2.05, 2.02, 1.98, 光谱变量数分别为250, 240, 250和70。 采用偏最小二乘判别分析法(partial least squares discriminant analysis, PLS-DA)对四种方法筛选的光谱变量建立判别模型, 随机选择97份样品作为建模集, 其余40份样品作为验证集。 通过R2, RMSEC和RMSEP分析可知, R2: GA>MC-UVE>CARS>SPA, RMSEC和RMSEP: GA玛咖 近红外光谱 鉴别 光谱信息筛选 模型集群分析 Lepidium meyenii Walp. NIR spectroscopy Identification Spectral information screening Model population analysis 
光谱学与光谱分析
2016, 36(2): 394

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!