作者单位
摘要
1 江苏大学食品与生物工程学院, 江苏 镇江 212013
2 2. Department of Molecular Cell Physiology, Kyoto Prefectural University of Medicine, Kyoto 602-8566, Japan
近红外光谱因为具有小成本、 易操作、 低耗时等优点, 所以广泛用于食品领域。 作为一种间接的检测方法, 近红外光谱检测需要建立光谱和浓度之间的统计模型。 但是, 一种条件下建立的模型在另一种检测条件下会失效。 针对此问题, 重新建模可以加以解决, 但是重新建立光谱与浓度之间的模型非常繁琐耗时。 此时, 模型转移可以在避免重新建模的情况下, 通过光谱校正, 保证预测精度。 在模型转移中, 已经建立好模型的光谱称为主光谱(A), 不用建立模型, 而只用主光谱模型预测的光谱称为从光谱 (B)。 模型转移方法的步骤是, 先在校正集中选择一些样本作为主光谱的转移集(At), 然后选择从光谱中浓度和At相同的光谱, 以此作为从光谱的转移集(Bt)。 通过AtBt构建模型转移矩阵。 最后将需要校正的从光谱(Bv)乘以上述的转移矩阵中, 即可获得校正后的从光谱(Bnew)。 此时, Bnew就可以用主光谱的模型来直接预测。 在模型转移中, 转移集样本的选择对模型校正至关重要。 目前, 转移集的样本通常从光谱之间的距离而非模型转移误差获得。 但是, 转移误差对模型转移结果的验证至关重要, 故该研究出了基于集群分析的集群优化法(ER)并将其用于优化KS方法产生的转移集样本。 ER先用随机方法建立转移集的多个子集合, 并计算每个子集合的转移误差。 然后, 对某一个样本, 计算包含这个样本的子集合转移误差均值。 最后, 选择转移误差均值较低的样本作为新转移集样本进行模型转移。 以玉米数据测试了ER算法。 结果显示, 对于典型相关分析-有信息成分提取法(CCA-ICE)、 直接校正法(DS)、 分段直接校正法(PDS)、 光谱空间转化法(SST)这些常见的模型转移方法, 相比于KS样本选择方法, ER方法可以找出重要的转移集样本, 进而显著降低模型转移误差。
模型转移 集群分析 样本选择 偏最小二乘 近红外光谱 Calibration transfer Model population analysis Sample selection Partial least squares Near-infrared spectrum 
光谱学与光谱分析
2022, 42(4): 1323
作者单位
摘要
江苏大学食品与生物工程学院, 江苏 镇江 212013
在近红外光谱分析中, 将近红外光谱和浓度信息建立统计模型, 通过光谱代入模型即可预测未知样本浓度。 但是, 检测条件的变化会导致光谱的改变, 进而导致原有的模型不能准确预测光谱改变后的样本。 对此, 模型转移可以通过校正新测量的光谱(从光谱), 使得从光谱能够被原有光谱(主光谱)建立的模型准确预测。 模型转移可以使用全光谱进行校正, 但是全光谱中往往包括噪声、 背景等干扰信息, 这些干扰会增加预测误差。 故可以使用变量选择方法找出光谱中有化学意义的信息来模型转移。 但是一般的变量选择算法只选择主光谱的区间, 从光谱使用主光谱相同的波长区间模型转移。 但是在实际工作中, 主光谱和从光谱有化学意义的区间往往不一致, 主从光谱使用同一区间模型转移会增加误差; 此外, 有时二者原光谱的波长范围并不一致, 从主光谱选出的区间不能用于从光谱的校正。 对此, 提出了基于双光谱区间遗传算法(GA-IDS), 同时选择主光谱和从光谱有化学意义的区间, 进而实现模型转移。 GA-IDS算法步骤包括, ①随机产生种群; ②分析种群中每条染色体, 删去错误染色体; ③根据每条染色体, 找出其相应的主光谱和从光谱波段组合, 并计算其模型转移后的验证均方根误差(RMSEV); ④按照概率, 执行选择、 交叉、 变异操作。 在一次迭代结束之后, 返回到步骤②, 重新执行纠错、 计算RMSEV、 选择、 交叉、 变异。 达到停止迭代的要求后, 将最低的RMSEV值所对应的染色体保存下来作为最优染色体, 其所对应的主从光谱区间作为最优区间。 用玉米、 小麦两套数据测试了该算法, 结果显示, 与全光谱相比, GA-IDS选择的主从光谱区间可以显著地降低误差; 与向后迭代区间选择法(IIBS)相比, 在小样本情况下, GA-IDS的误差显著地小于IIBS方法。
近红外光谱 模型转移 遗传算法 变量选择 向后迭代区间选择法 Near-infrared spectra Calibration transfer Genetic algorithm Variable selection Iterative interval backward selection 
光谱学与光谱分析
2022, 42(12): 3783
作者单位
摘要
东北林业大学机电工程学院, 黑龙江 哈尔滨 150040
木材的抗弯强度是木材重要的力学指标。 光谱分析操作简单、 方便、 快速, 已成为木材检测的重要手段。 但是在应用中, 面对检测环境的温湿度变化、 仪器部件老化和附件更换等情况, 采集到的光谱数据会发生一定程度的偏移。 为了解决这一问题, 以落叶松抗弯强度的近红外光谱预测模型为研究对象, 针对不同类型光谱仪数据差异而导致主机模型泛化能力差的问题, 提出了一种迁移学习与光谱转移校准结合的近红外光谱建模方法。 加工200组落叶松板材试件样本, 以NIRQuest512光谱仪为主机、 One-chip微型集成光谱仪为从机, 分别采集落叶松试材光谱数据, 利用力学万能测试机检测试件力学真值; 2类数据经过SNV、 S-G、 光谱剪切预处理后, 从机数据使用PDS转移校正完成从机到主机光谱线性变换; 然后, 利用SWCSS对2类光谱数据进行特征提取, 优选出主机与从机相关的稳定性一致光谱波段; 最后, 采用100组试件的2类近红外光谱数据进行GFK-SVM建模, 得到适用于主机、 从机设备的通用模型。 为了验证模型方法的有效性, 应用100组数据进行测试并对比了DS-PLS, PDS-PLS, DS-SWCSS-GFK-SVM和PDS-SWCSS-GFK-SVM等建模方法; 结果表明, PDS采用了滑窗技术, 方法相较DS方法可以更好地完成光谱数据的线形映射, 在一定程度上提高了建模精度, 统一了两组光谱仪之间的光程与波长数; SWCSS特征提取方法能够根据2组光谱数据集之间的差异与共性优选波段, 保证特征选择的有效性与稳定性, 提升建模精度; GFK-SVM适合不同光谱数据的迁移, 能够通过合理的核函数参数优选实现不同类型光谱数据的高维映射, 在高维空间中构建不同数据集的通用模型, 实现主机模型在从机光谱预测上的泛化, 提升了数据的使用效率, 测试集相关系数Rp达到0.875, 均方根误差RMSEP为11.975。
木材抗弯强度 模型转移 迁移学习 Wood bending strength Calibration transfer Transfer learning GFK-SVM GFK-SVM 
光谱学与光谱分析
2022, 42(5): 1471
作者单位
摘要
东北大学秦皇岛分校, 河北 秦皇岛 066000
近红外光谱分析技术近年来在各种领域的定性、 定量分析等方面得到广泛的应用。 多元标定技术则是光谱分析领域中最先进的技术, 而环境条件、 测量仪器或测量物质自身的变化, 都可能导致多元标定模型不再适用于新样本的预测。 重新标定和重新建模必然会浪费大量时间和资源。 一种解决方案是标定迁移, 将源域已有的标定模型扩展到目标域中, 避免重复建模的代价。 在化学计量学的相关文献中, 绝大多数迁移方法都需要在两台仪器相同条件下都测量一组迁移标准样品, 但在近红外光谱测量技术中, 由于标准样品具有挥发等特性, 使得构建仪器标定迁移方法的标准样品难以获得和保存。 针对这些问题, 提出了一种联合特征子空间分布对齐(JSDA)的标定迁移方法, 此方法可以在从仪器没有标准样本的情况下建立标定迁移模型。 JSDA首先建立源域和目标域数据特征的联合主成分分析(PCA)子空间; 然后通过对齐映射在联合特征子空间中的源域特征分布和目标域特征分布来校正标定模型; 最后, 应用最小二乘模型构建校正后源域上的标定模型, 该模型可直接用于目标域的标定。 实验结果表明与已有成熟的标定迁移方法相比, JSDA在公开的真实数据集上的预测性能比较有优势, 验证了该模型在实际应用中的有效性和优越性。
近红外光谱 标定迁移 PCA子空间 联合子空间分布对齐 Near infrared spectroscopy Calibration transfer PCA subspace Joint subspace distribution alignment 
光谱学与光谱分析
2021, 41(11): 3411
作者单位
摘要
东北大学秦皇岛分校, 河北 秦皇岛 066000
凭借高效、 无损和环保的优点, 近红外光谱在多个领域广泛用作物质快速分析方法的同时, 仍面临着光谱标定模型生命周期短, 构建仪器标定迁移方法的标准样品难以获得和保存等问题。 在化学计量学文献中, 迁移方法通常能够矫正主从仪器之间的光谱差异, 但绝大多数方法都需要在两台仪器相同条件下测量一组迁移标准样品。 虽然样品数目不必过多, 但总体上表明, 必须对其进行很好的选择才能保证成功迁移。 对于在主从仪器中选择代表性的样本子集, 现有Kennard-Stone算法作为样本选择的主要算法。 在标准样本的确定问题中, 假设主仪器已找到标准样本, 选择的样本集需要在从仪器中进行测量, 仅当迁移样本足够稳定时才有可能, 但现有近红外光谱技术无法保证这一点。 如果假设使用从仪器的样本作为标准样本, 考虑到新工业应用中光谱光源的变更, 主仪器被从仪器代替, 因此不再可用。 基于目前存在的这些问题, 提出了一种平均分布差异最小化的NIR标定迁移方法(MCT), 此方法可以在不考虑从仪器标准样本(即标准样本自由)的情况下, 针对近红外光谱数据的多重共线性, 首先假设存在一个主从仪器光谱的共同偏最小二乘子空间, 并将主从仪器光谱数据分别投影到该公共子空间; 然后, 引入平均分布差异最小化算法, 即分别给出主从光谱数据在子空间的平均分布中心表示函数, 在最小化两个光谱平均分布(中心点)的差异的同时, 最大化投影后主仪器光谱的协方差, 推导求解出最佳子空间; 最后, 将主光谱样本和从光谱预测样本分别投影到该偏最小二乘子空间中, 利用主光谱数据得到回归模型, 该模型可用于预测从光谱浓度。 通过对玉米数据集和小麦数据集的测试研究, 证明的预测效果与SBC, PDS, CCACT, TCR和MSC相比有所改善, 该方法可以实现更低的预测误差。
近红外光谱 标定迁移 平均分布差异 标准样本自由 偏最小二乘回归 Near infrared spectroscopy Calibration transfer Mean distribution discrepancy Standard-free Partial least square regression 
光谱学与光谱分析
2021, 41(10): 3051
作者单位
摘要
江苏大学食品与生物工程学院, 江苏 镇江 212013
近红外光谱(NIR)具有快速、 无损、 操作方便的特点, 故广泛用于食品分析。 作为一种间接的分析技术, NIR需要建立光谱与待测浓度之间的统计模型来实现检测。 故模型的维护有助于保证NIR的预测准确性。 在外界条件发生变化的情况下, 诸如样品性状的改变、 仪器对理化指标函数关系的变化、 湿度和温度等环境因素的改变, 会导致相同样品的光谱信号发生偏移, 进而使得原有模型的预测精度下降。 此时, 如果重新建模, 虽然可以解决光谱偏移对建模的影响, 但是重新建模将耗费大量的人力物力。 对此, 模型转移可以在避免重新建模的情况下, 校正光谱的偏移, 进而提高模型预测精度。 通常模型转移算法多用全光谱进行模型转移, 这种方法计算量较大, 且不能找到合适的有化学意义的波段。 故提出一种基于模型转移中的变量选择方法: 向后迭代区间选择法(IIBS), 通过计算主光谱(用于建模的那组光谱)和从光谱(发生偏移, 需要通过模型转移算法将其校正的光谱)中, 变量区间的重要性信息(回归系数(β)、 残差向量(Res)以及变量重要性投影(VIP))。 进而通过计算该区间变量重要性信息的几何平均数, 并以此作为该区间的区间重要性指标。 接着根据区间的重要性, 删除重要性信息较小的变量区间。 然后对主光谱和从光谱重复迭代上述过程: 计算变量的重要性信息, 计算区间的重要性信息, 删除重要性信息较小的区间。 最后, 比较不同的主光谱和从光谱区间组合的验证均方根误差(RMSEV), 选择RMSEV最小的主光谱和从光谱区间作为最优区间。 玉米、 小麦两套NIR数据测试了该算法。 结果显示, 与全波段相比, β, Res以及VIP均可以从主光谱和从光谱中选择较少的, 有化学意义的区间, 提高模型转移的精度。 在比较不同变量重要性向量方面, 基于β的变量选择算法, 模型转移的计算误差较小。
近红外光谱 模型转移 变量选择 回归系数 残差向量 VIP值 Near infrared spectra Calibration transfer Variable selection Regression coefficient Residual error VIP 
光谱学与光谱分析
2021, 41(6): 1789
作者单位
摘要
1 江苏大学食品与生物工程学院, 江苏 镇江 212013
2 Department of Molecular Cell Physiology, Graduate School of Medical Science, Kyoto Prefectural University of Medicine, Kyoto 602-8566, Japan
样本选择是模型转移的重要组成部分, 其目的是在主光谱和从光谱中选择合适的样本, 建立二者的转移模型, 使得从光谱的预测样本能通过转移模型校正成类似于主光谱的样本, 进而用主光谱的模型直接预测其浓度。 目前, 常用的样本选择算法有: Kennard-Stone 法 (KS法), SPXY法和SPXYE法。 根据上述算法的特点, 提出了一种新的样本选择方法: 加权SPXYE法(WSPXYE法), 进而将其用于选择合适的转移集样本。 WSPXYE同样先计算样本间的距离, 其距离有三个部分组成: 光谱(X)之间的归一化距离dxs, 浓度(y)之间的归一化距离dys, 以及校正误差(e)之间的归一化距离des。 其加权代数和dwspxye=αdxs+βdys+(1-α-β)des即为WSPXYE距离。 计算了WSPXYE距离之后, 可以根据其距离选择距离较大的样本作为转移集样本。 WSPXYE是Kennard-Stone法(KS法), SPXY法和SPXYE法的推广, 而KS法(α=1, β=0)、 SPXY法(α=0.5, β=0.5)以及SPXYE法(α=0.333, β=0.333)则是WSPXYE法的特例。 直接校正法(DS)、 有信息成分提取-典型相关分析法(CCA-ICE)作为模型转移算法验证了WSPXYE方法的效果。 结果显示, 与KS法、 SPXY法以及SPXYE法相比, WSPXYE法可以通过调节参数, 选择合适的样本, 获得较低的误差。
样本选择 模型转移 WSPXYE WSPXYE Kennard-Stone Kennard-Stone SPXY SPXY SPXYE SPXYE Sample selection Calibration transfer 
光谱学与光谱分析
2021, 41(3): 984
作者单位
摘要
天津大学精密测试技术及仪器国家重点实验室, 天津 300072
药品安全与质量监管迫切需要在线、 快速、 低成本的成分检测技术。 近红外光谱技术在检测成本及速度方面具有显著优势, 基于近红外光谱的药品成分检测方法, 对于提高药品质量监管水平有着十分重要的研究意义和应用价值。 在实际应用中, 不同光谱仪器由于性能参数不同, 测量光谱存在一定差异, 很难实现定量校正模型共享。 因此, 研究不同光谱仪器之间模型传递对于提高分析效率十分重要。 针对头孢类药品成分检测的需要, 研究了头孢类药品中三种组分定量校正模型, 提出了一种基于马尔可夫链(MC)的转换集选择的不同仪器间定量校正模型传递方法。 采用两台不同厂家光谱仪器分别测量56份不同批次的头孢拉定颗粒样品, 针对样品的三种组分: 头孢拉定、 头孢氨苄和水分, 使用偏最小二乘法(PLS)建立定量校正模型。 通过构建概率矩阵, 选择合适的转换集, 提高模型转换效率及不同仪器得到光谱数据的建模预测精度。 实验结果表明, 利用该模型转移算法, 可利用少量转换集样本实现不同光谱仪器间定量校正模型转移, 模型转移前后, 定量校正模型对于三种主成分预测相对误差从9.67%, 52.14%和19.25%, 分别下降到到4.37%, 31.12%和11.67%。 利用该模型传递方法可以有效修正主从仪器光谱差异, 实现了不同仪器测量光谱及定量分析模型传递共享。 该研究的建模分析与模型传递方法也为药品成分与质量检测提供了技术支撑。
近红外光谱 药品成分检测 定量校正模型 模型传递 马尔可夫链 Near-infrared spectroscopy Drug composition detection Quantitative calibration model Calibration transfer Markov chain 
光谱学与光谱分析
2020, 40(11): 3562
作者单位
摘要
1 贵州中烟工业有限责任公司技术中心, 贵州 贵阳 550009
2 贵州医科大学食品科学学院, 贵州 贵阳 550025
模型转移是解决近红外光谱仪器间存在差异导致校正模型难以在多台仪器间通用问题的重要方法。 利用主成分-马氏距离方法判断样品在不同仪器间的光谱差异性, 然后通过吉洪诺夫正则化约束和校正模型参数, 提出新的模型转移算法, 实现模型在不同近红外光谱仪器上的共享和使用。 首先使用一组标准样品光谱, 建立主机和子机近红外光谱模型预测误差最小化函数。 通过约束主机和子机的模型参数的差异, 求出子机的模型参数, 从而达到模型转移的目的。 该方法应用于药物活性成分和烟叶中总植物碱与总糖的含量分析, 结果表明使用15个标准样品时, 子机光谱样本的预测均方根误差(RMSEP)分别从8.3 mg、 0.49%和1.91%降到3.9 mg、 0.09%和0.83%。 转移后模型预测相对分析误差(RPD)均大于3.0, 子机光谱样本的预测效果得到明显提高。 该方法理论明确、 直观, 在实际应用中样品预测准确性较好, 为具有标准样品的模型转移方法提供一种新思路。
近红外光谱 吉洪诺夫正则化 模型转移 马氏距离 Near-infrared spectroscopy Tikhonov regularization Calibration transfer Mahalanobis distance 
光谱学与光谱分析
2020, 40(6): 1804
作者单位
摘要
山西农业大学工学院, 山西 太谷 030801
在水果的品质检测和分级分选中, 存在不同仪器所建检测模型难以共享的难题。 为此, 以壶瓶枣为研究对象, 利用可见/近红外光谱技术探讨仪器间可溶性固形物含量(SSC)检测模型的传递方法。 首先, 采用美国ASD(Analytical Spectral Device)公司生产的两台仪器采集样本的光谱信息, 采用最小二乘支持向量机(LS-SVM)建立原始光谱、 Savitzky-Golay一阶导数处理、 标准正态变量变换后的SSC检测模型, 预测不同仪器采集的光谱时3种方法的预测能力均较差。 预测同一台仪器的光谱时, 基于原始光谱的主仪器所建模型最优, 预测集的决定系数(R2p)和均方根误差(RMSEP)分别为0.73和1.36%。 在此基础上, 采用Kennard/Stone算法选取标样, 利用专利算法(Shenk’s)、 直接标准化(DS)、 斜率/偏差算法(S/B)进行模型传递。 然后, 根据回归系数提取主仪器(24个)和从仪器(28个)的特征波长, 优选出单一变量(SV)24个、 共性变量(CV)23个、 融合变量(FV)29个, 均涵盖了SSC的主要吸收谱带。 利用优选的变量分别建立主仪器的LS-SVM检测模型, 采用主仪器的预测结果(R2p=0.78~0.80, RMSEP=1.07%~1.13%)明显好于全波段所建模型, 但预测从仪器时RMSEP为6.62%~7.88%, 模型失效。 最后, 基于波长位置偏移和分子振动的吸收特性提出了共性变量优选结合差值补正(CV-MC)、 单一变量优选结合差值补正、 融合变量优选结合差值补正、 共性变量优选结合波长补正算法(CV-WC)进行模型传递, 并与SV-Shenk’s, CV-Shenk’s, FV-Shenk’s, SV-DS, CV-DS, FV-DS, SV-S/B, CV-S/B和FV-S/B进行对比分析。 结果表明, 基于全波段进行模型传递时, 预测结果均较差(R2p=0.03~0.34, RMSEP=2.44%~4.67%); 基于优选变量所建模型经SV-Shenk’s, CV-Shenk’s, FV-Shenk’s传递后的结果较差, 经其他算法传递后的结果(R2p=0.47~0.73, RMSEP=1.30%~1.90%)好于全波段; 基于共性变量传递后的结果好于单一变量和融合变量, CV-MC结果最佳(R2p=0.73, RMSEP=1.30%), CV-WC传递后的预测结果(RMSEP=1.62%)与CV-DS和CV-S/B相近。 研究表明, CV-MC和CV-WC均是一种有效模型传递算法, 对建立不同仪器间通用的鲜枣品质检测模型具有重要意义。
可见/近红外光谱 模型传递 鲜枣 无损检测 Near/infrared spectroscopy Calibration transfer Jujube Non-destructive detection 
光谱学与光谱分析
2019, 39(4): 1041

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!