江苏大学食品与生物工程学院, 江苏 镇江 212013
黑果枸杞属药食同源植物, 富含多糖、 蛋白质、 矿物质、 花青素等生物活性物质, 具有清除自由基、 抗氧化、 美容养颜及调节人体免疫系统的作用, 引起国内外研究者的极大关注, 备受消费者的追捧。 我国幅员辽阔, 黑果枸杞的种植主要分布于新疆、 西藏、 内蒙古、 青海、 宁夏等地, 不同产地受海拔、 日照、 环境因素的影响所产黑果枸杞品质也不尽相同。 针对市场上不同产地黑果枸杞产地信息标注混乱, 品质参差不齐而导致市场混乱现象, 利用近、 中红外光谱技术结合化学计量学方法对黑果枸杞的产地品质信息进行区分。 首先对所收集不同产地的5种, 共计190个黑果枸杞样本进行近、 中红外光谱采集及多糖含量的测定, 利用主成分分析(PCA)对所采集的原始数据进行降维处理并采用偏最小二乘-支持向量机(LS-SVM)对其进行定性区分。 结果显示, 经PCA处理后的三维主成分得分图可明显地将黑果枸杞的光谱数据按照产地类型分为5大类, 进一步采用LS-SVM对其进行处理, 得出融合光谱与单一近、 中红外光谱所建LS-SVM模型相比, 融合光谱所建模型的预测能力优于单一一种光谱所建模型的预测能力, 当主成分数为9时, 近、 中红外融合光谱的校正集识别率达到100%, 预测集识别率达到99.17%。 采用联合区间偏最小二乘(Si-PLS)对多糖含量进行定量预测, 结果显示, 近、 中红外光谱融合后建立Si-PLS预测模型的校正集相关系数(Rc)为0.976 9, 交互验证均方根误差(RMSECV)最小为2.08%, 预测集的相关系数(Rt)达到0.967 0, 均方根误差(RMSEP)为2.40%。 另外用15个新的黑果枸杞样本对所建立最佳Si-PLS模型进行验证, 验证模型的Rt和RMSEP分别为0.947 7和2.57%, 结果证明研究所建最佳Si-PLS模型的鲁棒性好、 精确度高。 结合LS-SVM、 Si-PLS的近、 中红外融合光谱技术, 可以精简、 优化模型, 达到快速、 准确地识别黑果枸杞的产地品质信息的目的。
红外光谱 黑果枸杞 多糖 光谱融合 联合区间偏最小二乘 Infrared Spectroscopy Lycium Ruthenicum Murr. Polysaccharide Data fusion Synergy interval partial least squares 光谱学与光谱分析
2020, 40(12): 3878
黑龙江八一农垦大学电气与信息学院, 黑龙江 大庆 163319
在近红外光谱的建模预测分析中, 数据的冗余及共线性会严重影响模型的预测精度和稳健性。 特征波长选择是提高定量分析预测精度的一种有效方法。 随机蛙跳(RF)是一种依据不同的变量具有不同的被选择可能性的特征波长选择算法, 近年来在特征波长提取方面展现良好的性能。 该方法通过多次迭代, 计算每个变量被选择的概率, 以优选概率高的变量为特征波长。 但由于其初始变量集V0的产生是随机的, 具有较大的不确定性, 可能会包含无用或干扰信息, 难以保证初始信息的有效性, 使得迭代次数过大, 运行时间过长。 故而提出一种改进的联合区间随机蛙跳(Si-RF)特征波长选择算法, 通过联合区间偏最小二乘法(SiPLS)对全谱进行变量初选, 此时得到的波长对目标变量变化最为敏感, 将其作为RF的初始变量子集, 以解决RF运行时间较长、 效率较低的问题。 另一方面, RF在选择特征波长时, 选择被选概率值大于阈值的变量为特征波长, 但对概率值阈值的设定无理论依据, 易受人为因素影响。 通过对变量按被选概率值降序排列后逐次增加一个波长建立多元线性回归(MLR)模型, 以验证均方根误差(RMSEV)值最低时的变量子集为特征波长, 以找到预测精度最高点所包含的波长, 提高预测精度。 针对上述两点进行改进, 将其应用于一组土壤样本近红外光谱数据集, 进行特征波长选择后, 建立MLR模型, 与RF-MLR及全谱-PLSR模型的预测精度进行比较。 结果表明: RF经过10 000次迭代, 优选出10个波长点, 建立的MLR模型的预测均方根误差(RMSEP)为1.6276; 而改进后Si-RF只需进行1 000次迭代, 优选出17个波长点, 其MLR模型的RMSEP减小到0.818 4, 大大提升了预测精度, 提高运行效率。 相较于全谱, 也极大的提高了预测精度, 简化模型的复杂度, 证明改进的Si-RF是一种有效的特征波长选择算法。
近红外光谱 特征波长选择 多元校正 随机蛙跳 联合区间偏最小二乘 Near-infrared spectroscopy Feature wavelength selection Multivariate calibration Random frog Synergy interval partial least squares 光谱学与光谱分析
2020, 40(11): 3451
1 安徽建筑大学环境与能源工程学院, 安徽 合肥 230601
2 安徽建筑大学水污染控制与废水资源化安徽省重点实验室,安徽 合肥 230601
为了快速、准确地测定强化生物除磷(EBPR) 过程中污泥胞内糖原的含量,采用 4种预处理方法分别对污泥近红外光谱进行预处理,并结合联合区间偏最小二乘(siPLS) 进行变量优选,建立光谱吸光度数据与糖原含量的定量分析模型。结果表明,将一阶 S-G(Savitzky-Golay) 平滑处理后的光谱等分为 20个子区间,联合子区间[10 13 16 19]建立的 siPLS模型预测效果最优,预测集的均方根误差(RMSEP) 和相关系数(rp) 分别达到 0.0048、0.9105,且该模型的交互验证和外部验证相对分析误差(RPD) 均大于 3.0。一阶平滑处理后的光谱 siPLS模型预测精度高、建模变量少,可实现糖原含量的快速测定。
强化生物除磷 糖原 近红外光谱 Savitzky-Golay平滑法 联合区间偏最小二乘 enhanced biological phosphorus removal(EBPR) glycogen near infrared spectroscopy (NIR) Savitzky-Golay smoothing(S-G) interval partial least squares (siPLS)
1 石河子大学机械电气工程学院, 新疆 石河子 832003
2 石河子大学食品学院, 新疆 石河子 832003
波段筛选方法的选取以及随后的光谱特征波段的提取对高光谱模型效果的影响较大。 为了快速准确检测羊肉的pH值, 开展并讨论了利用两种特征波段筛选方法对羊肉pH值高光谱模型的影响研究。 本研究采用二阶导数(2D)、 多元散射校正(MSC)和中心化处理(mean-centering)相结合的方法对所提取纯肌肉部分的代表性光谱进行预处理, 利用联合区间偏最小二乘(siPLS)和联合区间偏最小二乘结合遗传算法(siPLS-GA)对全波段473~1000 nm范围光谱进行特征波段的提取, 并分别建立相对应特征波段范围羊肉pH的PLS预测模型, 同时与全波段的PLS模型效果相比较。 结果表明采用siPLS-GA提取的特征波长建立的PLS模型效果最优, 其选取的特征波长点数为56, 校正集相关系数(Rcal)和均方根误差(RMSEC)分别为0.96和0.043, 预测集相关系数(RP)和均方根误差(RMSEP)分别为0.96和0.048。 siPLS-GA方法既能够减少建模使用的光谱变量, 又可以提高模型精度, 因此利用高光谱图像技术结合siPLS-GA可以实现羊肉pH的特征波段筛选和快速准确检测。
高光谱图像 羊肉pH 特征波段 联合区间偏最小二乘(siPLS) 遗传算法(GA) Hyperspectral imaging(HSI) Lamb pH Characteristic bands Synergy interval partial least square(siPLS) Genetic algorithm(GA) 光谱学与光谱分析
2016, 36(9): 2925
1 江苏大学电气信息工程学院, 江苏 镇江 212013
2 江苏大学机械工业设施农业测控技术与装备重点实验室, 江苏 镇江 212013
3 滁州职业技术学院信息工程系, 安徽 滁州 239000
为解决偏最小二乘判别分析(PLSDA)建模时光谱区域中的噪声及冗余信息干扰问题,提出一种基于联合区间偏最小二乘判别分析(SiPLSDA)算法,并将该算法应用于猪肉近红外光谱的定性建模分析。SiPLSDA 利用联合区间偏最小二乘回归(SiPLS)进行光谱特征区域筛选,在筛选出来的光谱区域内建立数据的定性预测模型。采用Antaris II 快速傅里叶变换近红外光谱分析仪获取波数范围为10000~4000 cm-1的猪肉样本近红外光谱,采用标准正态变量变换(SNV)进行近红外光谱的预处理,用SiPLSDA 建立猪肉近红外光谱的定性模型。实验结果表明,SiPLSDA 建立的预测模型对猪肉储藏时间的识别率达到93.94%,高于基于全光谱区域建立的PLSDA 预测模型的识别率。
光谱学 近红外光谱 猪肉 定性建模 偏最小二乘判别分析 联合区间偏最小二乘回归 激光与光电子学进展
2015, 52(4): 043003
1 江苏大学食品与生物工程学院, 江苏 镇江 212013
2 江西农业大学生物科学与工程学院, 江西 南昌 330045
挥发性盐基氮(TVB-N)含量是评价肉制品新鲜度的重要指标。尝试采用遗传联合区间偏最小二乘(GA-Si-PLS)从高光谱数据之光谱信息中筛选出最优波长。再提取各波长所对应的灰度图像的纹理特征,纹理特征变量经主成分优化后,作为输入层,运用反向传播神经网络(BP-ANN)构建鸡肉的TVB-N含量的定量模型。实验表明,模型对训练集和预测集的均方根误差分别6.61和9.84,相关系数分别为0.9054和0.8030。研究表明可以利用高光谱中的图像信息对鸡肉TVB-N含量进行快速无损检测。
光谱学 高光谱成像 检测 遗传联合区间偏最小二乘 挥发性盐基氮 遗传算法 反向传播神经网络 激光与光电子学进展
2013, 50(7): 073003
江苏大学 食品与生物工程学院,江苏 镇江 212013
为了实现快速无损地检测猪肉新鲜度的目的,应用近红外光谱法测定猪肉新鲜度重要指标—挥发性盐基氮(TVB-N)的含量。猪肉原始光谱经标准偏差归一化方法(SNV)预处理后,用联合区间偏最小二乘法(siPLS)建立猪肉预处理后光谱和TVB-N含量的校正模型并与经典偏最小二乘法(PLS)模型、间隔偏最小二乘法(iPLS)模型作比较。试验结果表明,利用联合区间偏最小二乘法所建的预测模型最佳,其校正集相关系数(Rc)和交互验证均方根误差(fRV)分别为0.8332和3.75,预测集的相关系数(Rp)和预测均方根误差(fRP)分别为0.8238和4.17。研究结果表明利用近红外光谱和联合区间偏最小二乘法可以快速地测定猪肉中挥发性盐基氮的含量。
光谱学 近红外光谱术 联合区间偏最小二乘 挥发性盐基氮 猪肉