高西娅 1,2,3,*张朱珊莹 1,2,3卢翠翠 1,2,3蒙泳吉 1,2,3[ ... ]谢勤岚 1,2,3
作者单位
摘要
1 中南民族大学生物医学工程学院, 湖北 武汉 430074
2 认知科学国家民委重点实验室, 湖北 武汉 430074
3 医学信息分析及肿瘤诊疗湖北省重点实验室, 湖北 武汉 430074
血红蛋白是人体的一项重要生理指标, 浓度异常会导致人体产生各种疾病。 红外光谱技术具有简单、 无损、 快速等优点, 非常适合用于生理参数的定量分析。 由于光谱背景复杂、 有效信息弱, 如何提取有效特征变量, 构建精准定量模型是个难题。 针对此问题, 以血液样本和血红蛋白仿体溶液样本光谱数据为研究对象, 采用SPXY法、 K_S法、 duplex法、 等间隔划分法四种数据集划分方法划分数据并通过建模对比, 优选出最佳数据集划分方法为SPXY法。 遍历了SavitzkyGolay一阶求导滤波(S_G1)+小波变换、 小波变换+S_G1、 标准正态变量变换(SNV)+S_G1三种预处理方法, 优选出SNV+S_G1预处理方法。 结合串联思想, 提出组合区间偏最小二乘法(SiPLS)与连续投影算法(SPA)串联的特征波长优选方法, 构建SiPLS-SPA-PLS预测模型, 用两组数据对模型进行验证, 依据评价指标判断模型的优劣, 并与全谱PLS, SPA-PLS和SiPLS三种定量模型相比较。 实验结果表明: (1)使用SiPLS-SPA-PLS模型进行定量分析, 血液样本的Rc, Rp, RMSEC和RMSEP值分别为0.993 6, 0.990 6, 0.199 2和0.184 6, 仿体溶液样本的Rc, Rp, RMSEC和RMSEP值分别为0.998 9, 0.998 5, 1.848 9和2.007 4。 相比全谱PLS, SPA-PLS, SiPLS三种定量模型, Rc和Rp值最大, RMSEC和RMSEP值最小, 该模型最优, 可以更精准地实现血红蛋白的定量分析。 (2)SiPLS-SPA-PLS定量模型能更加准确地筛选最优波段, 两种样本筛选出来的有效波段分别为血液(1 144~1 264, 1 606~1 798 nm)、 仿体溶液(1 018~1 390, 1 600~1 700 nm), 剔除掉仪器的影响因素, 大致相同, 此方法可以精准优选出特征波长。 (3)该模型可以提取有效变量, 去除无用噪声影响, 血液样本从全谱的700个光谱变量中优选出28个, 仿体溶液样本从全谱的1201个光谱变量优选出41个, 提高检测速度和预测效率。 该方法为血红蛋白快速精准检测提供了一种思路。
红外光谱 定量分析 波长优选 Infrared spectroscopy SiPLS-SPA SiPLS-SPA Quantitative analysis Wavelength selection 
光谱学与光谱分析
2023, 43(1): 50
作者单位
摘要
江苏大学食品与生物工程学院, 江苏 镇江 212013
小麦是制作馒头的主要原料之一, 小麦中水、 蛋白质、 淀粉会因产地以及烘干程度的差异而不同, 进而影响到加工成馒头的品质。 所以实现对小麦产地和烘干程度的快速鉴别就显得尤为重要。 感官评定是鉴别小麦产地和烘干程度常用的方法, 对比感官评定, 光谱分析可以识别样品中的分子结构等信息。 基于此, 尝试利用近红外和中红外光谱融合技术实现对不同产地和不同烘干程度的小麦同时鉴别。 首先选取了两个不同产地的小麦, 再利用微波干燥法对两个不同产地的小麦做烘干预处理, 使烘干的小麦水含量为12%±0.5%, 原麦水含量为18%±0.5%。 分别标记为原麦A, 烘干A, 原麦B, 烘干B, 再将小麦研磨成粉末, 过100目筛网筛选后, 置于自封袋中备用。 随后分别采集四种小麦样品的近红外和中红外光谱信息, 在Matlab 7.10的环境下使用标准正态变量变换(standard normal variable transformation, SNVT)对采集到的原始光谱数据进行预处理, 利用主成分分析对预处理后的数据进行降维处理, 再结合线性判别分析(linear discriminant analysis, LDA)和支持向量机(support vector machine, SVM)分别建立小麦近红外、 中红外光谱数据识别模型。 另外利用联合区间偏最小二乘法(synergy interval partial least square, SiPLS)筛选出利用标准正态变量变换(SNVT)预处理后的小麦近红外和中红外光谱数据特征光谱区间, 将筛选出的近红外和中红外光谱数据特征光谱区间融合后再结合线性判别分析(LDA)和支持向量机(SVM)建立小麦融合光谱信息的识别模型。 然后比较同种光谱数据下利用线性判别分析(LDA)和支持向量机(SVM)建立的小麦识别模型识别率、 比较同种建模方法下近红外和中红外光谱数据建立小麦识别模型识别率、 比较同种建模方法下光谱数据融合和单一光谱数据建立小麦识别模型识别率。 结果表明, 同种光谱分析方法, 利用SVM建立的四种小麦识别模型识别率高于利用LDA建立的小麦识别模型识别率。 同种建模方法, 近红外光谱数据建立的小麦识别模型识别率优于中红外光谱数据建立的小麦识别模型识别率。 而在同种建模方法下, 利用SiPLS筛选出近红外和中红外光谱数据的特征光谱区间数据融合后建立小麦识别模型识别率最高, 光谱数据融合后结合LDA建立的小麦识别模型校正集识别率为98.75%, 预测集识别率为97.50%; 而将此选择的变量结合SVM建立的小麦识别模型的校正集和预测集识别率都达到100.0%。 对比利用单一光谱数据建立的小麦识别模型识别率, 光谱数据融合之后建立的小麦识别模型识别率得到显著提高, 该研究从纵向和横向上全面地比较了光谱数据建立的小麦模型识别率, 结果可为更准确地运用光谱融合技术建立小麦产地以及烘干程度识别模型提供参考。
小麦 光谱分析技术 联合区间偏最小二乘法 线性判别分析 支持向量机 Wheat Spectral analysis technology Synergy interval partial least square (SiPLS) Linear discriminant analysis (LDA) Support vector machine (SVM) 
光谱学与光谱分析
2019, 39(5): 1445
刘金明 1,2,*初晓冬 1王智 1许永花 3[ ... ]孙勇 1
作者单位
摘要
1 东北农业大学工程学院, 黑龙江 哈尔滨 150030
2 黑龙江八一农垦大学电气与信息学院, 黑龙江 大庆 163319
3 东北农业大学电气与信息学院, 黑龙江 哈尔滨 150030
预处理是提高玉米秸秆生物转化利用效率的有效途径。 玉米秸秆经生物炼制转化为生物燃料时, 转化率与其原料内的纤维素和半纤维素含量直接相关。 为了实现对预处理后玉米秸秆的生物炼制过程的有效调控, 提出使用近红外光谱(NIRS)对玉米秸秆的纤维素和半纤维素含量进行快速检测, 解决传统化学方法测试速度慢、 成本高的问题。 为了提高NIRS检测的效率和精度, 将遗传算法与模拟退火算法相结合构建遗传模拟退火算法(GSA)用于预处理后玉米秸秆纤维素和半纤维素含量NIRS特征波长优选。 GSA算法以NIRS波长点数为码长进行二进制编码, 以偏最小二乘法(PLS)回归模型的交叉验证均方根误差为目标函数, 结合温度参数设计适应度函数, 基于Metropolis判别准则实现扰动解的选择复制, 能够在避免早熟的同时有效提高进化后期的搜索效率。 采用碱预处理、 生物预处理及其相结合的方法对采集的玉米秸秆进行预处理后制备样品120个, 并测定其纤维素和半纤维素含量及NIRS。 使用7点Savitzky-Golay平滑结合多元散射校正和标准正则变换对光谱进行预处理后, 利用Kennard-Stone法按3∶1比例划分校正集和验证集。 然后, 使用GSA算法对NIRS全谱进行特征波长优选(记为Full-GSA)、 对协同区间偏最小二乘法(SiPLS)优选后谱区进行特征波长优选(记为SiPLS-GSA)、 对反向区间偏最小二乘法(BiPLS)优选后谱区进行特征波长优选(记为BiPLS-GSA), 并使用PLS回归模型和验证集对特征波长优选结果进行评测。 Full-GSA以全谱1 557个波长点为基因, 执行16次算法, 优选出118个纤维素特征波长点和164个半纤维素特征波长点。 SiPLS-GSA经SiPLS优选的纤维素和半纤维素谱区波长点数分别为388个和160个, 再经GSA进一步优选后得到157个纤维素特征波长点和148个半纤维素特征波长点。 BiPLS-GSA经BiPLS优选的纤维素和半纤维素谱区波长点数分别为358个和180个, 再经GSA进一步优选后得到130个纤维素特征波长点和153个半纤维素特征波长点。 结果表明, 通过波长优选, 不仅参与建模的波长点数量显著减少, 而且回归模型的性能显著优于全谱建模。 其中, 采用Full-GSA优选的纤维素特征光谱回归性能最佳, 采用SiPLS-GSA优选的半纤维素特征光谱回归性能最佳。 回归模型验证集的平均相对误差(MRE)分别为1.752 4%和2.020 8%, 较全谱建模分别降低了13.636 6%和25.368 4%。 基于结合温度参数设计适应度函数的策略构建的GSA具有良好的全局搜索性能, 适用于玉米秸秆纤维素和半纤维素含量NIRS特征波长优选。 GSA以全谱每个波长点为染色体基因的编码方案适用于NIRS全谱的特征波长优选。 GSA同样适用于SiPLS和BiPLS优选后谱区的特征波长优选, 能够有效实现优选后谱区的波长点优选。
玉米秸秆 近红外光谱 遗传模拟退火算法 协同区间偏最小二乘法 反向区间偏最小二乘法 特征波长 Corn stover Near infrared spectroscopy (NIRS) Genetic simulated annealing algorithm (GSA) Synergy interval partial least squares (SiPLS) Backward interval partial least squares (BiPLS) Characteristic wavelength 
光谱学与光谱分析
2019, 39(3): 743
梅从立 1,2,*陈瑶 2尹梁 2江辉 2[ ... ]刘国海 2
作者单位
摘要
1 浙江水利水电学院电气工程学院, 浙江 杭州 310018
2 江苏大学电气信息工程学院, 江苏 镇江 212013
近红外技术广泛应用于食品、 药品等生产过程和产品质量检测, 具有样品无需预处理、 成本低、 无破坏性、 测定速度快等优点。 但是, 全光谱数据维数高、 冗余信息多, 直接应用于建模会导致模型复杂性高、 稳定性差等问题。 siPLS是最常见的光谱数据降维方法, 但是难以处理光谱数据的共线性问题。 LASSO是一种相对新的数据降维方法, 但在小样本应用中具有不稳定性。 针对siPLS和LASSO在近红外光谱数据应用中存在的问题, 提出了基于siPLS-LASSO的近红外特征波长选择方法, 并将其应用于秸秆饲料蛋白固态发酵过程pH值监测。 该方法首先采用siPLS算法, 实现对光谱波长最佳联合子区间的优选; 然后, 对优选联合子区间使用LASSO算法进行特征波长选择, 在此基础上建立PLS校正模型。 同时, 将siPLS-LASSO方法与其他传统特征波长选择方法进行了对比。 结果表明: 建立在siPLS-LASSO方法优选33个特征波长基础上的PLS模型预测结果更好, 其预测方差(RMSEP)和相关系数(Rp)分别为0071 1和0980 8; 所提siPLS-LASSO方法有效选取了特征波长, 提高了模型预测性能。
近红外光谱 波长优选 固态发酵过程 NIR spectroscopy Wavelength selection LASSO LASSO siPLS siPLS Solid state fermentation process 
光谱学与光谱分析
2018, 38(2): 436
作者单位
摘要
1 燕山大学信息科学与工程学院, 河北省特种光纤与光纤传感重点实验室, 河北 秦皇岛 066004
2 内蒙古民族大学物理与电子信息学院, 内蒙古 通辽 028000
采用紫外可见(ultraviolet/visible, UV-Vis)光谱技术和近红外(near-infrared, NIR)光谱技术及信息融合技术对乙醇汽油中乙醇含量进行了检测。 首先采用组合区间偏最小二乘(synergy interval PLS, SiPLS)算法作为特征提取方法, 分别建立了基于UV-Vis和NIR光谱的偏最小二乘(PLS)回归模型; 再根据油品的实际情况, 运用信息融合理论将UV-Vis和NIR光谱信息进行融合, 建立了数据级融合(low level data fusion, LLDF)和特征级融合(mid-level data fusion, MLDF)模型, 并与单谱源模型效果进行了比较, 确定了最优模型为数据级融合后再进行矢量归一化的模型(LLDF-VN1); 最后分别用高乙醇含量样品和市售汽油样品的光谱数据对该最优模型进行了通用性检验。 结果表明: UV-Vis和NIR光谱数据单独建模均能很好的检测并提供较好的预测结果; 而UV-Vis和NIR光谱数据直接融合在基于校正集的回归模型中效果最好, 其校正集相关系数rc=0999 9, 校正集交叉验证均方差RMSECV=0125 8, 校正集整体评价偏差Biasc=0000 6; 而采用数据级融合后再进行矢量归一化的模型(LLDF-VN1)的预测效果为最佳, 其rp=0999 1, RMSEP=0352 7, Biasp=-0073 8; 自配溶液对最优模型(LLDF-VN1)的通用性验证中, rp=0999 7, RMSEP=0329 1, Biasp=0102 2; 市售汽油对最优模型(LLDF-VN1)的通用性验证中, rp=0990 1, RMSEP=0892 7, Biasp=0675 1。 实验结果说明通过将UV-Vis和NIR光谱信息进行数据级融合可以快速、 准确的检测出乙醇汽油中乙醇的含量, 并能实现乙醇浓度的宽范围检测, 为进一步实现混合油品中物质的快速检测奠定了基础。
紫外可见光谱 近红外光谱 乙醇汽油 信息融合 UV-Vis spectroscopy NIR spectroscopy SiPLS SiPLS Ethanol-gasoline Information fusion 
光谱学与光谱分析
2017, 37(2): 429
李卫华 1,2,*徐玲 1,2杨英 1,2严国兵 1,2[ ... ]帅磊 1
作者单位
摘要
1 安徽建筑大学环境与能源工程学院, 安徽 合肥 230601
2 安徽建筑大学水污染控制与废水资源化安徽省重点实验室,安徽 合肥 230601
为了快速、准确地测定强化生物除磷(EBPR) 过程中污泥胞内糖原的含量,采用 4种预处理方法分别对污泥近红外光谱进行预处理,并结合联合区间偏最小二乘(siPLS) 进行变量优选,建立光谱吸光度数据与糖原含量的定量分析模型。结果表明,将一阶 S-G(Savitzky-Golay) 平滑处理后的光谱等分为 20个子区间,联合子区间[10 13 16 19]建立的 siPLS模型预测效果最优,预测集的均方根误差(RMSEP) 和相关系数(rp) 分别达到 0.0048、0.9105,且该模型的交互验证和外部验证相对分析误差(RPD) 均大于 3.0。一阶平滑处理后的光谱 siPLS模型预测精度高、建模变量少,可实现糖原含量的快速测定。
强化生物除磷 糖原 近红外光谱 Savitzky-Golay平滑法 联合区间偏最小二乘 enhanced biological phosphorus removal(EBPR) glycogen near infrared spectroscopy (NIR) Savitzky-Golay smoothing(S-G) interval partial least squares (siPLS) 
红外技术
2016, 38(12): 1053
作者单位
摘要
1 石河子大学机械电气工程学院, 新疆 石河子 832003
2 石河子大学食品学院, 新疆 石河子 832003
波段筛选方法的选取以及随后的光谱特征波段的提取对高光谱模型效果的影响较大。 为了快速准确检测羊肉的pH值, 开展并讨论了利用两种特征波段筛选方法对羊肉pH值高光谱模型的影响研究。 本研究采用二阶导数(2D)、 多元散射校正(MSC)和中心化处理(mean-centering)相结合的方法对所提取纯肌肉部分的代表性光谱进行预处理, 利用联合区间偏最小二乘(siPLS)和联合区间偏最小二乘结合遗传算法(siPLS-GA)对全波段473~1000 nm范围光谱进行特征波段的提取, 并分别建立相对应特征波段范围羊肉pH的PLS预测模型, 同时与全波段的PLS模型效果相比较。 结果表明采用siPLS-GA提取的特征波长建立的PLS模型效果最优, 其选取的特征波长点数为56, 校正集相关系数(Rcal)和均方根误差(RMSEC)分别为0.96和0.043, 预测集相关系数(RP)和均方根误差(RMSEP)分别为0.96和0.048。 siPLS-GA方法既能够减少建模使用的光谱变量, 又可以提高模型精度, 因此利用高光谱图像技术结合siPLS-GA可以实现羊肉pH的特征波段筛选和快速准确检测。
高光谱图像 羊肉pH 特征波段 联合区间偏最小二乘(siPLS) 遗传算法(GA) Hyperspectral imaging(HSI) Lamb pH Characteristic bands Synergy interval partial least square(siPLS) Genetic algorithm(GA) 
光谱学与光谱分析
2016, 36(9): 2925
作者单位
摘要
江苏大学电气信息工程学院, 江苏 镇江 212013
目前市面上销售的橄榄油主要分为特级初榨橄榄油和普通初榨橄榄油两类, 为了鉴别两种不同品质的橄榄油, 提出了一种应用siPLS-IRIV-PCA算法的橄榄油品质鉴别的新方法。 基于橄榄油的近红外光谱数据, 应用联合区间偏最小二乘法(siPLS)对橄榄油的近红外光谱进行了波长区间优选, 使用交叉验证均方根误差(RMSECV)评估模型的性能并选择最优波长区间, 通过迭代保留信息变量(IRIV)算法从最优波长区间中选择特征波长, 根据选择的特征波长构建主成分分析(PCA)模型。 对90组特级初榨橄榄油和90组普通橄榄油样本进行了判别鉴定。 PCA将1 427个波长变量作为输入变量, 前两个主成分贡献率为51.891 8%和26.473 2%; siPLS-PCA将408个波长变量作为输入变量, 前两个主成分贡献率为56.039 1%和36.235 5%; siPLS-IRIV-PCA将6个波长变量作为输入变量, 前两个主成分贡献率为66.347 6%和32.304 3%。 结果表明, 与PCA和siPLS-PCA鉴别方法相比, siPLS-IRIV-PCA具有最佳的鉴别性能。
近红外光谱 橄榄油 联合区间偏最小二乘法 迭代保留信息变量 主成分分析 Near infrared spectroscopy Olive oil siPLS IRIV PCA 
光谱学与光谱分析
2016, 36(9): 2798
作者单位
摘要
北京工商大学 计算机与信息工程学院 食品安全大数据技术北京市重点实验室, 北京 100048
小麦蛋白质含量的性状遗传力较高, 通过选择蛋白质含量高的籽粒母本可以达到优质育种的预期效果。研究采用高光谱成像技术结合化学计量学方法建立多籽粒小麦粗蛋白平均模型来实现单籽粒小麦粗蛋白含量的快速预测。实验采集47份小麦样本(每份100粒)的高光谱图像并提取平均光谱信息, 通过联合区间偏最小二乘法筛选特征变量优化建立多籽粒小麦粗蛋白平均模型。模型的相关系数为0.94, 预测均方根误差为0.28%, 相对分析误差为3.30。通过图像处理提取出待测单籽粒小麦的高光谱图像, 应用平均模型预测单籽粒小麦在每个空间像素点的粗蛋白, 取其平均值作为该粒麦种的最终粗蛋白含量。经验证, 应用上述模型预测同一组样本的单籽粒小麦时, 不同籽粒的小麦粗蛋白含量确实存在差异, 但蛋白含量均围绕其所在样本的平均值浮动, 因此反映出采用平均模型预测单籽粒小麦蛋白的准确性和基本可行性。该方法的研究可以为小麦育种过程中高蛋白籽粒麦种的优选提供一种新思路, 推动小麦优质育种的发展。
高光谱图像 联合区间偏最小二乘法 单籽粒小麦 粗蛋白 育种 hyperspectral image SiPLS single wheat seed protein breeding 
红外与激光工程
2016, 45(s1): S123002
作者单位
摘要
1 江苏大学食品与生物工程学院, 江苏 镇江212013
2 江西农业大学工学院, 江西 南昌330045
茶汤滋味是茶叶品质的核心, 该研究利用近红外光谱技术快速检测绿茶滋味品质。 试验以滋味化学鉴定法作为绿茶滋味品质检测的标准方法, 试验得到的滋味总得分值作为近红外光谱预测模型的参考测量值。 在模型建立过程中, 首先利用联合区间偏最小二乘法(siPLS)筛选特征子区间; 然后, 用遗传算法(GA)在特征子区间内优选特征变量。 最优模型在优选出38个特征变量, 主成分因子数为6时获得, 模型预测集相关系数(Rp)为0.890 8, 预测均方根误差(RMSEP)为4.66。 研究结果表明, 利用近红外光谱技术结合siPLS-GA算法检测绿茶滋味品质是可行的, 同时表明siPLS-GA算法相对于其他方法在本研究中的应用具有一定的优越性。
近红外光谱 联合区间偏最小二乘法 遗传算法 绿茶 滋味品质 Near infrared (NIR) spectroscopy Synergy interval PLS (siPLS) Genetic algorithm (GA) Green tea Taste quality 
光谱学与光谱分析
2011, 31(7): 1782

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!