作者单位
摘要
1 温州商学院信息工程学院, 浙江 温州 325035
2 温州职业技术学院人工智能学院, 浙江 温州 325035
3 西安交通大学数学与统计学院, 陕西 西安 710049
为提高利用红外光谱数据鉴别中药材产地的预测模型效果, 应该选用合适的数据预处理方法和合适的算法。 针对具有3 448个特征(波长551~3 998 nm)的658条红外光谱中药材数据, 借助于支持向量机(SVM)算法, 研究了10种基于样本预处理方法(不做预处理、 最大最小归一化、 标准化、 中心化、 移动平均平滑、 SG平滑滤波、 多元散射校正、 正则化、 一阶导数和二阶导数法)与5种基于特征波长预处理方法(不做预处理、 中心化、 最大最小归一化、 标准化和正则化)的组合(共50种)对产地模型预测精度和稳定性的影响。 结果表明: 合适的数据预处理对提高模型精度是必要的; 标准化和最大最小正则化方法光谱的预处理建模效果较好, 其预测系数值约85%; 基于特征的预处理对模型预测效果改进小。 只做光谱预处理或基于特征预处理的预测稳定性值近似相等(两类方式的决定系数平均值都近64%); 基于样本+特征的组合预处理方法中, 二阶导数+标准化处理和二阶导数+正则化组合处理方法的模型预测效果好, 其决定系数R2达到近94%; 而中心化+正则化组合处理达不到直接采用原始数据(不做数据预处理)的建模效果, 该方法预测效果最差。 该研究的方法和结论为具有高维光谱特征的药材产地鉴别和选取有效的预处理方法提供了参考, 对进一步分析药材药效和化学成份有重要的意义, 也可供其他光谱数据分析借鉴。 也为高维小样本数据建模的前期数据处理提供了思路。
中药材产地鉴别 光谱数据 数据预处理 小样本高维特征数据 SVM算法 Origin identification of Chinese medicinal materia Infrared spectroscopic data Data preprocessing High dimensional small sample SVM algorithm 
光谱学与光谱分析
2023, 43(7): 2238
作者单位
摘要
1 食品科学与技术国家重点实验室, 中国-加拿大食品科学与技术联合实验室(南昌), 江西省生物活性多糖重点实验室, 南昌大学, 江西 南昌 330047
2 Guelph Research and Development Centre, Agriculture and Agri-Food Canada, Guelph N1G 5C9, Canada
近红外光谱检测技术可反映样品内部含氢化学键伸缩振动与合频吸收信息, 具有分析速度快、 经济、 重现性好以及环境友好等优点, 常用于食品、 药品及材料领域的检测分析之中。 豌豆是世界上最重要的栽培作物之一, 种植、 分布广泛, 具有高淀粉、 高蛋白、 低脂质等营养特性, 长久以来受到消费者的喜爱。 为了明确不同产地豌豆的近红外光谱建模差异, 对不同产地豌豆进行建模分析。 研究采集了河南省南阳市不同地区42份豌豆样本, 首先测定了豌豆的营养成分(总淀粉、 蛋白质、 水分、 灰分及脂质), 再重点采用近红外光谱中的积分球漫反射技术, 在12 000~4 000 cm-1波段对不同豌豆样品进行光谱采集, 通过判别分析模型(DA)结合不同的预处理方法得到最优预处理数据, 结合主成分分析(PCA)、 偏最小二乘判别分析(PLS-DA)以及正交偏最小二乘判别分析(OPLS-DA)等方法, 对光谱特征差异进行分类分析, 从而构建并验证南阳豌豆的产地识别模型。 结果表明, 不同区域南阳豌豆的营养组分及含量总体差异较小(总淀粉36.30%~46.93%, 蛋白质16.37%~25.50%, 水分6.78%~9.16%, 灰分2.29%~3.38%, 脂质0.37%~1.43%); 基于近红外光谱建立的判别模型表明, DA模型判别分析准确率可达92.4%, 并且PCA、 PLS-DA以及OPLS-DA得到的模型预测能力分别为96.7%, 85.1%和83.6%, 表明以上模型均可实现南阳豌豆鉴别模型的建立。 此外, 通过变量重要性投影值法提取(VIP>1.0)筛选出的不同产地差异波段显示, 4 710~4 000, 5 320~5 200以及7 200~6 220 cm-1可作为南阳豌豆产地鉴别的特异性检测波段。 该研究可为构建不同区域豌豆产地鉴别、 追溯信息库提供方法学依据。
豌豆 产地鉴别 营养成分 近红外光谱技术 判别模型 Pea Origin identification Nutritional components Near-infrared spectroscopy technology Discriminant model 
光谱学与光谱分析
2023, 43(4): 1095
作者单位
摘要
兰州大学信息科学与工程学院, 甘肃 兰州 730000
百合鳞茎, 百合科百合属多年生草本球根植物生长的肥厚鳞片构成的地下变态茎, 是一种典型的药食同源作物, 含有丰富营养成分的同时还具有抗肿瘤、 抗抑郁、 降血糖、 提高免疫力等保健作用。 不同产地百合鳞茎的市场价格差异较大, 依赖于人工经验感官的传统评测方法主观性强、 确定性差, 难以广泛推广在现代生产环节。 以化学检验法为主的先进检测方法耗时长、 费用高, 而且难以满足产地鉴别这一要求。 针对百合鳞茎现场快速地产地判断和品质评价的需求, 提出了一种使用拉曼光谱和机器学习的百合鳞茎检测方法。 拉曼光谱是一种基于非弹性散射的振动光谱, 能够做到快速准确的无损检测, 将拉曼光谱与机器学习算法相结合, 建立了我国分布最为广泛的三种百合鳞茎(兰州百合、 宜兴百合和龙牙百合)的产地分类模型, 着眼于基质光谱上479, 870, 942和1 606 cm-1等特征峰, 提出了一种基于拉曼光谱的成分含量判断产地和评价百合鳞茎品质的无损检测方法。 首先采集百合鳞茎样本的光谱, 经过光谱数据预处理后, 使用人工先验法提取百合鳞茎代表物质并确定特征峰, 再使用主成分分析和t-分布随机邻域嵌入方法降维提取光谱数据特征。 并将获得的数据特征分别应用于支持向量机、 决策树和随机森林算法。 实验结果显示, 这些分类模型在同一个测试集上均表现出较为理想的分类准确率, 其中基于主成分分析和决策树算法的模型准确率可达91.7%, 基于t-分布随机邻域嵌入和支持向量机的模型分类准确率为93.7%, 基于主成分分析和随机森林算法的组合模型, 准确率高达95.8%。 综上, 该方法可以实现现场快速识别和鉴定百合鳞茎的产地, 提高现代生产过程中质量评估环节的准确性, 为现代化生产的产地鉴别和百合鳞茎质量分析提供参考。
百合鳞茎 拉曼光谱 成分分析 特征提取 产地鉴别 Lily bulb Raman spectroscopy Component analysis Feature extraction Origin identification 
光谱学与光谱分析
2023, 43(1): 183
作者单位
摘要
1 浙江大学药学院, 浙江 杭州 310030
2 浙江大学智能创新药物研究院, 浙江 杭州 310018
烟草是一种成分复杂的天然植物, 地理位置、 生长条件等外界因素直接影响着烟叶的品质; 我国烟叶种植范围十分广泛, 每个产区种植的烟叶都有其独特的风格特征, 不同产区的烟叶配比对卷烟的质量起着决定性的作用。 为实现烟叶产地准确、 快速判别, 基于近红外光谱(NIRS), 采用灰狼算法(GWO)优化的支持向量机(SVM)算法实现烟叶产地鉴别分类。 以8个产地的824个烟叶样本为研究对象, 基于x-y距离样本集划分(SPXY)方法得到校正集617个和验证集207个样品。 首先应用最佳波长筛选方法, 如竞争自适应加权采样(CARS)和随机青蛙(RF)算法减少光谱冗余信息, 最终从1 609个变量中分别获得141和534个与产地相关的重要变量, 并以此输入SVM作为建模数据, 接下来在相同搜索范围内比较了粒子群优化算法(PSO)、 遗传算法(GA)和GWO对SVM分类模型的优化效果。 结果表明, 经RF筛选后的光谱变量较CARS具有更好的产地建模性能, 其中RF-GWO-SVM对8个产地烟叶的整体判别正确率达到了96.62%, 相较于RF-PSO-SVM和RF-GA-SVM正确率更高。 同时, RF-GWO-SVM的运行时间分别比RF-PSO-SVM和RF-GA-SVM的运行时间缩短156和131 min, RF-GWO-SVM具有精度更高、 寻优速度更快等优点。 GWO对于SVM模型参数具有更高效的优化能力, 可用于烟叶产地快速鉴别模型的建立。
近红外光谱技术 灰狼算法 支持向量机 烟叶 产地鉴别 Near-infrared spectroscopy Grey wolf optimizer Support vector machine Tobacco Origin identification 
光谱学与光谱分析
2022, 42(9): 2830
作者单位
摘要
1 成都市药品检验研究院, 四川 成都 610045
3 成都中医药大学, 四川 成都 611137
产地是影响中药材质量的重要因素, 产地差异导致中药材质量参差不齐, 为维护市场秩序, 有必要建立中药材产地鉴别方法, 以便更加精准地判别和分析中药材品质。 以多产地临床大宗药材丹参为研究对象, 收集不同产地丹参样品150份, 采用显微聚焦拉曼光谱技术在无损条件下对每份丹参样品的每根药材表面随机扫描1~n次, 求每份样品扫描1~n次的平均光谱。 分析原始光谱数据发现丹参表面光谱信号同时包含了丹参酮类成分的拉曼光谱和杂质的荧光光谱, 主要表现在特定波长范围内不同产地丹参存在各自的聚集区和丹参表面光谱信号强度明显弱于或强于丹参酮类对照品的拉曼光谱信号强度。 对扫描1~n次的平均光谱数据进行预处理后运用偏最小二乘判别分析(PLS-DA)和随机森林分类算法[不筛选(RF)或筛选重要变量(RF-VS)]建立扫描1~n次的丹参产地分类模型。 结果随机扫描1次所得最优模型训练集和测试集预测准确率分别为88%和87%, 且对质量差和质量优的丹参样品区分准确率高达97%; 随机扫描2次和3次所得最优模型训练集和测试集预测准确率均分别为89%和87%, 结合模型运行效率和成本, 选择随机扫描1次所得光谱, 经一阶导数(1ST-D)预处理和RF-VS计算所得模型为丹参最终产地鉴别模型。 综上, 在无损伤条件下显微聚焦拉曼光谱技术能建立快速、 准确的丹参产地鉴别预测模型, 为该技术进一步用于贵细中药材的产地和真伪鉴别提供参考。
拉曼光谱 丹参 产地鉴别 Raman spectroscopy Danshen Identification of the origin 
光谱学与光谱分析
2022, 42(6): 1774
作者单位
摘要
中国地质大学(武汉)珠宝学院, 湖北 武汉 430074
甘肃马衔山和田玉具有重要的宝玉石价值和考古文化价值, 其中产地区分为甘肃马衔山和田玉的研究重点。 通过测试分析马衔山和田玉的化学成分, 对比其与国内主要产地和田玉的化学成分差异, 建立微量元素产地判别模型, 对甘肃马衔山和田玉的产地鉴别进行探究, 为甘肃齐家文化中古玉器溯源提供数据支撑。 以电子探针分析甘肃马衔山和田玉的主量元素, 结果表明其主要成分为透闪石。 采用激光剥蚀电感耦合等离子体质谱仪分析其微量元素和稀土元素, 对比新疆、 青海、 辽宁、 江苏、 贵州、 甘肃马衔山和田玉微量元素蛛网图、 稀土元素参数和稀土元素配分图, 结果表明不同产地和田玉存在差异, 可进行产地区分; 三维散点图δCe-ΣREE-LREE/HREE投图可将青海、 辽宁、 江苏、 贵州和田玉进行产地区分, 但不能区分新疆和甘肃马衔山和田玉; 运用SPSS软件对新疆、 青海、 辽宁、 江苏、 贵州、 甘肃马衔山和田玉的微量元素建立产地线性判别模型, 对于已知六个产地: 新疆、 青海、 辽宁、 江苏、 贵州、 甘肃马衔山的数据, 判别分析正确率可达100.0%, 交叉验证正确率为90.3%, 预留10组马衔山和田玉数据, 回代验证正确率为100%。 微量元素产地线性判别模型在和田玉产地判别中获得很好的效果。
和田玉 马衔山 化学成分 产地鉴别 线性判别分析 Hetian Yu Maxianshan Chemical composition Origin identification Linear discriminant analysis 
光谱学与光谱分析
2022, 42(5): 1451
作者单位
摘要
1 合肥工业大学食品与生物工程学院, 安徽 合肥 230601
2 安徽大学电气工程与自动化学院, 安徽 合肥 230601
4 江苏大学电气信息工程学院, 江苏 镇江 212013
太平猴魁茶因其特有的“喉韵”深受广大消费者喜爱, 不同产地太平猴魁茶市场价格相差较大, 如何实现产地精准鉴别是目前促进绿茶产业发展的关键因素。 依赖于人工经验的感官评审方法主观性强、 稳定性差, 无法应用于实际生产检测过程。 作为目前主要的检测分析方法, 化学分析方法周期长、 检测成本高, 而且目前没有用于茶叶产地鉴别的统一标准。 近红外光谱(NIR)作为一种无损检测分析方法, 具有快速、 非破坏性、 无污染等特点, 但是不同产地太平猴魁茶主要内含成分及其含量基本相同, 不同产地样本光谱特征峰分布相似, 导致常规分析方法无法有效选择特征变量。 卷积神经网络(CNN)作为经典深度学习网络模型之一, 具有强特征提取和模型表达能力。 采用太平猴魁茶产地光谱特征分析, 利用一维卷积神经网络模型(1-D CNN)提取太平猴魁茶NIR特征, 提出一种基于1-D CNN和NIR的太平猴魁茶产地鉴别分析方法。 试验以6个不同产地共120个样本为研究对象, 分析10 000~4 000 cm-1范围内的光谱信息; 将样本随机划分为训练集(84, 占70%)和测试集(36, 占30%), 分别讨论不同间隔采样、 网络结构、 卷积核大小及激活函数对产地鉴别结果的影响, 并引入Dropout方法对比分析模型过拟合现象; 最终建立一个具有9层结构的1-D CNN模型。 蒙特卡罗试验结果表明, 相比于基于原始光谱数据(40.57%, 7.06)和PCA方法(31.93%, 6.96)的太平猴魁茶产地预测模型准确率和标准差, 基于1-D CNN的太平猴魁茶产地鉴别模型预测精度和稳定性更高, 其测试集预测准确率平均值和标准差分别为97.73%和3.47。 因此, 1-D CNN可有效提取太平猴魁茶不同产地NIR特征, 提高太平猴魁茶产地鉴别精度, 为太平猴魁茶精准产地鉴别及溯源分析提供参考。
产地鉴别 卷积神经网络 近红外光谱 特征提取 太平猴魁茶 Geographical origin discrimination Convolutional neural network Near-infrared spectroscopy Feature selection Taiping Houkui tea 
光谱学与光谱分析
2021, 41(9): 2776
作者单位
摘要
1 云南省农业科学院药用植物研究所, 云南 昆明 650200
2 云南中医药大学中药学院, 云南 昆明 650500
黄精药材品质优劣与基原植物产地环境因子密切相关, 建立简单、 快速且能够准确鉴别药材产地的方法对保证其质量可控及用药安全具有重要的理论意义和应用前景。 研究中以云南、 四川和广西9个产地的133份滇黄精Polygonatum kingianum coll. et Hemsl根茎为试验材料, 采集衰减全反射-傅里叶变换红外光谱(ATR-FTIR)和紫外-可见光光谱(UV-Vis)数据预处理后分别建立单一光谱随机森林(Random forest, RF)模型; 将ATR-FTIR与UV-Vis数据直接串联完成低级融合, 提取两种光谱的主成分数(PCs)和潜在变量(LVs)以实现中级(中级融合PCs和中级融合LVs)和高级数据融合(高级融合PCs和高级融合LVs), 基于不同数据融合策略分别建立RF模型; 比较不同模型的正确率(ACC)、 灵敏度(SEN)和特异性(SPE), 筛选产地鉴别最佳模型。 结果显示, 不同产地滇黄精ATR-FTIR和UV-Vis峰型相似, 吸光度略有差异, ATR-FTIR显示14个共有峰, 与糖类、 甾体皂苷、 黄酮类和生物碱类物质有关, 其UV-Vis共有峰主要位于272及327 nm处, 与黄酮类物质有关; ATR-FTIR、 UV-Vis和低级融合的RF模型, 训练集和预测集ACC分别为(76.34%, 95.00%), (80.65%, 95.00%)和(83.87%, 100.00%), 但SEN和SPE值较低, 故不宜采用; 中级融合PCs和中级融合LVs的RF模型的SEN和SPE分别为大于0.91和0.98, 训练集ACC分别为91.40%和97.85%, 预测集ACC均为97.50%; 高级融合PCs和高级融合LVs的RF训练集ACC分别为77.42%和97.85%, 预测集ACC均为95.00%, 高级融合PCs的RF模型鉴别效果较差, 高级融合LVs的RF模型存在过拟合现象; 模型鉴别能力为中级融合LVs>中级融合PCs>低级融合> UV-Vis>ATR-FTIR>高级融合PCs; 提取LVs对产地鉴别的方法优于PCs; 中级融合LVs建立的RF模型鉴别ACC最高, SEN和SPE大于0.98, 模型性能最佳。 该方法可为黄精药用资源的科学评价提供理论依据和技术支撑。
滇黄精 产地鉴别 数据融合 数据衰减全反射-傅里叶变换红外光谱 紫外-可见吸收光谱(UV-Vis) Polygonatum kingianum Origin identification Data fusion ATR-FTIR UV-Vis 
光谱学与光谱分析
2021, 41(5): 1410
卢诗扬 1,2,*张雷蕾 1,2潘家荣 1,2杨德红 1,2[ ... ]朱诚 1,2
作者单位
摘要
1 中国计量大学生命科学学院, 浙江 杭州 310018
2 浙江省海洋食品品质及危害物控制技术重点实验室, 浙江 杭州 310018
现在樱桃市场上存在着大量以次充好的不良现象, 严重损害了名牌樱桃的品牌经济效益, 所以亟需一种能对不同产地樱桃实现快速无损鉴别的技术。 拉曼光谱溯源技术作为光谱溯源技术的一种, 由于具有快速、 高效、 无污染、 无损分析等优点, 逐渐得到相关研究者的重视。 长短期记忆(LSTM)网络是一种具有记忆性的反馈神经网络, 它是循环神经网络的一种变体。 LSTM网络克服了循环神经网络中梯度消失的缺点, 适合处理序列敏感的问题和任务, 目前被广泛应用在语音识别、 图像识别和手写识别等领域, 但LSTM网络在产地溯源方面的应用还有待研究。 基于此, 提出了一种LSTM网络与拉曼光谱技术结合的能对不同产地樱桃实现快速无损鉴别的技术。 将来自美国、 山东和四川的369个樱桃作为研究样本, 用拉曼光谱仪在785 nm激光下获得了不同产地樱桃的光谱数据。 并且以每条经过基线校正后的拉曼光谱数据作为网络输入数据, 基于LSTM网络构建了能对不同产地樱桃实现快速鉴别的判别模型, 并且以样本判别准确率A、 样本精确率P、 样本召回率R和样本F值作为评价指标, 探究了不同预处理方法对LSTM网络判别模型性能的影响。 结果表明: 当样本训练集和测试集的比例为85∶38时, 直接采用原始拉曼光谱数据的LSTM网络模型的产地鉴别能力不高, 鉴别准确率为79.87%。 但当使用预处理过后的拉曼光谱数据, 模型的鉴别准确率维持在92%以上。 并且光谱经过SG+MSC预处理后模型的鉴别准确度最好, 鉴别准确率达99.12%。 同时在采用SG+MSC预处理的方法下, LSTM网络鉴别模型的精确率、 召回率、 F值均较高, 表明了所提出的LSTM网络模型有较好的性能可实现对不同产地樱桃的鉴别, 为樱桃的产地溯源提供了一种新的思路。
长短期记忆网络 拉曼光谱 产地鉴别 樱桃 Long short-term memory network Raman spectroscopy Origin identification Cherry 
光谱学与光谱分析
2021, 41(4): 1177
作者单位
摘要
我国是全球最大的牛肝菌出口国, 云南则是国内牛肝菌最大产区。 美味牛肝菌香郁爽滑、 营养丰富, 备受消费者青睐, 但因不同的地理气候和环境差异, 导致品质参差不齐。 开展云南省不同产区美味牛肝菌产地鉴别, 有利于提高商品质量控制。 本研究采集云南省13个产地美味牛肝菌样品124份, 使用傅里叶变换中红外光谱(FTIR-MIR)、 傅里叶变换近红外光谱(FTIR-NIR)、 紫外可见光谱(UV-Vis)和电感耦合等离子体原子发射光谱法测定光谱信息与不同部位矿质元素含量并进行分析, 对原始光谱进行平滑(Savitzky-Golay, SG)、 二阶导数(SD)、 标准正态变换(SNV)等预处理, 数据使用Kennard-Stone分类法分为训练集与预测集, 通过偏最小二乘辨别分析(PLS-DA)和支持向量机(SVM)建立分类模型后进行对比分析, 寻找最佳的产地鉴别方法。 结果显示: (1)元素测定方法中茶叶标准物质回收率在91.00%~106.00%之间, 方法准确可靠; (2)美味牛肝菌富含元素K, P, Mg, Na和Ca且不同部位相同产地, 不同产地相同部位元素之间存在差异性, 可能与美味牛肝菌不同部位的富集能力和不同产地地理环境差异相关; (3)中级融合通过主成分分析(PCA)提取重要信息, 其中FTIR-MIR和UV-Vis光谱数据的累计贡献率达到83.50%和66.70%, 代表重要信息变量; (4)在PLS-DA与SVM模型中, 数据融合后的产地鉴别效果基本高于单一数据鉴别, 说明数据融合策略在美味牛肝产地鉴别中效果显著; (5)采用Hottelling T2检测法对数据融合进行异常值检验, 结果表明模型未超过置信区间, 具有准确性与可信性; (6)PLS-DA模型的初级融合和中级融合结果都高于SVM, 说明PLS-DA模型中级融合可以作为产地鉴别的最佳方法。 多种光谱结合不同部位矿质元素可准确鉴别不同产地美味牛肝菌, 为云南美味牛肝菌地域品质差异评价提供有效的分析方法。
美味牛肝菌 多种光谱分析 矿质元素 产地鉴别 Boletus eduils Multi-spectral analysis Mineral Identification of producing areas 
光谱学与光谱分析
2020, 40(12): 3839

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!