作者单位
摘要
1 辽宁工程技术大学 软件学院,辽宁 葫芦岛 125105
2 湖州师范学院 信息工程学院,浙江 湖州 313000
为充分利用高光谱影像中蕴含的空谱特征,提出了一种半监督空谱局部判别分析的高光谱影像特征提取算法(S4LFDA)。鉴于高光谱数据集具有空间一致性,首先将像元进行空间重构,保存高光谱数据的近邻关系;其次引入光谱信息散度重构像元间的相似度;为了充分利用大量无标签样本提高算法性能,采用模糊C均值聚类算法对样本进行聚类分析得到伪标签;然后通过增加规范化项到局部力导引算法(FDA)的类内散度矩阵和类间散度矩阵中,以此保持无标签样本的聚类结构一致性;最后通过局部FDA算法来保持有标签样本类间散度最大化和类内散度最小化并求解最佳投影向量。S4LFDA算法既保持了数据集在光谱域的可分性,又保持了像元在空间区域内的近邻关系,合理利用有标签样本及无标签样本,提高了算法的分类性能。在Pavia University和Indian Pines数据集上进行实验,总体分类精度达到95.60%和94.38%。与其他维数约简算法相比,该算法有效提高了地物分类性能。
高光谱影像 半监督 空谱 判别分析 特征提取 地物分类 hyperspectral image semi-supervision spatial spectrum discriminant analysis feature extraction feature classification 
液晶与显示
2024, 39(2): 131
作者单位
摘要
南京邮电大学通信与信息工程学院信号处理与传输研究院,江苏 南京 210003
针对未知物体的分类问题,提出了一种基于支持向量机和关联成像的分类方法。该方法利用线性判别分析法提取出物体的特征向量,并根据该特征向量设计出应用于关联成像系统的特征散斑,将特征散斑照射物体获得桶探测器值,支持向量机可以依据桶探测器值进行判别从而获得物体的类别。该方法的可行性在MNIST数据集上得到了验证,结果表明,该方法在10个分类任务中均可取得较高的分类准确率,平均分类准确率达90.5%。与其他分类方法的对比结果表明,所提方法在准确率上更具优势。
关联成像 线性判别分析 机器学习 支持向量机 
激光与光电子学进展
2024, 61(10): 1011008
作者单位
摘要
1 河南中医药大学药学院, 河南 郑州 450046 河南省中药质量控制与评价工程技术中心, 河南 郑州 450046漯河医学高等专科学校, 河南 漯河 462002
2 河南中医药大学药学院, 河南 郑州 450046 河南省中药质量控制与评价工程技术中心, 河南 郑州 450046
3 河南中医药大学第三附属医院, 河南 郑州 430003河南省中药质量控制与评价工程技术中心, 河南 郑州 450046
4 贾 豪
5 河南中医药大学药学院, 河南 郑州 450046
经典名方一贯煎由生地黄、 北沙参、 麦冬、 当归、 枸杞子、 川楝子6味药组成, 具有滋养肝肾、 疏肝理气之效。 红外光谱技术具有快速无损的优点, 可完整的将不同批次一贯煎基准样品的信息表达。 运用傅里叶变换红外光谱仪采集样品的红外光谱, 对原始光谱进行预处理, 得到相对峰高, 对共有峰进行归属, 采用聚类分析(HCA)、 主成分分析(PCA)及正交偏最小二乘法-判别分析(OPLS-DA)对图谱数据进行评价。 结果表明15批一贯煎基准样品中868、 822和779 cm-1波段为糖骨架伸缩振动吸收峰, 多为枸杞所贡献, 815 cm-1波段处少数为麦冬所贡献; 生地黄单煎液在1 148 cm-1波段处、 沙参单煎液在1 158、 1 082和1 019 cm-1波段处、 当归单煎液在993 cm-1波段处均有对糖苷类成分的贡献; 川楝子单煎液1 746 cm-1波段处可溶性脂类糖苷成分吸收峰明显, 一贯煎复方中此处吸收峰并不明显, 可能为川楝子与其他五味药配伍煎煮过程中化学成分发生变化。 HCA结果显示, 当组间距离=10时, S1、 S2、 S15聚为一类, S9、 S11、 S12、 S13、 S14聚为一类, S3、 S4、 S5、 S6、 S7、 S8、 S10聚为一类, 表明不同批次一贯煎汤剂内部质量存在一定差异。 PCA分类结果与聚类分析结果基本一致, 并计算不同批次的主成分综合得分, 其中批次3一贯煎汤剂质量最佳, 批次1质量最次, 由载荷散点图分析得到1 104、 1 142、 1 412、 1 260和868 cm-1波段峰对主成分1的贡献率较大; 777、 2936、 923、 1 721、 818和637 cm-1波段峰对主成分2的贡献较大。 OPLS-DA结果与HCA和PCA结果一致, 以VIP>1为标准, 筛选出七个导致样品之间产生差异的波段, 分别为777、 637、 923、 2 936、 1 260、 1 412和1 630 cm-1, 该结果与PCA载荷图中寻找的重要性权重变量基本一致。 所建立的一贯煎红外指纹图谱方法简单、 准确度高, 可用于经典名方的快速鉴别分析, 为经典名方一贯煎的质量控制与评价提供参考。
经典名方 一贯煎 基准样品 指纹图谱 聚类分析 主成分分析 正交偏最小二乘法-判别分析 Classic prescription Yiguanjian Benchmark samples Fingerprint mapping Cluster analysis Principal component analysis Orthogonal partial least squares-discriminant anal 
光谱学与光谱分析
2023, 43(10): 3202
作者单位
摘要
1 金陵科技学院计算机工程学院, 江苏 南京 211169
2 浙江大学台州研究院, 浙江 台州 317700
3 滁州职业技术学院信息工程学院, 安徽 滁州 239000
不同品种茶叶因其所含的有机化学成分不同, 其效果也会有差别。 所以, 寻找出一种能准确迅速的鉴别茶叶品种的技术方法是非常重要的。 近红外光谱(NIR)分析是一种无损检测技术, 能很好的鉴别茶叶品种。 使用NIR光谱仪采集茶叶的NIR数据。 为了对包含噪声信号的茶叶近红外光谱进行准确鉴别, 提出了一种模糊线性判别QR分析的新方法, 可以对茶叶近红外光谱进行准确分类。 通过使用模糊线性判别分析(FLDA)将由主成分分析(PCA)压缩的茶叶近红外光谱数据进行降维, 由模糊线性判别分析得出的特征向量构建鉴别向量矩阵, 对鉴别向量矩阵进行矩阵的QR分解, 得到新的鉴别向量矩阵。 经过模糊线性判别QR分析后使用K近邻算法进行分类, 具有准确率高等优点。 以岳西翠兰、 六安瓜片、 施集毛峰和黄山毛峰四种茶叶为研究样本, 每类65个, 茶叶样本总数为260个。 采集茶叶近红外光谱数据的仪器为AntarisⅡ型傅里叶近红外光谱仪对光谱数据进行预处理, 采用多元散射校正, 由于采集到的茶叶光谱数据存在散射干扰。 以此得到的近红外光谱数据的维数为1557维, 通过主成分分析压缩数据集的维数, 使得光谱数据集的维数达到7维。 经压缩过后的光谱数据集中的鉴别信息再通过模糊线性判别QR分析进行提取, 使得光谱数据的维数降低到3维。 利用K近邻算法对茶叶样本进行分类, 实现对茶叶品种的准确分类。 最后进行三种算法分析结果的比较, 分别是主成分分析结合K近邻算法、 主成分分析和线性判别分析结合K近邻算法、 主成分分析和模糊线性判别QR分析结合K近邻算法。 在权重指数m=2, K=1条件下, 最后的分类准确率分别为83.89%, 87.78%和98.33%。 实验结果显示: 模糊线性判别QR分析可以实现茶叶近红外光谱的准确鉴别分析, 其展现出来的效果比主成分分析和线性判别分析表现的效果更好。
模糊线性判别分析 主成分分析 近红外光谱 K近邻算法 Fuzzy linear discriminant analysis Principal component analysis Near-infrared spectroscopy K-nearest neighbor algorithm 
光谱学与光谱分析
2023, 43(12): 3802
作者单位
摘要
1 西南林业大学生物多样性保护学院, 云南 昆明 650224
2 西南林业大学地理与生态旅游学院, 云南 昆明 650224
3 中国科学院哀牢山亚热带森林生态系统研究站, 云南 景东 676209
植物凋落物是联结生物有机体合成和分解的桥梁, 通过物质流、 能量流及信息流深刻地影响了陆地生态系统的结构、 功能及关键生态过程。 自然生态系统中地表凋落物通常以混合物的形式分解, 尤其是在物种极其丰富的亚热带常绿阔叶林中。 受样地内树种组成影响, 叶凋落物往往属、 种混杂, 非专业人士难以实现准确鉴别, 这为后续凋落物分解研究带来一定的困难。 近红外光谱分析技术作为一种快速无损的检测手段, 已经成功应用于牛肝菌、 柑橘、 水稻等的种类鉴别。 该技术为解决叶凋落物鉴定这一难题提供了新的途径。 该研究收集云南哀牢山典型中山湿性常绿阔叶林6种优势树种叶凋落物共计540份, 获取样品近红外漫反射光谱, 分析不同种类叶凋落物平均光谱图特征。 建模时, 使用Kennard-Stone算法将540个样品数据以2∶1比例分为训练集与验证集, 其中360个样品数据用于叶凋落物分类模型的建立, 180个样品数据用于叶凋落物分类模型的验证。 使用标准正态变量变换(SNV)、 Savitzky-Golay卷积平滑(SG)、 多元散射校正(MSC)、 导数处理(Derivative)等单一与组合算法对光谱数据进行预处理, 并采用主成分分析(PCA)与正交偏最小二乘判别分析(OPLS-DA)2种模式识别方法对不同树种叶凋落物进行鉴别。 结果表明: (1) 叶凋落物近红外光谱主成分分析得分图中各组数据呈现交织状态, 虽然经SNV+SG方法预处理后, 光谱数据得到优化, 变色锥与舟柄茶与其他树种出现一定的区分, 但仍然无法实现6种叶凋落物的准确鉴别。 (2) SNV+SD预处理方法结合OPLS-DA建立的模式识别模型, 效果最好, 因变量累计拟合指数为0.922, 模型累计预测能力指数为0.894, 置换检验显示模型未过度拟合, 训练集与验证集识别率均为100%。 研究表明, 在对样本近红外光谱进行预处理优化的基础上, 结合有监督的OPLS-DA模式识别方法, 可以实现不同树种叶凋落物的准确鉴别, 为后续植物凋落物研究提供了有力的技术支撑。
近红外光谱 叶凋落物 主成分分析 正交偏最小二乘判别分析 哀牢山 Near-infrared spectroscopy Leaf litters Principal component analysis Orthogonal partial least squares discriminant anal Mts. Ailaoshan 
光谱学与光谱分析
2023, 43(7): 2119
作者单位
摘要
南京林业大学材料科学与工程学院, 江苏 南京 210037
基于近红外光谱技术对木材产地进行识别必须依赖于光谱数据预处理方法和校准模型, 然而大多数采用近红外光谱技术识别木材产地的研究工作都是采用经典的线性模型。 构建木材地理溯源系统有利于促进木材市场的良性发展, 打击乱砍滥伐, 保护濒危树种。 为提高木材产地识别效率, 提出一种基于近红外光谱技术结合机器学习的木材产地识别方法。 首先建立木材产地的光谱数据集, 采集来自两种不同产地的樟子松、 泡桐、 榉木、 柚木、 椴木和臭椿的光谱数据, 每个树种构成一个数据集, 并将特征维度降至2维, 以探索各数据集的数据分布情况; 其次对原始光谱数据进行特征工程, 即分别采用主成分分析法和线性判别分析法对高维光谱数据进行降维处理, 以提高模型的泛化能力, 并对比两种降维技术对模型准确率的影响; 最后构建木材产地鉴别模型, 分别从非线性算法、 回归算法、 分类算法、 概率算法、 集成算法和深度学习算法六个角度选取了支持向量机、 逻辑回归、 K最近邻、 朴素贝叶斯、 随机森林和人工神经网络6种算法建立模型, 采用学习曲线、 网格搜索法、 K折交叉验证等算法优化模型参数以提高模型识别准确率及稳健性, 并从模型的准确率与运行时间两个层面来评估模型效果。 结果表明, 基于近红外光谱技术结合机器学习是识别木材地理来源的有效手段, 樟子松、 泡桐、 榉木、 柚木、 椴木和臭椿的准确率分别达到98.3%、 100%、 100%、 100%、 100%、 98.3%, 相应的模型运行时间分别为0.183、 0.182、 0.181、 0.182、 11.424和12.969 s。 综合分析6种模型在各数据集上的表现, 发现非线性的支持向量机和人工神经网络模型比其余模型更具有优势。 其中, 基于人工神经网络构建的木材产地鉴别模型表现优异, 在各数据集中识别率最高, 但运行时间远多于其余算法。
机器学习 近红外光谱 木材产地识别 主成分分析法 线性判别分析 人工神经网络 Machine learning Near-infrared spectroscopy Wood origin identification Principal component analysis Linear discriminant analysis Artificial neural network 
光谱学与光谱分析
2023, 43(11): 3372
作者单位
摘要
1 江苏大学卓越学院, 江苏 镇江 212013
2 江苏大学电气信息工程学院, 江苏 镇江 212013
3 浙江大学台州研究院, 浙江 台州 317700
4 滁州职业技术学院信息工程学院, 安徽 滁州 239000
茶叶是全球最受欢迎饮品之一, 且具有丰富的营养价值, 但目前市面上的茶叶鱼龙混杂, 难以辨别。 因此, 快速准确的分类方法对茶叶进行鉴别具有重要的研究意义。 由于大多数化合物基频吸收带均出现在波长为2 500~25 000 nm的中红外区域, 茶叶的中红外光谱中含有大量关于茶叶品种的特征鉴别信息, 利用这一显著特点可以对其进行分类。 提出模糊协方差学习矢量量化(FCLVQ), 该算法在GK(Gustafson-Kessel)聚类的基础上, 引入学习向量量化(LVQ)中学习速率的概念, 用以控制模糊类中心的更新速率。 FCLVQ结合中红外光谱, 通过不断迭代计算样本模糊隶属度值和模糊聚类中心, 实现对茶叶的快速精准分类。 选取市场上的峨眉山茶叶、 优质竹叶青茶叶、 劣质竹叶青茶叶作为实验对象。 将实验对象分为3组(每个品种各1组), 每组32个, 共计96个样本。 利用FTIR-7600型傅里叶红外光谱分析仪分别采集每组样本的中红外光谱数据, 每组样本采集三次, 取其平均值作为样本的红外光谱数据。 首先, 由于原始光谱含有噪声数据, 故使用多元散射校正(MSC)作降噪预处理; 其次, 由于光谱数据维数高达1 868维, 采用主成分分析(PCA)将光谱数据降至14维, 其14个主成分的累计贡献率为99.74%; 然后将降维后的光谱数据使用线性判别分析(LDA)进一步降至2维, 同时提取数据中的鉴别信息; 最后运行模糊C均值聚类算法(FCM), 将其运算得到的聚类中心作为FCLVQ的初始聚类中心参与迭代, 设置模糊隶属度的权重指数m=2, 最终分类准确率高达95.25%。 将FCM算法、 GK算法、 模糊Kohonen聚类网络(FKCN)算法与FCLVQ算法的运行结果进行对比, FCM, GK和FKCN的分类准确率分别为90.91%, 92.41%和90.91%。 结果表明, 与其他三个算法相比较, FCLVQ在m=2, 主成分个数为14时有着更好的分类效果, 可以用来实现对茶叶品种的准确分类。
中红外光谱 茶叶 模糊聚类 主成分分析 线性判别分析 Mid-infrared spectroscopy Tea Fuzzy clustering Principal component analysis Linear discriminant analysis 
光谱学与光谱分析
2023, 43(2): 638
作者单位
摘要
1 中国航天员科研训练中心, 北京 100094
2 厦门大学固体表面物理化学国家重点实验室, 化学化工学院, 福建 厦门 361005
人体能量摄入量与能量消耗量平衡是评估健康的标准之一。 不平衡的能量摄入量可能造成生物体组织细胞损伤、 机体过度肥胖等后果。 评估能量摄入量对人的身体健康管理具有重大意义。 目前评估能量摄入量的主要方法是膳食回顾法, 该方法不仅耗时长, 还会增加待评估人员的负担, 所以亟需开发一种简单快速的能量摄入量评估方法。 能量摄入后经过体内的消化代谢, 会产生代谢产物作为废弃物排出体外。 废弃物如尿液等, 含有大量的化学物种, 可以系统性反映生物体的饮食代谢状况和疾病进程。 基于高灵敏、 可无损检测两个组“指纹式”分子光谱特征的表面增强拉曼光谱(SERS), 采用谱峰统计、 无监督和有监督聚类算法分别对尿液的SERS信号开展分析, 最终实现对不同能量摄入量的聚类分析。 首先尝试对能量摄入量分组分别为1 500, 2 030和2 700千卡·日-1两个组的志愿者尿液SERS谱图进行谱峰分析, 发现很多有机分子的拉曼谱峰存在一定程度的重叠, 所以直接对谱峰进行解析及归属存在较大难度, 需要采用化学计量学的方法建立分类模型, 以实现良好区分和预测效果。 对比无监督的主成分分析(PCA)和有监督的正交偏最小二乘判别分析(OPLS-DA)两种算法的区分效果。 首先对原始光谱数据直接进行主成分分析, 发现模型中不同类别的散点分布存在较大程度的重叠, 这使得组别归类效果很差, 而经过一阶导数差分校正基线后, 模型呈现出可分类的趋势。 OPLS-DA算法通过预先设定Y的标签及正交信号矫正处理, 能将X矩阵信息分解成与Y相关和不相关的两个组分, 集中表达相关的信息, 实现良好的分类效果。 结果表明, OPLS-DA算法可以对三种不同能量摄入量水平进行很好的归类, 而且每两组间也可以实现很好区分。 ROC分析结果表明敏感性和特异性均达到100%。 200次迭代的置换检验结果也说明了模型良好的可靠性和预测性。 表明通过采集尿液的拉曼信号, 经过一定的数据处理即可评估人体能量摄入量水平。 该方法可以实现尿液的快速分析, 测试分析时间小于2 min, 操作简单, 判别结果准确, 在医疗健康领域具有很大应用前景。
表面增强拉曼光谱 能量摄入 尿液分析 主成分分析 正交偏最小二乘判别分析 Surface enhanced Raman spectroscopy Energy intake Urine analysis Principal component analysis Orthogonal partial least-squares discriminant anal 
光谱学与光谱分析
2023, 43(2): 489
作者单位
摘要
1 湖南农业大学食品科学技术学院, 湖南 长沙 410128
2 湖南师范大学医学院, 湖南 长沙 410013
菊花为菊科植物菊的头状花序, 滁菊、 贡菊、 杭菊和亳菊是常见的几类药用品种菊花。 不同品种菊花在外观上具有极大的相似性, 非专业人员仅凭肉眼难以对其进行准确鉴别分析。 常规仪器分析法检测成本较高, 分析时间较长, 且需要对样品进行破坏性处理, 影响了产品的二次销售。 近红外光谱技术作为近年来快速发展起来的一种绿色、 简单、 快速的新型检测技术, 在中药鉴别领域取得了很大的进展。 基于便携式近红外光谱仪结合化学计量学方法建立了一种菊花品种无损鉴别方法。 利用便携式近红外光谱仪采集了滁菊、 贡菊、 杭菊和亳菊完整以及粉末状两种物理形态样品的光谱, 采用单一以及组合光谱预处理方法消除光谱中存在的干扰, 结合不同模式识别方法(主成分分析法、 软独立模式分类法和Fisher线性判别分析法)分别构建了不同品种菊花的鉴别模型。 结果表明: 由于仪器的限制及样品物理性状的原因, 光谱中存在较为明显的背景、 基线漂移以及噪声的干扰, 完整样品由于物理性状的原因, 基线漂移干扰尤为严重; 采用主成分分析法结合光谱预处理方法无法实现不同品种菊花的准确鉴别, 完整样品最佳鉴别正确率仅为8.33%, 粉末样品最佳鉴别正确率为52.38%; 通过软独立模式分类法结合预处理方法可以得到较为准确的鉴别结果, 完整样品光谱数据经一阶导数+多元散射校正优化后鉴别正确率为95%, 粉末状样品数据采用原始数据的鉴别正确率为92.5%; Fisher线性判别分析方法结果最佳, 完整样品数据经连续小波变换优化后可以得到97.5%的鉴别正确率, 粉末状样品采用原始光谱便可得到100%鉴别正确率。 以上结果表明, 当采用合适的预处理和建模方法, 完整样品和粉末状样品鉴别结果较为一致, 基于便携式近红外光谱仪结合化学计量学可实现对不同品种菊花的准确无损鉴别分析, 为食药同源产品的无损鉴别分析提供了新途径。
便携式近红外光谱仪 菊花 无损鉴别 Fisher线性判别分析 Portable near infrared spectrometer Chrysanthemum Nondestructive identification Fisher linear discri-minant analysis 
光谱学与光谱分析
2022, 42(4): 1129
作者单位
摘要
华阴兵器试验中心,陕西 华阴714200
为了找出一种快速、简便、准确的方法来探究霉菌试验后**装备表面生长的霉菌种类,按照标准的试验方法进行了霉菌试验,利用傅里叶红外光谱仪对经过不同菌种腐蚀后的样本进行了测试,获取了光谱数据,并通过对数据进行初步的主成分分析确定了光谱数据的识别区域。采用最小距离匹配、光谱角匹配、光谱信息散度、光谱协方差、主成分分析、偏最小二乘判别分析(Partial Least Squares Discriminant Analysis,PLS-DA)、随机森林等分类算法建立了识别模型。研究结果表明,随机森林算法能够很好地识别霉菌种类,准确率预期在98%以上。基于合适的分类算法,傅里叶红外光谱(Fourier Transform Infrared, FTIR)技术能够实现对菌种的有效鉴别。
傅里叶红外光谱 偏最小二乘判别分析 光谱信息散度 随机森林 霉菌试验 菌种识别 FTIR PLS-DA spectral information divergence random forest mold test species identification 
红外
2022, 43(10): 41

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!