作者单位
摘要
1 齐鲁工业大学(山东省科学院), 山东省科学院海洋仪器仪表研究所, 山东 青岛 266061
2 齐鲁工业大学(山东省科学院), 山东省科学院海洋仪器仪表研究所, 山东 青岛 266061中国石油大学(华东)计算机科学与技术学院, 山东 青岛 266590
海洋沉积物的粒度研究有助于了解人类活动对自然环境的影响。 将主成分分析(PCA)和连续投影算法(SPA)融合能够综合利用两种光谱特征提取方法的优势, 获得比单一特征提取方法更丰富的特征波长, 实现无关特征和干扰信息的剔除, 最大限度减少特征信息的丢失, 有利于沉积物粒度的分析。 以青岛市东大洋村潮间带表层32份沉积物为例, 将海洋沉积物划分为0.3~0.2、 0.2~0.1、 0.1~0.075和<0.075 mm四个不同粒径的沉积物样品, 分别测定不同粒径的32份沉积物的可见-近红外反射光谱, 共计128条光谱。 将128条光谱数据分别以2∶1, 1∶1和1∶2的比例划分建模集和检验集进行分析; 采用主成分分析和连续投影融合算法(FOPAS )提取不同粒径沉积物的特征光谱, 利用支持向量机算法建立粒径分类模型。 结果显示, 对2∶1、 1∶1、 1∶2比例的数据集, 融合算法检验集正确率分别为83.33%、 82.81%、 75.29%, 仅在2∶1比例下正确率低于连续投影算法检验集的正确率90.47%, 其余正确率相对于单一特征提取算法均有显著的提高, 表明使用融合算法提取特征光谱建立的分类模型在训练集样本量少, 粒径清晰的条件下, 其分类模型相较于单独使用两个特征提取算法的模型更具有优势。 采用基于主成分分析和连续投影融合算法的海洋沉积物粒度分类模型, 能够提高海洋沉积物粒度分类结果的正确率, 建立正确率更高的粒度分类模型, 对快速粒度分类提供了解决方法。
海洋沉积物 粒度分类 主成分分析 连续投影算法 融合算法 Marine sediments Particle size classification Principal component analysis Successive projection algorithm Fusion algorithm 
光谱学与光谱分析
2023, 43(10): 3075
作者单位
摘要
1 新疆师范大学地理科学与旅游学院, 新疆 乌鲁木齐 830054新疆干旱区湖泊环境与资源实验室, 新疆 乌鲁木齐 830054
2 新疆师范大学地理科学与旅游学院, 新疆 乌鲁木齐 830054
3 新疆干旱区湖泊环境与资源实验室, 新疆 乌鲁木齐 830054
4 新疆财经大学统计与数据科学学院, 新疆 乌鲁木齐 830012
土壤有机碳含量是土壤肥力与土壤质量的主要决定因素, 与土壤生产力密切相关。 采用高光谱模型估算土壤有机碳含量成为了解土壤肥力的重要方法。 利用高光谱分析技术结合机器算法实现快速、 高精度的估算土壤有机碳含量, 对土壤肥力的可持续利用至关重要。 根据实测的土壤有机碳含量及其高光谱反射率数据, 运用Savitzky Golay方法对光谱波段进行平滑去噪, 采用连续投影算法(SPA)、 遗传算法(GA)对原始光谱及其5种不同数学变换光谱分别进行特征波段的筛选, 并基于随机森林(RF)方法构建土壤有机碳含量的高光谱估算模型。 为进一步降低模型的复杂度, 将SPA算法与GA算法相结合, 寻找最佳特征参数, 以提升土壤有机碳含量特征波段的识别率和可信度。 结果表明: (1)在原始光谱中, 基于GA算法筛选SOC含量的高光谱响应波段主要集中在350~410、 827~928、 997~1 064、 1 201~1 234、 1 541~1 574、 1 667~1 710、 2 153~2 186和2 357~2 707 nm; 当RMSE为6.09时, SPA算法筛选了11个特征变量。 (2)基于GA算法筛选特征波段时, 原始光谱R、 标准正态变量(SNV)、 多元散射校正(MSC)、 一阶微分(FD)、 对数的倒数(RL)与连续统去除(CR)的维数分别降低到407、 697、 668、 667、 493、 784维, 占全光谱波段的18.93%~36.47%; 基于GA-SPA算法筛选后, 6种光谱变量的维度介于8~17维, RMSE介于4.53~6.30。 (3)在一阶微分光谱形式下, 基于GA-SPA算法挑选的12个特征变量所构建的RF模型预测效果最好, 模型的建模集R2c为0.78, RMSEc为5.48, 验证集R2p为0.82, RMSEp为4.50, RPD为2.18。 研究表明, 光谱一阶微分可以增强土壤的光谱信息, GA算法结合SPA算法寻找光谱特征变量, 既简化了估算模型的复杂度, 又提高了估算模型的精度, 基于遗传算法—连续投影算法的高光谱模型具有较高的估算能力。
土壤有机碳含量 连续投影 遗传算法 高光谱估算模型 湖滨绿洲 Soil organic carbon content Successive projection algorithm Genetic algorithm Hyperspectral estimation model Lakeside oasis 
光谱学与光谱分析
2023, 43(7): 2232
作者单位
摘要
1 黑龙江八一农垦大学信息与电气工程学院, 黑龙江 大庆 163319
2 黑龙江八一农垦大学工程学院, 黑龙江 大庆 163319
目前, 近红外光谱(NIRS)可以实现种子活力的快速、 无损检测, 但区分的活力等级一般少于3级且精度不高。 建立种子活力多等级、 高精度的NIRS检测模型, 解决活力等级增加与预测模型精度之间的矛盾是现阶段近红外种子活力检测的主要任务。 以玉米种子为研究对象, 采用人工老化的方法获得5种活力等级的种子样本并采集对应的光谱数据建立反向神经网络(BP)预测模型。 为了提高模型的精度和稳健性, 提出一种耦合平均影响值-连续投影特征波长提取算法(MIVopt-SPAsa)。 该算法针对连续投影算法(SPA)耗时过长的问题, 采用平均影响值算法(MIV)对其预降维。 MIV方法实现了对波长影响值的排序, 但缺乏选取波长影响阈值的指标, 因此引入相对距离比对MIV算法进行优化(MIVopt), 实现特征波长范围的有效分割。 针对SPA提取特征变量数目确定的问题, 设定了特征波长数目范围并在此范围内优中选优, 实现了自适应的SPA(SPAsa)特征提取。 使用耦合MIVopt-SPAsa算法对具有1 845个波长的玉米种子近红外全谱数据进行特征提取, 提取出特征波长37个, 主要分布在玉米种子近红外光谱的7个主要吸收峰附近, 表明该算法可以有效提取出与玉米种子生化物质近红外吸收特性一致的特征波长。 为了测试该算法对模型性能的影响, 建立了全谱BP模型、 MIV-BP模型、 SPAsa-BP模型、 MIVopt-SPAsa-BP模型和竞争自适应重加权CARS-BP模型对5个等级的玉米种子活力进行分级, MIVopt-SPAsa-BP模型的预测平均准确率可达99.1%, 预测精度高于其他模型; 其计算平均时间为14.382 s, 低于MIV-BP模型的计算时间(24.523 s)、 CARS-BP模型的计算时间(97.226 s)和SPAsa-BP模型的计算时间(101.224 s), 但高于全谱模型的平均计算时间(0.253 1 s); 其最佳表现交叉熵为0.007 892, 远远低于另外4个模型。 实验结果表明: MIVopt-SPAsa算法可以有效地提高玉米种子活力近红外检测模型的精度, 实现种子活力多等级、 精确、 无损检测, 为种子活力检测模型的优化提供参考。
近红外光谱 种子活力 玉米 平均影响值算法 连续投影算法 Near infrared spectroscopy Seed vigor Maize Mean impact value Successive projection algorithm 
光谱学与光谱分析
2022, 42(10): 3135
作者单位
摘要
南京理工大学电子工程与光电技术学院, 江苏 南京 210094
对转炉炼钢终点的实时精准控制能够有效提高钢铁产出的质量, 炉口火焰光谱在炼钢不同时期的变化明显, 对其进行分析处理并与机器学习方法相结合可有效用于炼钢终点的实时控制。 针对炉口火焰光谱数据量大、 现有方法对光谱特征提取在可信度和实时性上不足的缺陷, 提出一种基于窗口竞争性自适应重加权采样(WCARS)结合迭代式连续投影算法(ISPA)的光谱特征波长选择方法, 该方法在有效解决模型过拟合问题的同时, 能够降低高维数据计算的复杂度。 将火焰光谱数据沿波长方向进行窗口划分后, 使用CARS进行计算选出特征窗口波段, 再将迭代式选择与传统连续投影算法相结合, 通过重复迭代精选出特征波长, 在此基础上使用支持向量机回归(SVR)建立炼钢终点碳含量预测模型。 实验采集363组炼钢后期的炉口火焰光谱数据作为样本, 并对其进行Savitzky-Golay平滑预处理。 使用WCARS-ISPA算法从全光谱数据中选出10个特征波长作为SVR模型的输入, 碳含量为模型输出, Kennard-stone算法对训练集和测试集进行划分, 选择碳含量的平均预测误差、 预测误差在±2%以内的命中率以及运行30次的平均时间作为模型评价指标。 实验结果显示, 模型的平均碳含量预测误差为1.413 2%, 命中率高达90.63%, 运行时间为0.019 679 s。 与使用全光谱和WCARS-ISPA, CARS-SPA, WCARS和SPA四种不同特征选择方法选出的特征波长建模得到的结果进行对比, 基于WCARS-ISPA方法选出的特征波长建立的终点碳含量预测模型误差最小、 命中率最高。 提出一种新的炉口火焰光谱特征波长提取方法, 使用窗口竞争性自适应重加权采样结合迭代式连续投影算法选取特征波长, 并在此基础上建立转炉炼钢终点碳含量预测模型, 实验结果表明, 该方法能够有效提取火焰光谱特征, 所建模型能够对转炉炼钢终点进行准确预测, 满足工业生产的实时控制要求, 为实际生产提供可靠帮助。
转炉炼钢 火焰光谱 窗口竞争性自适应重加权采样 迭代式连续投影算法 终点预测 BOF steelmaking Flame spectra Window competitive adaptive reweighted sampling Iterative successive projection algorithm End-point prediction 
光谱学与光谱分析
2021, 41(8): 2332
作者单位
摘要
1 陕西科技大学电气与控制工程学院, 陕西 西安 710021
2 广州谱民信息科技有限公司, 广东 广州 510006
3 中山大学药学院, 广东 广州 510006
4 江西保利制药有限公司, 江西 赣州 341900
随着中药制剂存储时间的延长, 其有效成分含量逐渐降低。 化学检测手段损耗样品、 检测时间长、 成本高, 利用近红外光谱对不同年份的经典名方安胎丸进行年份鉴别。 为探讨这种无损、 快速质量控制方式的可行性, 采集了三年的105粒样本在1 000~1 799 nm波段近红外光谱吸光度数据, 随机选择80个作为训练集, 25个作为测试集。 首先采用连续投影算法(SPA), 消除原始光谱数据中的冗余信息, 对输入全光谱进行优化降维, 根据测试集的内部交叉验证均方根误差值, 从输入的800个波长中提取出11个特征波长, 分别是: (1 692, 1 714, 1 405, 1 001, 1 114, 1 478, 1 514, 1 788, 1 202, 1 014, 1 164) nm; 然后建立支持向量机(SVM)分类模型, 由于SVM模型中的参数选取对分类正确率影响很大, 利用粒子群优化(PSO)算法, 对SVM模型中惩罚参数C和核函数参数进行寻优, 形成PSOSVM分类模型; 最后将SPA降维后的特征波长输入到PSOSVM分类算法中。 用Matlab软件进行仿真测试, 分别构建SVM, SPA-SVM和本文的SPA-PSOSVM三种方法分类模型, 分类测试正确率分别达到了76%, 92%和100%。 从仿真结果可以看出, SPA波长优选可有效地降低光谱信息中存在的冗余信息, 减少建模所需的时间, 结合PSOSVM分类模型降低了模型的复杂度, 提高分类精度。 结果证实, 依照所建立的利用近红外算法, 可以准确无损区分中药制剂安胎丸生产的年份, 该研究可为中药制剂年份间差异评价提供一种思路。
近红外光谱 安胎丸 年份预测 连续投影算法 粒子群优化结合支持向量机 Near infrared spectroscopy Antai pills Year classification Successive projection algorithm(SPA) Particle swarm optimization combined with support 
光谱学与光谱分析
2020, 40(8): 2592
作者单位
摘要
东北石油大学电子科学学院, 黑龙江 大庆 163318
准确及时的检测原油含水率对注水策略调整、 原油开采能力评估、 油井开发寿命预测等均具有重要意义。 然而, 当前我国大多数油田均已进入高含水的开发中晚期, 含水率测量难度大且准确率不高。 在此背景下, 开展了高含水情况下利用近红外光谱进行原油含水率测量的研究。 首先介绍了目前原油含水率检测的常用方法, 分析了它们的优劣。 理论上, 由于水的近红外光吸收带与原油中C—H键的吸收带有明显区别, 根据Lambert-Beer吸收定律和吸光度线性叠加定律可知, 不同含水率高含水原油近红外光谱会存在较强响应差异。 为此, 对高含水原油进行近红外光谱检测, 建立原油含水率与近红外光谱响应间的非线性映射模型, 可实现高含水原油含水率的精确测量。 为了验证该方法的有效性, 搭建了近红外光谱数据采集实验装置: 采用白炽灯作为光源, 经过光路调节成平行光后垂直射入样品池, 用近红外光谱仪(海洋光学NIR512)采集光谱用于分析。 其中, 接收光谱仪带宽为900~1 700 nm, 平均分成512个波段。 光谱数据利用光谱仪配套软件储存在电脑中。 样本采用相同厚度不同比例的油水混合物, 样本含水率范围为70%~99%, 共采集数据60组, 每组重复3次取平均值。 得到原始数据后, 先进行原始数据预处理, 以减少数据采集时来自高频随机噪音及温度不稳定、 样本不均匀、 基线漂移、 光散射等不利因素的影响。 分别选用了S-G滤波、 一阶导数和S-G滤波+一阶导数作为数据预处理的方法, 利用连续投影算法(SPA)对光谱数据进行降维, 并利用偏最小二乘法(PLS)和多元线性回归(MLR)进行建模, 模型精度通过计算均方根误差值(RMSE)和相关系数(r)来验证。 对比发现, 使用S-G滤波+一阶导数建立的模型RMSE值最小(RMSE=0.007 0, r=0.998 3)。 使用SPA降维后的模型要优于全波段PLS模型(RMSE=0.083 3, r=0.920 6)与MLR模型(RMSE=0.099 9, r=0.967 1)。 利用SPA提取出的31个特征波长建立的模型仅占全波段的6.05%, 并获得了较好的精度。 证明了利用光谱检测高含水原油含水率可行性, 并且得到了满意的精度, 为高含水原油的含水率检测提供了新的方法, 为进一步利用近红外光进行高含水原油的快速检测与在线监测提供参考。
近红外光谱 高含水率原油 连续投影算法 偏最小二乘法 Near-infrared spectroscopy (NIR) High water content crude oil Successive projection algorithm (SPA) Partial least square (PLS) 
光谱学与光谱分析
2019, 39(11): 3452
作者单位
摘要
1 新疆大学资源与环境科学学院, 新疆 乌鲁木齐 830046
2 新疆绿洲生态教育部重点实验室, 新疆 乌鲁木齐 830046
3 新疆智慧城市与环境建模普通高校重点实验室, 新疆 乌鲁木齐 830046
为了探索分数阶微分在高光谱估算小麦叶片含水量上的可行性,在农田尺度上,利用春小麦野外光谱数据与实测叶片含水量数据,以0.2阶为步长,计算光谱0~2阶微分,并分析其与小麦叶片含水量的相关性,再利用连续投影算法(SPA)从通过0.01水平显著性检验的波段中筛选出估算叶片含水量的最佳波段组合,并建立估算春小麦叶片含水量的反射传播(BP)神经网络模型。结果表明:分数阶微分可以细化小麦叶片含水量与光谱数据相关性的变化趋势;分数阶微分处理后,相关系数通过0.01水平显著性检验的波段数量呈现先增后减的趋势,在不同的波段范围内,分数阶微分的最佳阶数也有所不同;SPA筛选出的敏感波段基本上集中在红光、近红外波段范围内,1.2阶微分后水分敏感波段数最多,达到13个;所建立的模型中,基于1.8阶微分建立的6-4-1结构的BP神经网络模型为最佳模型,其建模组均方根误差为0.701,决定系数为0.751,验证组的均方根误差为0.227,决定系数为0.917,相对分析误差为3.253,说明了分数阶微分后的模型稳定性和预测能力较整数阶微分得到明显的提升,可为高光谱定量反演春小麦叶片含水量提供参考。
光谱学 分数阶微分 连续投影算法 叶片含水量 春小麦 高光谱估算 
激光与光电子学进展
2019, 56(15): 153002
作者单位
摘要
1 陆军勤务学院军事设施系, 重庆 401311
2 陆军勤务学院油料系, 重庆 401311
高光谱成像具有快速无损和图谱合一的特点, 每个波段都会呈现一幅图像, 每个像素点都显示一条光谱曲线, 不仅可以获取样本的光谱信息, 还可以表征物体的空间信息, 目前在诸多领域展现出极大的应用价值。 采用高光谱成像实现土壤中石油烃含量分布的可视化。 制备不同石油烃含量的砖红壤样本, 分为建模样本和预测样本。 采集高光谱图像, 为避免图像背景的干扰, 采用掩膜的方法进行背景剔除。 之后提取建模样本中感兴趣区域的平均光谱, 采用连续投影算法筛选特征变量, 基于提取的特征变量, 一方面建立MLR预测模型, 另一方面从预测样本中提取特征波段的高光谱图像。 最后, 将特征图像上像素点的数据代入模型, 得到石油烃的含量分布情况。 通过图像处理的方法, 不同的含量赋予不同的颜色, 实现砖红壤中石油烃含量分布的可视化。 研究结果表明, 采用高光谱成像与图像处理方法能够初步实现砖红壤中石油烃含量分布的可视化, 为以后大范围地识别和反演土壤中石油烃含量提供了基础。
高光谱成像 砖红壤 石油烃含量 连续投影算法 可视化 Hyperspectral imaging Latosol Petroleum-hydrocarbon content Successive projection algorithm Visualization 
光谱学与光谱分析
2018, 38(9): 2916
白铁成 1,2,*王亚明 1张楠楠 1姚娜 1[ ... ]王兴鹏 3,4
作者单位
摘要
1 塔里木大学信息工程学院, 新疆 阿拉尔 843300
2 University of Liège-Gembloux Agro-Bio Tech, Gembloux 25030, Belgium
3 塔里木大学水利与建筑工程学院, 新疆 阿拉尔 843300
4 中国农业科学院农田灌溉研究所, 河南 新乡 453000
胡杨叶片水分含量是评价胡杨健康状况的重要指标。 光谱检测法是一种常用的手段, 但在近红外光谱的测量过程中, 在一定程度上必然受到仪器噪声、 摆放形态差异和环境的干扰, 为避免噪声、 散射对近红外光谱的影响, 减少数据维数, 采用多元散射校正(MSC)算法对原始光谱数据进行预处理, 去除散射和基线漂移的影响, 增加了光谱数据的信噪比, 使有效光谱信息较为明显, 谱带特征得到加强, 有利于特征波长的选择。 为降低模型的复杂度, 防止过拟合现象, 减小共线性影响, 利用连续投影算法(SPA)进行特征变量选择, 并通过多元线性回归模型, 分析各个波长模拟的残差平方, 评价各个波长的贡献, 剔除贡献较小的波长, 最终获得用于建模的特征波长, 改善建模条件。 最后使用偏最小二乘回归算法建立胡杨叶片水分含量检测模型。 实验表明, 直接使用原始光谱, 利用SPA算法筛选变量个数为6个, 模型预测精度为90.144%, 相关系数r=0.674 24, RMSE=0.021 434, MSC处理后, 利用SPA算法选定最终变量数为5个, 预测精度为97.734%, 相关系数r=0.781 63, RMSE=0.016 776。 MSC和SPA算法有效的消除了散射噪声、 减小了共线性干扰, 模型的预测精度和相关性增加, 误差减小, 可用于胡杨叶片水分的快速无损检测, 而且对其他作物叶片水分检测也具有一定的借鉴意义。
近红外光谱 多元散射校正 连续投影算法 偏最小二乘回归 水分 Near infrared spectrum Multiple scattering correction Successive projection algorithm Partial least squares regression Moisture 
光谱学与光谱分析
2017, 37(11): 3419
作者单位
摘要
1 浙江大学生物系统工程与食品科学学院, 浙江 杭州 310058
2 华东交通大学电气工程与自动化学院, 江西 南昌 330013
应用遗传算法结合连续投影算法近红外光谱检测土壤有机质研究。 采集浙江省文城地区农田土壤样品近红外光谱数据, 土壤样品数为394个。 为简化模型, 采用遗传算法结合连续投影算法挑选出18个特征波长建模, 应用偏最小二乘回归建立有机质预测模型, 建模集的决定系数为081, 均方根预测误差为022, 剩余预测偏差为231, 预测集的决定系数为083, 均方根预测误差为020, 剩余预测偏差为245。 研究发现, 遗传算法结合连续投影算法在简化模型同时, 模型的预测评价指标同采用全谱波长建模并没有明显降低。 因此, 遗传算法结合连续投影算法挑选的特征波长可以应用于近红外光谱检测土壤有机质含量。
近红外光谱 土壤有机质 遗传算法 连续投影算法 Visible near infrared spectroscopy Soil organic matter Genetic algorithm Successive projection algorithm 
光谱学与光谱分析
2017, 37(2): 584

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!