作者单位
摘要
1 中国海洋大学信息科学与工程学院, 山东 青岛 266100
2 青岛科技大学信息科学技术学院, 山东 青岛 266061
3 山东烟草研究院有限公司, 山东 济南 250101
近红外光谱数据的高维、高冗余、高噪声和非线性的特性严重影响了光谱相似性度量的准确性,针对该问题,提出了一种基于网格划分局部线性嵌入(GGLLE)算法的近红外光谱相似性度量方法。首先,根据关键化学成分在光谱中的表达,将高维光谱数据划分为多个网格子空间。其次,对局部线性嵌入(LLE)算法做了两方面改进,并采用改进的LLE算法依次实现每个子空间从高维空间向低维空间的特征映射,计算生成子空间的相似度矩阵。最后,将子空间相似度矩阵归一化处理并求解所累加和生成光谱样本集的相似度矩阵,实现光谱的相似性度量。实验选取两组某烟草企业提供的烟叶光谱构建了光谱的相似性度量模型,以相似性度量的准确率作为算法优劣的衡量标准。实验结果表明,GGLLE算法构建的相似性度量模型的准确率为93.3%,明显优于主成分分析、栈式自编码器和LLE算法的64.2%、67.5%和82.5%,从而证明了GGLLE算法的有效性。
光谱学 近红外光谱 相似性度量 改进局部线性嵌入算法 网格子空间 测地线距离 高维数据 
激光与光电子学进展
2019, 56(3): 033001
作者单位
摘要
中国海洋大学信息科学与工程学院, 山东 青岛 266100
针对高维空间下获取最优特征子集异常复杂和模型识别准确率较低的问题, 提出了基于特征分层选择和融合度相结合的近红外光谱多类识别度量算法。 首先引入跳跃度, 构造了一种特征分层方法, 将所有特征依据对样本的重要性程度划分不同的特征子集, 从而避免了从原始特征数据逐个剔除无关特征构建特征子集的繁琐过程; 同时又改进了样本的融合度, 将其代替K最近邻分类器(KNN)中依据概率进行类别判断的方式, 提高了分类器的识别精度, 较好地解决了多类识别准确率较低的问题。 为验证该算法的有效性, 选取五类具有代表性382个烟叶样品为实验对象, 构建了烟叶产地识别度量模型, 并选取64个样本进行了模型测试, 以预测均方根误差(RMSEP)、 交互验证均方差(RMSECV)和相关系数(r)作为模型稳健性的评价指标, 以产地识别准确率作为算法优劣评价标准。 仿真实验结果表明, 利用该算法构建的模型具有较低的RMSEP(0.117), RMSECV(0.106)和较高的r(0.973), 平均识别准确率达到98.44%, 性能明显优于其他算法, 该算法对于高维光谱数据具有良好的识别性能。
近红外光谱 特征分层选择 融合度 特征子集 多类识别 Near infrared spectral Feature hierarchical selection Sample fusion degree Feature subset Multiclass identification 
光谱学与光谱分析
2017, 37(4): 1095

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!