作者单位
摘要
1 攀枝花学院数学与计算机学院, 四川 攀枝花 617000
2 中北大学软件学院, 山西 太原 030051
恒星光谱分类是天文学研究的一个热点问题。 随着观测光谱数量的急剧增加, 传统的人工分类无法满足实际需求, 急需利用自动化技术, 特别是数据挖掘算法来对恒星光谱进行自动分类。 关联规则、 神经网络、 自组织网络等数据挖掘算法已广泛应用于恒星光谱分类。 其中, 支持向量机(SVM)分类能力突出, 被广泛应用于恒星光谱分类。 该方法试图在两类样本之间找到一个最优分类面将两类分开。 该方法具有较高的时间复杂度, 计算效率有限。 双支持向量机(TWSVM)的出现有效地解决了SVM面临的效率问题。 该方法通过构造两个非平行的分类面将两类分开, 每一类靠近某个分类面, 而远离另一个分类面。 TWSVM的计算效率较之传统SVM提高近4倍, 因此, 自TWSVM提出后便受到研究人员的持续关注。 但上述方法在分类决策时, 一方面没有考虑数据的分布特征, 另一方面较易受噪声点和奇异点的影响, 分类效率难以显著提升。 鉴于此, 在双支持向量机的基础上, 提出融合数据分布特征的模糊双支持向量机(TWSVM-SDP)。 该方法引入线性判别分析(LDA)的类间离散度和类内离散度, 用以表征光谱数据的分布性状; 引入模糊隶属度函数用以降低噪声点和奇异点对分类结果的影响。 在SDSS DR8恒星光谱数据集上的比较实验表明, 与支持向量机SVM、 双支持向量机TWSVM等传统分类方法相比, 融合数据分布特征的模糊双支持向量机TWSVM-SDP具有更优的分类能力。 该方法亦存在一定的局限性, 其中一大难题是其无法处理海量光谱数据。 接下来将利用大数据处理技术, 来对所提方法在大数据环境下的适应性展开进一步研究。
恒星光谱 分类 数据分布特征 模糊隶属度 双支持向量机 Stellar spectra Classification Spectral distribution properties Fuzzy membership function Twin support vector machine 
光谱学与光谱分析
2019, 39(4): 1307
作者单位
摘要
1 泉州信息工程学院软件学院, 福建 泉州 362000
2 中北大学软件学院, 山西 太原 030051
3 中国科学院新疆天文台, 新疆 乌鲁木齐 830011
4 辽宁科技大学理学院, 辽宁 鞍山 114051
恒星光谱分类是天文技术与方法领域一直关注的热点问题之一。 随着观测设备持续运行和不断改进, 人类获得的光谱数量与日俱增。 这些海量光谱为人工处理带来了极大挑战。 鉴于此, 研究人员开始关注数据挖掘算法, 并尝试对这些光谱进行数据挖掘。 近年来, 神经网络、 自组织映射、 关联规则等数据挖掘方法广泛应用于恒星光谱分类。 在这些方法中, 支持向量机(SVM)以其强大的学习能力和高效的分类性能而备受推崇。 SVM的基本思想是试图在两类样本之间找到一个最优分类面将两类分开。 SVM在求解时, 通过将其最优化问题转化为具有(QP)形式的凸问题, 进而得到全局最优解。 尽管该方法在实际应用中表现优良, 但为了进一步提高其分类能力, 有的学者提出双支持向量机(TSVM)。 该方法通过构造两个非平行的分类面将两类分开, 每一类靠近某个分类面, 而远离另一个分类面。 TSVM的计算效率较之传统SVM提高近4倍, 因此, 自TSVM提出后便受到研究人员的持续关注, 并出现若干改进算法。 在恒星光谱分类中, 一般分类算法都是根据历史观测光谱来建立分类模型, 其中最关键的是对光谱进行人工标注, 这项工作极为繁琐, 且容易犯错。 如何利用已标记的光谱以及部分无标签的光谱来建立分类模型显得尤为重要。 因此, 提出带无标签数据的双支持向量机(TSVMUD)用以实现对恒星光谱智能分类的目的。 该方法首先将光谱分为训练数据集和测试数据集两部分; 然后, 在训练集上进行学习, 得到分类依据; 最后利用分类依据对测试集上的光谱进行验证。 继承了双支持向量机的优势, 更重要的是, 在训练集上学习分类模型过程中, 不仅考虑有标记的训练样本, 也考虑部分未标记的样本。 一方面提高了学习效率, 另一方面得到更优的分类模型。 在SDSS DR8恒星光谱数据集上的比较实验表明, 与支持向量机SVM、 双支持向量机TSVM以及K近邻(KNN)等传统分类方法相比, 带无标签数据的双支持向量机TSVMUD具有更优的分类能力。 然而, 该方法亦存在一定的局限性, 其中一大难题是其无法处理海量光谱数据。 该工作将借鉴海量数据随机采样思想, 利用大数据处理技术, 来对所提方法在大数据环境下的适应性展开进一步研究。
恒星光谱 智能分类 双支持向量机 无标签数据 Stellar spectra Intelligent classification Twin support vector machine Unlabeled data 
光谱学与光谱分析
2019, 39(3): 948
作者单位
摘要
1 东北林业大学信息与计算机工程学院, 黑龙江 哈尔滨 150040
2 东北林业大学机电工程学院, 黑龙江 哈尔滨 150040
针对实木板材表面存在的活节、 死节、 裂纹与虫眼4类缺陷, 提出了基于近红外光谱分析的定性识别模型。 随机选取50个样本组成训练集, 30个样本组成测试集, 在室内温度20 ℃、 相对平均湿度50%环境下, 采用900~1 700 nm的近红外光谱仪采集样本表面光谱, 并利用SNV方法进行光谱数据预处理, 以消除固体颗粒大小、 表面散射及光程变化对漫反射光谱的影响; 然后, 采用偏二叉树双支持向量机(PBT-SVM)构建缺陷分类模型, 运用模拟退火算法(SA)对4类核函数、 参数及波长特征进行全局寻优; 寻优过程以97个波长吸收度为输入特征, 运用顺序前向法依次加入新特征, 当分类器准确率达到90%时, 得到核参数及波长特征; 最后, 通过确定的核函数、 参数与波长构建了缺陷分类模型, 并对测试样本集进行了分类验证。 实验结果表明, SNV预处理方法使相同缺陷的近红外光谱具有较好的一致性, 其中, 活节与死节光谱差异显著, 但死节、 裂纹与虫眼的光谱趋势相近; 当PBT-SVM分类器采用多项式核函数、 参数在γ=28.63, coef=18.69, d=1, C=12.03时, 缺陷识别效果最好, 裂纹和活节的识别率达到了100%, 虫眼为93.33%, 死节为93.33%, 平均准确率达到了96.65%, 平均识别时间仅为0.002 s。 利用近红外光谱分析的方法能够快速、 有效地完成4类实木板材缺陷的识别。
实木板材 缺陷识别 近红外光谱 偏二叉树双支持向量机 模拟退火 Solid wood plate Defect identification Near infrared spectroscopy Partial two tree double support vector machine Simulated annealing 
光谱学与光谱分析
2018, 38(6): 1724
作者单位
摘要
1 中北大学计算机与控制工程学院, 山西 太原 030051
2 河南信息统计学院人事处, 河南 郑州 450008
3 山西大学商务学院信息学院, 山西 太原 030031
支持向量机(support vector machine, SVM)具有良好的学习性能和泛化能力, 因而被广泛应用于恒星光谱分类中。然而实际应用面临的数据规模往往很大, SVM便暴露出计算量大、分类速度慢等问题。为了解决上述问题, Jayadeva等提出双支持向量机(twin support vector machine, TWSVM), 将计算时间减少至SVM的1/4。然后上述方法仅关注数据的全局特征, 对每类数据的局部特征并未关注。鉴于此, 提出基于流形模糊双支持向量机(manifold fuzzy twin support vector machine, MF-TSVM)的恒星光谱分类方法。利用流形判别分析获得数据的全局特征和局部特征, 模糊隶属度函数的引入将各类数据区别对待, 尽可能减少噪声点和奇异点对分类结果的影响。与C-SVM, KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明了该方法的有效性。
自动分类 恒星光谱 流形判别分析 模糊隶属度 双支持向量机 Automatic classification Star spectra data Manifold-based discriminant analysis (MDA) Fuzzy membership Twin support vector machine (TWSVM) 
光谱学与光谱分析
2015, 35(1): 263

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!