作者单位
摘要
河北工业大学, 天津 300400
恒星的分类问题一直是天文研究的一大热点, 恒星的亚型分类对探究恒星演化、 稀有天体识别等具有重大意义。 针对LAMOST光谱亚型分类问题设计了SSTransformer (stellar spectrum transformer)分类模型, 该模型主要由三部分组成, 包括输入模块、 嵌入模块、 SST编码模块。 在输入模块中, 将光谱数据进行分块处理, 这些块经过线性投射层被映射为向量。 在嵌入模块中, 为了提取有用的数据特征, 将线性投射层的输出加入一个可学习的类别嵌入块, 为了保留位置信息, 再加入位置嵌入块, 之后将这些数据特征向量送入SST编码模块。 最后在SST编码模块中, 对数据特征进行提取处理, 并利用多层感知器结合新特征对恒星光谱进行分类。 采用的A、 F、 G、 K、 M型恒星光谱数据均来自LAMOST DR8中的一维低分辨率光谱, 35 256条一维光谱数据用于SSTransformer模型的训练, 8815条一维光谱数据用作模型的测试。 为了加快模型的收敛速度, 对数据采用Z-Score归一化处理。 由于是多分类问题, 实验采用了准确率、 精确率、 召回率、 F1-Score、 Kappa系数五个评价指标。 实验结果证明, 利用SSTransformer模型可实现对一维恒星光谱数据有效的筛选分类, 分类准确率达到98.36%, 比支持向量机(support vector machine, SVM)算法、 极端梯度提升(eXtreme Gradient Boosting, XGBoost)算法, 以及卷积神经网络(convolutional neural networks, CNN)的分类准确率更高。
恒星光谱 自动分类 SSTransformer模型 归一化 Stellar spectra Automatic classification SSTransformer model Normalized 
光谱学与光谱分析
2023, 43(8): 2523
作者单位
摘要
1 河北工业大学, 天津 300400
2 中国科学院国家天文台, 北京 100012
天体光谱处理中的一项基本任务是对大量的恒星光谱进行自动分类。 到目前为止, 恒星光谱的分类工作多是基于一维光谱数据。 该研究打破传统的天体光谱数据处理流程, 提出了基于二维恒星光谱分类的方法。 在LAMOST(the large sky area multi-object fiber spectroscopic telescope)的数据处理流程中, 所有的一维光谱都是由二维光谱抽谱、 合并得来。 二维光谱是由光谱仪产生的图像, 包括蓝端图像和红端图像。 基于LAMOST二维光谱数据, 提出了特征融合卷积神经网络(FFCNN)分类模型, 用于二维恒星光谱的分类。 该模型是一个有监督的算法, 通过两个CNN模型分别提取蓝端图像和红端图像的特征, 然后将二者进行融合得到新的特征, 再利用CNN对新特征进行分类。 所使用的数据全部来源于LAMOST, 我们在LMOST DR7中随机选择了一批源, 然后获得了它们的二维光谱。 一共有14 840根F, G和K型恒星的二维光谱用于FFCNN模型的训练, 其中包括7 420根蓝端光谱和7 420根红端光谱。 由于三类恒星光谱的数量并不均衡, 在训练的过程中分别为每类恒星光谱设置了不同权重, 防止模型出现分类失衡现象。 同时, 为了加快模型收敛, 对二维光谱数据采用Z-score归一化处理。 此外, 为了充分利用所有样本, 提高模型的可靠度, 采用五折交叉验证的方法验证模型。 3 710根二维光谱用作测试集, 使用准确率、 精确率、 召回率和F1-score来对FFCNN模型的性能进行评价。 实验结果显示, F, G和K型恒星的精确率分别达到87.6%, 79.2%和88.5%, 而且它们超过了一维光谱分类的结果。 实验结果证明基于FFCNN的二维恒星光谱分类是一种有效的方法, 它也为恒星光谱的处理提供了新的思路和方法。
二维恒星光谱 光谱分类 FFCNN模型 归一化 交叉验证 Two-dimensional stellar spectra Spectral classification FFCNN model Normalized Cross-validation 
光谱学与光谱分析
2022, 42(6): 1881
作者单位
摘要
1 齐齐哈尔大学计算机与控制工程学院, 黑龙江 齐齐哈尔 161006
2 梧州学院大数据与软件工程学院, 广西 梧州 543002
天文光谱线指数数据能够较好地保留着恒星的物理特征信息, 为此借助线指数特征数据构建多参数模型, 有利于更好地回归分析数据的共变关系及谱线的内在规律。 世界上光谱获取率最高的施密特天文望远镜LAMOST发布的观测光谱都已经过标记, 利用天文可视化工具分析这些标记的恒星光谱线指数会产生预测因子自相关, 多元线性回归时因变量存在共线性, 导致方差较大、得到最小二乘回归系数不稳定, 虽不影响使用回归的有效性, 但较难从回归方程中得到独立预测因子的评估系数。 利用LAMOST巡天光谱数据中A型恒星Lick线指数为数据源, 选取有效温度Teff为7 000~8 500 K, 取信噪比大于50的光谱特征值实现回归分析恒星参数Teff值, 经箱线图呈现DR5星表中, A型光谱86 097条具备Teff值大样本光谱数据的整体分布, 统计分析26种线指数的特征值后, 选取分布相似且带宽为12 的kp12, halpha12和hgamma12字段, 减少解释线指数变量的数目, 优化冗余变量方差膨胀因子(VIF)系数。 实验选取两两变量间观测数据集, 局部拟合回归散点、 同样的数据源使用散点图的总体轮廓生成高密度散点图, 利用色差透明性突出显示数据密集区域。 结果表明多元线性回归和岭回归算法都能从低分辨率光谱中确定A型恒星的有效温度, 但经过共线性数据分析有偏估计实验, 使用岭回归分析寻找最佳模型, 能更准确地确定恒星有效温度, 进而得到预测A型恒星有效温度及谱线回归特性。
恒星光谱 岭回归 线性模型 Lick线指数 Stellar spectra LAMOST LAMOST (Large sky area multi-object fiber spectros Ridge regression Linear model Lick line index 
光谱学与光谱分析
2019, 39(8): 2624
作者单位
摘要
1 攀枝花学院数学与计算机学院, 四川 攀枝花 617000
2 中北大学软件学院, 山西 太原 030051
恒星光谱分类是天文学研究的一个热点问题。 随着观测光谱数量的急剧增加, 传统的人工分类无法满足实际需求, 急需利用自动化技术, 特别是数据挖掘算法来对恒星光谱进行自动分类。 关联规则、 神经网络、 自组织网络等数据挖掘算法已广泛应用于恒星光谱分类。 其中, 支持向量机(SVM)分类能力突出, 被广泛应用于恒星光谱分类。 该方法试图在两类样本之间找到一个最优分类面将两类分开。 该方法具有较高的时间复杂度, 计算效率有限。 双支持向量机(TWSVM)的出现有效地解决了SVM面临的效率问题。 该方法通过构造两个非平行的分类面将两类分开, 每一类靠近某个分类面, 而远离另一个分类面。 TWSVM的计算效率较之传统SVM提高近4倍, 因此, 自TWSVM提出后便受到研究人员的持续关注。 但上述方法在分类决策时, 一方面没有考虑数据的分布特征, 另一方面较易受噪声点和奇异点的影响, 分类效率难以显著提升。 鉴于此, 在双支持向量机的基础上, 提出融合数据分布特征的模糊双支持向量机(TWSVM-SDP)。 该方法引入线性判别分析(LDA)的类间离散度和类内离散度, 用以表征光谱数据的分布性状; 引入模糊隶属度函数用以降低噪声点和奇异点对分类结果的影响。 在SDSS DR8恒星光谱数据集上的比较实验表明, 与支持向量机SVM、 双支持向量机TWSVM等传统分类方法相比, 融合数据分布特征的模糊双支持向量机TWSVM-SDP具有更优的分类能力。 该方法亦存在一定的局限性, 其中一大难题是其无法处理海量光谱数据。 接下来将利用大数据处理技术, 来对所提方法在大数据环境下的适应性展开进一步研究。
恒星光谱 分类 数据分布特征 模糊隶属度 双支持向量机 Stellar spectra Classification Spectral distribution properties Fuzzy membership function Twin support vector machine 
光谱学与光谱分析
2019, 39(4): 1307
作者单位
摘要
1 泉州信息工程学院软件学院, 福建 泉州 362000
2 中北大学软件学院, 山西 太原 030051
3 中国科学院新疆天文台, 新疆 乌鲁木齐 830011
4 辽宁科技大学理学院, 辽宁 鞍山 114051
恒星光谱分类是天文技术与方法领域一直关注的热点问题之一。 随着观测设备持续运行和不断改进, 人类获得的光谱数量与日俱增。 这些海量光谱为人工处理带来了极大挑战。 鉴于此, 研究人员开始关注数据挖掘算法, 并尝试对这些光谱进行数据挖掘。 近年来, 神经网络、 自组织映射、 关联规则等数据挖掘方法广泛应用于恒星光谱分类。 在这些方法中, 支持向量机(SVM)以其强大的学习能力和高效的分类性能而备受推崇。 SVM的基本思想是试图在两类样本之间找到一个最优分类面将两类分开。 SVM在求解时, 通过将其最优化问题转化为具有(QP)形式的凸问题, 进而得到全局最优解。 尽管该方法在实际应用中表现优良, 但为了进一步提高其分类能力, 有的学者提出双支持向量机(TSVM)。 该方法通过构造两个非平行的分类面将两类分开, 每一类靠近某个分类面, 而远离另一个分类面。 TSVM的计算效率较之传统SVM提高近4倍, 因此, 自TSVM提出后便受到研究人员的持续关注, 并出现若干改进算法。 在恒星光谱分类中, 一般分类算法都是根据历史观测光谱来建立分类模型, 其中最关键的是对光谱进行人工标注, 这项工作极为繁琐, 且容易犯错。 如何利用已标记的光谱以及部分无标签的光谱来建立分类模型显得尤为重要。 因此, 提出带无标签数据的双支持向量机(TSVMUD)用以实现对恒星光谱智能分类的目的。 该方法首先将光谱分为训练数据集和测试数据集两部分; 然后, 在训练集上进行学习, 得到分类依据; 最后利用分类依据对测试集上的光谱进行验证。 继承了双支持向量机的优势, 更重要的是, 在训练集上学习分类模型过程中, 不仅考虑有标记的训练样本, 也考虑部分未标记的样本。 一方面提高了学习效率, 另一方面得到更优的分类模型。 在SDSS DR8恒星光谱数据集上的比较实验表明, 与支持向量机SVM、 双支持向量机TSVM以及K近邻(KNN)等传统分类方法相比, 带无标签数据的双支持向量机TSVMUD具有更优的分类能力。 然而, 该方法亦存在一定的局限性, 其中一大难题是其无法处理海量光谱数据。 该工作将借鉴海量数据随机采样思想, 利用大数据处理技术, 来对所提方法在大数据环境下的适应性展开进一步研究。
恒星光谱 智能分类 双支持向量机 无标签数据 Stellar spectra Intelligent classification Twin support vector machine Unlabeled data 
光谱学与光谱分析
2019, 39(3): 948
作者单位
摘要
中北大学软件学院, 山西 太原 030051
支持向量机作为一种经典的分类方法被广泛应用于恒星光谱分类领域。 该方法在实际应用中取得了较为理想的分类效果, 但其面临无法解决多分类问题的挑战。 在支持向量机的基础上, 提出多类支持向量机, 建立基于多类支持向量机的恒星光谱分类模型。 该方法的最大优势是经过一次分类过程, 可以确定多类样本的类属。 SDSS DR8恒星光谱数据上的比较实验表明, 本研究所提的方法较之已有多分类方法在分类性能上有一定的提升。
支持向量机 多类支持向量机 恒星光谱 自动分类 Support vector machine Multi-class support vector machine Stellar spectra Automatic classification 
光谱学与光谱分析
2018, 38(7): 2307
作者单位
摘要
1 中北大学软件学院, 山西 太原 030051
2 中国科学院光学天文重点实验室, 北京 100012
数据挖掘被广泛应用于恒星光谱分类。 为了提高传统光谱分类方法性能, 提出熵学习机(Entropy-based Learning Machine, ELM)。 在该方法中, 熵用来刻画分类的不确定性。 为了得到理想的分类结果, 分类的不确定性应最小, 基于此, 可得ELM的最优化问题。 ELM在处理二分类问题和稀有光谱发现等方面具有一定优势。 SDSS中K型、 F型、 G型恒星光谱数据集上的比较实验表明: ELM在进行恒星光谱分类时, 其分类性能优于k近邻(k Nearest Neighbor)和支持向量机(Support Vector Machine)等传统分类方法。
数据挖掘 恒星光谱分类  斯隆数字巡天 Data mining Stellar spectra classification Entropy Sloan digital sky survey (SDSS) 
光谱学与光谱分析
2018, 38(2): 660
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
大规模光谱巡天将产生海量的光谱数据, 为搜寻一些奇异甚至于未知类型的光谱提供了机会, 对这些特殊天体的研究有助于揭示宇宙的演变规律和生命起源, 巡天数据的离群数据挖掘有助于这些特殊的光谱的发现。 利用线指数对光谱数据进行降维能够在尽可能多的保留光谱物理特征的同时, 有效解决高维光谱数据聚类分析中运算复杂度较高的问题。 提出了基于线指数特征的海量恒星光谱离群数据挖掘及分析的方法, 以恒星光谱的Lick线指数作为光谱数据的特征, 利用聚类搜寻离群数据的方法在海量光谱巡天数据搜寻离群数据, 以此为基础并给出线指数特征空间内离群光谱数据的分析方法。 实验结果证明: (1)以线指数作为光谱的特征值能快速的完成对高维光谱数据的离群数据挖掘, 可以解决高维光谱数据运算复杂度高的问题; (2)该方法是在聚类结果上进行的离群数据挖掘, 能够有效的挖掘出数量较少的发射线恒星、 晚M型恒星、 极贫金属星、 缺失数据光谱等数据; (3)线指数特征空间的离群数据挖掘可以得到线指数特征空间内特殊恒星的发现规则。 本文所提出的基于线指数特征的离群数据挖掘及分析方法可以应用到巡天数据的相关研究中。
Lick线指数 离群数据挖掘 恒星光谱 Lick line index Outlier datamining Stellar spectra 
光谱学与光谱分析
2016, 36(10): 3364
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
聚类分析是数据挖掘中用以发现数据分布和隐含模式的一种重要算法, 能简单有效地研究大样本、 多参量和类别未知的光谱数据。 以线指数作为光谱数据的特征值能够在尽可能多的保留光谱物理特征的同时, 有效解决高维光谱数据聚类分析中运算复杂度较高的问题。 本文提出了基于线指数特征的海量恒星光谱数据聚类分析的方法, 提取恒星光谱中的Lick线指数作为海量巡天光谱数据的特征, 使用k均值聚类算法完成对光谱数据的聚类, 然后对聚类结果进行有效的分析。 实验结果证明该方法能够快速有效地将具有相似物理特征的恒星光谱数据聚集到一起, 该方法可以应用到巡天数据的研究中。
Lick线指数 聚类分析 恒星光谱 Lick line index Clustering Stellar spectra 
光谱学与光谱分析
2016, 36(8): 2646
作者单位
摘要
1 辽宁科技大学理学院, 辽宁 鞍山 114051
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
近些年海量恒星光谱数据的获取使得恒星三个基本参数(表面有效温度Teff, 表面重力log g, 金属丰度[Fe/H])的自动测量方法研究成为一个重要的研究课题, 相应对恒星大气物理参数测量的研究将对科学家研究宇宙演化等重大科学问题具有重要的意义。 但是目前国内外针对此问题所做的研究并不是很广泛深入, 且已有的一些方法还不能够完全准确地估计出恒星的大气物理参数。 因此本文研究了一种基于质量估计的恒星大气物理参数自动测量方法, 该方法计算量比较小, 其主要思想是首先建立一些质量分布, 将原始光谱数据经过质量估计算法映射到新的质量空间, 然后在质量空间利用支持向量机回归对恒星的三个基本物理参数进行估计。 在实验中, 从SDSS-DR8光谱数据库中选择部分实测光谱数据来进行训练和测试, 并将该方法预测出的参数结果与SSPP给出的参数值进行了对比, 取得了比较理想的结果。 实验结果表明, 该研究方法的准确率更高, 预测结果更稳定, 训练所用的时间短, 在恒星大气物理参数自动测量上是行得通的, 可以有效地测量恒星的大气物理参数。
恒星光谱 参数测量 质量估计 Stellar spectra Parameter measurement Mass estimation 
光谱学与光谱分析
2015, 35(11): 3204

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!