作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
特殊恒星是金属丰度异常的恒星, 其中包含的信息对于研究宇宙起源、 太阳系的演变以及生命的演化都有着重要的意义。 因此, 特殊恒星的搜寻是国内外巡天项目中的重要目标。 恒星光谱中包含着恒星的化学成分、 物理性质以及运动状态等丰富的信息, 它是开展恒星研究的重要依据。 恒星的识别、 分类以及特殊恒星的发现主要依据的是恒星光谱数据。 随着LAMOST和SDSS等国内外大规模数字巡天项目的深入展开, 恒星光谱的数据量达到了前所未有的高度, 如此大的数据量为特殊恒星的发现提供了强有力的支撑。 因此如何利用这些数据快速准确地发现特殊、 稀少甚至于未知类型的恒星光谱是天文学研究的重要问题。 数据挖掘是结合模式识别、 机器学习、 统计分析及相关专家背景知识, 从数据中提取出隐含的过去未知的有价值的潜在信息的技术, 其在处理大数据方面有着天然的优势, 越来越多的数据挖掘方法被应用到巡天数据处理及分析之中。 目前针对特殊恒星搜寻的数据挖掘算法主要包含随机森林、 聚类分析以及异常值检测等, 但随着巡天深度的拓展, 观测的目标越来越暗, 进而观测光谱的信噪比也随之变低。 低信噪比光谱中存在着大量的无用信息, 直接利用相关算法对其进行分析处理得到的结果往往存在很大的偏差。 因此, 如何从大量低信噪比恒星光谱巡天数据中有效地搜寻出特殊的恒星光谱, 是当前面临的一个重要问题。 由于低信噪比恒星光谱本身的特点, 对于从中搜寻特殊恒星光谱的工作开展较少。 为了解决此问题, 在仔细研究光谱数据处理方法的基础上, 针对低信噪比巡天数据中特殊恒星光谱的搜寻, 提出了一种以主成分分析(PCA) 和基于密度峰值聚类为基础的方法。 该方法首先选取O, B, A, F, G, K和M各种类型的高信噪比恒星光谱, 进行波长统一和流量插值后, 利用主成分分析得到特征光谱; 然后利用方差贡献率最大的前几个特征光谱对低信噪比的恒星光谱进行重构得到高信噪比的光谱; 最后利用重构之后的高信噪比光谱进行聚类, 聚类分析中得到的离群数据即为所要搜寻的特殊恒星光谱。 在聚类时, 考虑到恒星光谱数据本身的特点, 采用了一种基于密度峰值的聚类方法来进行聚类及离群点的挖掘。 实验表明, 该方法能够在低信噪比的恒星光谱巡天数据中准确地搜寻出数量相对较少的特殊恒星。 同时, 也可应用于诸如LAMOST、 SDSS等各种银河系巡天的光谱数据分析与挖掘中。
银河系巡天 离群数据挖掘 低信噪比光谱 Galaxy survey Outlier data mining Low SNR spectra 
光谱学与光谱分析
2019, 39(2): 618
作者单位
摘要
1 太原科技大学计算机科学与技术学院, 山西 太原 030024
2 中国科学院国家天文台光学天文重点实验室, 北京 100012
LAMOST巡天已获取超过100 000条星系光谱, 为探索珍贵、 稀有的天体从而完善现有科学理论提供了重要的数据条件。 研究采用基于相关子空间的离群挖掘方法, 从LAMOST DR3星系光谱数据中获得的离群数据挖掘结果中, 针对呈现出多种稀有特征的光谱J140242.45+092049.8进行了深入分析。 首先利用特征光谱线进行红移测量并交叉SDSS同源光谱提供的红移信息, 测量并证认了该光谱的两套红移系统: 吸收线系统z1=0.020 95、 发射线系统z2=0.069 5。 从整体上, 通过交叉现有文献及SDSS图像特征, 分析了该“吸收+发射”模式的双红移系统属于透镜星系的可能性, 而红移间隔Δz=0.048远大于Keel指出的双星系具有物理关系的临界0.008, 意味着该目标前景与背景星系之间只是视向重叠, 即视向星系对, 没有相互的物理作用; 对于前景星系(吸收线系统), 通过测量光谱中呈现的特殊的特征线强度, 分析了属于E+A星系的可能性; 对于背景星系(发射线系统)光谱中呈现的双峰特征, 分析了该光谱来自双峰发射线星系的可能性; 此外, 初步分析了该光谱中背景星系发射线强度关系异常的原因。
双红移系统 透镜星系 星系对 离群数据 Dual-redshift systems Lens Galaxy pairs Outlier mining 
光谱学与光谱分析
2017, 37(4): 1269
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
大规模光谱巡天将产生海量的光谱数据, 为搜寻一些奇异甚至于未知类型的光谱提供了机会, 对这些特殊天体的研究有助于揭示宇宙的演变规律和生命起源, 巡天数据的离群数据挖掘有助于这些特殊的光谱的发现。 利用线指数对光谱数据进行降维能够在尽可能多的保留光谱物理特征的同时, 有效解决高维光谱数据聚类分析中运算复杂度较高的问题。 提出了基于线指数特征的海量恒星光谱离群数据挖掘及分析的方法, 以恒星光谱的Lick线指数作为光谱数据的特征, 利用聚类搜寻离群数据的方法在海量光谱巡天数据搜寻离群数据, 以此为基础并给出线指数特征空间内离群光谱数据的分析方法。 实验结果证明: (1)以线指数作为光谱的特征值能快速的完成对高维光谱数据的离群数据挖掘, 可以解决高维光谱数据运算复杂度高的问题; (2)该方法是在聚类结果上进行的离群数据挖掘, 能够有效的挖掘出数量较少的发射线恒星、 晚M型恒星、 极贫金属星、 缺失数据光谱等数据; (3)线指数特征空间的离群数据挖掘可以得到线指数特征空间内特殊恒星的发现规则。 本文所提出的基于线指数特征的离群数据挖掘及分析方法可以应用到巡天数据的相关研究中。
Lick线指数 离群数据挖掘 恒星光谱 Lick line index Outlier datamining Stellar spectra 
光谱学与光谱分析
2016, 36(10): 3364
作者单位
摘要
1 中北大学计算机与控制工程学院, 山西 太原 030051
2 山西大学商务学院信息学院, 山西 太原 030031
由于人类对宇宙的认识有限, 因此, 如何通过对光谱数据分析发现一些新的、 特殊的天体成为天文学家面临的重要课题。 目前, 常见特殊天体发现方法的基本思想是利用智能分类算法对离群数据进行分析。 然而, 当前主流分类算法大多对离群数据不敏感, 分类性能甚至受离群点影响较大, 因而无法完成特殊天体发现任务。 鉴于此, 提出基于模糊大间隔最小球分类模型的离群数据挖掘方法, 该方法利用部分一般样本和离群样本建立最小球模型, 并在此基础上引入模糊技术, 通过降低噪声的权重, 尽量减少噪声的影响。 与C-SVM, SVDD, KNN等传统分类方法在SDSS恒星光谱数据集上的比较实验表明所提方法的有效性。
恒星光谱 分类 模糊大间隔最小球 离群数据 Stellar spectrum Classification Fuzzy large margin and minimum ball Spectra outlier data 
光谱学与光谱分析
2016, 36(4): 1245
作者单位
摘要
太原科技大学 计算机科学与技术学院,山西 太原 030024
寻找特殊的、未知的天体是人类探索宇宙奥妙所追求的目标之一,天体光谱数据挖掘是实现该目标的一种有效方法。约束概念格是一种新的概念格结构,具有构造效率高、提取知识针对性和实用性强等特点。针对天体光谱数据在特征子空间中的局部偏离,采用VC++ 6.0和Oracle 9i作为开发工具,设计与实现了基于约束概念格的天体光谱局部离群数据挖掘系统,并对软件模块功能和体系结构,以及天体光谱数据预处理、约束概念格构造方法、基于链表结构的概念格构造、局部离群数据挖掘方法等关键技术进行了详细描述。 运行结果表明,该系统实现天体光谱数据局部离群数据挖掘是可行的、有价值的,从而为寻找未知的、特殊的天体提供了一种新途径。
天体光谱 局部离群数据 约束概念格 稠密子空间 稀疏度系数 Celestial body spectrum Local outliers Constrained concept lattice Dense subspace Sparsity coefficient 
光谱学与光谱分析
2009, 29(2): 551

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!