作者单位
摘要
太原科技大学计算机科学与技术学院, 山西 太原 030024
类星体是人类所观测到的最遥远天体, 对于了解早期宇宙的演化具有重要科学意义。 由于类星体距离地球较远, 其红移一般较大, 导致在光学观测窗口中只有很少的特征(发射线), 且难以识别。 类星体光谱的异常特征提取与分析可对未知类星体的识别, 提供有效的判别依据。 离群检测作为数据挖掘领域的一个主要研究内容, 旨在发现那些稀有、 特殊数据对象及异常特征, 可作为从海量类星体光谱数据中, 发现特殊、 未知类星体的一种有效途径和手段。 Spark作为新一代大数据分布式处理框架, 可为海量天体光谱的有效分析和处理, 提供一个高效且可靠的并行编程平台。 本文充分利用集群系统和Spark编程模型的强大数据处理能力, 提出一种基于稀疏子空间的类星体光谱异常特征并行提取与分析方法, 其工作由三个模块组成, 即类星体光谱特征约减、 类星体光谱的稀疏子空间构造和搜索、 类星体光谱异常特征提取并行算法设计与分析。 类星体光谱特征约减模块, 通过属性相关性分析来识别呈现聚类结构的类星体光谱特征线, 这些特征线通常会聚集在稠密区域且对类星体光谱异常特征检测毫无意义。 光谱特征约减旨在运行异常特征检测算法之前剪枝类星体光谱的冗余特征线, 缩小光谱数据检测范围。 类星体光谱的稀疏子空间构造和搜索模块, 通过设定的稀疏系数阈值来测量类星体光谱的子空间密度, 并采用粒子群优化方法作为稀疏子空间的搜索策略, 从而快速、 高效地获取类星体的异常特征。 在第三个模块中, 提出了一种MapReduce框架下的类星体光谱异常数据并行检测算法, 该算法由并行化数据约减策略、 稀疏子空间并行搜索技术两个MapReduce构成, 达到适应海量光谱数据的处理目标。 最后对检测出的部分类星体异常特征进行了理论分析、 测量及人眼证认, 充分说明稀疏子空间可为识别特殊、 未知类星体候选源, 提供有效支持和有力证据。
类星体 稀疏子空间 郭守敬望远镜(LAMOST) 光谱分析 Quasi-stellar object Sparse subspace LAMOST Spectral analysis 
光谱学与光谱分析
2021, 41(4): 1086
作者单位
摘要
1 华南师范大学数学科学学院, 广东 广州510631
2 潍坊教育学院会计与统计学院, 山东 青州2625
随着高质量CCD传感器技术的日渐成熟与广泛应用, 以及许多大型巡天计划的相继实施, 天体数据量极大, 因此天体观测数据的自动识别、 分析问题首当其冲。 文章在原始测量空间使用最近邻方法(NN)研究了正常星系与类星体光谱的识别问题。 正常星系和类星体属于河外天体, 一般距离地球较远, 其观测光谱会受到许多干扰, 所以这两类天体光谱的分类在光谱自动识别研究中具有一定的代表性。 同时, 采用的NN是模式识别和数据挖掘方面的基准性方法, 在许多新方法的评估中, 往往以NN方法的性能作为比较对象。 从实用价值来说, 研究表明, NN方法的类星体和正常星系光谱识别率与文献中复杂方法的最好结果相当, 但该文方法不需要进行分类器的训练, 利于实时进行增量式学习和并行实现, 这对海量光谱数据的快速处理有重要意义。 因此, 该研究具有重要的理论参考意义和一定的实用价值。
天体光谱分类 最近邻方法 正常星系 类星体 Spectra classification Nearest neighbor method Galaxy Quasar(quasi-stellar object QSO) 
光谱学与光谱分析
2011, 31(9): 2582

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!