作者单位
摘要
太原科技大学计算机科学与技术学院, 山西 太原 030024
针对LAMOST DR5 pipeline分类为Unknown的光谱数据对其进行了特征提取和聚类分析。 主要工作如下: (1) 基于影响空间及数据场的特征提取。 首先基于影响空间从低信噪比光谱中提取出大量小集团; 然后计算各小集团内部的场并根据场对光谱排序, 依次访问光谱序列及其小集团内的成员来获得特征谱; (2) 对上述特征谱进行K-means聚类, 并统计了每一类目标所在天区、 观测视宁度、 各波段信噪比、 亮度、 光谱仪/光纤的分布情况。 (3) 低质量光谱聚类结果的理论分析。 通过聚类所有低质量光谱被分为了5大簇: A 光谱信噪比较低或与传统分类模板差异较大, 但通过特征分析可确定其类别(占比2.7%); B 光谱蓝端或红端出现疑似特征线或分子带, 但与线表无法匹配(占比23.6%); C 光谱蓝端信噪比极低, 且该波长区域噪声值较强, 其他波长区域的连续谱和线的特征较弱(占比48.0%); D 红蓝两端拼接问题导致5 700~5 900 Å局部光谱突起明显, 其他波长区域的连续谱和线的特征较弱(占比24.2%); E 存在大量缺省值导致无法确定其类别(占比1.5%)。 实验结果表明, 该方法不仅能够有效提取低信噪比光谱的特征谱, 同时能够通过特征谱的聚类分析揭示低质量光谱的成因, 从而为制定光谱观测计划提供参考, 为低信噪比光谱分析及处理提供方法借鉴。
低信噪比光谱 光谱分解 特征分析 数据场 聚类分析 Low-SNR spectra Spectral decomposition Feature analysis Data field Clustering analysis 
光谱学与光谱分析
2022, 42(4): 1186
作者单位
摘要
太原科技大学计算机科学与技术学院, 山西 太原 030024
类星体是人类所观测到的最遥远天体, 对于了解早期宇宙的演化具有重要科学意义。 由于类星体距离地球较远, 其红移一般较大, 导致在光学观测窗口中只有很少的特征(发射线), 且难以识别。 类星体光谱的异常特征提取与分析可对未知类星体的识别, 提供有效的判别依据。 离群检测作为数据挖掘领域的一个主要研究内容, 旨在发现那些稀有、 特殊数据对象及异常特征, 可作为从海量类星体光谱数据中, 发现特殊、 未知类星体的一种有效途径和手段。 Spark作为新一代大数据分布式处理框架, 可为海量天体光谱的有效分析和处理, 提供一个高效且可靠的并行编程平台。 本文充分利用集群系统和Spark编程模型的强大数据处理能力, 提出一种基于稀疏子空间的类星体光谱异常特征并行提取与分析方法, 其工作由三个模块组成, 即类星体光谱特征约减、 类星体光谱的稀疏子空间构造和搜索、 类星体光谱异常特征提取并行算法设计与分析。 类星体光谱特征约减模块, 通过属性相关性分析来识别呈现聚类结构的类星体光谱特征线, 这些特征线通常会聚集在稠密区域且对类星体光谱异常特征检测毫无意义。 光谱特征约减旨在运行异常特征检测算法之前剪枝类星体光谱的冗余特征线, 缩小光谱数据检测范围。 类星体光谱的稀疏子空间构造和搜索模块, 通过设定的稀疏系数阈值来测量类星体光谱的子空间密度, 并采用粒子群优化方法作为稀疏子空间的搜索策略, 从而快速、 高效地获取类星体的异常特征。 在第三个模块中, 提出了一种MapReduce框架下的类星体光谱异常数据并行检测算法, 该算法由并行化数据约减策略、 稀疏子空间并行搜索技术两个MapReduce构成, 达到适应海量光谱数据的处理目标。 最后对检测出的部分类星体异常特征进行了理论分析、 测量及人眼证认, 充分说明稀疏子空间可为识别特殊、 未知类星体候选源, 提供有效支持和有力证据。
类星体 稀疏子空间 郭守敬望远镜(LAMOST) 光谱分析 Quasi-stellar object Sparse subspace LAMOST Spectral analysis 
光谱学与光谱分析
2021, 41(4): 1086
作者单位
摘要
太原科技大学计算机科学与技术学院, 山西 太原 030024
LAMOST一期巡天成功获取河外星系光谱超过150 000条, 大样本光谱数据为探索奇异、 稀有的天体从而完善现有的天体演化理论提供了必要的数据条件; 而先进的信息技术为从海量的数据中挖掘这些珍稀样本提供了有效途径。 针对采用基于DoPS的数据挖掘方法, 从LAMOST DR5星系光谱数据获得的离群数据挖掘结果中, 呈现出疑似P-Cygni轮廓特征的光谱J152238.11+333136.1进行了深入讨论。 首先针对该光谱的基本信息、 疑似P-Cygni轮廓特征以及相应的离群数据挖掘方法进行了简要表述, 光谱在Hβ和[OⅢ]λ4860处呈现P-Cygni轮廓, 在NeⅢλ3869和HeⅠλ5874处呈现反P-Cygni轮廓; 其次, 对该特征的真实性及其生成机制从以下4个角度展开讨论。 (1)交叉同源观测。 Sloan巡天2004年(相差11年)的同源观测, 其光谱上并未呈现对应的特征, 据推测可能是正在进行的演化活动或者光纤定位误差所致; (2)通过分析光谱质量、 减天光残差等方法, 分析P-Cygni特征是否为观测或数据处理所致。 NeⅢλ3869和HeⅠλ5874处呈现反P-Cygni轮廓可信度较低; 同时, 通过比较目标光谱与超级天光, 以及相邻光纤观测到的光谱在对应波长处的光谱特征, 说明存在 P-Cygni轮廓为减天光过程导致的可能性; (3)光谱子型差异。 IRAS和WISE等近红外同源观测, 显示其为Seyfert 2型星系, 光学波段发射线强比[NⅡ]/Hα, [OⅢ]/Hβ显示其为HⅡ区, 结合光学、 红外测光图像特征, 推测目标可能是两个星系进行并合活动; (4)从导致P-Cygni轮廓的物理机制的角度, 分析了由星系并合触发外流、 由恒星形成(爆发)电离气体触发的外流以及由Wolf-Rayet特征星系的超星风等原因引起的可能性。
P-Cygni轮廓 郭守敬望远镜(LAMOST) 离群特征 P-Cygni profiles Outflows Outflows LAMOST Outlier characteristics 
光谱学与光谱分析
2020, 40(4): 1304
作者单位
摘要
1 太原科技大学计算机科学与技术学院, 山西 太原 030024
2 中国科学院国家天文台光学天文重点实验室, 北京 100012
低分辨率天体光谱中呈现的双峰发射线轮廓可能反映着比较珍稀的物理现象, 如双活动星系核(AGNs)、 双超大质量黑洞(SMBH)、 喷流云与窄线区的相互作用, 也可能是光谱处理过程产生的低质量特征线。 双峰发射线轮廓一般由2个或2个以上的波峰构成, 对该特征进行提取并分析, 可作为双AGN、 星系对、 双黑洞等稀有天体更有效的搜寻依据, 从而有助于更深入地研究星系乃至宇宙的形成与演化。 提出一种新的基于相关子空间的双峰发射线特征提取与分析方法, 主要工作分为以下三部分: 首先利用稀疏差异因子δ度量双峰发射线光谱中属性差异程度, 利用KNN方法约束参与稀疏差异因子计算的光谱范围, 在此基础上, 针对LAMOST低分辨率光谱给出基于相关子空间的特征提取方法; 其次, 为了验证稀疏差异因子σ以及KNN的输入参数k对双峰发射线光谱的适应性, 选择LAMOST双峰发射线光谱样本及普通星系光谱数据, 红移范围z<0.3(确保Hα, Hβ, [OⅢ]λλ4 959, 5 007, [NⅡ]λλ6 548, 6 584, [SⅡ]λλ6 717, 6 731等发射线落在LAMOST波长覆盖范围), 获得训练集光谱总数332+332(正负样本)条, 并借助人眼检查分析该方法中的两个参数: k和δ阈值α对结果的影响, 实验表明, 当k=18, α=0.6时, 相关属性分布较密集且稀疏点较少, 结果比较理想; 最后, 对332条双峰发射线光谱特征子空间所在的波长区间、 双峰红/蓝移间隔、 双峰线强比等进行了理论分析、 测量及人眼认证的基础上, 给出了基于相关子空间的双峰发射线特征表述。 此外, 从双峰特征子空间上不同的发射线激发机制([OⅢ]/[NⅡ]/[SⅡ]等禁线、 Hα、 Hβ等氢线)及相关特征子空间上线强关系等角度, 对样本中双峰轮廓进行了分析。
双峰发射线 相关子空间 郭守敬望远镜(LAMOST) 光谱分析 Double-peaked emission lines Relevant subspace LAMOST Spectral analysis 
光谱学与光谱分析
2019, 39(6): 1677
作者单位
摘要
1 太原科技大学计算机科学与技术学院, 山西 太原 030024
2 中国科学院国家天文台光学天文重点实验室, 北京 100012
天光背景扣除是LAMOST 1D光谱数据处理中重要的环节, 其扣除好坏直接影响光谱产品质量, 因此构造理想的超级天光光谱模型具有重要的意义。 通常超级天光是由与目标天体同时观测的天光光纤光谱构造而成, 同一区域的天光背景可能随着不同的观测时刻有着规律性的变化特征(如月相变化), 如果能充分分析并利用这些特征, 可有效校正超级天光模型, 从而提高减天光效果。 轨迹聚类方法是一种分析目标随时、 空变化特征的有效工具, 针对LAMOST天光光谱中可能存在的变化规律, 给出一种基于轨迹聚类的天光光谱特征分析方法。 主要分以下三部分: 首先是天光光谱的时序化描述。 LAMOST pipeline采用且提供了每个观测天体的即时超级天光光谱, 为了获取特定天区背景天光的光变特征, 需选择天光光纤光谱以及扣除目标天体光谱的背景光谱, 以5°视场(LAMOST望远镜视场)为单位, 按观测日期MJD均匀分组, 从而对特定区域的天光光谱进行了时序化表征; 其次给出基于密度的天光光谱数据聚类算法STK-means。 为解决随机参数导致收敛及聚类效果不理想的问题, 在分析天光光谱时序数据特征的基础上, 给出基于密度的相似性度量公式, 并作为传统k-means聚类的初始参数选择依据, 从而给出基于密度的天光光谱数据聚类算法STK-means; 最后进行实验分析。 实验验证了该方法的正确性和有效性以及不同初始参数K值的选择对聚类结果的影响。 在此基础上, 利用STK-means聚类方法, 对LAMOST第一期巡天中一个完备小天区的天光光谱时序数据进行了轨迹特征分析, 结果表明, 除个别光谱质量较差或常说异常外, 该特定区域的天光背景以农历每月十五、 十六为中心向两边呈对称分布, 反映了该区域观测过程中受月相的影响变化情况, 该特征经量化后可为校正超级天光模型提供一种有效途径。 同时, 由于时序化描述过程中均匀采样的要求, 该方法可适用于反银心、 盘、 晕等高天体数密度区域, 而对于高银纬低数密度区域则需要更长时间的巡天观测。 此外, 该方法还可有效发现特定区域的离群(异常)天光光谱, 为天文学家进一步分析提供珍稀样本。
天光背景 轨迹聚类 多目标光纤光谱 郭守敬望远镜(LAMOST) Sky background Trajectory clustering Multi-object fibre spectroscopy LAMOST 
光谱学与光谱分析
2019, 39(4): 1301
作者单位
摘要
1 太原科技大学计算机科学与技术学院, 山西 太原 030024
2 中国科学院国家天文台光学天文重点实验室, 北京 100012
LAMOST巡天已获取超过100 000条星系光谱, 为探索珍贵、 稀有的天体从而完善现有科学理论提供了重要的数据条件。 研究采用基于相关子空间的离群挖掘方法, 从LAMOST DR3星系光谱数据中获得的离群数据挖掘结果中, 针对呈现出多种稀有特征的光谱J140242.45+092049.8进行了深入分析。 首先利用特征光谱线进行红移测量并交叉SDSS同源光谱提供的红移信息, 测量并证认了该光谱的两套红移系统: 吸收线系统z1=0.020 95、 发射线系统z2=0.069 5。 从整体上, 通过交叉现有文献及SDSS图像特征, 分析了该“吸收+发射”模式的双红移系统属于透镜星系的可能性, 而红移间隔Δz=0.048远大于Keel指出的双星系具有物理关系的临界0.008, 意味着该目标前景与背景星系之间只是视向重叠, 即视向星系对, 没有相互的物理作用; 对于前景星系(吸收线系统), 通过测量光谱中呈现的特殊的特征线强度, 分析了属于E+A星系的可能性; 对于背景星系(发射线系统)光谱中呈现的双峰特征, 分析了该光谱来自双峰发射线星系的可能性; 此外, 初步分析了该光谱中背景星系发射线强度关系异常的原因。
双红移系统 透镜星系 星系对 离群数据 Dual-redshift systems Lens Galaxy pairs Outlier mining 
光谱学与光谱分析
2017, 37(4): 1269
作者单位
摘要
太原科技大学计算机科学与技术学院, 山西 太原030024
探索海量的M型恒星中具有磁活动、 巨星等较特殊、 稀有的天体, 对于后续观测、 银河系结构、 演化等科学研究具有重要的意义, 针对M型恒星光谱特征线出现在子空间中的局部偏离, 设计并实现了晚型恒星离群数据挖掘系统。 首先采用稀疏因子和稀疏度系数度量样本在属性空间上的分布特征, 并在此基础上对M型恒星光谱特征线进行离散化、 降维等预处理, 获得光谱子空间; 然后采用微粒群算法搜索离群子空间, 并证认子空间内光谱是否离群; 此外, 选择SDSS M型光谱特征线指数集为样本, 实验分析了稀疏因子和稀疏度系数的设置对离群结果的影响, 并将离群挖掘结果与SDSS提供光谱型等参数对照, 表明利用该系统实现晚型恒星光谱特征线局部离群数据挖掘是可行并有价值的。
局部离群 光谱特征线 子空间 Local outlier Spectra characteristic line Subspace 
光谱学与光谱分析
2014, 34(5): 1421
作者单位
摘要
太原科技大学计算机科学与技术学院, 山西 太原030024
频繁模式是频繁出现在数据集中的模式, 在数据挖掘中起着非常重要的作用。 针对恒星光谱分类任务, 在频繁模式的基础上, 提出一种基于分类模式树的恒星光谱分类规则挖掘方法。 首先根据数据库中恒星光谱各属性出现的频率不同, 其在分类中的重要程度也不同的特征, 提出一种新的树型结构——分类模式树, 给出了相关概念及其构造方法SSCPTC, 然后, 将恒星光谱的特征信息映射到分类模式树上, 通过采用自顶向下和自底向上两种模式相结合的方法对分类模式树进行遍历, 实现分类规则的提取, 同时引入模式有用度的概念来调整分类规则的数量、 提高分类模式树的构造效率; 最后采用国家天文台提供的SDSS恒星光谱作为实验数据, 验证了该方法的正确性, 而且具有较高的分类正确率。
恒星光谱 分类规则 模式有用度 决策属性 Star spectrum Classification rule Pattern capability Decision attribute 
光谱学与光谱分析
2013, 33(10): 2875
作者单位
摘要
太原科技大学计算机科学与技术学院, 山西 太原030024
随着LAMOST巡天的逐步实施, 天体光谱数据量极大, 对观测数据进行自动分类及分析具有重要的意义。 采用常规方法获取的分类规则集中, 往往存在大量冗余规则, 影响了分类效率和质量。 本文给出了一种基于谓词逻辑的分类规则后处理方法, 通过利用谓词描述光谱分类规则, 并对分类规则集进行谓词演算, 消除冗余规则。 最后, 采用LAMOST观测的恒星光谱数据, 实验验证该方法在保证分类准确率不降低的前提下, 可大幅提高自动分类效率。
天体光谱数据 分类规则 谓词逻辑 后处理 Data mining Classification rule Predicate logic Post processing Stellar spectra data 
光谱学与光谱分析
2013, 33(1): 237
作者单位
摘要
1 太原科技大学计算机科学与技术学院, 山西 太原 030024
2 太原科技大学机械电子工程学院, 山西 太原 030024
3 中国科学院国家天文台, 北京 100012
变星对人类研究宇宙的起源与发展具有重要意义, 对于变星研究的困难首先源于对变星的筛选和识别, 即如何从海量恒星光谱数据中有效识别变星光谱。 传统的异常数据定义试图通过不同的方式寻找异常数据与一般模式之间的偏差, 进而予以定量分析和筛选。 然而, 这种方法的时间复杂度过大, 且结果存在不可理解和无法解释的问题。 文章利用熵可以反映系统有序程度与稳定程度的特性, 引入信息熵作为衡量数据集一般模式的标准, 提出了基于信息熵的变星光谱快速识别方法。 该方法显著降低了算法的时间复杂度, 有效地消除了人为主观因素对识别结果的影响。 采用国家天文台提供的Sloan数字巡天数据实验验证了该方法的可行性和有效性。
变星光谱 信息熵 异常数据 Variable star spectrum Information entropy Outlier mining 
光谱学与光谱分析
2012, 32(1): 255

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!