作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
特殊恒星是金属丰度异常的恒星, 其中包含的信息对于研究宇宙起源、 太阳系的演变以及生命的演化都有着重要的意义。 因此, 特殊恒星的搜寻是国内外巡天项目中的重要目标。 恒星光谱中包含着恒星的化学成分、 物理性质以及运动状态等丰富的信息, 它是开展恒星研究的重要依据。 恒星的识别、 分类以及特殊恒星的发现主要依据的是恒星光谱数据。 随着LAMOST和SDSS等国内外大规模数字巡天项目的深入展开, 恒星光谱的数据量达到了前所未有的高度, 如此大的数据量为特殊恒星的发现提供了强有力的支撑。 因此如何利用这些数据快速准确地发现特殊、 稀少甚至于未知类型的恒星光谱是天文学研究的重要问题。 数据挖掘是结合模式识别、 机器学习、 统计分析及相关专家背景知识, 从数据中提取出隐含的过去未知的有价值的潜在信息的技术, 其在处理大数据方面有着天然的优势, 越来越多的数据挖掘方法被应用到巡天数据处理及分析之中。 目前针对特殊恒星搜寻的数据挖掘算法主要包含随机森林、 聚类分析以及异常值检测等, 但随着巡天深度的拓展, 观测的目标越来越暗, 进而观测光谱的信噪比也随之变低。 低信噪比光谱中存在着大量的无用信息, 直接利用相关算法对其进行分析处理得到的结果往往存在很大的偏差。 因此, 如何从大量低信噪比恒星光谱巡天数据中有效地搜寻出特殊的恒星光谱, 是当前面临的一个重要问题。 由于低信噪比恒星光谱本身的特点, 对于从中搜寻特殊恒星光谱的工作开展较少。 为了解决此问题, 在仔细研究光谱数据处理方法的基础上, 针对低信噪比巡天数据中特殊恒星光谱的搜寻, 提出了一种以主成分分析(PCA) 和基于密度峰值聚类为基础的方法。 该方法首先选取O, B, A, F, G, K和M各种类型的高信噪比恒星光谱, 进行波长统一和流量插值后, 利用主成分分析得到特征光谱; 然后利用方差贡献率最大的前几个特征光谱对低信噪比的恒星光谱进行重构得到高信噪比的光谱; 最后利用重构之后的高信噪比光谱进行聚类, 聚类分析中得到的离群数据即为所要搜寻的特殊恒星光谱。 在聚类时, 考虑到恒星光谱数据本身的特点, 采用了一种基于密度峰值的聚类方法来进行聚类及离群点的挖掘。 实验表明, 该方法能够在低信噪比的恒星光谱巡天数据中准确地搜寻出数量相对较少的特殊恒星。 同时, 也可应用于诸如LAMOST、 SDSS等各种银河系巡天的光谱数据分析与挖掘中。
银河系巡天 离群数据挖掘 低信噪比光谱 Galaxy survey Outlier data mining Low SNR spectra 
光谱学与光谱分析
2019, 39(2): 618
作者单位
摘要
天津大学精密测试技术及仪器国家重点实验室, 天津 300072
温度变化是影响近红外无创血糖测量精度的主要因素之一。 为降低温度变化对近红外漫反射光谱的影响, 提出了一种基于温度不敏感源-探测器距离的测量方法, 即在漫反射光强对人体组织温度变化不敏感的源-探测器距离处进行光谱测量。 利用Monte Carlo方法模拟了温度为30~40 ℃、 葡萄糖浓度为0~300 mmol·L-1的皮肤组织在多个源-探测器距离处的漫反射光强。 根据模拟结果, 分析了人体皮肤组织模型中温度不敏感源-探测器距离的存在性及其受葡萄糖浓度变化的影响; 比较了1 000 nm处温度恒定和温度变动时, 不同源-探测器距离处漫反射光强与葡萄糖浓度的相关性; 进一步地, 利用六个波长(1 000, 1 050, 1 100, 1 150, 1 350和1 410 nm)下的温度不敏感源-探测器距离及其他距离处的漫反射光强, 建立了葡萄糖的偏最小二乘(PLS)模型, 并比较了这些模型在温度恒定和温度变动时的预测精度。 结果表明, 在1 000~1 440 nm范围内, 人体存在温度不敏感源-探测器距离, 且葡萄糖浓度变化对该距离的影响可以忽略不计; 当组织温度变化时, 温度不敏感源-探测器距离处的漫反射光强与葡萄糖浓度的相关性及建模效果均明显优于其他源-探测器距离, 基本接近样品温度恒定时的情况。 研究表明, 基于温度不敏感源-探测器距离的测量方法能有效降低温度变化对漫反射光强的影响, 有望提高近红外漫反射无创血糖测量的精度。
近红外漫反射光强 无创血糖测量 Monte Carlo模拟 温度不敏感源-探测器距离 Near-infrared diffuse reflectance Non-invasive blood glucose sensing Monte Carlo simulation Temperature insensitive source-detector separation 
光谱学与光谱分析
2018, 38(10): 3163
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 哈尔滨理工大学荣成学院, 山东 威海 264300
3 中国科学院光学天文重点实验室, 国家天文台, 北京 100012
恒星的连续谱是由于黑体辐射导致的光辐射强度随波长(频率)连续光滑变化的光谱。 每条观测到的光谱数据中都会包含连续谱、 谱线和噪声。 恒星的分类主要是依据光谱的谱线、 连续谱的相对强度以及光谱的其他特征。 恒星连续谱的分布以及谱线的轮廓是由恒星大气内的物理因素决定的, 也可以根据连续谱及谱线对恒星大气的物理参数进行估计。 因而处理光谱的主要问题就是提取连续谱, 并且通过归一化进行谱线的提取。 恒星连续谱提取的算法主要有多项式逼近、 中值滤波、 形态滤波以及小波滤波等, 但是这些方法对于低质量光谱处理的鲁棒性不是很好, 因此有必要研究一种新的算法对低质量光谱的连续谱进行提取。 在仔细分析恒星低质量连续谱的基础上, 提出一种基于蒙特卡罗方法的低质量恒星连续谱拟合方法。 该方法对恒星光谱筛选过程中不在范围内的点利用蒙特卡罗均匀分布进行自动插值, 让每一个波长都对应一个流量点, 然后对这些流量点进行低阶多项式迭代拟合, 从而得到连续谱。 为了验证算法对不同信噪比的低质量光谱连续谱提取的鲁棒性, 利用不同的信噪比在原始光谱中加入不同的高斯白噪声对低质量光谱进行模拟。 结果表明蒙特卡罗算法对不同信噪比的低质量光谱的拟合具有较高的精度与较强的鲁棒性。
低质量光谱 连续谱 蒙特卡罗 随机分布 Low-quality spectrum Spectrum continuum Monte Carlo Uniform distribution 
光谱学与光谱分析
2018, 38(3): 963
刘杰 1潘景昌 1吴明磊 1,2刘聪 1[ ... ]刘猛 1
作者单位
摘要
1 山东大学(威海)机电与信息工程学院, 山东 威海 264209
2 哈尔滨理工大学(荣成校区), 山东 威海 264209
3 中国科学院光学天文重点实验室, 中国科学院国家天文台, 北京 100012
大规模光谱巡天项目如LAMOST等产生了海量极具研究价值的观测数据, 如何对此数量级的数据进行有效的分析是当前的一个研究热点。 聚类算法是一类无监督的机器学习算法, 可以在不依赖于领域知识的情况下对数据进行处理, 发现其中的规律与结构。 恒星光谱聚类是天文数据处理中一项非常重要的工作, 主要对海量光谱巡天数据按照其物理及化学性质分类。 针对LAMOST巡天中的早M型矮恒星的光谱数据, 使用多种聚类算法如K-Means, Bisecting K-Means和OPTICS算法做了聚类分析, 研究不同聚类算法在早M型恒星数据的表现。 聚类算法在一定程度依赖于其使用的距离度量算法, 同时研究了欧氏距离、 曼哈顿距离、 残差分布距离和上述三种聚类算法搭配下的表现。 实验结果表明: (1)聚类算法可以很好地辅助分析早M型矮恒星的光谱数据, 聚类产生的簇心数据和MK分类吻合得非常好。 (2)三种不同聚类算法表现不尽相同, Bisecting K-Means在恒星光谱细分类方面更有优势。 (3) 在聚类的同时也会产生一些数量较少的簇, 从这些簇中可以发现一些稀有天体候选体, 相对而言OPTICS适合用来寻找稀有天体候选体。
聚类 降维 LAMOST LAMOST Clustering Dimension reduction 
光谱学与光谱分析
2017, 37(12): 3904

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!