太原科技大学计算机科学与技术学院, 山西 太原030024
连续数值属性离散化是天文光谱数据预处理中的主要研究内容之一。 针对天文光谱特征线, 提出了一种基于改进模糊C均值聚类的天文光谱特征线软离散化算法。 该算法首先利用样本的密度值选取特征线的候选初始模糊聚类中心, 有效地克服了对噪声数据敏感的缺陷; 其次采用决策表中的相容性作为评判标准, 动态的调节聚类参数, 以达到优化的光谱特征线离散化效果; 最后采用晚型星、 类星体、 高红移类星体SDSS天文光谱特征线数据集。 实验验证了该算法具有较高的识别率, 为天文光谱特征线数据预处理提供了一种新途径。
天文光谱 特征线 离散化 模糊聚类 软划分 Celestial spectrum Characteristic line Discretization Fuzzy clustering Soft partition 光谱学与光谱分析
2012, 32(5): 1435