相同关键词【Data mining】论文列表 -- 中国光学期刊网

作者单位

摘要

上海交通大学电子信息与电气工程学院, 薄膜与微细加工教育部重点实验室, 上海 200240

能源储存系统是电动汽车、电子设备等高新技术的重要基础。近年来基于机器学习的电池设计能够快速连结材料微观结构?材料微观性能?电池宏观性能的复杂关系, 成为了热点研究。本文从能源电池的微观材料设计和宏观状态预测两方面系统性地综述了电池设计中机器学习的应用现状和前景, 概括综述了机器学习电池设计的研究数据来源、算法的优缺点及其在电池领域的应用场景以及近年来的相关创新性工作及其展望, 以期为机器学习在能源储存系统的宏微观设计提供了参考。

机器学习数据挖掘电池材料电池状态 machine learning data mining battery materials battery state

PDF全文 Full Text

硅酸盐学报

2023, 51(2): 438

智能电网

基于能源大数据关联规则挖掘方法的电网稳定运行研究

吴岩杜雪松付宇恒

作者单位

摘要

国网四川省电力公司信息通信公司, 四川成都 610061

随着各行各业用电需求的不断增长, 我国的电网规模也不断提升。电网在线运行的历史数据呈现爆发式增加, 在能源大数据背景下如何有效利用历史数据以达到对电网系统在线运行状态的稳定评估是一个巨大的挑战。在能源大数据背景下, 通过采用数据挖掘方法, 建立关联分析模型, 实现了对电网调度运行特点及规律的自动挖掘, 最后采用某省级调度中心5个月的在线历史数据进行离线分析。根据发掘出的电网运行规则表明建立的模型能够提高对电网的在线分析能力, 验证了所提出方法的有效性。

电力系统数据挖掘关联规则调度工作智能电网 power systems data mining association rules scheduling efforts smart grid

PDF全文 Full Text

光学与光电技术

2022, 20(4): 139

光通信系统与网络技术

基于数据挖掘的多波段激光数据分类算法研究

赵丽莉 ^*

作者单位

摘要

长春理工大学光电信息学院，长春 130000

针对多波段激光干涉图像中的频谱数据混叠问题，文章提出了一种基于数据挖掘技术的自相关提取分类算法。首先，采用自相关计算模式完成数据属性分类; 然后，通过属性隶属度函数作为判据设计了基于特征数据挖掘的自回归平均模型; 最后，采用时序衰减权值系数循环迭代的方式完成数据挖掘。实验对混合激光光源进行测试，并与传统均值分类算法和最小二乘法分类算法作了对比。仿真结果表明，该算法的分类平均误差为0.110，优于另外两种算法(0.191和0.167)，并且在相同数据总量的条件下该算法的耗时最少。由此可见，该算法对多波段激光干涉图像中混叠数据的有效分离具有很好的改善作用，在混叠数据分类应用中具有一定的实用价值。

PDF全文 Full Text

光通信研究

2021, 47(6): 12

光通信与光传感

基于贝叶斯分区数据挖掘的光纤网络异常分析算法

刘云朋 ¹霍晓丽 ¹刘智超 ^2,*

作者单位

摘要

¹ 焦作大学信息工程学院，河南焦作 454000

² 长春理工大学光电工程学院，吉林长春 130000

光纤网络通信中异常信息的快速、准确识别是保证通信稳定的关键，随着光纤网络通信数据的激增，也成为了近年来的一个研究热点。文中结合异常信息识别算法的精度与收敛速度之间的制约机理，提出了基于贝叶斯分区数据挖掘的异常信息识别算法。首先，采用贝叶斯定量完成数据样本的特征分类，通过极大化分析修正先验概率；然后，依据异常信息的不同类型设置挖掘特征参数及概率化系数；最后，依据贝叶斯分区分别对样本数据进行具有针对性的数据挖掘。实验以光纤局域网的通信状态数据为样本，将该算法与人工神经网络算法和遗传算法的识别结果进行对比，计算了三种算法的识别正确率、收敛速度以及算法稳定性。该算法的识别正确率均值为93.83%，在数据量增大时未发生明显的降低。收敛速度与遗传算法相近，均值为3.25 s。漏检率和误检率均值分别为0.10%和0.54%。结果表明：该算法识别正确率与收敛速度均得到了提高，稳定性好，并能够在漏检率与误检率之间通过参数控制进行微调，具有较好的应用价值。

光纤网络异常信息识别数据挖掘贝叶斯分区 optical fiber network abnormal information identification data mining Bayesian partition

PDF全文 Full Text

红外与激光工程

2021, 50(8): 20210121

科研论文

基于有限样本的大气偏振模式生成方法

甘鑫 ^1,2高欣健 ^1,*钟彬彬 ^1,2王昕 ^1,2[ ... ]高隽 ^1,2

作者单位

摘要

¹ 合肥工业大学计算机与信息学院，安徽合肥 230009

² 合肥工业大学图像信息处理研究室，安徽合肥 230009

³ 合肥高创股份有限公司，安徽合肥 230088

大气偏振模式在导航等领域具有广阔的应用前景，但是由于受到大气偏振信息采集装置物理特性的限制，在同一时刻只能获得局部的、不连续的偏振信息，对实际应用产生影响。针对此问题，本文通过挖掘大气偏振模式分布的连续性，提出一种大气偏振模式生成方法，从局部的偏振信息生成全天域的大气偏振模式。此外，偏振信息往往受到不同的天气条件、地理环境等因素的影响，而这些偏振数据在真实环境中难以采集。针对此问题，本文挖掘不同天气、地理条件下有限样本数据之间的多样性关系，以此关系将生成的大气偏振模式泛化到不同的条件下。本论文在仿真数据和实测数据上进行了实验，并与其它最新方法进行对比，实验结果证明了本文方法的优越性和鲁棒性。

大气偏振模式生成有限样本驱动偏振数据挖掘 atmospheric polarization mode generation few-shot driven polarization data mining

PDF全文 Full Text

光电工程

2021, 48(5): 200331

信号与信息处理、计算机与控制

基于决策树的听力损失致病基因筛查方法

郭宇 ^*李凤美陈雨行洪凯程 [ ... ]陈晓禾

作者单位

摘要

中国科学院苏州生物医学工程技术研究所, 江苏苏州 215163

\确定出生缺陷高危致病基因类型, 推进遗传性疾病早期筛查和生育指导, 对于先天性听力损失等出生缺陷的一级预防具有重要意义。本文采用通用数据挖掘工具, 应用其决策树算法分析了近千例 GJB2基因突变检测的临床数据, 建立了听力出生缺陷的致病基因辅助筛查模型。通过研究模型树的结构和样本分类结果, 发现模型树中有 5组分支获得了纯净的听力损失阳性样本。此外, 每个分支构成的基因位点的状态集合与临床研究证实的致病基因突变状态相一致。该决策树方法建立的筛查模型可以协助医生从临床大数据中快速筛选出致病基因的类型。

临床大数据听力损失决策树基因筛查数据挖掘 \clinical big data hearing loss decision tree genetic screening data mining artificial intelligence

PDF全文 Full Text

太赫兹科学与电子信息学报

2020, 18(4): 703

低信噪比巡天数据中特殊恒星光谱的搜寻方法

吴明磊 ^1,*潘景昌 ¹衣振萍 ¹韦鹏 ²

作者单位

摘要

¹ 山东大学(威海)机电与信息工程学院, 山东威海 264209

² 中国科学院光学天文重点实验室, 国家天文台, 北京 100012

特殊恒星是金属丰度异常的恒星, 其中包含的信息对于研究宇宙起源、太阳系的演变以及生命的演化都有着重要的意义。因此, 特殊恒星的搜寻是国内外巡天项目中的重要目标。恒星光谱中包含着恒星的化学成分、物理性质以及运动状态等丰富的信息, 它是开展恒星研究的重要依据。恒星的识别、分类以及特殊恒星的发现主要依据的是恒星光谱数据。随着LAMOST和SDSS等国内外大规模数字巡天项目的深入展开, 恒星光谱的数据量达到了前所未有的高度, 如此大的数据量为特殊恒星的发现提供了强有力的支撑。因此如何利用这些数据快速准确地发现特殊、稀少甚至于未知类型的恒星光谱是天文学研究的重要问题。数据挖掘是结合模式识别、机器学习、统计分析及相关专家背景知识, 从数据中提取出隐含的过去未知的有价值的潜在信息的技术, 其在处理大数据方面有着天然的优势, 越来越多的数据挖掘方法被应用到巡天数据处理及分析之中。目前针对特殊恒星搜寻的数据挖掘算法主要包含随机森林、聚类分析以及异常值检测等, 但随着巡天深度的拓展, 观测的目标越来越暗, 进而观测光谱的信噪比也随之变低。低信噪比光谱中存在着大量的无用信息, 直接利用相关算法对其进行分析处理得到的结果往往存在很大的偏差。因此, 如何从大量低信噪比恒星光谱巡天数据中有效地搜寻出特殊的恒星光谱, 是当前面临的一个重要问题。由于低信噪比恒星光谱本身的特点, 对于从中搜寻特殊恒星光谱的工作开展较少。为了解决此问题, 在仔细研究光谱数据处理方法的基础上, 针对低信噪比巡天数据中特殊恒星光谱的搜寻, 提出了一种以主成分分析(PCA) 和基于密度峰值聚类为基础的方法。该方法首先选取O, B, A, F, G, K和M各种类型的高信噪比恒星光谱, 进行波长统一和流量插值后, 利用主成分分析得到特征光谱; 然后利用方差贡献率最大的前几个特征光谱对低信噪比的恒星光谱进行重构得到高信噪比的光谱; 最后利用重构之后的高信噪比光谱进行聚类, 聚类分析中得到的离群数据即为所要搜寻的特殊恒星光谱。在聚类时, 考虑到恒星光谱数据本身的特点, 采用了一种基于密度峰值的聚类方法来进行聚类及离群点的挖掘。实验表明, 该方法能够在低信噪比的恒星光谱巡天数据中准确地搜寻出数量相对较少的特殊恒星。同时, 也可应用于诸如LAMOST、 SDSS等各种银河系巡天的光谱数据分析与挖掘中。

银河系巡天离群数据挖掘低信噪比光谱 Galaxy survey Outlier data mining Low SNR spectra

PDF全文 Full Text

光谱学与光谱分析

2019, 39(2): 618

基于熵学习机的恒星光谱分类

刘忠宝 ^1,*任娟娟 ²宋文爱 ¹张静 ¹[ ... ]富丽贞 ¹

作者单位

摘要

¹ 中北大学软件学院, 山西太原 030051

² 中国科学院光学天文重点实验室, 北京 100012

数据挖掘被广泛应用于恒星光谱分类。为了提高传统光谱分类方法性能, 提出熵学习机(Entropy-based Learning Machine, ELM)。在该方法中, 熵用来刻画分类的不确定性。为了得到理想的分类结果, 分类的不确定性应最小, 基于此, 可得ELM的最优化问题。 ELM在处理二分类问题和稀有光谱发现等方面具有一定优势。 SDSS中K型、 F型、 G型恒星光谱数据集上的比较实验表明: ELM在进行恒星光谱分类时, 其分类性能优于k近邻(k Nearest Neighbor)和支持向量机(Support Vector Machine)等传统分类方法。

数据挖掘恒星光谱分类熵斯隆数字巡天 Data mining Stellar spectra classification Entropy Sloan digital sky survey (SDSS)

PDF全文 Full Text

光谱学与光谱分析

2018, 38(2): 660

LAMOST-DR1中激变变星光谱的数据挖掘研究

姜斌 ¹李紫宣 ¹曲美霞 ¹王文玉 ¹罗阿理 ²

作者单位

摘要

¹ 山东大学(威海)机电与信息工程学院, 山东威海 264209

² 中国科学院国家天文台, 北京 100012

LAMOST-DR1是郭守敬望远镜正式巡天发布的首批数据, 其数量超过目前世界上所有已知恒星巡天项目的光谱总数。这为进一步扩大特殊和稀少天体如激变变星的数量提供了样本, 同时也对天文数据处理方法和技术提出了更高的要求。针对LAMOST的数据特点, 提出一种能够在海量天体光谱中自动、快速发现激变变星的方法。该方法使用拉普拉斯特征映射对天体光谱进行降维和重构。结果表明不同类别的天体光谱在拉普拉斯空间中能够得到较明显的区分。在使用粒子群算法对神经网络的参数进行优化后, 对LAMOST-DR1的全部数据进行了自动识别。实验共发现了7个激变变星, 经过证认, 其中2个是矮新星, 2个是类新星, 1个是高度极化的武仙座AM型。这些光谱, 补充了现有的激变变星光谱库。本文验证了拉普拉斯特征映射对天体光谱进行特征提取的有效性, 为高维光谱进行降维提供了另一途径。在郭守敬望远镜正式发布的数据中寻找激变变星的首次尝试, 实验结果表明该自动化的方法鲁棒性好, 速度快, 准确率高。该方法也可用于其他大型巡天望远镜的海量光谱处理。

数据挖掘拉普拉斯特征映射激变变星 Data mining Laplacian eigenmap Cataclysmic variables

PDF全文 Full Text

光谱学与光谱分析

2016, 36(7): 2275

光电技术应用

一种改进的CLIQUE高维子空间聚类算法

王东 ^*王理想范伟

作者单位

摘要

重庆理工大学计算机科学与工程学院, 重庆 400054

分析了经典的CLIQUE聚类算法，阐述了该算法存在的局限性，针对该算法时间复杂度高和聚类精度低的问题，提出了一种改进的CLIQUE聚类算法；改进的算法不仅具有传统CLIQUE算法的优点，而且利用降低冗余维度和备份密集单元数据库D′的策略，大大降低了搜索成本和时间复杂度；且进一步用混合网格划分技术替代原有算法的固定网格划分技术，提高了聚类结果的精度，保留了密集单元的完整性。

子空间聚类维聚类挖掘类分析 subspace clustering high-dimensional clustering data mining clustering analysis

PDF全文 Full Text

半导体光电

2016, 37(2): 275

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索