作者单位
摘要
1 厦门大学电子科学系, 福建省等离子体与磁共振研究重点实验室, 福建 厦门 361005
2 厦门大学通信工程系, 福建 厦门 361005
3 Department of Bioprocess Engineering & Institute of Bioproduct Development, Universiti Teknologi Malaysia, Skudai81310, Malaysia
在基于核磁共振(NMR)的代谢组学数据分析中, 尺度缩放是关键的预处理步骤之一, 其主要目的是通过调整数据的方差结构, 改善后续的多变量统计分析的结果。 从信息熵的角度出发, 利用Kullback-Leibler (K-L)散度来度量不同实验分组的生物样品的1H NMR波谱数据的差异程度, 并结合单位方差缩放法, 提出一种基于K-L散度的尺度缩放方法。 该方法先利用单位方差法将数据各变量的标准差调整到同一水平上, 再利用K-L散度对各变量进行有监督地加权, 增强重要变量、 减弱无关变量。 由于K-L散度是在概率分布的意义上度量数据间的差异程度, 且对于高斯和非高斯分布的数据均适用, 因此能更准确地度量不同实验分组样品的1H NMR波谱数据的差异性, 从而更有效地地对谱数据的重要变量进行识别和加权。 人群尿液1H NMR波谱数据的分析结果表明, 基于K-L散度的尺度缩放方法能有效抑制噪声变量, 同时很好地区分特征变量和非特征变量; 提高主成分回归(PCR)模型的判别能力; 改善偏最小二乘回归判别分析(PLS-DA)模型的解释能力、 预测能力以及对特征代谢物的辨识能力。
尺度缩放 K-L散度 核磁共振波谱 代谢组学 特征代谢物 Data scaling K-L divergence rate NMR-based metabolomics Metabolic signatures 
光谱学与光谱分析
2014, 34(10): 2868
作者单位
摘要
厦门大学电子科学系, 福建省等离子体与磁共振研究重点实验室, 福建 厦门 361005
谱峰对齐是基于核磁共振的代谢组学数据预处理过程中的一个重要环节, 谱峰对齐效果直接影响后续的多变量统计分析。提出了一种基于高斯平滑的谱峰对齐算法(GPA)。算法通过调节高斯卷积函数的窗口大小, 实现波谱信号的多尺度平滑, 进而由粗到细、逐步实现波谱信号的谱峰对齐。真实的核磁共振波谱实验结果表明: GPA算法可以快速准确地实现谱峰对齐, 且对齐后的波谱信号在平均相似度、后续统计模型的解释能力等综合性能上的表现明显优于相关优化解缠(COW)和多尺度谱峰对齐(MSPA)等常用谱峰对齐算法。
谱峰对齐 高斯平滑 核磁共振波谱 peak alignment Gaussian smoothing nuclear magnetic resonance (NMR) spectrum 
光电技术应用
2013, 28(2): 51
作者单位
摘要
厦门大学电子科学系,福建省等离子体与磁共振研究重点实验室, 福建 厦门 361005
代谢组学数据不可避免地受到各种刺激因素的作用,如何降低干扰因素的影响是代谢组学数据预处理的一个重要任务。详细分析了代谢组学数据方差的构成及其在特征空间中的分布特点,并在此基础上提出一种滤除未知干扰因素的新方法,提高感兴趣因素的显著性。文中采用真实的代谢组学数据验证新滤波算法的有效性,并与正交信号校正 (orthogonalsignal correction,OSC)方法进行比较。实验结果表明,新滤波方法可以在抑制未知干扰因素影响的同时,较好地保留感兴趣因素信息以及生物体内在的个体差异信息,降低模型发生过拟合的危险,使后续的统计分析结果更可靠。
代谢组学 干扰因素 主成分分析(PCA) metabolomics disturbing factors principal component analysis (PCA) 
光电技术应用
2012, 27(1): 60

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!