基于机器学习的BiFeO3-PbTiO3-BaTiO3固溶体居里温度预测
钙钛矿结构BiFeO3-PbTiO3(BF-PT)基压电陶瓷具有准同型相界(MPB)与高居里温度(Tc), 在智能机电系统传感器、滤波器和驱动器等方面有广泛的应用前景[1⇓⇓-4]。
近年来, 数据驱动的机器学习(Machine Learning, ML)材料研究方法引起了学界的广泛关注[6⇓⇓-9]。ML越来越多地被应用于分子科学、材料科学和生物科学等领域[10⇓-12]。数据驱动+机器学习的研究范式显著加速了探索复杂陶瓷样本空间的材料研究。与传统实验或演绎方法不同, ML通过正交展开、模式识别、人工神经网络和遗传算法等方式对材料进行优化设计并取得了良好的效果[13⇓⇓-16]。然而, 关于钙钛矿结构压电材料的宏观极化与组分关系方面的仿真设计结果仍差强人意[17]; 利用高通量密度泛函理论筛选高性能压电材料在准确性等方面也值得商榷[18]。
Lookman等[19]小数据集主动学习模型加速了目标性能陶瓷的实验合成, 具体步骤包括: (i)训练已有数据集并建立预测模型; (ii)预测最高性能未知体系的组分; (iii)实验验证该组分的性能; (iv)把新的数据加入原始数据集, 并重新训练得到新的模型; (v)重复以上过程若干次, 直到获得足够满意的高性能陶瓷。这套方法适用于目标性能陶瓷的快速设计。然而, 一个非常重要的技术问题是构建小数据集机器学习模型时, 如何选择好的特征描述符?Askanazi等[20]对比了一系列“黑箱”回归算法(如K-近邻算法、支持向量机、随机森林等), 并指出输入回归模型的特征变量的选择对小数据集模型非常重要。
OUYANG等[21] 基于压缩感知理论提出了一套SISSO (Sure Independence Screening and Sparsifying Operator)特征工程研究框架[22-23]。该方法从基础物理量出发, 构造大量稀疏的高维描述符, 然后根据关联性降维筛选最有效的描述符, 并给出描述符与目标之间的函数关系。他们应用SISSO得到了不同氧化态和任意配位时的离子半径, 扩展了Shannon离子半径数据库。
本研究以课题组BiFeO3-PbTiO3-BaTiO3 (BF- PT-BT)三元系固溶体压电陶瓷的Tc实验数据为对象, 利用SISSO进行数据挖掘, 建立材料组分和Tc之间的量化关系。首先, 从热力学角度, 采用约合质量作为反映组分变化的描述符; 然后, 根据化学式构造更多基础描述符, 通过机器学习筛选描述符并得出合适的预测模型; 最后, 通过外部验证预测模型的可靠性。最终建立的一种多维度、多描述符、反映组分和性能关系的量化模型能够快速、简单、有效地预测钙钛矿结构压电陶瓷的居里温度。
1 数据集和描述符
首先, 选取22个BF-PT-BT三元系压电陶瓷的组分和居里温度实验数据[24], 建立内部训练集; 再选取3个相同体系实验数据作为外部测试集[25], 这些数据均在同一实验环境下采用传统的固相反应法制得。通过测量材料的介电常数随温度升高的变化, 将100 kHz频率下的介电常数变化的峰值对应的温度作为居里温度。居里温度为材料的本征参数与组分的关联性较大, 因此机器学习预测的准确率会较高且实用性较强。
Goldschmidt容忍因子作为特征参数被应用在描述钙钛矿晶体和陶瓷材料上已约100年, 现被大量回归算法机器学习模型所使用。然而该容忍因子主要用于描述氧转模式和铁电模之间的关联性, 或者说结构相关性质, 其本身就是基础特征rA和rB(A位和B位离子半径)的高维复合的一种数学表示。但该容忍因子在描述居里温度上存在一定的局限性。基于SISSO方法可以自动地构造出比它更优异的“新容忍因子”, 在判断是否为钙钛矿结构的精度可以达到92%, 而Goldschmidt容忍因子只有近75%。针对BF-PT-BT固溶体居里温度预测, 本工作只选择了rA和rB作为基础特征, 而构造类似容忍因子的过程则交给SISSO自动实现。最终选出了4个最重要的高维变量(即xi的函数)并用其构造出了回归模型函数y, 后续章节将验证该高维变量模型的精度。
表 1. 基础描述符及其物理意义
Table 1. Basic descriptor and related physical meaning
|
2 数据处理和机器学习
从热力学角度, 钙钛矿结构氧化物原胞的涨落可以用约合质量μ来描述[28], 用下列公式计算:
其中,
3 结果和讨论
3.1 二次多项式拟合
3.2 特征变量选择
为降低预测误差, 引入
其中, xi是第i个样本的描述符参数, pi和ei分别为Tc的预测值和实验值, n是样本数量。
图 4. 不同运算方式下μ和μ*A/B随维度变化的RMSE和MaxAE
Fig. 4. RMSE and MaxAE of μ and μ*A/B varied with dimension under different operation modes
采用运算方式2,
图 5. 采用两个描述符(a)和三个描述符(b)拟合结果的RMSE和MaxAE随维度的变化
Fig. 5. RMSE and MaxAE of two descriptors (a) and three descriptors (b) as a function of dimension
图 6. 描述符的变化和模型维度对拟合结果RMSE和MaxAE的影响
Fig. 6. Effects of the changes of descriptor and model dimension on the RMSE and MaxAE
3.3 模型的建立与验证
其中, a=1.977447895, b=2.964590758, c= 1.778816427, d=0.063342758, e=647.6695156, xi是基础描述符。该预测模型的RMSE为0.59 ℃, MaxAE为1.38 ℃。
表 2. 调整描述符参数后的测试集
Table 2. The test sets after adjusting descriptor parameters
|
模型中出现次数最多的为x1、x2和x3(μ、A/B和A/B_NU), 分别出现了7、6和5次, 说明μ、A/B和A/B_NU的确对Tc影响较大, 这与相关性和SISSO的误差分析结果一致。
表 3. 外部验证集结果
Table 3. Results of external verification set
|
图 7. 训练集(黑色方块)和测试集(红色圆形)的实验Tc与预测Tc
Fig. 7. Experimental Tc and prediction Tc for training set (black square) and test set (red circle)
4 结论
从热力学角度, Tc与约合质量μ的二次多项式关系表明, Tc随μ增加而上升, 但拟合结果误差较大。选取六个相对独立的基础描述符, 通过SISSO复杂运算构建得到的四维预测模型显著提升了预测精度。其中,μ、A/B和A/B_NU对Tc影响最大。预测模型的RMSE为0.59 ℃, MaxAE为1.38 ℃, 验证集的MRE为1.00%。描述符的选取(拆分、比值、约合)和修正方式还可以进一步降低预测误差。本课题构建的四维预测模型既可以用于预测其它陶瓷体系的居里温度, 还可以进一步用于构建主动学习框架, 能够快速、简便地预测钙钛矿型压电陶瓷的居里温度。
[5] 谢颖.ABO3型钙钛矿的相变机理表面稳定性和电子结构的理论研究. 哈尔滨: 黑龙江大学出版社, 2015.
[6] MURPHYK.Machine learning:a probabilistic perspective. Cambridge: The MIT Press, 2012, 58(8):27-71.
[7] PEDREGOSAF, VAROQUAUXG, GRAMFORTA, et al.Scikit- learn: machine learning in python. Journal of Machine Learning Research, 2011, 12(10):2825-2830.
[12] RANDHAWAG, HILLK, KARIL.ML-DSP: Machine learning with digital signal processing for ultrafast, accurate, and scalable genome classification at all taxonomic levels. BioMed Central, 2019, 20(1):267-23.
[21] OUYANGR, CURTAROLOS, AHMETCIKE, et al.SISSO: A compressed-sensing method for identifying the best low-dimensional descriptor in an immensity of offered candidates. Phys. Rev. Mater., 2018, 2(8):083802.
[24] NINGZ.Dielectric, ferroelectric, piezoelectric and aging properties of BiFeO3-PbTiO3-BaTiO3 high temperature piezoelectric ceramics. Shanghai: Master Thesis, Shanghai University, 2020.
[25] TUT.Fabrication of BF-PT-BT high temperature piezoelectric ceramics and sensors. Shanghai: Master Thesis, Shanghai University, 2017.
[27] BUTLERK, FROSTJ, SKELTONJ, et al.Computational materials design of crystalline solids. Che. Soc. Rev., 2016, 45(22):6138-6146.
[29] UUSIE, MALMJ, IMAMURAN, et al.Characterization of RMnO3 (R=Sc, Y, Dy-Lu): high-pressure synthesized metastable perovskites and their hexagonal precursor phases. Materials Chemistry & Physics, 2008, 112(3):1029-1034.
焦志翔, 贾帆豪, 王永晨, 陈建国, 任伟, 程晋荣. 基于机器学习的BiFeO3-PbTiO3-BaTiO3固溶体居里温度预测[J]. 无机材料学报, 2022, 37(12): 1321. Zhixiang JIAO, Fanhao JIA, Yongchen WANG, Jianguo CHEN, Wei REN, Jinrong CHENG. Curie Temperature Prediction of BiFeO3-PbTiO3-BaTiO3 Solid Solution Based on Machine Learning[J]. Journal of Inorganic Materials, 2022, 37(12): 1321.