Nature Communications:美科学家开发自适应性机器学习框架,有效加速新材料研发进程


据近期Nature Communications上的一篇文章所述,美国研究人员基于一种与实验紧密耦合的信息科学适应性设计,加速了具有目标性能新材料的发现进程。换句话来说,就是利用一个可控性相对较好的实验数据集,反复引导后续实验,以发现所需目标性能的新材料。

为了解决新材料的发现逐渐依赖于反复试验这个问题,他们开发了一个新的框架,即利用不确定性来迭代指导下一个实验的进行。该项目的工作集中于生成和筛选由成千上万的量子力学运算组成的数据库。然而,材料结构的相互作用、化学自由度和微观结构自由度引入了巨大的复杂性,尤其是涉及到了缺陷、固溶体、非整比化合物和多组分化合物时,就算当前最先进工具也无法设计解决。

该研究比较关注镍钛形状记忆合金,但实际上可以用于任何材料(聚合物、陶瓷或纳米材料)和目标属性(如介电响应,压电系数或带隙)。不仅如此,它还可以广义的优化多个属性。以镍钛合金来说,不仅可以降低损耗,还能将相变温度优化到只高于室温几度。总的来说,利用高性能超级计算资源,该团队设计了建立在机器学习基础和设计上的数据驱动框架,有效的加速发现具有目标属性新材料的进程。

【图文导读】

图一 适应性设计环形图

图片1

图中的所指的相关领域知识,包括之前的实验数据和物理模型,用以描述材料及其相关特性。这些信息应用于机器学习框架,进行包括误差估计在内的多种预测(统计学推理)。预测的结果用于实验设计工具(例如全局优化工具箱),以模型的改进和材料的发现为目标,然后建议继续进行新实验(材料合成与表征)。最后把结果反馈回数据库,为下一次迭代循环提供输入数据。绿色箭头表示利用实验或运算技术发展水平的步进式方法环形图,该法目前鲜有研究证明及反馈。图中的红星表示相比于4号样品,3号样品即使不是最好的选择,但由于巨大的不确定性,系统更期望3号样品进行改进,从而继续进行下面的实验和反馈。

图二 示例合金设计及其实验循环示意图

图片2

图中循环如下:(i)以有着已知热耗散ΔT、材料特性或材料描述的初始合金数据集作为推理模型的输入信息 。(ii)模型经多次训练,并与初始合金数据进行交叉验证(统计学推理)。(iii)建立一个未知的合金的数据集,定义为所有可能候选合金的全部搜索空间。将(ii)中的训练模型应用于(iii)中的所有合金,并预测它们的热耗散ΔT。(iv)选择四个“最佳”候选合金进行合成和表征。(v)已测ΔT的新合金增加了初始数据集,并进一步优化推理和设计。四个合金的实验部分采用迭代法,通过推理和设计,可以得到有着每种新预测ΔT的初始数据集,且每个循环后合金的初始数据集将扩大四倍。

图三 推理和设计组合

图片3

本图显示了有关镍钛形状记忆合金训练数据集的回归量:选择器组合,以及各个回归量:选择器组合的相对性能。横坐标绘制了从训练集里初始随机选择的数量,以构建统计推断模型。纵坐标是选择的平均数量,以找到训练集中最低热滞后ΔT的合金。经回归量:选择器组合发现,最佳的合金出现在选择尽可能少的时候。图中可以看出,对于镍钛形状记忆合金,SVRrbf:KG(连续红线)是最好的回归量:选择器组合。

注:SVR:Support Vector Regression 支持向量回归

GPM:Gaussian Process Model 高斯过程动态模型

KG:Knowledge Gradient  知识梯度

EGO:Efficient Global Optimization 高效全局优化算法

brf:radial basis function 径向基函数

lin: linear kernel 线性核函数

Min:minimum 最小值

图三 推理全局优化结果与思考

图片4

图3a 图为实验测量的热滞后ΔT与循环迭代次数的函数曲线,插图为其预测曲线。迭代0是22种合金的原始训练集。从1开始的每一次迭代都会合成四个新预测的合金。迭代次数为1和2的ΔT预测值和测量值之间差别很大,到迭代3-6次时显著降低,超过7次后又持续增加。这三个阶段可以理解为,在早期迭代中进行举例性探索,在中间迭代找到了一个合理的最小值,然后在后面的迭代中持续新的探索。

图3b 热滞后ΔT与价电子数的函数曲线说明:迭代3次后,在一个狭窄区域内有明显的低值,这有利于立方体转变为斜方六面体,且与立方体转变为正交晶系或单斜晶系相比,该值为已知的最小ΔT(全局最低值)。例如,由于SVRrbf:KG型回归量:选择器组合探索到在6.95附近的局部最小值,最终发现了Ti50.0Ni46.7Cu0.8-Fe2.3Pd0.2合金。(插图为价电子数6.9至7.00的区域放大图)

图3c 如图所示,图为四种合成合金的平均价电子数量与迭代数的函数,显示了在该特征空间内自适应设计的探索性质(迭代1、2次和7次后的标准差/误差线)。误差线表示四个样品的价电子数标准偏差。第十个迭代表明设计明显偏离了全局最低值( 在y轴约6.96处)。

图四 Ti50.0Ni46.7Cu0.8Fe2.3Pd0.2合金的实验测量值

图片5

图4a 图为新合金Ti50.0Ni46.7Cu0.8Fe2.3Pd0.2的电阻率随温度变化曲线。与NiTi相比,新合金表现出非常小的迟滞现象。插图为 Ni50Ti50的电阻率随温度变化曲线。

图4b Ti50.0Ni46.7Cu0.8Fe2.3Pd0.2的DSC曲线中两吸收峰之差ΔT为1.84 K,这是镍钛形状记忆合金材料有关记录中的最低值。同时热循环后(60次加热和冷却循环)也只有非常小的偏移(如插图所示,约为0.02 K),表明优良的抗热疲劳性能。

新闻链接:Machine learning accelerates the discovery of new materials

文献链接:Accelerated search for materials with targeted properties by adaptive design

材料人组建了材料人材料计算交流QQ群,欢迎从事材料计算的材料人们加入!QQ群号:562663183。

感谢材料人编辑部尉谷雨提供素材

分享到