斯坦福大学PRL:使用代理机器学习模型开发用于NEB计算的低标度算法


【引言】

NEB算法是用于计算化学体系中过渡态最为常用的方法。这种算法一般通过寻找反应物和产物转化的最小能量路径,来识别与两能态之间的势垒有关的能量。NEB算法及其很多变体都依赖于含有原子结构的内插图像的弹性带,这些图像又被称为移动图像。这些图像可以用弹性常数来固定,其位置则通过势能曲面的梯度进行优化,同时也受弹簧所施加的力作用。爬坡图像也可以被完整地包括进来,以确保涵盖带中最高能量点。路径优化是通过一个每一步迭代都对所有图像进行移动并求值的迭代过程实现的。这种耦合迭代过程成本极高,即使是仅包含单个粒子扩散的10个图像的体系,都需要几百个函数调用受力。此外,第一性原理电子结构计算中,力的求值要花费昂贵的计算资源。因此,开发原子体系的机器学习代理模型迫在眉睫。

【成果简介】

近日,美国斯坦福大学Thomas Bligaard研究员(通讯作者)团队在Physical Review Letters上发表了题为“Low-Scaling Algorithm for Nudged Elastic Band Calculations Using a Surrogate Machine Learning Model”的文章。文章表明,在传统的微动弹性带(NEB)计算中整合入代理高斯过程回归的原子模型,可以有效增加收敛速度。在文中所用的代理模型方法中,弹性带收敛的时间不与路径中移动图像的数量成比例,可以大大提高过渡态搜索的效率和鲁棒性。和传统的NEB计算相比,该算法不对图像数量进行任何操控,而是通过构造一个具有高斯过程回归的概率本质的收敛标准,对所有图像结合目标模型势能中鞍点力的不确定性估算来达到收敛。这种方法从函数求值的角度来说,要比传统的NEB方法快一个数量级,且没有损失收敛能垒的准确性。

【图文导读】

图1:经典爬坡微弹性带算法和机器学习微弹性带法的比较。

(a)经典爬坡微弹性带(CI-NEB)算法性能的二维Müller-Browns势能面表示;

(b)机器学习微弹性带(ML-NEB)法性能的二维Müller-Browns势能面表示。

预测的最小能量路径位于每个势能面的底部,来表示弹性带有关函数调用数量的能量分布演化。

图2:用有效介质理论证明ML-NEB算法在三种不同的原子体系中的性能表现。

(a)Au原子在Al(111)表面扩散的最小能量路径;

(b)Pt吸附原子在台阶式Pt表面跨越两层台阶扩散的最小能量路径;

(c)吸附在Pt(111)表面的Pt岛状七聚物发生重排的最小能量路径。

最小能量路径的计算分别由FIRE,LBFGS,MDMin和ML-NEB算法获得。每种算法收敛所需的的函数调用的数量如方括号内的加粗字体所示。

图3:在此前的体系中改变NEB图像的数量来测试ML-NEB算法的性能。

不同的传统算法和机器学习加速算法在图像数量增加时达到收敛所需要的函数求值的数量比较。下方折线图表示相对于ML-NEB算法预测结果中相同位置处的函数目标值,三个采集函数得到的沿路径预测能量的平均误差。

【小结】

在这篇工作中,作者提出了三种不同的采集函数用于优化决策,以实现调用最少的函数来获得准确的预测路径。作者展示了学习速率被采集函数的形式所驱动,好的选择取决于外推(减少预测路径的不确定性)和开发(尝试收敛鞍点)的平衡。该工作将函数求值数量的成本从NEB移动图像数量中剥离,所得的算法不仅比现有算法都能够节省函数调用,而且相对于其他算法提高了在准确路径收敛的鲁棒性。

文献链接:Low-Scaling Algorithm for Nudged Elastic Band Calculations Using a Surrogate Machine Learning Model(Phys. Rev. Lett.,2019,DOI: 10.1103/PhysRevLett.122.156001)

本文由Isobel撰写。

分享到