深度原理 Nat. Mach. Intell. | 最佳传输模型生成化学反应过渡态
在化学的微观世界里,过渡态(TS)就像化学反应中的 "能量高峰"—— 当分子们为了发生奇妙的化学变化而剧烈碰撞时,必须跨越这个转瞬即逝的能量顶峰。然而,这个关键的中间状态就像闪电一样难以捕捉:实验仪器的 "快门速度" 跟不上它的变化节奏,而传统的量子化学计算方法又如同用慢镜头拍摄烟花,即使是最强大的超级计算机,解析一个过渡态的结构也可能需要连续工作数小时甚至数天。这种困境让科学家们在探索复杂反应网络指导化工生产、设计性能更优的催化剂时举步维艰。
图一|二维势能面上的反应物(R),过渡态(TS),产物(P),以及最小能量路径(minimal energy pathway)
近日,深度原理 Deep Principle联合佐治亚理工大学,康奈尔大学等机构联合提出了一种革新性的过渡态检索方法--React-OT,采用最优传输(Optimal Transport, OT)的方法,从反应物和产物的结构插值开始,推导出高度精确的过渡态结构,相关成果已作为封面文章发表在 Nature Machine Intelligence 上,同时MIT News也对文章的第一兼通讯作者,深度原理 Deep Principle的创始人兼CTO段辰儒博士进行了专访报道。
【等待文章发出后补充一个采访内容和封面图片拼图】
本文将带你深入了解 React-OT 的核心原理、与传统方法的对比,以及它如何突破计算化学的瓶颈,大幅提升 TS 搜索的效率与精度,为反应机理研究和催化剂设计提供全新工具。
一、方法创新
��从 OA-ReactDiff 到 React-OT
OA-ReactDiff是深度原理 Deep Principle于2023年推出的首个生成3D化学反应的扩散生成模型,这项成果已在Nature大子刊Nature Computational Science上发表,并被选为封面论文。OA-ReactDiff仅依赖反应物和产物的3D几何形状即可生成过渡态结构,比传统量化方法预测过渡态速度提升1000倍。但是由于扩散模型采样过程中的随机性,OA-ReactDiff生成的过渡态也是随机的,往往需要多次采样才能获得理想的过渡态结构。
作为OA-ReactDiff的迭代升级版本,React-OT在OA-ReactDiff的基础上,针对给定的反应物和生成物(双端搜索)进行了改进,基于最优传输理论,通过流匹配方法,从反应物和产物直接推导TS结构,单次采样即可生成确定性的TS结构。
��最优传输(OT)
最优传输是一种数学理论和计算方法,用于描述两个概率分布之间的距离或者对应关系。它的核心概念是如何以最佳方式将一组资源(如质量、能量等)从一个位置传输到另一个位置。类比初中学习的线性规划问题:三个城市(A, B, C)分别有1、0.5、1.5吨煤,另外有两个城市(D, E)分别需要2、1吨煤,由于不同城市之间的运输成本不同,城市需求也不同,需要制定策略给出最优运输路线,这些“最优路线”在化学反应中就代表了最合理化学反应路径以其对应的过渡态结构。
��技术亮点速览
- 初始过渡态结构:OA-ReactDiff从高斯噪音中随机采样,所以生成的过渡态也存在随机性。React-OT则是从反应物和产物的线性插值出发,并且通过平移旋转等操作确保初始结构的等变性和唯一性,获得相对合理的初始猜测,将采样路径推向更接近最优传输的方向。
- 采样过程:OA-ReactDiff采用扩散模型,过渡态生成是一个随机采样过程。而React-OT将采样过程模拟为常微分方程,而不是扩散模型中的随机微分方程,将反应物、产物和过渡态的联合分布视为动态传输问题,通过流匹配(flow matching)方法,直接从反应物和产物推导TS结构,不再需要多次随机采样。
- 更大数据集的预训练:使用RGD1-xTB 数据集对React-OT进行预训练,然后再在Transition 1x数据集上进行模型的微调,RGD1-xTB包含95万个基于 GFN2-xTB 计算的化学反应,对比训练OA-ReactDiff使用的Transition1x 数据集(1 万个反应),RGD1-xTB的数据量大幅增加,可为 React-OT 提供更广泛的化学环境和结构信息。图二 | 扩散模型和最佳传输模型生成TS结构的工作概述(左)OA-ReactDiff的随机推理过程。(右)React-OT的确定性推理过程��挤爆牙膏的性能提升 在经过 RGD1-xTB 预训练后,React-OT显著提升了对未见反应类型的适应性和预测能力,即使在12 个非氢原子的复杂反应体系中,仍能准确生成TS结构,具备应对多步有机反应的能力。为了探索React-OT在反应网络探索中的实际应用,这篇文章选择γ-酮过氧化氢(KHP)作为研究对象。KHP 是一个备受关注的反应体系,近年来被广泛用于基准测试。图四| KHP的反应网络 其中红色/黑色的数字分别为DFT计算/React-OT生成的过渡态上计算得到的活化能三、应用展望��应用场景前瞻
- 段辰儒表示,“人类眨眼的平均时间是0.4秒。在这个时间内React-OT就可以精准的找到一个化学反应的过渡态,这在之前是不可想象的。极致的加速会产生行为模式的质变,React-OT将改变我们对化学反应的理解和探索新材料的方式。”
- 可以看到,React-OT生成的反应网络与文献记载的KHP反应节点完全一致,表明其能够准确捕捉所有关键反应,且两者的平均绝对能量差仅为 3.84 kcal/mol。这一案例研究展示了 React-OT 在加速反应网络探索中的应用潜力。
- ��在反应网络中的应用
- 图三 | React-OT和OA-ReactDiff模型在生成过渡态的精度和速度方面的性能对比 a. React-OT得到满足特定RMSD要求的TS结构的可能性高于两种扩散模型。b. OA-ReactDiff和React-OT生成过渡态的质量。c. 两种模型预测效果的对比。d. 运行速度的比较。
- 在使用Transition 1x训练React-OT之前,先在RGD1-xTB 数据集上对 React-OT进行了预训练,预训练后,React-OT在TS预测精度上实现了显著提升:生成结构的 RMSD 中位数和势垒高度误差降低 25%以上,相比未预训练模型精度提升显著。除了精度的提升之外,搜索过渡态所需运行时间也显著减少。OA-ReactDiff在单张GPU上需6秒完成过渡态搜索,而React-OT的采样过程消除了随机性,只要0.4秒就可以得到正确的TS结构。对比OA-ReactDiff,React-OT能适应更复杂的化学反应类型,对未见过反应的预测能力也要更好。
- 二、结果一览
- 催化剂设计:快速筛选高活性反应路径,加速清洁能源催化剂开发。
- 药物合成:精准预测有机反应能垒,优化合成路线,降低实验成本。
- 材料探索:构建超大型反应网络,发现新型功能材料(如MOFs、钙钛矿)。未来已来拓展阅读:Bohrium Notebookhttps://bohrium.dp.tech/notebooks/47742251216https://bohrium.dp.tech/apps/bohriumweb/job?type=apphttp://reactot-dev.deepprinciple.com
- 深度原理 Deep Principle(DeepPrinciple)官方使用链接��:
- 也可以通过Bohrium App或者深度原理 Deep Principle(DeepPrinciple)官方使用链接直接试用模型生成你想要的过渡态:
- 如果对生成式模型感兴趣,想进一步了解React-OT,复制下方链接,打开 Notebook:
- React-OT标志着化学反应TS搜索进入高效、精准的新纪元,有望成为计算化学领域的重要工具。欢迎关注深度原理 Deep Principle团队,探索更多前沿研究!
文章评论(0)