两院院士,再发Science!


一、【科学背景】

合成复杂有机分子的能力对于发现和制造功能性化合物(包括小分子药物)至关重要。这一过程通常是通过缓慢、费力、反复的设计-制造-测试-分析(Design-make-test-analyze, DMTA)循环进行的。新兴的机器学习(ML)工具可以生成新的候选分子,预测其性质,并通过计算机辅助合成规划(Computer-aided synthesis planning, CASP)提出反应路径。化学自动化方面的进步可以在人工设置之后,以最少的人工干预实现化学合成和表征。将以上流程以及化合物纯化、表征整合到DMTA工作流程中,可以开发出自主化学发现平台,无需人工重新配置即可在不同的化学空间中运行。尽管这些演示强调了集成预测工具和化学自动化的潜力,但它们的专业实施限制了执行的化学类型、可实现的结构类型,特别是这些平台可以探索的化学空间。在2019年,麻省理工学院Klavs F. Jensen教授(美国国家科学院、国家工程院两院院士)团队在Science上发表了一种结合AI设计合成路线和机器人执行的自动化合成平台,能够为给定分子提出最佳合成路线并执行所有合成操作流程,实现自动化合成。在此基础上,该团队近期再次在Science上发表开发了一个由集成机器学习工具驱动的闭环自主分子发现平台,以加速具有所需性质的分子的设计。

二、【科学贡献】

本研究展示了针对吸收波长、亲油性和光氧化稳定性的两个染料类分子案例研究。在第一项研究中,该平台通过分子DMTA循环的三次自动迭代,实验性地实现了294种未报道的分子,同时探索了四种鲜有报道的支架的结构-功能空间。在每次迭代中,指导探索的性质预测模型学习了不同支架衍生物的结构-性质空间,这些衍生物是通过多步合成和各种反应实现的。第二项研究利用在探索过的化学空间和以前报告过的分子上训练过的性质模型,在探索较少的结构-性质空间内发现了9种性能最好的分子。

综合平台以及平台预测并成功执行的反应概述 © 2023 AAAS

 

为了证明模型的开发,研究人员选择优化二苯并噻唑酮(BPT),这是一种有前景的支架,具有足够的环化产率和测试实验中良好的模型一致性,适量的现有数据点提供了发现新分子的机会,并且与其他常见染料家族具有结构相似性。研究人员用三个例子更新了代表有希望命中的支架的性质模型,并促使该平台发现同时最大化吸收波长、最小化分配系数和最小化光降解率的先导分子。

模型开发案例研究 © 2023 AAAS

 

三、【创新点

本研究开发了一个由集成机器学习工具驱动的闭环自主分子发现平台,以加速设计具有所需特性的分子。在实际应用中,展示了针对吸收波长、亲油性和光氧化稳定性的两个染料类分子案例研究,在探索较少的结构-性质空间内发现了9个性能最好的分子。

 

四、【科学启迪】

综述,本研究展示了一个DMTA循环,它可以探索化学空间并利用已知化学结构,而无需人工实验。该平台提出、合成并表征了303个未报道的染料类分子,它们分布在四个探索支架和一个利用支架上。该集成平台可通过搜索具有所需性质的结构(命中)来探索未知的结构-性质空间,并可通过优化有希望的候选结构(先导)来利用已表征的结构-性质空间。闭环集成平台的进一步发展有望加速分子发现。

 

原文详情:https://www.science.org/doi/10.1126/science.adi1407

本文由大兵哥供稿。

分享到