麻省理工学院(MIT)Joule综述(Perspective):通过自动化、机器学习和高性能计算加速材料研发
【引言】
成功的材料创新可以改变社会。然而,材料研究通常会涉及很长的时间序列并且成功的概率较低,这样就使那些希望研发出的材料可以短时间从实验室应用于商业领域的投资者望而却步。一系列新兴技术的组合可以使材料研发的步伐加快十倍甚至更多,这样可使相关利益者(投资者和研究人员)、市场和环境在时间序列上保持一致,同时也可提高投资回报。
近日,麻省理工学院(MIT)Tonio Buonassisi教授(通讯作者)等人在Joule上发表题为“Accelerating Materials Development via Automation, Machine Learning, and High-Performance Computing”的综述文章。文中系统的阐述了人工成本-时间成本-计算开发等方面的相互制约以及解决方案,加快材料开发周期所必须进行的关键步骤——计算辅助。新兴技术的组合可以加快材料体系的相互融合,缩短投资者的回本周期,加快材料在各个领域中的应用。
1、简介
由于各个领域所消耗时间的不匹配性,使得新材料的发展长期受阻。材料的发展通常需要15-25年,有时甚至需要合成并表征数百万样品。然而,企业和政府的资助者都希望能在他们领导的时间内获得一些实际的结果,通常是2-5年。而博士后和学生在实验室停留的时间通常也是2-5年,当一个项目长于一个人所停留的时间时,那么一个人的积极性与知识产权之间就不会产生这种无缝连接。考虑到市场竞争和环境等因素,新材料发展的市场驱动力往往需要在更短的时间内获得问题的解决方案。从历史角度来看,当投资额度基本相同时,时间的不匹配性导致研究能源材料(清洁技术)所获得的投资回报率远低于医疗、软件等领域。为了弥补时间跨度上的不匹配性,增加材料研发的成功率,无论是公共部门还是私营部门的成员们都在努力开发材料发展的新范式。美国材料基因组计划重点关注于以下三个“缺失环节”:计算工具将实验工作集中于最有希望的研究方向、汇总学习与识别研究趋势的数据库以及高通量实验工具。
图1 材料发现与开发的时间轴
当前,一种可用于实验性的材料研究的新范式正在兴起,这有望使发现新材料变得更快。以机器学习来引导快速、自动化的反馈循环,并强调通过最终产物和产业转移来创造价值。现在有一个独特的机会在测试平台上开发这些功能,而且在研究生产力和先发优势方面已有相当大的改善。
图2 加快材料发现的示意图
2、理论
目前,理论预测的速率已远远超过实验上的合成、表征及验证的速率。这种现象可由三个趋势实现:更快的计算、更高效和准确的理论方法与模拟工具以及快速筛选大型数据库的能力,如MaterialsProject.org。为了更好地集中有限实验的带宽,科研人员越来越关注模拟怎样合成,而不仅仅只是合成什么——在计算机模型中获取环境因素(如湿度)、反应能垒和动力学限制(即所谓的“非平衡”合成)的复杂性。同时,理论科学家试图合理地设计出具有多种综合性能的材料。
3、高通量材料、器件和合成体系
从历史上看,缓慢的真空沉积法抑制了材料发展。现代真空设备(包括组合方法和大规模、快速连续沉积/反应)极大地提高了材料和器件的合成速率。当前各种各样的沉积方法(如闭空间升华法)为材料制备提供了更快的生长速率、点缺陷的可控性、更精确的化学计量比以及杂质可控性等。随着高质量的前驱体和材料的出现,溶液法也变得更普遍了,包括CdS量子点、高聚物太阳能电池、卤化铅钙钛矿等。前驱体(从分子到纳米粒子)、可控合成(包括溶剂工程)和薄膜合成方法(实验室的旋涂技术到工业上的大规模印刷)等的日益多样化,使其成为一个强大且灵活的平台以沉积一系列新材料。3D打印材料的出现提供了另一种普遍的用于制备材料的替代方案。
4、缺陷容限与工程
通常来讲,研究人员主要对“理想”材料体系进行理论预测。然而,真实样品包含缺陷(如杂质、结构缺陷),而缺陷会破坏(偶尔也会有利于)材料主体或界面的性质。为了减轻高通量材料筛选过程中由缺陷导致的漏报风险,希望识别出一系列由缺陷影响较小的材料,以及快速诊断并消除缺陷对材料性能的影响,例如偶然发现卤化铅钙钛矿可应用于光电领域。除了可用于高通量液相沉积法以外,卤化铅钙钛矿还需要较少的研究工作才能实现与传统无机薄膜类似的性能改进。确定缺陷容限性的基本物理学原理并且开发其设计准则可以形成新材料的筛选标准,尤其是新的计算工具,如在异常检测中最先进的通用对抗网络。
图3 基于光伏应用的快速材料开发的研究实例
5、高通量诊断
表征工具也得益于高性能计算、自动化和机器学习,例如,高分辨X射线光电子能谱测试所花费的时间较之前得到极大改善。当前,先进的数据统计和机器学习有望进一步加快学习的速率,现存的一些设备可以获取一种样品的多个XPS图谱,而且可以进行大数据集的自动射频分析,可以估计一些在成分图上未知的材料。其他一些科研人员采用贝叶斯推断结合无损检测装置可以同时诊断出多种块体和界面性质,其可达到的诊断速率快于传统表征设备的10倍甚至更多。这种参数估计不仅可以快速地进行故障排除,而且还可以准确地估计材料的固有属性以及最终可能达到的性能。
6、机器学习
机器学习包含很多方法,可能在未来的材料开发周期中扮演不同的角色。第一,机器学习的一个常见应用是选择材料,其中实验观察可以用来预测未知化合物及新发现的材料的新性质;第二,机器学习工具可以从诊断中提取更多更准确的信息;第三,机器学习工具可以通过减少人为干预和依赖于启发式的程度来关闭诊断与合成之间的自动循环,如图2所示;而这三个应用均得益于更多数据的可用性,以训练和提高这些设备的预测能力。
7、构想“硬件云”
现在,材料合成设备正越来越具有远程操作性——能够使科研人员不用靠近沉积设备即可进行研究和操作,这样带来了两种影响深远的机遇。大型昂贵的合成设备可以与大规模并行表征设备组成未来实验室的合成中心,该中心由远程用户和研究人员操作并由现场专业人员管理。类似于软件云的概念,一个人的计算和数据以无缝形式储存于世界各地的机器上,硬件云将使用户以无缝的形式在国内或国际上分布的网络材料操作系统上进行存储、测量及开展研究(通过原位表征工具提供实时反馈)。所产生的第二个机遇即能够在公共或私有云的这些网络实验所收集的数据中进行存储、管理、访问、处理和诊断。这将产生两个问题:(1)通过大量实验和实验平台来提高数据的实用性,以用于后期分析;(2)用于分析哪些什么都不起作用的数据,这并不容易获得但对学习过程是有帮助的,并且在研究过程中提高集体效率方面都有着自己的价值。
8、加快材料开发与制造的基础设施投资
图2中所展示的愿景需要数年来持续的开发软件,硬件和人力资源,并以测试平台的方式连接这些新功能。这些主要涉及到以下投资:应用型机器学习,数据格式和存储标准,数据管理工具,基础设施等领域。
9 、加快材料开发与制造的人力资本投资
人力资本的投资需要准备研究人员利用这些新工具。从 “数据匮乏”到“数据丰富”的过渡会引发我们的思维,激励方式以及教授方面的转变。
【结论】
高性能计算,自动化和机器学习等技术有望加快材料发现的速率,更好的调整投资者和利益相关者之间的时间序列。这些新的技术将成为科学进程中不可或缺的一部分。在(半)自动化反馈回路中,合成,装备制造和诊断比现在要快十倍以上,这种高速率在不远的将来完全有可能实现。为了实现这一目标,需要进一步投资基础设施和人力资本,包括更加重视现存方法对解决材料相关问题的适应性应用、采用数据和元数据标准、数据管理工具、实验室基础设施(分散式和集中式)等。将这些工具整合到研发生态系统中部分取决于几个人的因素,即发展激励结构所需的时间、社区支持、教育和技能提升以及研究人员的心态,这些都源于我们的研究领域正在从思维“数据缺乏”向思维“数据富有”转变。这样就产生了一种理想的实验室,在这种实验室中,材料开发的持续进行不受其他因素的影响,可以通过计算能力增强人类的思维,以释放人类思维来进行科研使其更接近人类曾经想象的速度,并且可以解决一些与市场相关的时间框架中的社会挑战。
文献连接: Accelerating Materials Development via Automation, Machine Learning, and High-Performance Computing(Joule, 2018, DOI: 10.1016/j.joule.2018.05.009)
本文由材料人编辑部计算材料组杜成江编译供稿,材料牛整理编辑。
材料牛网专注于跟踪材料领域科技及行业进展,这里汇集了各大高校硕博生、一线科研人员以及行业从业者,如果您对于跟踪材料领域科技进展,解读高水平文章或是评述行业有兴趣,点我加入材料人编辑部。
欢迎大家到材料人宣传科技成果并对文献进行深入解读,投稿邮箱tougao@cailiaoren.com.
投稿以及内容合作可加编辑微信:cailiaokefu.
材料测试、数据分析,上测试谷!
文章评论(0)