小数据设计新材料的“洪荒之力”


材料牛注:《中庸》有言:“至诚之道,可以前知”,数据虽小,心向往之。殊不知小小的数据中,通过机器的学习,能够在浩大的材料家族里帮我们找到接近目标的理想潜在材料。

一直以来,寻找新型功能材料已是一个难题,然而在已知一个小的材料体系家族中寻找具有特殊性能的材料更是难上加难。

但是,西北大学工程系和Los Alamos国家实验室联合团队找到了解决方案。该团队发现了一个新颖的设计流程方法,该方法通过将机器学习和密度泛函理论计算相结合,为新材料的设计创造出指南,并指出材料所具有的一些实用电性能,如铁电性能和压电性能。使得通过学习小数据找到理想材料成为一个新颖的数据科学方法。

目前,很少有层状材料在特定的几何结构中具有这些性质,而这些性质对于找到开发电子、通信和能源问题的解决方案至关重要——这也意味着在传统研究方法中能够制定探究指南的数据十分有限。

McCormick工程学院材料科学与工程系副教授James M. Rondinelli解释道:“其他人在寻找新材料时,通常都是在具有相似性能材料的大量数据中进行查找,这样的工作一般都举步维艰,但我们知道如何从众多的数据库中提取信息。只是当你缺乏大量信息时,从数据中学习就成为了一个很大的难题。”

2017年2月17日在期刊Nature Communications中,发表了题为“Learning from data to design functional materials without inversion symmetry”的论文介绍了该研究成果。新墨西哥州Los Alamos国家实验室的Prasanna Balachandran是本文的共同作者。另外,Rondinelli实验室的前研究生Joshua Young和Los Alamos的高级研究员Turab Lookman均有所贡献。

在国家科学基金会和Los Alamos国家实验室开展的研究项目的支持下,Rondinelli的课题组专注于研究一类二维复合氧化物或Ruddlesden-Popper结构氧化物(一种四方钙钛矿的共生型结构),这些材料展现出很多性能和工艺技术——例如压电性能和铁电性能,同时可以与当今现代电子设备中的传统半导体材料相连。

Rondinelli说:“在这个材料体系大家族中,数据库是很渺小的。目前,只有大约10-15种材料由于其期望性能而被我们熟知,我们能够处理的数据很有限。传统上,数据科学主要用于解决对领域知识要求较低的大数据问题。”

另外,Rondinelli补充道:“尽管这个问题的本质数据很小,但是我们的方法十分有效,其原因在于我们能够将自己对于这些材料的理解(领域知识)与相关数据联系起来,为机器学习提供信息。”

因此,课题组开始建立一个已知材料的数据库,并使用计算机科学的子领域即机器学习,培养机器从数据中学习,并能够通过该学习做出更好预测的能力。“随着机器学习程度的不断加强,我们能够识别出人们希望开发材料的化学成分。”他介绍道。

在所调查的3000种以上材料中,数据科学方法发现了超过200种可能的理想材料。接下来,团队应用了几种类型的严格量子力学计算进行分析,评估了潜在材料的原子结构并检测其稳定性。

Rondinelli说:“我们想知道,材料是否具有所预测的结构?它有电子极化吗?它在实验室中能被合成吗?”

这项工作将可能的材料缩小到了19种,剩下的这些材料需要直接的实验分析。但是在200种之中仍然有更多的可能性。

通常,在开发新材料时,可能性的数目太大以至于我们无法一一探索和研究,又因筛选潜在材料的过程需要很大的花销,所以科学家们必须在他们的研究过程中慎重选择。

Balachandran说:“我们的工作有帮助研发者节约大量时间和资源的潜力。在研究过程中,我们只需要去尝试那些最有潜力的材料,而不需要探究所有可能的材料。”

原文链接:Designing new materials from 'small' data Unique workflow to design new materials

文献链接:Learning from data to design functional materials without inversion symmetry

本文由编辑部提供月亮素材,李雅倩编译,丁菲菲审核,点我加入材料人编辑部

材料测试,数据分析,上测试谷

分享到