东南大学王金兰教授Nature子刊:机器学习加速设计高效稳定无铅有机-无机杂化钙钛矿


【引言】

功能材料的开发是工业创新的基石,而且开发具有靶向性的材料一直是科学研究的热点。基于密度泛函理论(DFT)的高通量计算等技术的出现在一定程度上加速了材料的搜寻过程。近年来,各种材料的结构越来越复杂,难以使用传统的方法从成千上万种候选材料中高效筛选出具有价值的体系,但是,诸如人工智能等新兴技术可以较好地解决这一问题。最近,机器学习(ML)技术已经在材料设计等方面凸显其强大的功能,其不仅可以快速准确地实现材料设计,也可以从巨大的材料数据库中挖掘出材料的构效关系。
钙钛矿是一种用途广泛的功能材料,虽然ML技术为设计无机钙钛矿材料提供了思路,但其在有机-无机杂化钙钛矿(HOIPs)领域的应用还鲜有报道。HOIPs是一种极具前景的光电材料,其最显著的优点包括高功率转换效率(PCE)、易合成以及可调的带隙等。但存在两个关键的不足限制了HOIPs的商业应用,其中之一便是毒性(这也是一个严重的问题),主要是材料中含有铅(Pb)元素,其次是环境稳定性较差。因此,设计具有高PCE且在空气中持续稳定的无铅化HOIPs至关重要。

【成果简介】

东南大学王金兰教授(通讯作者)等人基于ML技术和DFT计算开发了一种靶向驱动法用于发现稳定的无铅HOIPs。研究人员从212个已报道的HOIPs带隙值中训练ML模型,然后成功地从5158种未开发的潜在HOIPs中筛选出六种具有适当太阳能带隙和室温热稳定性的正交无铅HOIPs,其中两种在可见区域具有直接带隙和优异的环境稳定性。之后,通过ML数据挖掘出了一种HOIPs带隙的紧密性结构-性质关系,发现影响理想HOIPs太阳能电池性能的因素包括容忍因子、八面体因子、金属电负性以及有机分子的极化率。最后,该方法能够快速实现高精度筛选,可广泛应用于功能材料设计。该成果以题为“Accelerated discovery of stable lead-free hybrid organic-inorganic perovskites via machine learning”发表于著名期刊Nature Communications

【图文导读】

图一 无铅HOIPs的设计框架


结合ML和DFT的材料设计框架用于高效搜寻具有适当带隙的稳定无铅化HOIPs,蓝框代表由已报道过的HOIP数据训练ML模型的材料筛选过程,之后,利用DFT进一步计算这些候选材料的电子性质并评估其稳定性,如绿框所示

图二 用于训练和测试HOIPs的输入数据


(a)212种高通量HOIPs结构,将11种有机小分子(A位点)与32种二价金属离子(B位点)结合组成ML模型的输入数据集,X是典型的卤化物
(b)HOIPs的容忍因子和带隙关系在训练(蓝点)和测试(红点)中的数据可视化,整个数据集包括金属、半导体和绝缘体

图三 所选特征的重要性和相关性


(a)使用GBR算法对14种选定的特征进行排序
(b)HOIPs所选特征中的皮尔逊相关系数矩阵热度图

图四 ML模型的结构与见解


(a)测试带隙和预测带隙的拟合结果,计算决定系数(R2)、皮尔逊系数(r)和均方差(MSE)以评估预测的误差,子图是对数据进行5次交叉验证分割时模型精度的收敛性
(b)对来自训练ML模型的预测数据集带隙的容忍因子散点图(蓝色、红色和深灰色点分别代表训练、测试和预测集)
所有潜在HOIPs的(c)容忍因子、(d)八面体因素、(e)A-位点离子的离子极化率和(f)B位点离子的电负性与预测带隙关系的数据可视化,虚线框表示每个特征的适当范围

图五 与DFT计算的对比


(a)六种筛选验证的HOIPs在ML预测和DFT计算结果之间的比较
DFT计算的(b)优化结构、(c)能带结构、(d)电子投影态密度以及(e)在300 K下,对C2H5OSnBr3和C2H6NSnBr3进行5 ps的AIMD模拟的总能量,(d)中的子图是靠近费米能级的投影态密度

【小结】

不同于那些需要在DFT水平上搜寻整个化学空间的高通量筛选方法,目前的ML和DFT组合方案只需在DFT水平上计算最具前景的HOIPs,这样可以极大地节省计算资源。注意,上面提到的筛选非常严格,事实上,其筛选条件可以根据目标进行调整以找到适合实验合成的候选材料。本文提出的靶向驱动法克服了传统试错法的主要障碍,同时,由于这种ML技术采用一种基于GBR算法的“末位淘汰”特征选择程序,因此其不仅可以瞬间达到DFT精度(甚至快于神经网络算法),而且适用于小数据集。这也就意味着可以使用相对较小的数据集来实现准确的预测。如果计算或实验的材料数据足以训练ML模型,该方法也适用于其他功能材料的设计与发现。

文献连接:Accelerated discovery of stable lead-free hybrid organic-inorganic perovskites via machine learning(Nature Communications, 2018, DOI: 10.1038/s41467-018-05761-w)

【作者简介】

王金兰教授现任职于东南大学物理学院,博士生导师,国家杰出青年基金获得者(2015)、江苏省“333高层次人才支持计划”第二层次获得者(2016)、国务院特殊津贴获得者(2018)。长期从事低维材料结构与物理化学性质的理论研究工作,主持多项国家自然科学基金与国家重点研发计划。发表SCI论文180余篇,影响因子10以上论文30余篇,其中Science 1篇,Nat. Commun. 7篇,J. Am. Chem. Soc. 5 篇,Angew. Chem. Int. Ed. 5 篇(封面热点文章1篇),Nano Lett/ACS Nano/Adv. Mater. 13篇,受邀撰写英文综述3篇。引用超过6400次,H-index 42,连续四年入选“Elsevier中国高被引学者名单(2014-2017)”。

课题组主页:http://hpc.seu.edu.cn/jlwang/index.html.

本文由材料人编辑部计算材料组杜成江编译供稿,材料牛整理编辑。

欢迎大家到材料人宣传科技成果并对文献进行深入解读,投稿邮箱tougao@cailiaoren.com.

投稿以及内容合作可加编辑微信:cailiaokefu.

分享到