Nature合作期刊npj Compu. Mater.: 顺序压电响应力显微镜和“小数据”问题
【引言】
材料科学背景下的“大数据”一词不仅代表了数据量的庞大,而且代表了特征数据集的繁杂。然而,就测量变量的有限步长而言,这些数据集只能算是很“小”规模的。由于这种限制,高阶统计量的应用也是无效的,而无监督学习方法的选择也仅限于那些利用低阶统计的方法。
【成果简介】
近日,德国杜伊斯堡-埃森大学Vladimir V. Shvartsman和Harsh Trivedi等研究人员通过利用可变磁场压电响应力显微镜(PFM)研究了多铁复合材料。由于实验限制,其中压电响应的磁场依赖性只能得到粗调步长的测量数据。而从该数据中有效地提取出上述与局域磁电效应相关的磁场依赖性是该研究要解决的核心问题。研究人员通过利用密度聚类方法在数据中预先标记出可能的模式,然后针对主成分分析(PCA)作为一种简单的非监督学习技术的表现进行评估。他们以这种组合分析为基础,从而着重研究了在上述案例中,如何使用基于非中心二次矩的PCA,才能提取出有关局域材料响应及其空间分布的信息。该研究发表于npj Computational Materials,题为“Sequential piezoresponse force microscopy and the ‘small-data’ problem”。
【图文导读】
图1. 数据的3D投影
基于由DBSCAN识别的集群数据标记的3D表示,(a)对应于BTO-BaM体系,(b)对应于BTO-CFO体系(灰色:集群-1,红色:集群-2,蓝色:集群-3)。
图2. 已识别集群(域映射)的空间分布与平均向量
(a)和(b)分别为BTO-BaM和BTO-CFO对应的PFM图像(以供参考)。(c)和(d)分别为系统-1和系统-2的已识别集群(域映射)的空间分布。(e)和(f)分别表示对应于system-1和system-2集群的平均向量。
图3. 前四个主要成分及源于体系1的数据矩阵分数图
(e-h)为前四个主成分及其相应的得分图(a-d),该分数图源于体系-1的数据矩阵(明暗对比分别对应高分和低分)。
图4. 前四个主要成分及源于体系2的数据矩阵分数图
(e-h)为前四个主成分及其相应的得分图(a-d),该分数图源于体系-2的数据矩阵(明暗对比分别对应高分和低分)。
图5. 力矩与组分曲线
(a)和(b)分别对应于BTO-BaM和BTO-CFO的力矩与组分曲线,显示了组分中非中心单变量矩的递减顺序。
【小结】
该研究通过使用PCA和DBSCAN进行组合分析,使得能够从可变磁场PFM数据集中获取物理意义。同时,利用有效的实验论证,他们强调了序列成像数据集固有的“小数据”问题。利用t-SNE获得了3D数据表示,从而得到了数据点的变化分布,突出了数据向量的稀疏性质。同时,使用DBSCAN有效地聚集了数据点。两个体系的标记数据结构清楚地表现出了对应于铁电相、磁相和界面的数据点,他们提出,两个系统的数据结构之间的关键差异在于它们的二次扩散。尽管存在个体复杂性,但两种数据集都通过PCA进行了最佳分析。从而得出结论,建议利用二阶非中心矩为此类数据集提供最优的特征提取。作为一般的物理结论,他们注意到与基于尖晶石-铁氧体的复合材料相比,基于六角铁氧体的复合材料中局部观察到的ME效应较弱。这种差异可能与此有关:在六角铁氧体中,每个微晶的可能易轴的数量(磁致伸缩最高)被限制为2,而在尖晶石-铁氧体的情况下有4个这样的可能轴,导致了更多界面处的均匀应力分布。
文献链接:Sequential piezoresponse force microscopy and the ‘small-data’ problem (npj Computational Materials ,2018, DOI: 10.1038/s41524-018-0084-9)
本文由材料人计算材料组Annay供稿,材料牛整理编辑。
材料牛网专注于跟踪材料领域科技及行业进展,这里汇集了各大高校硕博生、一线科研人员以及行业从业者,如果您对于跟踪材料领域科技进展,解读高水平文章或是评述行业有兴趣,点我加入编辑部大家庭。
欢迎大家到材料人宣传科技成果并对文献进行深入解读,投稿邮箱tougao@cailiaoren.com。
投稿以及内容合作可加编辑微信:cailiaokefu,我们会邀请各位老师加入专家群。
材料测试、数据分析,上测试谷!
文章评论(0)