东北师大Nature Communications:基于忆阻器实现广义BCM学习规则及时空学习功能
【研究背景】
类脑神经形态计算具有高能效、并行性、容错性以及自主认知等优势,被视为最有希望突破“冯·诺依曼瓶颈”的颠覆性技术。实现仿生大脑突触的自主学习功能是发展神经形态计算的关键基础。忆阻器作为一种新型离子—电子耦合器件,因其结构、功能与生物突触高度相似,且兼具信息存储与处理功能,是构建存算一体化神经形态计算系统的理想方案。
脉冲刺激频率依赖可塑性(Spiking-Rate-Dependent Plasticity, SRDP)是一种重要的生物突触调节特性,其典型代表是神经科学家Bienenstock,Cooper及Munro提出的BCM学习规则,它具有低频抑制、高频增强的阈值滑移效应。特别是,BCM学习规则能够为视觉皮层中高阶时空识别功能提供理论基础(如:基于频率的方向选择性)。但是,目前报道的利用忆阻器实现BCM学习规则多采用单一的突触前脉冲刺激方式,一方面不能完整地模拟BCM学习曲线,另一方面由于缺乏长时可塑性效应,限制了其在视觉时空图像识别等领域的应用。因此,利用忆阻器准确实现基于频率的时空特异性功能是一个具有挑战性的问题。
【成果简介】
近期,东北师范大学刘益春教授、徐海阳教授课题组与意大利米兰理工大学合作,在Nature Communications上发表题为“Toward a generalized Bienenstock-Cooper-Munro rule for spatiotemporal learning via triplet-STDP in memristive devices”的研究论文,首次报道了在忆阻器上利用三脉冲时序可塑性(Spiking-Timing-Dependent Plasticity, STDP)成功模拟了广义BCM学习规则,进一步通过设计忆阻器双层神经前馈网络实现了具有频率特性的时空学习功能。
研究者制备了基于Pt/WO3-x/W结构的忆阻器,利用内/外电场协同作用诱导亚稳态氧离子的定向移动,改变了WOx界面费米能级,从而实现了肖特基势垒和界面电阻的连续调制,获得了多种基本突触学习功能。更重要的是,研究者通过模拟突触的三脉冲STDP并将其延伸至BCM学习规则,弥补了传统忆阻体系中“增强抑制效应”的缺失,再现了完整的BCM学习曲线。通过调控器件在不同电导初始状态下的离子动力学过程,高度还原了BCM学习曲线的“阈值滑移效应”。数值计算发现,实验曲线与生物神经系统的三脉冲BCM数学模型高度吻合。进一步,为了获得视觉皮层中的高阶时空模式识别功能,研究者设计了一种基于忆阻器的双层神经前馈网络,以81个突触前神经元和4个突触后神经元分别作为输入和输出层。输入信号为具有高频和低频的四种定向模式(0°, 45°, 90°, 135°),同时将BCM曲线作为该神经网络的学习准则,在忆阻器阵列前馈网络中成功验证了基于频率的定向选择性,展现了忆阻器用于时空特异性学习的潜在能力。
【全文总结】
本文基于界面型氧化物忆阻器实现了三脉冲STDP功能,并将其推广至BCM学习规则,成功弥补了传统忆阻体系所缺失的“增强抑制效应”。通过构筑忆阻器双层神经前馈网络,实现了具有频率特性的方向选择性,展现了其时空特异性学习的能力。本研究不仅为完整模拟BCM学习规则提供了新途径,而且为忆阻器未来应用于高阶时空学习提供了新思路。
【图文导读】
图一 基于Pt/WO3-x/W二阶忆阻器的人工神经突触。
a) 生物神经突触的脉冲序列示意图。
b) Pt/WO3-x/W忆阻器阵列的扫描电镜图以及器件截面透射电镜图。
c) 器件连续I-V扫描图。
d) 器件连续正负脉冲测试图。
e) 器件电导驰豫过程图。
图二 基于Pt/WO3-x/W忆阻器模拟突触频率依赖的自适应功能。
a) 器件模拟突触EPSC现象。
b) 器件模拟突触PPF现象。
c) 器件模拟突触的频率依赖性。
d) 器件电导随突触后脉冲序列的变化。
e) 器件在不同初始态下的“频率阈值滑移效应”。
f) 生物系统中的BCM曲线。
图三 基于Pt/WO3-x/W忆阻器实现三脉冲STDP功能及广义BCM学习规则。
a) 两种三脉冲STDP信号设计示意图。
b) 器件在不同初始状态下模拟时间对称的三脉冲STDP现象。
c) 器件模拟时间不对称三脉冲STDP现象。
d) 器件在“1Pre-2Post”三脉冲STDP框架下的统计结果图。
e) 器件再“2Pre-1Post”三脉冲STDP框架下的统计结果图。
f) 器件电导对突触前/后频率的依赖性。
g) 器件在不同初始态下实现含有“增强抑制效应”的完整BCM曲线及其 “频率阈值滑移”特性。
图四 基于广义BCM学习规则数学模拟基于频率的方向选择性功能。
a) 器件实验数据点与BCM模型数值计算曲线的拟合。
b) 基于忆阻器阵列的双层前馈网络示意图。
c) 电导随学习迭代次数在四个特定方向下的变化。
d) 与四种特定方向对应的突触后频率随学习迭代次数的变化。
e) 忆阻器阵列在四种特定方向下的电导色彩图。
文献链接:Toward a generalized Bienenstock-Cooper-Munro rule for spatiotemporal learning via triplet-STDP in memristive devices. (Nat. Commun. 2020, 11:1510. DOI: 10.1038/s41467-020-15158-3)
【课题组介绍】
刘益春,东北师范大学教授,博士生导师。现任国际发光会议(ICL)程委会委员(2020大会主席)、国际II-VI族化合物材料会议顾委会委员、WILEY国际学术期刊《InfoMat》副主编。国家杰出青年科学基金获得者,中国科学院百人计划,教育部跨世纪优秀人才。长期从事氧化物半导体材料与信息器件领域的科研与教学工作,相关成果作为第一完成人荣获国家自然科学二等奖2项、国家教学成果一等奖1项。
文章评论(0)