集成无场SOT域壁突触与MTJ随机神经元:用于硬件玻尔兹曼机器的实现

时间:2026年5月17日
来源:Advanced Functional Materials

编辑推荐:

**摘要** 自旋电子学通过在一个平台上整合突触和神经元的功能,为节能的神经形态计算提供了一种有前景的方法。一个关键挑战是在工业采用的自旋电子学堆栈中实现无场自旋轨道扭矩(SOT)控制,无论是在突触设备还是神经元设备中。在这项研究中,我们展示了利用CoFeB铁磁薄膜系统的无场S

广告
   X   

**摘要**

自旋电子学通过在一个平台上整合突触和神经元的功能,为节能的神经形态计算提供了一种有前景的方法。一个关键挑战是在工业采用的自旋电子学堆栈中实现无场自旋轨道扭矩(SOT)控制,无论是在突触设备还是神经元设备中。在这项研究中,我们展示了利用CoFeB铁磁薄膜系统的无场SOT自旋电子学突触,其中不对称的设备设计和在CoFeB薄膜中特别设计的横向凹槽促进了有效的畴壁(DW)成核、移动以及固定/释放。这种方法产生了多个模拟的、非易失性的电阻状态,具有增强的线性和对称性,使得突触权重可以编程且稳定。我们提供了一种系统的测量方法来提高突触的线性和对称性。此外,我们还展示了作为SOT驱动的随机神经元的纳米级磁隧道结(MTJ),它们表现出电流可调的、类似玻尔兹曼的概率切换行为,这为硬件中的吉布斯采样提供了内在能力。通过将这些突触和神经元集成到一个玻尔兹曼机器中,并辅以一个分类层,我们在MNIST数据集上实现了超过98%的识别准确率,在Fashion-MNIST数据集上实现了86%的识别准确率。这项工作为无场突触和神经元设备建立了一个框架,为实用的、与材料兼容的、全自旋电子学的神经形态计算硬件奠定了基础。

**1 引言**

人工智能技术正在推动全球经济的发展,但由于互补金属氧化物半导体(CMOS)的缩放问题和内存-CPU瓶颈等问题,训练和测试大型神经网络面临着能源挑战[1, 2]。受大脑并行、事件驱动和节能处理方式的启发,神经形态计算作为一种有前景的替代方案应运而生[3-5]。然而,要实现硬件神经形态系统,我们需要能够复制生物神经元和突触的功能行为,同时确保低功耗、高耐久性和可扩展性[5]。在神经形态设备领域正在进行大量的研究和技术开发,利用了各种忆阻器设备概念,包括电阻式忆阻器设备[6]、相变存储器(PCM)[7]、铁电设备[8]和自旋电子学[9, 10]。这些基于超越CMOS存储设备的创新方法在解决使用传统计算方法进行AI训练时面临的能源挑战方面显示出巨大潜力[1]。其中,自旋电子学设备利用自旋自由度进行信息存储,已成为一种可持续的数据存储技术[11, 12],以及有前景的神经形态硬件原语,如突触、神经元、p比特[10, 13-16]和真随机数生成[17-19]。MTJ被视为一种最先进的自旋电子学存储设备,具有非易失性数据存储、超过周期的耐久性、可调的能量屏障、良好的CMOS兼容性以及亚纳秒级的读写时间,以及数字和模拟切换能力[20-22]。这些MTJ的优点也使基于自旋电子学的神经形态硬件成为各种神经形态架构的合适选择,包括人工神经网络、脉冲神经网络和概率计算。因此,用于神经形态计算的自旋电子学设备正在出现,作为生物突触[22-25]和神经元[26-30]的人工对应物。特别是基于磁畴壁(DWs)和斯格明子(skyrmions)的自旋电子学设备在神经形态计算中展示了多样的应用[31-40]。在这些设备中,自旋轨道扭矩(SOT)设备特别受到关注,因为它们可以解耦读写路径,从而实现更快、更可靠的切换[41, 42]。利用SOT驱动的畴壁运动,研究人员在多项研究中展示了类似突触和神经元的特性[31-36]。然而,对于垂直磁各向异性设备,要实现确定性的SOT需要打破系统的对称性,通常是通过在电流方向上施加外部磁场来实现的[43]。这一要求阻碍了SOT驱动的自旋电子学设备在高密度神经形态或数据存储应用中的可扩展性。实现无场自旋轨道扭矩(SOT)切换一直是扩展自旋电子学存储和神经形态设备的核心挑战。已经提出了各种策略来克服这一限制。Yu等人的早期工作通过引入楔形沉积结构对称性破坏来展示确定性切换[44]。后续的努力采用了结合自旋转移扭矩(STT)和SOT的混合方法,在SAS-MRAM中实现无场切换[45, 46],或者利用SOT、交换偏压和电压控制各向异性在VG-SOT-pMTJ设备中的相互作用[47]。第一个无场垂直SOT-MRAM在[48]中被提出,它结合了一个提供内置对称性破坏的混合自旋源。其他工作利用交换场梯度来诱导内部有效场以实现无场切换[49]。最近,基于二维范德华材料的异质结构被用来在室温以上展示确定性无场切换[50]。这些不同的方法突显了正在追求的材料和设备创新的广度,以消除SOT技术对外部场的需求,这是其实际部署的关键步骤。然而,实现基于无场SOT驱动的畴壁运动的自旋电子学突触,展示多态非易失性可编程塑性导电状态、稳健的线性和增强/抑制对称性,对于实现基于自旋的神经形态硬件至关重要。在神经形态自旋电子学研究中,重点主要放在独立的自旋电子学设备作为权重,或者作为脉冲元素的自旋电子学设备上,例如泄漏的积分- firing神经元。尽管脉冲神经网络在某些方面优于人工神经网络,但它们仍然受到算法和硬件(脉冲神经元)之间不匹配的限制。同时,MTJ在没有外部磁场的情况下的随机SOT驱动切换通常被视为一个缺点,但可以用来实现可控的随机行为,用于概率神经元的操作。由于突触和神经元都源自相同的材料堆栈,研究它们的组合功能可以为集成自旋电子学神经形态系统提供宝贵的见解。在这项工作中,我们开发并实验性地展示了一个基于无场自旋轨道扭矩(SOT)的自旋电子学突触和一个基于电流控制的MTJ的玻尔兹曼随机神经元。无场SOT是通过使用不对称的霍尔条几何结构实现的,其中加入了人工边缘凹槽来加强畴壁的固定。除了提高线性外,这些突触还表现出增强的保持能力。我们展示了一种定制的脉冲工程方案,实现了可控的、接近线性的增强和抑制——这是实现神经形态架构中稳定学习的关键。对于神经元,我们实现了由输入电流大小控制的概率切换行为,模仿了生物神经元的激活动态,并促进了随机神经推断。我们将自旋电子学突触和神经元元素集成到一个受限的玻尔兹曼机器(RBM)计算框架中,并使用MNIST和Fashion-MNIST(FMNIST)数据集验证了它们的功能。我们的结果证明了使用无场SOT和基于MTJ的设备作为节能且可扩展的硬件神经网络的基本构建块的可行性。这项工作为全自旋电子学基础的RBM硬件建立了一个框架,解决了技术集成挑战,并为基于物理的人工智能铺平了道路。

**2 实现无场SOT控制的自旋电子学突触**

自旋电子学突触是实现神经形态计算硬件的基本构建块。这些设备能够实现节能的模拟权重存储。图1展示了无场自旋轨道扭矩(SOT)控制的自旋电子学设备结构。这些结构被设计为具有多个非易失性、可塑性(可编程)导电值的人工突触,使得硬件神经网络能够训练出可编程的模拟权重。为此目的使用的材料堆栈是[Ta(5)/CoFeB(0.65)/MgO(2)/Ta/TaOx(2)],括号中的数字代表纳米(nm)厚度。图1a展示了第一种设备设计,它由一个带有多个横向读取臂的轨道组成。我们设计了两种类型的设备:

1. 具有意通道偏移设计的设备,其中CoFeB/MgO/Ta通道在底部重金属Ta上不对称放置,但这些设备中没有引入人工凹槽,见图1a,b。
2. 在磁性(CoFeB)轨道的两侧都有多个凹槽的设备结构,并且存在轻微的非故意(制造引起的)偏移,见图1c,d。

**无场SOT畴壁突触:**
(a) 具有意偏移设计几何形状的多臂霍尔条设备结构,
(b) 设备的顶视图SEM图像,其放大区域清楚地显示了CoFeB/MgO/Ta通道在重金属Ta上不对称放置的不对称蚀刻几何形状。
(c) 带有凹槽的多臂霍尔条设备结构;CoFeB/MgO/Ta通道在重金属Ta上对称放置,但设计中存在轻微的非故意偏移。
(d) 图c中所示设备的扫描电子显微镜(SEM)图像。这些设备的SEM图像显示了明显的偏移,如图1a所示,并在图1b中得到反映。图1d显示了图1c中凹槽几何形状的SEM顶视图及其放大版本,可以观察到大小为...的凹槽。人工通道偏移的目的是为了在CoFeB层内创建不对称的电流流动,从而实现无场畴壁切换。引入人工凹槽的目的是为了实现可控的畴壁固定,从而促进无场切换,并提供可控的突触电阻调制以及导电状态的增强保持。通道偏移、多个读取臂和凹槽的结合效应实现了无场自旋轨道扭矩(SOT)驱动的畴壁运动。图2展示了在底部Ta通道上CoFeB/MgO/Ta放置不对称的Ta/CoFeB/MgO/Ta霍尔条设备的电流诱导无场SOT切换特性。图2a显示了具有向下偏移(OD)几何形状的多臂霍尔条设备的光学图像。图2b和图2c分别展示了OD [见Sx1部分的光学和SEM图像]和向上偏移(OU) [见Sx1部分]设备的放大示意图。图2d和e分别展示了在零外部磁场()下的电流诱导切换行为。OD设备观察到了明显的、几乎滞后的切换循环,表明了稳健的无场SOT驱动的磁化切换。相比之下,OU设备表现出显著抑制和非确定性的切换行为。为了量化切换可靠性,我们通过重复的电流脉冲切换测量来评估比特错误率(BER)。OD设备表现出高度可靠的切换,BER约为[图2f,h],而OU设备的切换性能显著下降,BER约为[图2g,i]。这种明显的不对称性突出了几何偏移方向在实现确定性无场SOT切换中的关键作用。为了进一步理解这种行为的起源,进行了异常霍尔电阻(-)循环测量,以提取电流诱导的垂直于平面的有效磁场[51, 52] [见Sx1部分了解更多细节]。图2j,k分别展示了在没有施加任何平面内磁场的脉冲电流下OD和OU设备的-循环。对于OD设备,观察到了明显的循环偏移,滞后在正(负)电流脉冲下向负(正)方向移动。这种偏移使得可以直接提取[图2j中的箭头所示]。相比之下,OU设备也表现出循环偏移,但极性相反:滞后在正(负)电流脉冲下向正(负)方向移动。这证实了[的符号由结构不对称的方向决定。图2l显示了作为[函数提取的]。对于OD设备,随着电流的增加[几乎线性增加,表明了一个明确且确定性的SOT驱动的有效场。相比之下,OU设备对电流的依赖性较弱且非单调。鉴于OU设备中的[幅度非常小()并且伴随着较大的误差条,这种非单调性归因于焦耳热引起的随机性,这引入了[提取的不确定性。尽管这种非单调性的详细起源超出了本工作的范围,但两种设备在相同电流极性下的[相反符号与图2d,e中观察到的相反切换极性一致,从而建立了[与无场切换之间的直接联系。为了评估诱导的有效场是否足以驱动磁化反转,我们将[与矫顽场]进行了比较。如图2m所示,OD设备在较高电流()下的比率超过了一,确认有效场足够强,能够实现确定性切换。对于OU设备,比率接近于一,但仍然变化很大,与其较差的切换可靠性和高BER一致。OD设备在相当电流水平下的显著较大比率解释了其优越的切换比率和稳健性。电流诱导的[的起源归因于霍尔条设备的不对称几何形状,包括设计的横向偏移和在氩离子蚀刻过程中形成的CoFeB/MgO/Ta条的楔形边缘。这些结构上的不对称性导致了电流分布和电场梯度的不均匀性,从而产生了垂直的奥斯特场,并在自旋轨道转矩(SOT)效应中引入了一个额外的垂直于平面的自旋极化分量(“-spins”)[53-55]。此外,楔形几何结构引入了磁各向异性场的空间梯度,这促进了SOT下动态非共线自旋纹理的形成。Dzyaloshinskii-Moriya相互作用(DMI)稳定了手性自旋纹理并打破了对称性,从而促进了无场磁化切换[56, 57]。通过定量分析,对OD器件数据的线性拟合得出一个斜率,相当于每个单位的有效场效率,这与之前在Ta/(楔形CoFeB)系统中报告的值一致[56, 57]。我们还注意到,在具有轻微非故意制造引起的偏移的名义上对称的器件中也观察到了类似的无场切换行为和有限的[56, 57],这进一步支持了几何不对称性的关键作用。总体而言,这些结果表明,尽管OD和OU几何结构都打破了镜像对称性,但[56, 57]的大小、符号和稳定性严重依赖于偏移的方向。在OD配置中,有效场有助于SOT驱动的畴壁运动,实现了稳健且确定性的无场切换。相比之下,OU配置产生的有效场较弱且波动,这阻碍或破坏了切换,导致随机行为。这确立了工程化的几何不对称性是实现自旋电子器件中可靠无场SOT切换的关键设计参数。为了获得线性编程的电阻,我们测量了两种类型的器件。(1) 单读出:在这种类型的器件中,横向霍尔臂彼此分离,因此通过将其中一个臂连接到纳伏表来进行读取。在这种情况下,我们观察到了电阻的急剧变化,因为在异常霍尔测量中,[56, 57]取决于围绕横向臂的中心磁化,而磁化会急剧变化。(2) 组合:在这种器件中,多个霍尔臂被短路,然后测量电阻。异常霍尔电阻由以下公式给出:

(1)在大多数情况下,电阻取决于磁化的局部[56, 57]分量,该分量位于两个测量臂之间。在单臂读出方案中,切换是突然的;然而,在多臂设置中,每个臂测量的磁化变化随着畴的扩展而累积。这导致电阻的逐渐切换,如图3a所示。图3a显示了= 0时的特性;此外,在= 25 Oe时也获得了类似的特性(见图S4a)。图3b显示了不同[56, 57]值下的电阻切换(增强/减弱)周期。这个增强/减弱周期重复了五次;显示了这五个周期的平均值。多个模拟电阻状态清楚地反映了SOT控制的畴壁运动或畴的扩展和收缩。在蠕变区域,畴壁速度取决于局部固定势、临界解除固定势、电流和外部磁场。重金属中的电流产生了一种类似阻尼的SOT效应,驱动CoFeB层中的奈尔畴壁运动。DMI固定了畴壁的手性(内部角度[56, 57])。平面内的场[56, 57]设置了畴壁角度[56, 57],从而提高了SOT效率[56, 57]。有效驱动[56, 57]进入畴壁速度;在蠕变/接近阈值区域[56, 57]:

(2)因此,在固定电流幅度下,随着[56, 57]的增加(通过与手性对齐),[56, 57]迅速增加。这降低了解除固定势,减少了巴克豪森跳变,并产生了更少的电阻状态,导致图3b中看到的更突然的更新,如图3d所示。在零[56, 57]附近,畴壁遇到了间歇性的固定势,导致离散电阻状态的增加和线性的改善。我们通过逻辑模型对每个分支(脉冲)进行了建模,其中电阻[56, 57]和[56, 57]是脉冲数的非线性函数,不对称性通过一个单独的场依赖斜率参数[56, 57]来捕捉,用于增强和减弱:

(3)
(4)就磁化演变而言,S形特性源于(i)成核+生长[56, 57]或(ii)在有限窗口内具有每次脉冲成功概率的热辅助多站点切换[56, 57]。每条测量曲线都用逻辑函数在局部进行拟合,我们对所有这些结果拟合了一个全局逻辑函数,由图3b中的连续黑线表示。增强和减弱曲线的斜率通过以下公式计算:

(5)随着[56, 57]从(0到6) Oe的增加,增强(P)和减弱(D)特性的脉冲与斜率(S)曲线在这些场值下变得更高更窄(见图3c):中间的每次脉冲更新[56, 57]增加,而过渡跨越的脉冲数减少(更大)。从物理上讲,[56, 57]设置了畴壁角度以及DMI固定的畴壁手性[56, 57],增强了蠕变区域的有效SOT驱动[56, 57]和畴壁速度[56, 57],产生了更强、不那么类似巴克豪森的更新。P和D的不同之处在于手性使得一个方向与SOT的耦合更有效;在DMI补偿场附近,两个曲线趋于一致,对称性得到改善。全局线性的权衡是,非常大的[56, 57]将更新集中在少数几个脉冲中(早期饱和),而非常小的[56, 57]则将它们分散得太弱;最佳线性发生在[56, 57]过渡跨越32个脉冲的分支时。图2在图查看器中打开PowerPoint

电流诱导的无场切换在Ta/CoFeB/MgO/Ta霍尔条中,其中CoFeB/MgO/Ta条在底部Ta通道上不对称放置。(a) 具有组合多臂和向下偏移(OD)设计的霍尔条器件的光学图像。不对称CoFeB设计的放大示意图:OD (b) 和向上偏移(OU)(c)。在零磁场下,OD (d) 和 OU (e) 器件的电流诱导切换循环(-循环)。(f 和 h) OD 器件中的SOT驱动切换事件显示出比特错误率(BER)为,而 (g 和 i) OU 器件显示出增加的 BER 为。-循环对于 OD (j) 和 OU (k) 器件,在脉冲电流和零平面偏置场下。(l) 提取的两种器件的有效垂直场作为的函数;红线和蓝线代表线性拟合。(m) 两种器件的归一化场作为的函数。 (l) 和 (m) 中的误差条表示从三次测量中提取的或的标准偏差。图3在图查看器中打开PowerPoint

无场SOT控制的器件塑性:(a) 单独读出与组合读出的RI滞后特性,显示了突然与逐渐的电阻转换。(b) 在 和 5] Oe 下测量的(平均周期到周期电阻)增强/减弱,连续的黑曲线显示了拟合的模型。[注意:在我们的测量中,-1 Oe 对应于真实的 0 Oe]。(c) 不同下的增强/减弱斜率 S。(d) 随着增加的增强/减弱中的离散电阻状态数量。(e) 在增加的写入电流脉冲幅度和固定脉冲宽度 50 下测量的(周期到周期平均)电阻增强/减弱,连续的黑曲线显示了电流依赖的电阻演变模型。(f) 对于缩放版本的不对称器件,在增加的写入电流密度下的微磁模拟显示了随机的畴壁固定,与测量的电流依赖电阻切换一致。微磁模拟的详细信息在“方法:建模和模拟”部分讨论,模拟参数包含在表1中。我们在零场和一系列电流幅度下进行了额外的增强和减弱测量,如图3e所示。随着写入电流的增加,实验发现和微磁模拟(见图3f)显示了在固定轨道内的自旋轨道扭矩(SOT)驱动的畴壁的三阶段行为:(i) 在低电流区域(蠕变),有效SOT场的轻微增加导致畴壁速度的显著增加。结果,减弱和增强的效果变得更加明显,平台开始减弱。(ii) 在中等电流区域,畴壁与几何固定点(如人工凹槽和轨道及读出臂连接处的固定点)显著相互作用(见视频S1和S2,了解对称和不对称CoFeB薄膜中的磁化演变)。它可以倾斜或进动,暂时被捕获。这种相互作用导致模拟中的非单调凹陷,在实验观察中表现为较低的中间斜率、较晚的拐点以及平台计数的增加和方差(例如,在–附近)。(iii) 在较高电流下,驱动力超过了固定点,导致运动转变为流动状态,从而恢复了平滑和确定的更新。这种直接相关性建立了观察到的突触非线性与器件设计的固定排列内的SOT–DW相互作用之间的联系。进一步使用磁光克尔显微镜(MOKE)成像来观察凹槽器件中的无场SOT诱导的畴传播。为了将电阻演变与MOKE成像相关联,我们首先应用了16个减弱和16个增强脉冲,并测量了电阻,如图4a所示。器件在MOKE下进行观察,使用了相同的写入脉冲方案。图4b显示了开始时的整个器件MOKE图像(第一个减弱脉冲)。如图4c所示,在减弱阶段的放大图像清楚地显示了当电流达到-8.5 mA时,明亮的畴扩展并覆盖了整个轨道。这与图4a中观察到的类似趋势一致。同样,图4d中的MOKE图像捕捉了增强阶段的磁化演变。在反转电流方向并逐渐增加脉冲幅度时,我们观察到当电流达到8.5 mA时,暗色畴开始占据并覆盖整个轨道。这些图像证明了无场SOT诱导的畴壁运动的实现,因此,器件的减弱和增强。图5a显示了不同写入电流脉冲宽度下的RI滞后。我们观察到,将脉冲宽度从减少到,导致离散的可编程非易失性电阻状态数量从大约个状态增加到大约个状态。这里的离散状态代表了分离良好的电阻值。这清楚地与受限轨道中的自旋轨道扭矩(SOT)诱导的畴壁(DW)运动一致,其中每次脉冲的位移按以下方式缩放:

(6)长电流脉冲()通过在一个脉冲内克服多个固定点,导致畴壁位置的变化(),从而引起电阻的突然变化和状态数量的减少。另一方面,短脉冲()限制了,并允许更精确地采样固定景观,从而增加了状态的数量。这表明即使更短的脉冲也可以进一步提高可分辨状态的数量、线性和对称性。在 = Oe 和不同电流脉冲宽度下获得的类似测量结果显示在图S4b中。在图5b中,显示了在固定幅度写入电流下测量的增强/减弱的平均值和标准差。我们应用了脉冲,产生了20个周期内的多级增强和减弱,显示出可见的平台和周期到周期的变化——表明了随机的固定和解除固定。当我们将写入电流幅度增加到同时将脉冲宽度减少到(见图5c)时,器件从接近阈值的蠕变区域偏离。增加的自旋轨道扭矩(SOT)有效场降低了固定势垒,抑制了噪声,并导致更确定的畴壁(DW)传播。随着的减少,DW壁逐渐移动;总体结果是稳定性的提高、线性的改善以及增强和减弱之间的对称性。每个分支的响应可以通过逻辑函数准确描述,其更新率为。其中的中间斜率影响局部线性。固定幅度的脉冲将更新集中在拐点附近,但在极端情况下可能会饱和。尽管使用恒定的编程脉冲,器件表现出许多忆阻系统的典型准线性突触特性,但神经网络可以通过设备感知的训练来适应这些非理想性。为了进一步提高更新线性,我们还探索了三角形脉冲方案,这些方案在模拟记忆编程中广泛使用,并且可以使用标准的CMOS外围电路轻松实现,例如可编程电流驱动器或阶梯脉冲发生器。我们采用了变化的电流幅度方案,如图5d所示,其中电流幅度从4.75 mA线性增加到8.625 mA用于减弱,从-4.75 mA增加到-8.625 mA用于增强。增加的电流幅度逐渐按比例减少了固定势,使得由于多次固定事件而逐渐移动畴壁。因此,在脉冲驱动中,逻辑斜率在极端情况下最小(接近极端)并在中心附近减小,有效地由于每次脉冲的增量而在整个32脉冲分支中增强了全局线性。图5e,f显示了32和16个线性变化脉冲方案的平均值和标准差。在我们的实验中,我们应用了32个从某个范围到另一个范围的抑制脉冲来触发并逐渐扩展畴。随后是32个增强脉冲,这些脉冲的幅度也在某个范围内变化,用于触发反向畴的生成并完成整个循环。当电流方向反转时,相反的畴开始形成,从而促进了整个过程。我们重复了这个测量20次,以计算电阻切换的平均值和标准差。这种确定的畴形成和传播过程与传输数据直接相关:较高的电流会降低有效的钉扎势,而较短的脉冲则可以防止过冲。这些因素共同作用,提供了更多的可用状态,改善了增强和抑制之间的对称性,并创建了一个更加线性和可重复的突触轨迹。然而,在32脉冲方案中,增强和抑制之间的循环变化较大。这是因为使用32个脉冲使得畴切换更接近阈值区域,在该区域随机性会增加。最初的几个增强脉冲可能会随机地从反向畴中重新形成或解除钉扎,而后面的脉冲则趋于饱和。此时,自旋轨道扭矩(SOT)驱动的畴壁运动会转变为蠕动,导致微小的电阻波动占主导。此外,延长的脉冲序列可能会积累热漂移,从而在缺陷处增加捕获和释放的机会,这会增加标准差。相比之下,16脉冲协议将更新限制在确定性的中间斜率区域,在该区域有效的驱动力更大,畴壁运动更接近流动状态。这种配置使得循环变化显著减小。

图4:在图形查看器中打开

MOKE成像:(a) 随着施加的电流幅度脉冲增加,电阻的实时演变。(b) 测量中的设备完整MOKE图像显示了反向畴(亮区域)的生成。(c) 在抑制阶段,随着绝对电流幅度的增加,设备的放大MOKE图像显示了畴的传播和完全切换;(d) 在增强阶段,随着电流幅度的增加,设备的放大MOKE图像显示了反向畴的生成及其在轨道上的传播。

图5:在图形查看器中打开

调整突触的线性和对称性:(a) 在 = 25 Oe 和逐渐增加的写入脉冲宽度 10, 30, 50, 和 100 时,电阻切换的写入电流脉冲宽度依赖性显示,脉冲宽度越小,电阻切换越平滑。(b) 在脉冲宽度为50 和固定的写入电流 = -2.55 mA; = +2.58 mA 的情况下,测量20个周期后的增强/抑制的平均值和标准差。(c) 当施加 10 和 = -7.25 mA; = +7.2 mA 时,循环间的变化减小,线性略有改善。(d–f) 为了增强增强/抑制的线性和对称性,我们应用了逐渐增加的线性电流斜坡。(d) 使用16脉冲方案重复抑制/增强循环。(e) 使用32脉冲方案的线性编程设备的平均值和标准差;(f) 16脉冲方案的线性和对称性显著提高,循环间的变化也显著减小。

图6:在图形查看器中打开

实现随机MTJ神经元:(a) MTJ随机神经元设备结构和测量示意图。MTJ的直径分别为 和 100 nm。(b) MTJ设备的横截面透射电子显微镜(TEM)和相应的能量色散X射线光谱(EDS)分析。TEM图像(左)突出了MTJ区域(红色虚线框),而EDS元素图(右)显示了Mg、Fe、Co、Ru、Ta和Pt在 层中的空间分布,证实了界面的清晰性和元素组成的均匀性。(c) 在增加的读取电流下,100 nm设备的RH特性显示出良好的PMA,但由于众所周知的TMR的偏压依赖性,在更高的读取电流下TMR降低。(d) 在1 nm和100 nm [详见图S2]设备中测量的SOT控制的随机切换事件。(e,f) 这些设备中的电流控制切换概率[归一化的尖峰率]遵循Boltzmann S型激活函数,使得基于MTJ的Gibbs采样成为可能。

3 随机磁隧道结神经元

为了实现一个完整的自旋电子RBM,我们在两个尺度上制造并表征了无场SOT驱动的磁隧道结(MTJ)设备:微米级(柱状)和纳米级(柱状)。图6a显示了MTJ堆栈(厚度以nm为单位):这里5 nm厚的Ta底层作为自旋轨道扭矩的来源,用于切换0.65 nm厚的低势垒CoFeB自由层。2 nm厚的MgO作为隧道势垒,1.3 nm厚的CoFeB参考层作为固定层,该层本身由基于Ru的多层合成反铁磁体SAF钉扎。设备被加工成名义直径为 和 的圆形柱状。图6b显示了CoFeB自由层、MgO隧道势垒、CoFeB固定层以及其他合成反铁磁Co/Pt层的透射电子显微镜(TEM)元素映射,清晰地界定了界面并表明了高质量的MTJ薄膜沉积。图6c显示了随着读取电流增加,纳米MTJ设备的场电阻滞后特性。在纳米MTJ中,我们实现了33%的隧道磁阻(TMR),而在微米MTJ中,TMR约为44%(见图S5a)。考虑到典型的电压-偏压依赖性,我们观察到随着MTJ两端电压的增加,TMR有所下降。这一趋势在纳米和微米MTJ中随着读取电流的增加也表现得非常明显。此外,我们预计随着读取电流的进一步降低,TMR会有所改善。尽管在没有外部磁场的情况下,SOT驱动的MTJ中的随机切换是众所周知的,但这里的关键思想是控制这种随机性并将其系统级利用,以实现用于神经形态计算的硬件Gibbs采样单元(神经元)。图6d显示了微米MTJ中的SOT驱动随机切换;在纳米MTJ中也测量到了完全相似的特性(详见图S5b)。在这两种设备中,在没有外部场的情况下,我们观察到从低电阻状态到高电阻状态的尖峰(切换)率增加。如图6d所示,在2 mA的写入电流下,MTJ保持沉默;然而,随着电流的增加,MTJ开始随机切换。在所有测量中,直流电流通过Ta,而MTJ的电阻是用纳伏表测量的(详见方法部分)。由于自由层很薄(0.65 nm),这些设备中观察到的电流驱动的随机行为源于自旋轨道扭矩(SOT)和热激活之间的相互作用。通过Ta底层的电荷电流通过自旋霍尔效应产生横向自旋积累,对超薄CoFeB自由层施加扭矩。在低电流下,扭矩不足以克服磁能势垒,导致切换概率P[I]可以忽略不计。随着电流的增加,P[I]也随之增加。当I接近临界值时,SOT降低了能量势垒,允许热波动导致自由层的概率性切换。在更高电流下,由于饱和磁化和加热引起的各向异性能量的降低,势垒崩溃,导致随机切换事件的数量增加。

图7:在图形查看器中打开

自旋电子突触和随机神经元在RBM和DBN架构中的集成:(a) 用于实现权重范围在[-1到1]的自旋电子突触阵列,采用差分对几何结构。(b) 1-RBM + 分类器架构:784个可见神经元,256个隐藏神经元,用于MNIST数据分类。(c) DBN:2个RBM( 和 )和分类器(256)用于FMNIST数据分类。(d) 在MNIST数据集上,使用10、16脉冲线性增加和32脉冲线性增加编程方案的准确率随训练周期的变化。(e) 在FMNIST数据集上,使用10、16脉冲线性增加和32脉冲线性增加编程方案的准确率随训练周期的变化。(f) RBM的t分布随机邻居嵌入(t-SNE)显示了分离良好的簇,意味着RBM学习了隐藏特征。每个脉冲的切换概率遵循Arrhenius定律,

(8) 这可以通过逻辑函数很好地近似,

(9) 其中随着温度和杂散场的变化而变化。这个框架解释了测量到的类S型事件分布:在低电流下,能量势垒较大,而在高电流下,加热降低了矫顽力,杂散场改变了滞后现象,增强了随机事件,但没有达到完全确定的切换。

3.1 神经元模型

这些设备中的电流控制随机切换使它们能够应用于随机计算或Boltzmann机器。我们将切换概率(归一化的尖峰率)建模为通过重金属Ta的写入电流的逻辑函数。在纳米和微米MTJ中,模型基本上是相同的,仅在斜率和临界电流值上有所不同。纳米MTJ设备的神经元模型为

(10) 其中: 是归一化的尖峰概率(y轴), 是输入电流(x轴)。

其中纳米MTJ神经元的拟合参数为: = 5.0, = 4.36 mA。对于微米MTJ,神经元参数为 = 24.0, = 2.44 mA。

4 在受限玻尔兹曼机(RBM)中的集成

自旋电子突触内的多种可编程准线性导电状态,以及随机MTJ神经元,为构建适用于从模式识别到组合优化等不同应用的RBM和深度信念网络(DBN)提供了理想的基础,包括旅行商问题和图着色等任务。在RBM模拟中,我们使用差分对方法将这些自旋电子突触作为RBM中的对称权重(见图7a),从而实现了正负权重。MTJ随机神经元本质上支持RBM和DBN所需的硬件内Gibbs采样。我们在RBM()和分类器()架构中使用了这些MTJ设备作为MNIST识别的神经元[58],如图7b所示。对于FMNIST数据集[59],我们将网络扩展为包含2个RBM的DBN,即RBM-1(),RBM-2()和分类器()(见图7C)。我们的框架中的训练过程采用了两阶段方法,结合了设备物理和网络学习。在图7b所示的RBM + 分类器中,RBM层使用对比散度(CD-1)算法进行训练,以捕获无监督的特征表示。之后,通过反向传播使用交叉熵损失对softmax分类器进行微调。DW-突触电阻状态被用作RBM和DBN中的权重。模拟考虑了实际测量的状态,而不是电阻模型。权重使用测量的循环间平均电阻状态进行初始化,并且为了考虑循环间变化的影响,我们进一步使用( - , + )对网络进行测试,其中代表标准差,捕捉循环间变化,从而将设备变异性嵌入学习过程中(如图7d所示)。在DBN中,循环间的变异性被建模为噪声。受限玻尔兹曼机(RBM)层首先使用对比散度(CD-1)进行预训练,其中突触权重是从测量的设备导电状态获得的,这直接将设备变异性整合到学习算法中:

(11) 在分类器阶段使用反向传播进行微调,通过交叉熵损失来改善任务级别的性能。

(12) 我们使用了包括10个恒定电流脉冲、线性增加的16脉冲方案和线性增加的32脉冲方案的写入方案得出的权重。如图7e所示,我们使用16脉冲方案实现了90%的识别准确率,这归因于非常低的 和在这种情况下最高的线性和对称性。在32脉冲线性增加电流方案中,准确率稳定在89%左右,而在10个恒定电流脉冲方案中,准确率最初约为93%,但最终稳定在86%左右。在DBN中,MNIST数据识别的准确率在16状态方案中约为98%,在32状态方案中达到86%(见图7f)。不同脉冲方案的扩展准确率结果在表S2中有进一步详细说明。最后,由于突触和神经元都通过噪声权重采样和概率性切换从MTJ物理中引入了随机性,RBM自然表现出神经采样机(NSM)的特性,从而能够与底层的自旋电子硬件进行一致的推理和采样。

5 结论

总结来说,我们展示了使用行业标准Ta/CoFeB/MgO材料堆栈实现的无场自旋轨道扭矩(SOT)编程自旋电子突触和SOT控制的磁隧道结(MTJ)随机神经元。无场SOT神经形态设备的发展对于将这些技术扩展到神经形态电路至关重要。我们的设备设计具有不对称霍尔条,包括凹槽和多个臂。无场磁化切换的机制基于结构反演不对称性、界面Dzyaloshinskii-Moriya相互作用(DMI)和电流诱导效应的综合作用。这些组件共同实现了确定性的、节能的畴壁运动,从而实现了突触中的磁化控制。我们的设计还包括了畴壁(DW)固定,使得电流驱动的畴壁运动成为可能,并实现了多个稳定的、可编程的电阻状态,具有出色的线性、重复性和在增强/抑制周期中的对称性。这些指标对于任何忆阻式突触设备中的神经网络训练和推理都至关重要。缩小到100纳米直径的MTJ神经元设备表现出SOT控制的、类似玻尔兹曼的随机切换行为。切换概率作为电流的函数被建模为一个在硬件中执行Gibbs采样的逻辑神经元,使得这些神经元成为受限玻尔兹曼机(RBM)架构的理想候选者。这些神经元被集成到RBM和深度信念网络(DBN)架构中作为Gibbs采样单元和分类器神经元。自旋电子突触权重作为RBM训练所需的双极权重,使得能够捕捉数据中的正面和负面特征。使用来自各种编程方案的突触权重,我们使用16脉冲协议实现了高达90%的识别准确率,使用32脉冲协议实现了大约89%的准确率,使用恒定脉冲实现了大约86%的准确率。在DBN中,MNIST上的分类准确率达到了98%,FMNIST上的分类准确率为85-86%。MTJ突触和神经元的固有随机性进一步使得RBM具有类似神经采样机的特性,允许直接将概率推理映射到自旋电子硬件上。霍尔条突触以及随机MTJ神经元为全自旋电子RBM和DBN电路建立了必要的硬件组件。虽然在全MTJ堆栈中管理杂散场以实现无场SOT-MTJ仍然具有挑战性,但我们正在积极优化和实现用于无场突触的全MTJ。总体而言,突触特性、随机神经元激活和固有的采样特性为全自旋电子神经形态系统提供了一个可扩展的框架,使得分类、优化和其他应用成为可能,正如本工作中所展示的。

6 方法

6.1 设备制造

对于霍尔条设备,沉积了一层Ta(5纳米)/(0.65纳米)/MgO(2纳米)/Ta(2纳米)的堆栈。此外,还沉积了一层(0.9纳米)/MgO(2纳米)/Ta(2纳米)的堆栈作为离子束蚀刻的参考样品(如下所述)。对于MTJ设备,沉积了一个多层堆栈,包括Ta(5纳米)/(0.65纳米)/MgO(2纳米)/(1.3纳米)/Ta(0.6纳米)/Co(0.6纳米)/Pt(1.5纳米)/[Co(0.4纳米)/Pt(0.2纳米)/Co(0.5纳米)/Ru(1.0纳米)/Co(0.5纳米)/[Pt(0.2纳米)/Co(0.4纳米)/Ta(8纳米)。此外,还沉积了一个类似的堆栈,以(0.9纳米)作为底部磁层,作为MTJ柱的离子束蚀刻的参考样品#M。MgO层是通过RF磁控溅射沉积的,而所有其他层都是通过DC磁控溅射沉积的。所有薄膜都是在室温下使用ROTARIS溅射器在Si/(300纳米)基底上沉积的,基础压力约为mbar。

6.1.1 霍尔条设备制造

在将薄膜图案化为霍尔条设备之前,它们在真空中以300摄氏度退火1小时,并施加了8 kOe的垂直磁场。光刻是使用Heidelberg DWL66+无掩模激光光刻系统和AZ 5214E正性光刻胶进行的。Ar离子蚀刻是使用ADVANCEDMEMS离子束蚀刻器进行的。首先,使用暗模式曝光将霍尔条图案(有凹槽和无凹槽的)转移到薄膜上,然后进行显影和离子束蚀刻以形成标准的霍尔条(有凹槽和无凹槽的)。在第二步光刻中,用光刻胶覆盖霍尔条的电流通道。霍尔条和参考样品同时被蚀刻,直到参考样品变得绝缘,从而移除了(0.65纳米)/MgO(2纳米)/Ta(2纳米)堆栈。第三步光刻用于定义电接触垫,然后使用ESC溅射系统和剥离工艺沉积Ti(10纳米)/Au(100纳米)。

6.1.2 MTJ制造

磁隧道结(MTJ)的制造涉及精确的设备设计,包括对准标记,以实现无掩模激光光刻和电子束光刻(EBL)之间的准确重叠,同时最小化曝光时间。图案化是使用Heidelberg DWL66+无掩模激光光刻系统和JEOL JBX-6300FS EBL系统进行的。AZ 5214E光刻胶用于激光光刻,而mAN-3403负性光刻胶用于高分辨率EBL图案化。在暗模式激光光刻和显影之后,通过使用ADVANCEDMEMS离子束蚀刻器进行氩离子束蚀刻来定义图案转移。随后,通过使用JEOL EBL系统在100 kV和100 pA下以300纳米厚的mAN-2403光刻胶进行曝光,图案化纳米级柱结构。EBL处理的样品与参考样品同时被蚀刻,直到参考样品变得电绝缘——表明多层堆栈(不包括Ta层)从未受保护的区域完全去除。在不剥离光刻胶的情况下,样品立即转移到AJA磁控溅射系统上,沉积60纳米的绝缘封装层。然后通过N-甲基-2-吡咯烷酮(NMP)中的超声清洗去除剩余的光刻胶,从而在纳米柱顶部形成明确的开口,以便接触顶部电极。进一步使用明模式激光光刻在底部通道电极区域定义开口。然后使用Oxford PlasmaLab System 100 ICP-RIE系统通过反应离子蚀刻(RIE)去除指定接触点的材料。最后,使用明模式无掩模激光光刻定义电接触垫,然后通过ESC溅射和剥离工艺沉积Ti(10纳米)/Au(100纳米),完成MTJ设备的制造。MTJ设备在真空中以300摄氏度退火1小时,并施加了8 kOe的垂直磁场。

6.2 电气测量

电气测量是使用East changing EM3P系统进行的,该系统配备了两个Keithley Model 6221电流源和一个Keithley Model 2182A纳伏表。对于多脉冲测量,一个Keithley 6221用于施加典型的脉冲宽度为10毫安的电流脉冲(除非另有说明),作为写入电流,而另一个Keithley 6221在写入电流脉冲后几秒钟提供一个小的直流读取电流(通常为0.1毫安)。使用Keithley 2182A纳伏表测量读取电流下的霍尔电压。对于MTJ神经元特性(时间依赖的测量),一个Keithley 6221用于通过MTJ的底部通道施加相对较大的直流电流。在地面和MTJ顶部电极之间连接了一个10欧姆的电阻器,使得电阻器与MTJ串联,并允许大约0.01%的直流电流通过MTJ并流过电阻器。通过使用Keithley 2182A纳伏表测量10欧姆电阻器两端的电压来确定MTJ的电阻状态。MTJ的电阻(R)使用以下公式计算:

(13)其中R是MTJ底部通道的电阻,Rref是参考电阻器(10欧姆)的电阻,V是测量到的电阻器两端的电压,I是施加的直流电流。

6.3 MOKE测量

MOKE测量是使用TuoTuo Technology TTT-02 Kerr显微镜系统进行的,该系统配备了Keithley Model 6221电流源和Keithley Model 2182A纳伏表。测量过程中使用波长为635纳米的红光激光作为成像光源。Keithley 6221用于施加典型的脉冲宽度为10毫安的电流脉冲(除非另有说明),作为写入电流。最初,在霍尔条设备处于饱和磁化状态时捕获背景图像,这是通过施加一个大电流脉冲(8毫安)并结合一个26 Oe的平面内磁场来实现的。随后,在每个电流脉冲之后,使用Kerr显微镜系统记录差分图像。如果适用,会施加一个外部磁场,并使用外部高斯计测量其大小。

6.4 建模和仿真

在仿真中使用的0.65纳米磁层的总磁能包括交换能、塞曼能、单轴各向异性能、退磁能和DMI能。

(14)其中Kex是交换刚度,Perm是磁导率,Anisotropy是各向异性能量密度,Demag是退磁场,ExteriorField是外部场;此外,DMI能量密度然后按以下方式计算:

(15)微磁仿真是使用MuMax [60]进行的,该软件采用Landau–Lipschitz–Gilbert(LLG)方程作为计算磁化动态的核心原理。LLG方程以以下方式捕捉磁化动态:

(16)其中MagnetizationVector是归一化磁化矢量,GyromagneticRatio是旋磁比,GilbertDampingCoefficient是吉尔伯特阻尼系数,

(17)是磁化过程发生的有效磁场。然后,将自旋轨道扭矩作为修改后的STT添加到MuMax中。

(18)其中SpinHallCoefficient是材料的自旋霍尔系数,CurrentDensity是电流密度,FreeLayerThickness是自由层厚度。仿真参数在表1中给出。我们定义了带有侧臂的轨迹,如(SF1)所示,这与不对称和有凹槽的器件设计相匹配。在没有磁场的情况下,进行了多次批量仿真,电流密度逐渐增加。微磁图像和视频已添加到SF1中。表1. 磁性仿真细节。网格

细胞

各向异性

饱和度

交换

DMI

尺寸

尺寸

Ku

Mag.Ms

刚度

(纳米)

( )

( )

( )

( )

( )

( )

512, 128,

0.9

0.8

1

0.65

1

0.65

作者贡献

A.H.L.提出了无场SOT自旋电子突触设备和随机MTJ的想法,以及它们集成到RBM中的方案。A.H.L.、M.T.和C.F.规划了设备设计。M.T.和C.F.制造了设备。M.T.和A.H.L.规划并进行了突触和神经元设备的电气测量。M.T.、B.H.和J.X.进行了MOKE成像。A.H.L.进行了微磁仿真、突触和神经元建模,以及它们集成到RBM架构中的工作。G.M.进行了MTJ的TEM成像。A.H.L.在M. Tang、C.F.和G.S.的支持下撰写了手稿。所有作者都参与了结果的讨论和审查。G.S.在整个项目中提供了监督。

致谢

作者感谢Nabeel Aslam博士和Syed Kazmi博士的宝贵见解,并感谢Nanofabrication Core Lab提供了大部分设备制造的设施。

利益冲突

作者声明没有利益冲突。

数据可用性声明

与本研究相关的数据可以在合理请求时从作者处获得。

生物通微信公众号
微信
新浪微博


生物通 版权所有