人工智能(AI)正在迅速改变现代产业,其应用范围涵盖自然语言处理[1]、计算机视觉[2]、医学诊断[3]和自动驾驶[4]等领域。这一技术变革得益于机器学习模型规模和复杂性的指数级增长[5],这对计算硬件提出了前所未有的要求[6]。然而,传统的电子架构存在固有的局限性[7]。冯·诺依曼架构中存储单元和处理单元的物理分离导致了众所周知的“内存墙”问题[8],即大量的数据传输导致了高延迟和过高的能耗[9],这在部署大规模模型(如Transformer[10])时尤为关键。光神经网络(ONNs)作为一种有前景的计算范式应运而生,它利用光子而非电子作为信息载体,从而克服了这些瓶颈[11]。得益于光的超快传播速度、大规模并行性和低能耗,ONNs可以直接在光学域内执行矩阵运算,显著减少了与电光转换相关的开销[12]。因此,ONNs的能量效率比电子平台高出几个数量级。尽管在线性运算方面具有优势,ONNs仍面临一个核心挑战,即实现高效、宽带的非线性激活函数[13]、[14]。由于非线性矩阵运算必须通过光学方式实现,因此找到同时具备强非线性光学(NLO)响应、低成本和易于集成的材料至关重要[15]。
贵金属纳米粒子(如金和银)在非线性光学领域引起了广泛关注,特别是在开发高性能饱和吸收剂方面[16]、[17]。贵金属纳米粒子的吸引力在于其局域表面等离子体共振(LSPR)效应,即入射光子能够共振驱动纳米粒子中自由电子的集体振荡,产生强烈的局部电磁场[18]、[19]。通过控制纳米粒子的尺寸、形态和介电环境,可以精确地将LSPR峰值调谐到目标波长[19]、[20]。这种等离子体共振不仅决定了线性吸收特性,还显著增强了三阶非线性[21]。例如,金纳米薄膜在400纳米处的非线性吸收系数可达103 cm·GW-1 [22],而银纳米线薄膜[23]和铱纳米粒子[24]在不同光谱区域也表现出显著的非线性响应。然而,贵金属纳米粒子在实际应用于ONNs时受到多种限制[25]。它们的组成元素稀缺且昂贵,导致大规模制造成本高昂。贵金属的LSPR带宽通常较窄[22]、[23]、[24],限制了其操作波长范围,并降低了与多波长光学系统的兼容性。这些限制使得它们不适合用于可扩展、宽带且成本效益高的ONNs实现,因此需要探索结合强非线性响应、更宽可调范围和更低成本的替代材料。
为了克服这些挑战,我们提出了一种新策略,利用Galinstan(Ga-In-Sn合金[26]、[27])液态金属纳米薄膜作为高性能的光学非线性激活平台。与以往关于传统金属或等离子体饱和吸收剂的报告[27]、[28]、[29]、[30]、[31]、[32]、[33]、[34]、[35]、[36]不同,Galinstan液态金属纳米薄膜的独特之处在于它结合了设备兼容的致密薄膜、实验验证、适用于ONNs的饱和吸收、低成本液态金属与氧化层外壳、基于LSPR的机制、无需光刻的制造工艺以及单一组分的简单性(详见补充信息中的表S1)。液态金属合金在室温下独特地结合了金属特性和流体适应性,其组成元素丰富、成本低廉且对环境友好[26]、[27]、[37]、[38]。Galinstan纳米粒子表现出尺寸依赖的LSPR,通过超声波调控粒子尺寸,可以将其从可见光范围连续调谐到近红外范围(大约400–1100纳米),从而提供比贵金属纳米粒子更宽的光谱覆盖范围[27]。这种可调性确保了与不同波长运行的多种ONNs架构的兼容性。除了等离子体吸收外,Galinstan还展示了显著的非线性折射特性。据报道,Galinstan纳米粒子的非线性折射率在400–4000纳米的宽光谱范围内可达104–105 cm2 GW-1,远超许多传统介电或金属非线性材料的数值[27]。这表明在相对较低的激发强度下也能实现强非线性相互作用。尽管具有这些优势,但对Galinstan的非线性吸收行为的系统研究,尤其是在固态形式下的研究仍然有限[39]。以往的研究主要集中在溶液基Galinstan纳米粒子上,虽然这些系统对基础研究很有用,但存在不稳定性和与集成光子平台不兼容的问题[27]。
在这项研究中,我们介绍了一种基于尺寸可控的Galinstan纳米薄膜的可重构全光非线性激活函数(图1(a)),通过LSPR增强的吸收实现宽带和可调的NLO响应。通过精确调整纳米粒子尺寸,我们建立了共振波长与NLO强度之间的定量关系,实现了宽光谱覆盖和稳健的非线性调制。利用这种工程化的NLO行为,我们在ONNs模型中实现了光学激活功能(图1(b)),并在多个分类任务的标准机器学习基准测试中评估了其性能。基于Galinstan的设备在MNIST和Fashion-MNIST识别任务中的能量效率优于传统的光电非线性方法。在MNIST识别任务中,基于Galinstan的设备的分类准确率达到了97.54%。此外,在复杂的Fashion-MNIST识别任务中,分类准确率也超过了传统非线性方法,达到了87.90%。