尺寸可控的Galinstan薄膜在宽带可饱和吸收特性方面的研究及其在光神经网络应用中的潜力

时间：2026年5月24日

来源：Optical Materials

编辑推荐：

焦梦阳|李慧|顾敏|张启明上海科技大学人工智能科学与技术学院，上海200093，中国摘要高性能非线性光学（NLO）材料是下一代光电子学不可或缺的组成部分，它们在光神经网络（ONNs）中作为光学非线性激活单元发挥着关键作用，然而其实现仍然具有挑战性。本研究证明，尺寸可控的Galin

焦梦阳|李慧|顾敏|张启明

上海科技大学人工智能科学与技术学院，上海200093，中国

摘要

高性能非线性光学（NLO）材料是下一代光电子学不可或缺的组成部分，它们在光神经网络（ONNs）中作为光学非线性激活单元发挥着关键作用，然而其实现仍然具有挑战性。本研究证明，尺寸可控的Galinstan薄膜为实现全光非线性激活函数提供了一个强大且可调的平台，具有广泛的应用潜力。通过将纳米粒子的尺寸与其局域表面等离子体共振（LSPR）特性相关联，我们展示了一种在可见光到近红外光谱范围内调节NLO响应的通用方法。NLO行为源于LSPR的场增强效应，这导致了显著的饱和吸收（SA）。Galinstan薄膜的非线性吸收系数超过了某些经典NLO材料。此外，Galinstan薄膜还具有非常低的光学极限阈值，这对ONNs的应用非常有利。在ONNs的数值模拟中进一步评估了这些Galinstan薄膜激活单元的实用性，结果显示它们在MNIST和Fashion-MNIST数据集上实现了高精度的数字和图像识别（>97%）。这项工作为ONNs引入了一种宽带光学激活介质，并为下一代AI硬件指明了潜在的方向。

引言

人工智能（AI）正在迅速改变现代产业，其应用范围涵盖自然语言处理[1]、计算机视觉[2]、医学诊断[3]和自动驾驶[4]等领域。这一技术变革得益于机器学习模型规模和复杂性的指数级增长[5]，这对计算硬件提出了前所未有的要求[6]。然而，传统的电子架构存在固有的局限性[7]。冯·诺依曼架构中存储单元和处理单元的物理分离导致了众所周知的“内存墙”问题[8]，即大量的数据传输导致了高延迟和过高的能耗[9]，这在部署大规模模型（如Transformer[10]）时尤为关键。光神经网络（ONNs）作为一种有前景的计算范式应运而生，它利用光子而非电子作为信息载体，从而克服了这些瓶颈[11]。得益于光的超快传播速度、大规模并行性和低能耗，ONNs可以直接在光学域内执行矩阵运算，显著减少了与电光转换相关的开销[12]。因此，ONNs的能量效率比电子平台高出几个数量级。尽管在线性运算方面具有优势，ONNs仍面临一个核心挑战，即实现高效、宽带的非线性激活函数[13]、[14]。由于非线性矩阵运算必须通过光学方式实现，因此找到同时具备强非线性光学（NLO）响应、低成本和易于集成的材料至关重要[15]。

贵金属纳米粒子（如金和银）在非线性光学领域引起了广泛关注，特别是在开发高性能饱和吸收剂方面[16]、[17]。贵金属纳米粒子的吸引力在于其局域表面等离子体共振（LSPR）效应，即入射光子能够共振驱动纳米粒子中自由电子的集体振荡，产生强烈的局部电磁场[18]、[19]。通过控制纳米粒子的尺寸、形态和介电环境，可以精确地将LSPR峰值调谐到目标波长[19]、[20]。这种等离子体共振不仅决定了线性吸收特性，还显著增强了三阶非线性[21]。例如，金纳米薄膜在400纳米处的非线性吸收系数可达10³ cm·GW^-1 [22]，而银纳米线薄膜[23]和铱纳米粒子[24]在不同光谱区域也表现出显著的非线性响应。然而，贵金属纳米粒子在实际应用于ONNs时受到多种限制[25]。它们的组成元素稀缺且昂贵，导致大规模制造成本高昂。贵金属的LSPR带宽通常较窄[22]、[23]、[24]，限制了其操作波长范围，并降低了与多波长光学系统的兼容性。这些限制使得它们不适合用于可扩展、宽带且成本效益高的ONNs实现，因此需要探索结合强非线性响应、更宽可调范围和更低成本的替代材料。

为了克服这些挑战，我们提出了一种新策略，利用Galinstan（Ga-In-Sn合金[26]、[27]）液态金属纳米薄膜作为高性能的光学非线性激活平台。与以往关于传统金属或等离子体饱和吸收剂的报告[27]、[28]、[29]、[30]、[31]、[32]、[33]、[34]、[35]、[36]不同，Galinstan液态金属纳米薄膜的独特之处在于它结合了设备兼容的致密薄膜、实验验证、适用于ONNs的饱和吸收、低成本液态金属与氧化层外壳、基于LSPR的机制、无需光刻的制造工艺以及单一组分的简单性（详见补充信息中的表S1）。液态金属合金在室温下独特地结合了金属特性和流体适应性，其组成元素丰富、成本低廉且对环境友好[26]、[27]、[37]、[38]。Galinstan纳米粒子表现出尺寸依赖的LSPR，通过超声波调控粒子尺寸，可以将其从可见光范围连续调谐到近红外范围（大约400–1100纳米），从而提供比贵金属纳米粒子更宽的光谱覆盖范围[27]。这种可调性确保了与不同波长运行的多种ONNs架构的兼容性。除了等离子体吸收外，Galinstan还展示了显著的非线性折射特性。据报道，Galinstan纳米粒子的非线性折射率在400–4000纳米的宽光谱范围内可达10⁴–10⁵ cm² GW^-1，远超许多传统介电或金属非线性材料的数值[27]。这表明在相对较低的激发强度下也能实现强非线性相互作用。尽管具有这些优势，但对Galinstan的非线性吸收行为的系统研究，尤其是在固态形式下的研究仍然有限[39]。以往的研究主要集中在溶液基Galinstan纳米粒子上，虽然这些系统对基础研究很有用，但存在不稳定性和与集成光子平台不兼容的问题[27]。

在这项研究中，我们介绍了一种基于尺寸可控的Galinstan纳米薄膜的可重构全光非线性激活函数（图1(a)），通过LSPR增强的吸收实现宽带和可调的NLO响应。通过精确调整纳米粒子尺寸，我们建立了共振波长与NLO强度之间的定量关系，实现了宽光谱覆盖和稳健的非线性调制。利用这种工程化的NLO行为，我们在ONNs模型中实现了光学激活功能（图1(b)），并在多个分类任务的标准机器学习基准测试中评估了其性能。基于Galinstan的设备在MNIST和Fashion-MNIST识别任务中的能量效率优于传统的光电非线性方法。在MNIST识别任务中，基于Galinstan的设备的分类准确率达到了97.54%。此外，在复杂的Fashion-MNIST识别任务中，分类准确率也超过了传统非线性方法，达到了87.90%。

章节片段

材料制备

Galinstan纳米粒子是通过合金化和超声波方法制备的。首先将Ga（67 wt.%）、In（20.5 wt.%）和Sn（12.5 wt.%）颗粒充分混合后，将混合物在500°C下加热30分钟，得到一大块Galinstan合金溶液。取3克Galinstan液态合金，将其加入到200毫升N-甲基-2-吡咯里酮（NMP）中，整个过程在无氧干燥环境中进行。然后使用超声波清洗器对混合物进行超声处理。

材料表征和线性光学吸收

通过扫描电子显微镜（SEM）对Galinstan薄膜的形态特征进行了表征。Galinstan薄膜的SEM图像如图2(a-f)所示。不同处理时间得到的纳米粒子尺寸分别为150纳米、90纳米和60纳米，如图2(a–c)中所统计展示。尺寸分布直方图的纵轴标记为“粒子数量”（无量纲计数）。薄膜厚度约为700纳米，如图所示。