超表面是由亚波长“超”原子组成的二维阵列,通过实现对光-物质相互作用的精确和多功能控制,彻底改变了电磁波操控领域[[1], [2], [3]]。这些人工设计的结构超越了天然材料的固有限制,在包括遥感[4]、计算成像[5,6]和生物物理检测[7]在内的多种应用中取得了显著进展。尽管潜力巨大,但传统的设计方法(如有限元分析(FEA)和时域有限差分(FDTD)模拟)在应对现代光子系统日益增长的复杂性和多目标优化要求方面面临越来越大的挑战。经典的优化方法(包括拓扑优化[8,9]、进化算法[10,11]、基于伴随的方法[12,13]和混合逆向设计策略[14])在超表面设计方面取得了显著进展,但通常受到计算成本、收敛不稳定性和数据利用效率低下的限制。这些根本性限制促进了通过深度学习的数据驱动逆向设计范式的出现,建立了与传统设计方法互补的计算框架[[15], [16], [17]]。
在超表面逆向设计中,包括多层感知器(MLPs)[18]、卷积神经网络(CNNs)[19,20]、长短期记忆(LSTM)网络[21]和Transformer架构[22]在内的判别模型在从目标光学响应预测结构参数方面表现出色,显著加速了计算工作流程。MLPs在低维设计空间中表现出色[[23], [24], [25], [26], [27]],而CNNs能够捕捉高维模式中的复杂空间关系[[28], [29], [30], [31]]。同样,LSTM网络和Transformer能够模拟序列依赖性和长距离相互作用[[32], [33], [34]]。然而,判别模型本质上局限于训练数据分布内的插值,限制了它们生成新设计或完全探索设计空间的能力。
作为判别方法的补充,生成模型作为一种有前景的超表面逆向设计范式出现,它们通过学习并从底层数据分布中合成[[35]]。其中,变分自编码器(VAEs)[36]和生成对抗网络(GANs)[37]在设计合成方面尤为突出。VAEs通过结合物理约束生成结构多样且可制造的设计[[38,39]],而GANs通过对抗训练产生精确的模式[[40], [41], [42], [43], [44]]。尽管它们具有优势,但VAEs为了潜在空间的规范化通常会牺牲重建精度,导致保真度降低[[45]],而GANs则存在训练不稳定性和模式崩溃的问题[[46,47]]。此外,这两种框架都缺乏坚实的概率基础,阻碍了不确定性量化[[48]]。这些限制强调了需要先进的生成框架来充分利用数据驱动逆向设计的潜力。
扩散模型最近作为最先进的生成框架出现,在高分辨率图像合成和视频生成方面展现了前所未有的性能[[49], [50], [51], [52], [53]]。这些模型采用了一个向前添加噪声的过程和一个反向学习去噪的过程,从而能够生成具有复杂细节的精确输出。这一框架在图像生成领域取得了深刻进展,例如广泛采用的Stable Diffusion和DALL·E。尽管取得了这些成功,但它们在超表面设计中的应用仍处于起步阶段。最近的研究展示了将去噪扩散概率模型(DDPM)应用于超表面逆向设计的方法,称为MetaDiffusion方法[[54]]。虽然该方法显示出高预测精度,但在设计过程中固定了结构参数,限制了其灵活性和实用性。为了解决这一限制,后续研究提出了图像-参数扩散模型(I-P DM),该方法同时处理结构参数和模式,显著提高了设计灵活性[[55]]。然而,这种改进以模型复杂性和计算需求的增加为代价。此外,这两种方法都依赖于预测神经网络(PNN),这是一种在早期研究中为透射率正向预测提出的混合CNN-MLP架构[[56]]。然而,PNN通常需要较长的训练迭代才能达到满意的性能,这对它们在超表面逆向设计中的快速可靠应用构成了重大挑战。此外,与后来广泛采用的去噪扩散隐式模型(DDIM)相比,DDPM中大量的去噪步骤导致生成时间延长,限制了其与后续优化模块或其他优化算法的集成实用性[[50]]。最近,逆向设计领域从自动化设计算法转向了自适应设计范式[[57,58]],甚至有研究利用大型语言模型(LLMs)进行自主设备工程[[59], [60], [61]]。这种演变,加上上述计算限制,迫切需要一个能够同时实现更高设计自由度、卓越计算效率和更高级预测精度的新型框架。
受到思维链(CoT)范式的启发[[62], [63], [64]],这是推理语言模型(RLMs)高性能的关键驱动因素,我们提出了超表面逐步推理(MetaSR),这是一种创新的逐步生成-判别推理框架,用于超表面逆向设计。类似于CoT如何通过逻辑分割使语言模型解决复杂问题,所提出的MetaSR将逆向设计挑战分解为由专用神经模块执行的专门子任务。我们的框架整合了三个顺序排列的组件:模式生成模块(PGM)、参数推断模块(PIM)和透射率预测模块(TPM),共同促进设计解决方案的生成和评估。这种模块化方法提高了计算效率和质量,同时通过模块间的物理信息约束确保了可制造性。与端到端方法相比,MetaSR通过允许直接检查中间设计阶段提供了更高的可解释性。这种逐步范式为复杂的逆向设计挑战提供了稳健的解决方案,推动了超表面工程的实际应用。