一种用于超表面逆向设计的新型逐步生成-判别推理框架

时间：2026年1月9日

来源：Optics & Laser Technology

编辑推荐：

基于Chain-of-Thought原理提出元表面逆设计分步生成-推断框架MetaSR，集成图案生成、参数推断和透射预测模块，通过DDPM/DDIM扩散模型生成候选结构并利用Transformer编码器优化参数预测，在保证制造可行性的同时实现亚秒级高效设计探索与亚毫米级光学响应精度（MAE=0.005261）。

哈尔滨工业大学仪器科学与工程学院先进显微镜与仪器研究中心，中国哈尔滨 150080

摘要

超表面逆向设计是先进光子应用的核心，但在平衡设计精度和计算效率方面一直面临挑战。为了解决这些问题，我们提出了超表面逐步推理（MetaSR）这一新颖的逐步生成-判别框架，该框架借鉴了思维链（CoT）推理原理。MetaSR将逆向设计任务分解为一个透明的推理链：首先，基于U-Net的模式生成模块（PGM）使用去噪扩散概率模型（DDPM）或去噪扩散隐式模型（DDIM）生成候选模式；随后，参数推断模块（PIM）推断结构参数；最后，透射率预测模块（TPM）预测光学响应以进行验证，后两个模块均使用了Transformer编码器。定量评估表明，MetaSR具有出色的多功能性能，当优先考虑精度时，MetaSR-DDPM在最佳设计下的平均绝对误差（MAE）为0.005261，均方误差（MSE）为0.0005637；而当强调效率时，MetaSR-DDIM能在几秒钟内生成数百个高质量候选结构，从而实现快速的设计空间探索。除了这些指标外，MetaSR的模块化架构通过其透明的逐步推理过程提供了新的可解释性，这是传统黑盒方法的重要优势。所提出的框架为超表面逆向设计建立了一个新的范式，结合了卓越的性能、设计可解释性和可扩展性，有望在多种纳米光子应用中产生重大影响。

引言

超表面是由亚波长“超”原子组成的二维阵列，通过实现对光-物质相互作用的精确和多功能控制，彻底改变了电磁波操控领域[[1], [2], [3]]。这些人工设计的结构超越了天然材料的固有限制，在包括遥感[4]、计算成像[5,6]和生物物理检测[7]在内的多种应用中取得了显著进展。尽管潜力巨大，但传统的设计方法（如有限元分析（FEA）和时域有限差分（FDTD）模拟）在应对现代光子系统日益增长的复杂性和多目标优化要求方面面临越来越大的挑战。经典的优化方法（包括拓扑优化[8,9]、进化算法[10,11]、基于伴随的方法[12,13]和混合逆向设计策略[14]）在超表面设计方面取得了显著进展，但通常受到计算成本、收敛不稳定性和数据利用效率低下的限制。这些根本性限制促进了通过深度学习的数据驱动逆向设计范式的出现，建立了与传统设计方法互补的计算框架[[15], [16], [17]]。

在超表面逆向设计中，包括多层感知器（MLPs）[18]、卷积神经网络（CNNs）[19,20]、长短期记忆（LSTM）网络[21]和Transformer架构[22]在内的判别模型在从目标光学响应预测结构参数方面表现出色，显著加速了计算工作流程。MLPs在低维设计空间中表现出色[[23], [24], [25], [26], [27]]，而CNNs能够捕捉高维模式中的复杂空间关系[[28], [29], [30], [31]]。同样，LSTM网络和Transformer能够模拟序列依赖性和长距离相互作用[[32], [33], [34]]。然而，判别模型本质上局限于训练数据分布内的插值，限制了它们生成新设计或完全探索设计空间的能力。

作为判别方法的补充，生成模型作为一种有前景的超表面逆向设计范式出现，它们通过学习并从底层数据分布中合成[[35]]。其中，变分自编码器（VAEs）[36]和生成对抗网络（GANs）[37]在设计合成方面尤为突出。VAEs通过结合物理约束生成结构多样且可制造的设计[[38,39]]，而GANs通过对抗训练产生精确的模式[[40], [41], [42], [43], [44]]。尽管它们具有优势，但VAEs为了潜在空间的规范化通常会牺牲重建精度，导致保真度降低[[45]]，而GANs则存在训练不稳定性和模式崩溃的问题[[46,47]]。此外，这两种框架都缺乏坚实的概率基础，阻碍了不确定性量化[[48]]。这些限制强调了需要先进的生成框架来充分利用数据驱动逆向设计的潜力。

扩散模型最近作为最先进的生成框架出现，在高分辨率图像合成和视频生成方面展现了前所未有的性能[[49], [50], [51], [52], [53]]。这些模型采用了一个向前添加噪声的过程和一个反向学习去噪的过程，从而能够生成具有复杂细节的精确输出。这一框架在图像生成领域取得了深刻进展，例如广泛采用的Stable Diffusion和DALL·E。尽管取得了这些成功，但它们在超表面设计中的应用仍处于起步阶段。最近的研究展示了将去噪扩散概率模型（DDPM）应用于超表面逆向设计的方法，称为MetaDiffusion方法[[54]]。虽然该方法显示出高预测精度，但在设计过程中固定了结构参数，限制了其灵活性和实用性。为了解决这一限制，后续研究提出了图像-参数扩散模型（I-P DM），该方法同时处理结构参数和模式，显著提高了设计灵活性[[55]]。然而，这种改进以模型复杂性和计算需求的增加为代价。此外，这两种方法都依赖于预测神经网络（PNN），这是一种在早期研究中为透射率正向预测提出的混合CNN-MLP架构[[56]]。然而，PNN通常需要较长的训练迭代才能达到满意的性能，这对它们在超表面逆向设计中的快速可靠应用构成了重大挑战。此外，与后来广泛采用的去噪扩散隐式模型（DDIM）相比，DDPM中大量的去噪步骤导致生成时间延长，限制了其与后续优化模块或其他优化算法的集成实用性[[50]]。最近，逆向设计领域从自动化设计算法转向了自适应设计范式[[57,58]]，甚至有研究利用大型语言模型（LLMs）进行自主设备工程[[59], [60], [61]]。这种演变，加上上述计算限制，迫切需要一个能够同时实现更高设计自由度、卓越计算效率和更高级预测精度的新型框架。

受到思维链（CoT）范式的启发[[62], [63], [64]]，这是推理语言模型（RLMs）高性能的关键驱动因素，我们提出了超表面逐步推理（MetaSR），这是一种创新的逐步生成-判别推理框架，用于超表面逆向设计。类似于CoT如何通过逻辑分割使语言模型解决复杂问题，所提出的MetaSR将逆向设计挑战分解为由专用神经模块执行的专门子任务。我们的框架整合了三个顺序排列的组件：模式生成模块（PGM）、参数推断模块（PIM）和透射率预测模块（TPM），共同促进设计解决方案的生成和评估。这种模块化方法提高了计算效率和质量，同时通过模块间的物理信息约束确保了可制造性。与端到端方法相比，MetaSR通过允许直接检查中间设计阶段提供了更高的可解释性。这种逐步范式为复杂的逆向设计挑战提供了稳健的解决方案，推动了超表面工程的实际应用。

章节片段

MetaSR框架

所提出的MetaSR的核心创新在于它将逆向设计任务战略性地分解为三个可解释且专门的模块：模式生成、参数推断和透射率预测，每个模块都针对其特定功能进行了精心优化。

如图1a所示，该框架在一个包含174,883个自由形超表面单元格的开源数据集上进行了训练和评估（详细信息见补充材料Text S1和图S1）

MetaSR的性能验证

为了严格验证其优势，我们将使用不同采样器和光谱数据的MetaSR与MetaDiffusion和I-P DM进行了比较，在所有评估中保持数据集比例的一致性（详细信息见补充材料Text S9、表S4、表S5、图S7、图S8和图S9）。此基准测试是在与我们端到端性能评估相同的协议下进行的，确保了直接和公平的比较。

如表1所示，MetaSR

结论

总之，MetaSR建立了一个用于超表面逆向设计的逐步生成-判别推理框架。借鉴CoT原理，我们的模块化架构集成了PGM、PIM和TPM，实现了卓越的性能，并超越了现有方法。关键的是，这种分解通过透明的中间输出提高了可解释性，同时通过可选的DDPM和DDIM采样器适应了不同的逆向设计要求

CRediT作者贡献声明

Jiakang Lao：撰写——原始草稿、可视化、软件、方法论、概念化。Shuyang Zhou：撰写——原始草稿、可视化、软件、方法论、概念化。Zihan Zhao：撰写——原始草稿、可视化、软件、方法论、概念化。Guoqin Cao：方法论、研究。Zhihang Jiang：方法论、研究。Xinwei Wang：撰写——审稿与编辑、监督、项目管理、概念化。Cong Wang：撰写——审稿与