基于深度学习的多孔微结构热应力分析在固体氧化物燃料电池中的应用

时间：2026年5月16日

来源：Next Energy

编辑推荐：

尹龙石|原翔太郎|中泽拓人|鹿泽直树日本千叶工业大学机械工程系，千叶县成田市津田沼2-17-1，275-0016 **摘要** 确保固体氧化物燃料电池电极的机械耐久性需要识别在制造过程中多孔微观结构内部局部热应力产生的位置。传统上，采用有限元（FE）分析等数值模拟

尹龙石|原翔太郎|中泽拓人|鹿泽直树
日本千叶工业大学机械工程系，千叶县成田市津田沼2-17-1，275-0016

**摘要**
确保固体氧化物燃料电池电极的机械耐久性需要识别在制造过程中多孔微观结构内部局部热应力产生的位置。传统上，采用有限元（FE）分析等数值模拟方法来实现这一目标。然而，这些方法通常需要大量的计算资源。本研究开发了一种基于模拟的图像到图像学习框架，可以直接从二维截面相图中预测热点区域。训练了一个基于Pix2Pix的条件生成对抗网络（cGAN），使用从三维微观结构上计算出的FE应力场得到的真实标签来生成二值热点图。为了评估形态真实性的影响，比较了通过动力学蒙特卡洛烧结模拟生成的2个合成数据集：（i）由理想化球形颗粒堆积形成的微观结构；（ii）由GAN堆积形成的微观结构，后者能更好地表示不规则的孔隙形态。当将该模型应用于通过聚焦离子束扫描电子显微镜重建的阴极微观结构时，使用GAN数据集训练的模型获得了更低的平均绝对误差，并更准确地捕捉到了高应力区域。这清楚地表明，在预测多孔材料的机械响应时，将真实的孔隙几何形状纳入训练数据集的重要性。所提出的框架结合了基于物理的模拟和基于Pix2Pix的cGAN，能够快速可靠地预测多孔微观结构的热点区域。

**1. 引言**
固体氧化物燃料电池（SOFC）由于其高发电效率和作为清洁下一代能源设备的潜力而成为一种有前景的技术。近年来，对高度可靠的SOFC电极的需求显著增加[1]、[2]、[3]，以实现全面应用。特别是，减轻多孔陶瓷电极中的脆性断裂已成为一个关键的工程挑战。
电极在制造过程中产生大量热应力的主要因素是其组成材料的热膨胀系数不匹配[4]。特别是在多孔电极中，由此产生的热应力通常是不均匀的，局部应力集中会导致微裂纹[5]、[6]。因此，准确了解多孔电极中热应力集中的位置对于提高电极性能、增强可靠性和优化制造条件至关重要。然而，由于电极微观结构的复杂性（这是由高温烧结亚微米级陶瓷粉末引起的），量化多孔体内的热应力分布具有挑战性。
已经进行了各种数值模拟来解决这些挑战。其中，一种广泛使用的方法是将有限元方法（FEM）应用于通过聚焦离子束扫描电子显微镜（FIB-SEM）重建的三维（3D）电极结构[7]、[8]。这种方法能够分析电极在微观尺度上的机械性能。例如，Vaidya等人[9]研究了阴极微观结构中的热应力与体积分数之间的关系，证明调整体积分数对于减少热应力至关重要。Celik等人[10]分析了阳极-电解质界面附近的热应力，并发现800℃是热应力导致分层或微裂纹的关键温度。Yu等人[11]研究了三维重建阳极结构的热机械行为，强调了氧化钇稳定氧化锆体积分数对机械强度的显著影响。然而，利用重建微观结构进行的这种介观尺度有限元（FE）分析通常需要大量的时间和成本，包括测量过程和后续分析。
近年来，深度学习作为一种降低测量和分析成本的有前景的方法受到了广泛关注。一些研究开发了基于深度学习的应力预测技术，这些技术大致可以分为两种方法。第一种方法使用U-net模型（一种卷积神经网络，CNN）生成与原始图像对应的应力分布图像。U-net是由Olaf等人[12]提出的一种语义分割模型，用于将图像中的目标与背景分离。从根本上说，由于原始图像和应力分布图像的几何结构相同，U-net适合学习两张图像之间的对应关系。Bolandi等人[13]构建了一个使用U-net架构的网络，能够在提供形状、边界条件和载荷等输入的情况下输出二维（2D）线性弹性钢板的应力分布，从而无需进行FE分析。Keles等人[14]开发了一个基于U-net的神经网络，用于确定2D各向同性弹性材料中的应力集中因子。他们证明，这种方法预测应力集中的速度比传统的FEM快10,000倍。
第二种方法使用生成对抗网络（GAN）生成应力分布图。GAN是由Goodfellow等人[15]提出的一种图像生成网络，包括一个生成器和一个鉴别器，它们以对抗的方式同时进行训练，使生成器能够产生与真实图像非常相似的结果。例如，Yang等人[16]开发了一个条件GAN（cGAN）[17]，可以直接将2D形状转换为应变或应力场。Jiang等人[18]开发了一个基于cGAN的StressGAN模型，能够预测在不同形状、载荷和边界条件下的2D冯·米塞斯应力分布。此外，GAN比基于CNN的网络（如U-net）能够更准确地预测应力分布。然而，这些先前的研究主要集中在2D结构的应力预测上，对于更真实的3D结构的应力分布预测的例子有限。此外，所开发网络的通用性，特别是它们能否应用于实际的多孔结构，尚未得到充分研究。
在这项研究中，使用Pix2Pix模型[19]（一种GAN）构建了一个能够从3D多孔电极的2D截面图像预测应力集中区域的深度学习模型。为了最小化生成训练数据所需的实验工作量，提出了一种新的训练数据生成方法，将数值模拟与深度学习技术相结合。最后，将构建的网络模型应用于实际的多孔微观结构，并评估了应力集中预测的准确性和通用性。

**2. 材料与方法**
**2.1. 训练数据生成**
深度学习模型依赖于大量的训练数据。数据的质量与网络预测的准确性相关；因此，高质量的数据会产生更精确的结果[20]、[21]。通常，SOFC电极是通过将陶瓷粉末堆积并在高温下烧结来制造的。尽管实验上获得大量电极结构数据是理想的，但实验通常需要大量的时间和成本，这使得大规模生成不切实际。因此，本研究采用基于电极制造的数值模拟和深度学习来创建与实际电极结构非常相似的训练数据。

**2.1.1. 粉末堆积结构的生成**
在这项研究中，研究了训练数据质量对预测准确性的影响。一般来说，烧结后的微观结构取决于烧结前粉末的特性。因此，采用了两种不同的方法来生成初始堆积结构，从而产生了具有不同粉末形状特征的训练数据集。
在第一种方法中，假设粉末由球形颗粒组成。虽然这是一种理想化的表示，但球形颗粒被广泛用作基本堆积模型。在这项研究中，通过离散元方法（DEM）生成了由球形颗粒组成的堆积结构。DEM是一种数值方法，通过数值求解多个颗粒的平移和旋转运动方程来计算颗粒组装的运动，从而能够分析粉末系统的复杂行为[22]、[23]。
开源软件LIGGGHTS[24]被用于DEM分析。颗粒采用颗粒模型，颗粒间力使用Hertz-Mindlin接触模型进行建模。总共生成了81种不同的结构，通过系统地改变4个参数：平均颗粒直径（0.45、0.50、0.55 µm）、对数正态颗粒尺寸分布的标准差（0.000、0.075、0.150 µm）、体积分数（45%、50%、55%）和初始随机种子（3种不同的种子）。关于DEM计算的详细信息在[25]、[26]中给出。
第二种方法采用了更真实的初始堆积结构模型，其中颗粒呈现出复杂的非球形形状。为了获得它们的3D组装结构，通常使用FIB-SEM进行3D重建。然而，由于相关的实验成本，通过3D重建生成大量训练数据具有挑战性。为了解决这个问题，使用了一个现有的GAN模型以最小的实验成本生成了许多合理的3D初始结构。具体来说，SliceGAN[27]被用来从一组2D截面图像生成3D重建图像。
作为应力预测的模型系统，本研究使用了钙钛矿型陶瓷La0.8Sr0.2CoO3（LSC）的预烧结截面图像。这些陶瓷被广泛用作SOFC阴极。预烧结样品是通过将LSC粉末（燃料电池材料，LSC-P）丝网印刷到掺钆的氧化铈（GDC）电解质基底上，然后在管式炉中以400℃脱粘制备的。随后，通过离子铣削产生一个平面截面，并通过FE-SEM捕获了预烧结样品的3个截面图像。这3个图像被调整为227 × 151像素（50 nm分辨率），如图1所示，并用作SliceGAN网络的输入训练数据。训练后，SliceGAN成功生成了81个尺寸为128 × 128 × 128像素的3D多孔结构。

**2.1.2. 烧结电极结构的生成**
随后，通过动力学蒙特卡洛（KMC）方法[28]、[29]、[30]对初始结构进行了烧结模拟。在KMC中，微观结构被体素化，每个体素被赋予一个状态值q，该值决定了与微观结构相关的能量。这里，空洞体素被赋予q=0，所有其他（固体）体素被赋予正的q值。获得相同q值的一组体素被视为具有单晶取向的晶粒。根据参考文献[28]、[29]，系统的总能量Etot由公式（1）给出：
(1)
Etot = ∑i=1N∑j=1nJij1−δ(qi,qj)
其中Jij是位点i和j之间的表面（或晶界）能量，δ是克罗内克德尔塔，N是位点i的最近邻位点数量，n是位点i的最近邻位点数量。
在KMC方法中，根据指定的烧结算法执行体素交换，以模拟烧结过程中的微观结构演变。使用了三种固态烧结算法：（i）晶粒生长，（ii）孔隙迁移（表面扩散），以及（iii）空位形成和湮灭。算法（i）–（iii）根据各自的频率参数fgg、fpm和fvf在每个蒙特卡洛步骤中执行。如果选择了某个算法进行执行，则根据交换规则尝试在所有位点进行体素交换。根据参考文献[28]，交换的接受概率P由Metropolis方法确定，如公式（2）所示：
(2)
P = exp−ΔEtot/kBT
对于ΔEtot>0
1
对于ΔEtot≤0
其中kB是玻尔兹曼常数，T是每个烧结算法指定的温度波动。
KMC模拟参数包括以下内容：每种算法的试验频率参数fgg、fpm、fvf，温度波动值kBTgg、kBTpm、kBTvf以及表面/晶界能量Jij。尚未为LSC开发特定的参数集。因此，本研究使用了为La0.6Sr0.4Co0.2Fe0.8O3-δ（LSCF）这种具有类似特性的钙钛矿阴极材料确定的参数集。尽管LSC和LSCF都是钙钛矿阴极材料，但扩散行为和烧结动力学的差异可能导致模拟的微观结构演变有所不同[31]。在本研究中，KMC模拟主要用于生成大量合理的烧结微观结构，以便进行后续的体素-FEM分析和网络训练。通过将训练好的网络应用于FIB-SEM重建的LSC微观结构（第3.2节），进一步验证了整个工作流程的稳健性。未来工作将确定LSC特定的KMC参数集并量化其对结果微观结构和热点预测的影响。关于KMC参数的详细信息可以在文献[26]、[32]、[33]中找到。在烧结分析过程中，每当密度增加3%时，就会记录一次3D结构数据。因此，从最初的81种不同初始结构中生成了大约1300个具有不同密度的烧结微观结构。2.1.3. 应力分布的生成最后，从通过KMC分析获得的烧结结构中提取了64 × 64 × 64像素的子集。随后使用3D体素有限元方法（FEM）[34]进行了线性热应力分析。在这项分析中，考虑了电极制造过程中典型的热应力生成场景。具体来说，一个由GDC电解质基底和LSC阴极层组成的陶瓷层从大约1000°C（烧结温度）冷却到室温。在冷却过程中，由于两种材料的热膨胀系数不同，在每一层内部都产生了热应力。本研究重点关注了冷却过程中多孔LSC层中产生的热应力。在FEM模型中，每个立方体体素被视为一个单一的六面体一阶元素。每个元素被赋予相对于基底9.7 ×10−6 [1/K]的热膨胀系数不匹配值。边界条件施加了双轴约束，将最外层x和y表面的节点位移固定为零。温度变化设置为-1000°C，杨氏模量和泊松比分别设置为130 GPa和0.3。生成训练数据的工作流程总结在图2中。本研究的目的是仅使用2D截面图像来预测通过3D应力分析识别出的高应力区域。为此，从每个3D结构中提取了10个平行于xz平面的截面切片。这个过程产生了大约14,000对来自81个初始微观结构的截面图像及其对应的应力分布图。每个截面图像都被二值化，固体和多孔相分别用白色和黑色表示。应力分布图是根据x方向应力生成的，这是热应力的主要组成部分。为了以可重复的方式定义热点区域，使用了应力场的上尾百分位数[35]、[36]。具体来说，使用了第95百分位的应力值作为操作阈值：超过此值的区域被标记为“热点”（图2中的深蓝色），而低于此值的区域被标记为“安全区域”（图2中的浅蓝色）。选择这个百分位数是一个实际的折中方案。较低的阈值（例如第90百分位）会包括与损伤起始不太直接相关的较宽的中等应力区域，而较高的阈值（例如第98百分位）会产生过小的热点比例，从而阻碍模型训练[37]、[38]。应该注意的是，这个百分位数阈值用于构建一致的训练标签，并不代表材料失效的标准。如果准备了相应的标记数据集，可以重新训练所提出的框架以适应其他阈值。未来的工作还将研究根据阈值条件化网络，以提高对不同热点定义的适应性。最后，在本研究中，基于DEM的数据集是从球形颗粒堆积结构生成的，而基于GAN的数据集则是从SliceGAN重建的堆积结构中得到的。下载：下载高分辨率图像（258KB）下载：下载全尺寸图像图2. 生成2个不同训练数据集的方法示意图。数据集来源于（a）基于DEM的微观结构和（b）基于GAN的微观结构。DEM = 离散元方法；GAN = 生成对抗网络；KMC = 动力学蒙特卡洛。2.2. 生成对抗网络（GAN）GAN由一个生成器和一个鉴别器组成，它们以对抗的方式一起训练。标准的GAN架构如图3所示。GAN的主要目标是防止鉴别器区分生成器生成的图像和真实图像。这是通过最小化生成器误差同时最大化鉴别器误差来实现的。在传统的GAN中，当初始随机噪声z作为输入提供给生成器G时，G被训练将这个向量映射到真实样本空间。同时，D确定接收到的样本是真实的还是生成的[15]。cGAN是GAN的扩展，在其中向生成器添加了一个标签，从而修改网络以在特定条件下产生结果[17]。例如，Isola等人[19]开发了一个基于cGAN的Pix2Pix网络，该网络允许生成器使用输入图像作为标签来生成新的高质量图像。下载：下载高分辨率图像（54KB）下载：下载全尺寸图像图3. 标准GAN网络架构的示意图。GAN = 生成对抗网络。2.2.1. 网络架构细节在这项研究中，构建了一个网络，仅使用3D多孔结构的2D截面图像来预测高应力区域（应力集中区域）。值得注意的是，3D结构中包含的信息与其2D截面图像中包含的信息不同。通常，从整个3D结构获得的固相密度与从同一结构的单个2D截面获得的密度不同。这表明，尽管两个2D截面之间的固相密度相似，它们很可能来源于不同的3D微观结构。例如，多孔材料的密度与其杨氏模量密切相关[39]、[40]、[41]、[42]。具体来说，如果网络在缺乏原始3D结构宏观密度信息的2D截面图像上进行训练，可能会导致无法捕捉到进行应力评估所需的关键结构特征。为了解决这个问题，计算了本研究中使用的两个数据集的3D密度（ρ3D）和2D密度（ρ2D）之间的绝对差异|ρ2D-ρ3D|。基于DEM的数据集的|ρ2D-ρ3D|的平均值为3.0%，基于GAN的数据集的为3.3%。然而，在基于DEM的数据集中，|ρ2D-ρ3D|的最大值达到了16.6%，而在基于GAN的数据集中达到了22.3%。这种差异主要是由于2D截面图像中可用的结构信息有限以及模型尺寸的限制。为了提高应力预测的准确性，网络被提供了获得给定2D截面图像的多孔体的3D密度（ρ3D）。图4展示了基于Pix2Pix模型的构建网络架构，它由两个部分组成：生成器G和鉴别器D。详细架构如下：下载：下载高分辨率图像（359KB）下载：下载全尺寸图像图4. 基于Pix2Pix的架构，用于预测多孔体中生成的热点区域。（a）未包含ρ3D时的网络架构；（b）包含ρ3D时的网络架构。生成器包括一个下采样部分（1个输入层后跟6个卷积层）、一个中间层和一个上采样部分（6个转置卷积层后跟1个输出层）。下采样层的输入层接收从3D多孔结构中提取的二值化相图（表示固体和空隙相）。为了与Pix2Pix实现保持一致，这个相图被表示为一个尺寸为128 × 128 × 3的3通道图像。经过6次卷积后，输出进行批量归一化并使用Leaky ReLU激活。在中间层，输入ρ3D数据（尺寸1 × 1 × 1）并与下采样层的输出融合。上采样部分包括6个转置卷积层，包括上采样、融合和卷积层。上采样层有效地将输入特征图的大小翻倍。融合层采用了跳跃连接的概念[12]，将放大的特征图与下采样层的相同大小的特征图合并。在后续的卷积层中，进一步提取特征，并对其输出进行批量归一化，然后使用ReLU函数激活。上采样层的输出层包括一个上采样层和一个卷积层，其输出使用tanh函数激活。最终输出是一个尺寸为128 × 128 × 3的3通道热点图，与2.1.3节中描述的真实标签图像一致。鉴别器包括一个输入层、4个卷积层和一个输出层。鉴别器的输入层接收条件输入相图x和相应的输出图y（真实的或生成的），以及可选的标量ρ3D，它们被连接起来形成鉴别器输入。然后对输出进行批量归一化并使用Leaky ReLU激活。在4个卷积层和输出层之后，网络确定输入是真实的还是生成的。网络的详细规格在附录A中提供。应该注意的是，在这项研究中，Pix2Pix（cGAN）模型被构建为一个图像到图像的转换框架。目标输出是通过百分位数阈值处理应力场构建的3级标签图像，而不是每个像素的概率图。因此，生成器产生一个具有连续像素值的3通道图像（通过tanh激活函数），而不是语义分割中通常使用的类别概率。2.3. 损失函数和评估方法在这项研究中，采用了Isola等人[19]提出的损失函数Ltotal，它包括对抗损失LGAN和L1距离函数。对抗损失LGAN[15]旨在通过分别最小化和最大化共享值函数VG,D来促进生成器G和鉴别器D之间的竞争。具体来说，生成器尝试最小化VG,D，而鉴别器尝试最大化它，从而推动网络达到动态平衡。对抗损失由（3）、（4）[19]表示：(3)LGAN=minGmaxDVG,D(4)minGmaxDVG,D=Ex,ylogDx,y+Ex[log(1−D(x,Gx))]其中x表示输入图像，y表示真实图像，G(x)是G从x生成的图像，D(x, y)是D对于图像对（x, y）的输出，E表示期望值。应该注意的是，本研究中使用的真实图像是通过应力场的百分位数阈值处理得到的3级标签图，并不包含原始的连续应力值。因此，网络的目标是再现热点区域的标签图，而不是回归连续的应力值。对于这种公式，标准的Pix2Pix目标（对抗损失LGAN + L1距离）是合适的，因为对抗项鼓励真实的空间模式和清晰的边界，而L1项强制与真实值在像素级别上一致。相比之下，交叉熵损失通常用于输出每个像素类别概率的分割网络。此外，如2.1.3节所述，在第95百分位定义下，热点像素只占总面积的一小部分。在这种情况下，基于概率的分割通常需要额外的处理，如类别加权或焦点损失，以处理显著的类别不平衡[37]、[38]。此外，距离函数L1最小化了生成图像和真实图像之间的平均像素值差异。这个术语指导网络生成在像素级别上具有高度相似性的图像。距离函数L1在方程（5）[19]中定义。(5)L1=1N∑i=1Nyi−Gxi其中yi表示真实图像的第i个像素值，G(x)i是生成图像的第i个像素值，N是像素的总数。最终损失函数Ltotal在方程（6）[19]中表示。(6)Ltotal=LGAN+λL1其中λ是距离函数L1的权重因子，设置为λ = 0.001 [19]。平均绝对误差（MAE）用于通过比较生成图像和真实标签图像之间的像素值来评估生成的热点图像的准确性。MAE由以下方程（7）定义，这在图像到图像的转换任务中是常用的：(7)MAE=1N∑i=1Nyi−yˆi其中yˆi表示生成图像的第i个像素值。MAE是通过平均所有像素（和颜色通道）的绝对差异来计算的，报告的MAE值代表整个测试集的平均值。在这项研究中，MAE是直接从输出图像的3通道像素值计算的，没有额外的二值化或后处理。2.3.1.错误来源及其传播
热点图中的预测误差可能源于工作流程的多个阶段：(i) 生成或重建的微观结构的不确定性，(ii) 体素有限元（voxel-FEM）应力分析中的数值和建模误差（例如，分辨率、边界条件和材料参数），(iii) 基于百分位的标记引入的不确定性，以及 (iv) Pix2Pix 模型内的学习和优化误差。这些因素可能沿着流程传播（从微观结构生成到 FEM 应力场分析、标记图构建、网络训练/推理，最终到 MAE 评估），并影响最终预测。未来的工作旨在通过优化模型参数和 FEM 设置、扩展和验证数据集以及纳入不确定性和敏感性分析来减少这些误差。

2.4. 执行环境和训练参数
所有训练都在配备了 NVIDIA RTX 3090 GPU 的计算机上进行。训练参数设置为 200 个周期、学习率为 0.0002，批量大小为 32，并使用 Adam 优化器。然而，在 GAN 训练过程中，生成器和鉴别器之间的性能不匹配可能导致训练不稳定，甚至模式崩溃 [43]。理想情况下，生成器和鉴别器应该公平竞争；然而，性能不平衡可能导致一方占据主导地位，从而使训练偏离。因此，在本研究中，生成器与鉴别器的训练比例调整为 5:1；也就是说，每进行 5 次生成器更新，就进行 1 次鉴别器更新以稳定训练。

3. 结果与讨论
3.1. 引入 3D 密度的影响
本节探讨了将宏观 3D 密度信息（ρ3D）纳入网络预测准确性的影响。测试数据来自两种类型的训练数据集，并计算了 MAE。结果如表 1 所示，每个结果都对应特定的固相密度范围。图 5 展示了两个网络生成的代表性图像的比较。相应的输入图像（相图）和真实图像也一并提供以供参考。

表 1. 从测试数据计算出的平均绝对误差。这些值使用两个不同的数据集和网络模型进行评估，并且每个值都对应特定的密度范围。
密度范围（%）
45–55 55–65 65–75 75–85 85–100 全部（45−100）
基于 DEM 的数据集
无 ρ3D 模型 9.3 8.8 7.4 6.4 8.1
有 ρ3D 模型 7.9 6.9 6.3 5.7 6.5
基于 GAN 的数据集
无 ρ3D 模型 11.4 9.6 8.0 6.3 5.0 8.0
有 ρ3D 模型 10.7 9.4 7.9 6.7 5.4 7.9
DEM = 离散元方法；GAN = 生成对抗网络

下载：下载高分辨率图像（413KB）
下载：下载全尺寸图像

图 5. 使用 (a) 基于 DEM 的数据集和 (b) 基于 GAN 的数据集进行热点预测的典型结果。每个图显示以下内容：(i) 原始相图，(ii) 热点图的真实值，(iii) 使用无 ρ3D 的网络模型预测的热点图，以及 (iv) 使用 ρ3D 的网络模型预测的热点图。红色圆圈突出显示了典型的热点位置，这些位置是否包含 ρ3D 而有所不同。
DEM = 离散元方法；GAN = 生成对抗网络。

模型中未包含 ρ3D 时，基于 DEM 和基于 GAN 的数据集的预测准确性几乎相同（MAE 分别为 8.1 和 8.0）。然而，将 ρ3D 引入基于 DEM 的数据集后，MAE 从 8.1 降低到 6.5（减少了约 20%），显示出预测准确性的显著提高。相反，对于基于 GAN 的数据集，引入 ρ3D 仅使 MAE 从 8.0 降低到 7.9，表明对预测准确性的影响可以忽略不计。

如图 5 所示，基于 DEM 的数据集中的真实图像显示孔隙边缘周围存在高应力，特别是在颗粒颈部附近的固相区域。基于 DEM 的数据集生成的相应图像表明，是否包含 ρ3D 会影响预测的热点位置（红色圆圈）。值得注意的是，包含 ρ3D 的模型生成了更准确的图像，成功预测了颈部区域的应力集中位置。在基于 GAN 的数据集中，真实图像中的应力集中位置基本上与基于 DEM 的数据集相同。然而，包含 ρ3D 并没有显著改变高应力位置。生成图像与真实图像的比较表明，即使没有 ρ3D，网络也能够预测应力集中位置。

为了展示向网络中添加 ρ3D 的效果，可视化了基于 DEM 的数据集的每个激活层的输出。图 6 展示了这种可视化的典型示例。由于 ρ3D 信息的引入仅影响转置卷积过程，而不影响下采样过程，因此这里仅展示了转置卷积层的输出。如图 6 所示，在没有 ρ3D 的情况下，网络主要关注孔隙区域，如红色圆圈所示。从线性弹性的角度来看，应力集中通常发生在孔隙周围，其大小与局部孔隙几何形状密切相关。这表明网络对孔隙形状的关注使其能够提取局部应力场特征，从而有助于准确预测热点位置。

下载：下载高分辨率图像（194KB）
下载：下载全尺寸图像

图 6. 两种不同网络模型生成器输出激活层的比较。红色圆圈表示两个网络都认为重要的孔隙区域，而红色方块表示包含 ρ3D 信息的网络认为重要的颈部区域。

另一方面，包含 ρ3D 的网络不仅可以关注孔隙区域（由红色圆圈表示），还可以关注高应力区域（由红色方块表示），如图 6 所示。这表明包含 ρ3D 的网络能够更精确地分析孔隙的几何特征。尽管 ρ3D 并不直接表示精确的 3D 微观结构，但它作为一个有价值的描述符，用于分类多孔几何的特征。通常，烧结过程中微观结构的时间演变是根据颗粒大小和密度之间的关系来描述的 [44]。因此，将 ρ3D 作为先验知识提供给网络 [45]，可以提供与烧结过程中密度变化相关的粗略结构特征，这些特征随后与直接从横截面图像获得的特征融合。因此，应力集中区域的识别得到了增强。

然而，尽管在基于 DEM 的数据集中包含 ρ3D 显著提高了预测准确性，但在基于 GAN 的数据集中观察到的效果很小。如 2.2.1 节所讨论的，|ρ2D – ρ3D| 对于两个数据集几乎相同，表明 3D 多孔微观结构中固相的空间分布没有差异。因此，ρ3D 效果的差异归因于两个不同训练数据集中局部结构复杂性的固有差异。如图 5 所示，在基于 DEM 的数据集中，假设初始颗粒为球形的情况下，烧结后的微观结构显示出相对简单的孔隙形态，而基于 GAN 的数据集则使用实际初始粉末的横截面 SEM 图像生成了广泛的孔隙形状，如图 1 所示。该数据集中的孔隙形状明显更为复杂且随机性更高。具体来说，基于 DEM 的数据集可能包含许多具有类似局部结构特征的孔隙，使得从 2D 横截面图像得出的预测不足以区分具有类似结构的孔隙附近的应力。因此，将 ρ3D 引入网络有效地帮助识别了结构相似的孔隙，从而提高了应力集中区域的预测准确性。相比之下，基于 GAN 的数据集使网络能够区分具有高度不同局部几何形状的孔隙。将宏观特征（如 ρ3D）纳入网络并没有提高预测性能，这表明多孔体内应力集中的程度主要由孔隙的局部几何特征（如大小、曲率和粗糙度）决定，而不是由整体密度决定。

随后，评估了密度对网络预测准确性的影响，如表 1 所列。观察到明显的相关性：随着密度的增加，MAE 减少，无论是否包含 ρ3D 都是一致的。如图 5 所示，低密度结构包含更多孔隙，从而增强了孔隙结构的多样性和随机性。因此，网络有效提取图像特征的能力可能受到其结构复杂性的阻碍，导致预测准确性降低。如前所述，基于 GAN 的数据集显示的孔隙结构比基于 DEM 的数据集更复杂，特别是在低密度时。因此，对于密度低于 70% 的情况，基于 GAN 的数据集的预测准确性低于基于 DEM 的数据集。因此，网络性能似乎依赖于孔隙微观结构，特别是在低密度区域，需要扩展训练数据集以提高对高度不规则结构的预测准确性。

无论密度如何，将 ρ3D 引入基于 DEM 的数据集都提高了预测准确性，而在基于 GAN 的数据集中则没有改善。这一发现表明，尽管由于烧结过程中的孔隙合并和稳定，微观结构变得简单，但初始粉末的几何特征仍然存在。因此，在基于 GAN 的数据集中，即使在高密度下，应力集中也主要由局部孔隙几何形状决定。

3.2. 应用于 FIB-SEM 重建的微观结构
将训练好的网络应用于实际电极微观结构以评估其实用性。在本研究中，从具有大约 65% 密度的标准阴极微观结构的横截面图像中预测了 σxx 应力集中位置。两种 LSC 多孔体分别通过在 GDC 基板上涂覆 LSC 薄膜并在 1200°C 下烧结 60 分钟以及在 1000°C 下烧结 120 分钟来制备。图 7 展示了通过 FIB-SEM（JEOL JIB-4601F）重建的密度分别为 61% 和 71% 的 LSC 烧结体的微观结构。图像分辨率为 50 nm。样品制备和重建的详细信息在其他地方提供 [30]。从这个重建的体积中，裁剪出 178 张尺寸为 64 × 64 像素的横截面图像用于预测。测量的 MAE 值总结在表 2 中，图 8 将生成的图像与从 FEM 分析获得的真实图像进行了比较。

下载：下载高分辨率图像（199KB）
下载：下载全尺寸图像

图 7. 使用 FIB-SEM 重建的 LSC 阴极材料的微观结构。每个样本的相对密度分别为 (a) 61% 和 (b) 71%。
FIB-SEM = 焦离子束扫描电子显微镜

表 2. 从两个不同数据集和网络模型计算出的平均绝对误差。这些值使用两个不同的数据集和网络模型进行评估。
密度（%）
61 71
基于 DEM 的数据集
无 ρ3D 模型 8.9 9.8
有 ρ3D 模型 8.8 9.7
基于 GAN 的数据集
无 ρ3D 模型 7.5 8.7
有 ρ3D 模型 7.3 8.6
DEM = 离散元方法；FIB-SEM = 焦离子束扫描电子显微镜；GAN = 生成对抗网络

下载：下载高分辨率图像（241KB）
下载：下载全尺寸图像

图 8. 使用网络模型（a）无 ρ3D 和 (b) 有 ρ3D 进行热点预测的典型结果。每个图显示以下内容：(i) 原始相图，(ii) 热点图的真实值，(iii) 使用基于 DEM 的数据集预测的热点图，以及 (iv) 使用基于 GAN 的数据集预测的热点图。红色圆圈表示基于 GAN 的模型比基于 DEM 的模型更准确地预测的高应力颈部区域。
无论是否包含 ρ3D，基于 GAN 的数据集的 MAE 值都大约低 1.1–1.4 个点。这表明使用基于 GAN 的方法对实际微观结构的预测性能更优。如图 8 中生成的图像所示，基于 DEM 的模型提供了合理的预测；然而，基于 GAN 的模型更准确地预测了高应力颈部区域（由红色圆圈表示）。这种性能提升是因为基于 DEM 的数据集基于球形颗粒模型，缺乏实际微观结构中的复杂孔隙形状。特别是，在相对低密度的烧结微观结构中，这些形状至关重要。相反，基于 GAN 的数据集反映了实际微观结构，观察到模型在新数据预测方面的泛化能力和鲁棒性得到了增强。

有趣的是，引入 ρ3D 的影响与第 3.1 节描述的测试数据不同。如表 2 所示，与测试数据情况不同，即使对于基于 DEM 的模型，引入 ρ3D 的影响也很小。这一发现还表明，LSC阴极微观结构中的应力集中点主要受局部孔隙几何形状的影响，而非宏观特征（如ρ3D）的影响。因此，为了提高对实际微观结构的预测性能，准备与实际微观结构高度相似的高质量训练数据至关重要，正如基于GAN的数据集所成功实现的那样。在本研究中，采用了一种针对烧结微观结构的训练数据生成方法，该方法结合了深度学习技术SliceGAN、KMC方法和基于体素的FEM。在生成训练数据的过程中，唯一的实验工作是获取烧结前粉末的横截面图像。这种方法能够在短时间内生成大量高质量的训练数据，同时最大限度地减少实验工作量。此外，该方法具有很高的可扩展性。例如，通过实验获取初始粉末的额外2D横截面图像作为SliceGAN的输入，并为KMC模拟生成新的输入结构，可以轻松扩充训练数据集。此外，利用迁移学习技术可以以最小的努力对网络进行优化。

本研究重点预测σxx应力，这是双轴应力场中的主要分量。为了确保耐久性设计的准确性，预测其他应力分量（特别是σyy）也至关重要。然而，仅使用xz截面来预测σyy（如本研究中所采用的）存在显著挑战，因为缺乏y方向上的空间信息。除了xz截面外，结合y方向上相邻切片的结构信息可能会提高模型性能。尽管这个问题超出了本研究的范围，但它代表了未来研究的一个重要课题。

4. 结论

本研究通过使用Pix2Pix模型成功开发了一个深度学习网络。该网络能够预测3D多孔体2D横截面图像中的应力集中位置。两种网络的比较清楚地表明，在训练数据集中纳入孔隙的局部结构特征的重要性，尤其是在预测具有复杂孔隙几何形状的多孔材料时。此外，提出了一种通过集成深度学习技术（用于从多个2D截面重建3D微观结构）、KMC方法（用于预测烧结过程中的3D微观结构演变）和基于体素的FEM（用于机械分析）来快速生成大量类似实际微观结构的训练数据的方法。最终的训练数据集和网络在预测通过FIB-SEM重建的阴极微观结构中的应力集中位置方面表现出可靠的性能，达到了很高的准确度。

作者贡献声明

Yinlong Shi：概念化、方法论、软件开发、验证、形式分析、研究、资源管理、数据整理、撰写——原始草稿准备、可视化

Shotaro Hara：概念化、软件开发、验证、撰写——审阅和编辑、监督、项目管理、资金获取

Takuto Nakazawa：形式分析、研究、数据整理

Naoki Shikazono：监督、项目管理、资金获取

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部