随着人工智能和大规模模型的快速发展,数据中心面临单机架功率密度、服务器功耗和芯片功耗的不断上升。NVIDIA的B200 GPU芯片峰值功耗达到700W,而单机架最大功率密度已从16 kW激增至50 kW甚至超过100 kW。正如Amy [1] 所指出的,冷却效率已成为限制数据中心能源密度和功耗的主要因素。传统的空气冷却方式已无法满足热管理需求。冷板液体冷却技术已成为高计算功率、高功耗、高热流数据中心的关键解决方案。该技术能有效散热,同时显著降低功耗效率(PUE),年PUE值可能低于1.10 [2]。全球数字化转型加速了互联网、云计算、移动通信、大数据、人工智能等依赖于电子元件持续创新的技术的发展。高性能处理器(CPU、GPU、IGBT、ASIC)越来越重视多功能性、高集成度和小型化。图1显示了过去20年芯片功耗、热流密度和晶体管数量的趋势 [3]。因此,高密度封装的电子设备会产生更大的功耗,从而增加芯片的热生成和热流密度。目前,热设计功率(TDP)超过300W的高密度芯片已在主流数据中心得到广泛应用,最大热流(HF)已超过500W/cm2 [4]。事实上,NVIDIA的GB200 Grace Blackwell GPU的TDP高达1200W,HF超过1000W/cm2。新发布的GB300 GPU的TDP高达1400W,HF预计超过1500W/cm2 [5,6]。高功率和高热流密度会导致电子元件温度升高。如果不能及时冷却到安全工作温度(低于85°C)[3],[7],[8],[9],不仅会引发热故障,还会导致参数变化和不可逆的热应力损伤。实证研究表明,电子元件的工作可靠性每升高10°C就会减半 [10]。这些关键的热挑战需要先进的热管理解决方案。
尽管空气冷却技术已经成熟,但其固有的局限性使得最大冷却能力约为100W/cm2,无法满足当代电子元件的高散热需求 [11]。相比之下,液体冷却技术具有更高的热容量和更快的热传导速度,冷却能力是空气的1000–3000倍 [12,13]。这使得液体冷却成为现代电子热管理的最佳解决方案。随着微制造和制造技术的发展,具有小尺寸、大比表面积、高传热系数和高稳定性的液体冷却MCHS成为解决高热流(HF)电子元件散热问题的有效方法,能够有效应对超过1000 W/cm2的散热挑战 [1],并已广泛应用于汽车电池 [[14],[15],[16]]、发光二极管 [[17],[18],[19]] 和太阳能热收集系统 [[20],[21],[22]] 等领域。特别是在数据中心领域,随着功率密度的持续增加,MCHS不与电子元件直接接触,从而提高了可靠性和与现有硬件的兼容性。此外,较低的冷却剂消耗和紧凑轻便的结构特性使得MCHS能够灵活应用于新的数据中心安装和现有设施的改造,便于维护。MCHS的灵活布局允许其与空气冷却系统结合形成混合冷却方案,或与其他冷却方法结合,建立梯度冷却系统,实现高HF下的针对性局部冷却。因此,MCHS在成本、兼容性、可靠性、可维护性和操作灵活性方面具有明显优势。
为了解决传统微通道散热器(MCHS)的局限性,如温度均匀性差、局部热点形成和传热效率低等问题,研究人员正在追求多方面的设计改进,以提高传热性能(HTP)[[23],[24],[25],[26]]。基板材料是影响MCHS HTP的最直接因素,因为不同的材料具有不同的热导率、表面纹理和润湿性。这些参数对冷却介质流动特性和整体HTP有着关键影响。Du等人 [27] 综合研究了金属、陶瓷和半导体材料对MCHS性能的影响。Kim等人 [28] 进一步介绍了不同尺度制造材料的先进测量方法,并总结了各种热界面材料的热传输优化方案。材料属性(强度、硬度、抗应力性、表面特性)决定了适当的制造方法,以确保结构完整性和尺寸精度。Deng等人 [29] 列出了改进的MCHS制造技术,包括蚀刻、微机械切割、微电火花加工、激光加工、烧结和3D打印。制造技术的进步使得流动通道优化更加精细,特别是通过仿生设计显著提高了传热性能并降低了流动阻力。Wu等人 [30] 系统回顾了具有分形结构(如叶脉、支气管网络、蜘蛛网)的仿生MCHS。最佳通道几何形状需要与具有优异热性能、流动性、化学稳定性、环境兼容性和安全性的工作流体协同配合。纳米流体克服了传统冷却剂(空气、去离子水、有机液体如R134a/R22/HFE-7100)的固有局限性,成为卓越的热传输增强介质。Maghrabie等人 [31] 全面分析了纳米流体对MCHS HTP的影响,涵盖了热物理性质、性能、挑战、应用和未来前景。MCHS通道尺度的减小和几何复杂性的增加阻碍了内部流动机制的实验观察,掩盖了涉及摩擦、表面张力和粘性力的基本热传输机制。计算方法如计算流体动力学、分子动力学模拟、格子玻尔兹曼方法和直接模拟蒙特卡洛提供了关键的研究途径。此外,基于人工智能的优化算法(如人工神经网络(ANN)、遗传算法(GA)、田口算法和机器学习)能够高效精确地优化MCHS结构。Gao等人 [32] 通过典型案例研究对这些数值方法进行了批判性回顾。性能评估仍然至关重要:虽然压降(ΔP)、传热系数(HTC)和温度均匀性(TU)是关键的热指标,但新的多参数指标能更好地指导MCHS设计优化 [33]。尽管现有文献从多个角度探讨了HTP的改进,但仍然缺乏对制造材料、制造方法、仿生设计和性能表征的全面覆盖。鉴于MCHS作为高热流数据中心冷板关键组件的快速发展,更新研究进展的综合总结十分必要。
如图2所示,本文综合分析了过去五年中微通道散热器(MCHS)在四个领域的研究进展:制造材料、制造技术、仿生设计和性能表征。首先,通过金属和非金属分类全面研究了MCHS制造材料,并对不同类型材料的传热性能进行了比较分析。其次,根据制造理论将MCHS制造技术分为三个发展阶段:等效制造、减材制造和增材制造。详细介绍了每个阶段的技术及其优势、局限性和材料兼容性。随后,概述了在通道优化和界面增强方面的最新仿生MCHS进展,利用了独特的生物拓扑结构和表面形态。最后,系统化了新的性能评估指标,以促进MCHS的最佳设计。