随着云计算与边缘服务的快速崛起,数字基础设施的碳足迹急剧增加,对可持续资源管理提出了迫切需求。本研究针对联邦式边缘-云系统,提出了一种独特的碳感知工作负载编排器。该编排器采用动态时空工作负载管理方法,在碳排放、能源成本、服务级协议(SLA)违规以及资源利用率之间进行平衡。所提方法融入了基于实时碳强度、联邦约束以及多域资源优化的自适应加权机制,旨在解决现有碳感知调度方法中的关键缺陷。研究人员通过详细模拟进行了验证,该模拟涵盖7天内3个云数据中心与9个边缘节点上的3969个独立工作负载。结果表明,与静态调度基准相比,所提算法在统计上实现了显著改进,包括碳排放降低10.2%(p<0.001)、成本降低15.7%(p<0.001),以及SLA违规相对减少60%(p<0.001),碳效率提升了14.0%。通过针对更大规模联邦的全面研究,确立了该框架的有效可扩展性。该编排器利用智能决策,根据实时和本地环境条件调整运行方式,同时确定跨联邦域的操作效率水平。通过与现有最优方法的直接竞争,对框架为每种工作负载类型保障公平性的能力进行了额外分析,结果显示大多数指标均有改善,包括公平性显著提升(21.6%)以及消除了紧急工作负载类型的SLA违规。本研究证明了在资源供给中综合考虑碳感知对于可持续云-边缘计算的重要性,并提出了一种面向分布式系统的环境感知工作负载供给方法。
云计算与边缘服务的快速增长使数字基础设施成为全球碳排放的重要因素,数据中心的电力消耗约占全球总用电量的1%-2%。国际能源署数据显示,全球数据中心电力需求已从2019年的约300太瓦时(TWh)增至2022年的约460 TWh,人工智能应用是主要驱动因素,预计到2026年将进一步增至620-1050 TWh。日益增长的计算需求与全球多数地区发电碳强度占比提升相结合,催生了平衡数字需求与环境责任的可持续计算模型。联邦式边缘-云系统的发展为优化碳消耗带来了障碍与机遇。这类分布式系统跨越不同地理区域,具有碳强度模式各异、资源能力异构以及运行约束多变等特点。这种分布性虽增加了资源管理的复杂性,但也为通过计算任务在时空上的转移进行碳感知编排提供了新机遇。然而,由于根本性限制,现有调度机制通常未能利用这些机会。大多数现有方法仅关注空间转移或时间转移,很少有方法兼顾两者。此外,硬件生产的隐含排放对调度决策的影响常被忽视,而随着电力运行的脱碳化,这可能成为日益重要的考量因素。近期研究在碳感知计算的多个方面取得了进展,例如有学者提出了使用深度Q网络(DQN)和凝聚聚类进行动态虚拟机放置的方法,另有学者创建了以人工智能为中心的、基于机器学习和强化学习调度来预测碳强度的框架。然而,相关工作多集中于集中式云方法,对边缘-云联邦约束以及跨域环境中碳减排、性能保证和运行成本间的权衡处理有限。
基于上述文献分析,研究人员识别出在现有边缘-云系统碳感知调度方法中仍未解决的三个关键研究空白:第一,缺乏集成的时空优化,现有方法大多将空间转移与时间转移分开处理,忽略了二者协同优化的优势;第二,缺乏联邦感知约束,先前工作多假设单一管理域,忽略了数据主权、域信任边界和跨域策略合规性等现实联邦边缘-云基础设施的必要条件;第三,静态或单目标加权,现有的多目标调度器使用固定权重或仅优化单一指标(如仅碳排放),无法适应碳强度、工作负载关键性或运行成本的动态变化。
本研究直接针对上述空白,在碳感知联邦编排器方面做出了以下贡献以推动该领域发展:首先,提出了一种动态自适应加权机制,该机制利用环境实时状况和工作负载关键性,解决了研究空白第三点;其次,构建了基于碳、成本、性能和SLA的多目标优化框架,并考虑了联邦约束,同时解决了研究空白第一点和第三点;再次,进行了广泛而严格的验证,通过与现有最优方法的对比,在不同指标上显示出统计上显著的性能提升,且未损害成本、SLA或碳效率,解决了所有研究空白;最后,在现实约束下的异构联邦环境中验证了实际可行性,解决了研究空白第二点。
相关工作部分梳理了碳感知计算从提高能效的初级方法到形式化多目标优化方法的发展历程,文献通常可归类为空间转移方法、时间转移方法或混合方法,以及近期人工智能驱动的碳感知调度、联邦学习和生命周期感知方法。
联邦边缘-云基础设施部分描述了由不同管理域(即云数据中心和边缘节点)组成的联邦计算基础设施,这些域具备不同的能力和碳特性。该模型复现了现实中的计算环境,其中资源天然分布在不同地理位置和组织边界上。
提出方法部分介绍了一种新颖的碳感知联邦编排器。虽然优化框架主要关注运行碳排放,但研究人员也承认硬件制造和部署产生的隐含排放的重要性。在当前实现中,通过优先利用现有基础设施而非配置新硬件,在节点选择过程中定性考虑了隐含排放。生命周期排放的定量集成仍作为未来工作。
实验设计部分说明为构建代表联邦边缘-云系统复杂特性的健壮模拟环境,采用了MATLAB R2020a进行建模与模拟。模拟基础设施包含3个联邦域内的3个云数据中心和9个边缘节点,代表了实际实施规模。实验周期设定为7天(672小时),包含3969个工作负载任务。
结论与未来工作部分指出,本研究提出了一种用于边缘-云架构中碳感知联邦编排的整体架构,解决了可持续发展背景下分布式数字基础设施可持续资源管理这一根本问题。研究表明,智能多目标优化和动态时空工作负载放置能够产生显著的环境和经济价值,同时实现高质量的服务水平。