基于可解释性潜在空间深度学习的短期负荷预测模型性能提升研究

时间:2026年1月19日
来源:Results in Engineering

编辑推荐:

本文针对可再生能源并网带来的电力供需平衡挑战,提出了一种融合自编码器(AE)、卷积长短期记忆网络(ConvLSTM)和可解释人工智能(XAI)的新型短期负荷预测(STLF)框架XAE-ConvLSTM。研究通过AE进行数据降维和特征提取,利用ConvLSTM捕捉时空依赖性,并借助SHAP等XAI技术增强模型透明度。在AEP和Panama数据集上的实验表明,该模型在MAE、RMSE、MAPE%和R2等指标上均显著优于传统深度学习模型,为智能电网的可靠运行和能源管理提供了精准、可解释的决策支持。

广告
   X   

随着城市化进程的加速和人民生活水平的提高,全球电力需求持续增长,这对现有能源系统构成了巨大挑战。与此同时,为了实现碳达峰和碳中和目标,构建清洁、绿色、净零排放的电力系统已成为当务之急,这促使可再生能源(RES)在电网中的占比不断提升。然而,风能、太阳能等可再生能源具有间歇性和不确定性的特点,导致电力供需之间常常出现不平衡。这种供需之间的波动会引发电价波动,因为大规模电能存储仍然面临技术挑战。智能电网(SG)框架为无缝集成经济高效、可靠安全的能源提供了先进的基础设施。通过利用先进的智能技术,智能电网促进了以人为中心、环境可持续和技术集成的能源解决方案。维持电力供需之间的稳定平衡至关重要,这可以通过开发准确的负荷和发电预测模型来实现。这些模型必须包含短期(小时级)和长期(月级)的时间范围,以确保全面的预测准确性并保持价格稳定。
电力负荷预测(LF)机制对于复杂多变的发电和需求模式下电力系统有效、实用和可靠的运行至关重要。它是能源供应商、零售商和规划者的决策基础。有保守估计指出,一个10吉瓦(GW)的公用事业公司,其预测误差每降低1%,每年可节省高达160万美元的成本。而一个中型欧洲公用事业公司的预测精度提高0.1%,就可在不平衡市场中降低约300万美元的运营成本。在过去的几十年里,没有任何单一的预测方法能够满足所有公用事业的需求。根据不同的目标,人们采用了各种预测和方法论。基于时间序列分析,电力预测可分为四类:超短期负荷预测(U-STLF),跨度从几分钟到几小时,有助于增强电网稳定性和可靠性;短期负荷预测(STLF),跨度数小时、数天或数周,有助于优化资源和最小化成本;中期负荷预测(MTLF),跨度数月到数年,为公用事业公司提供资源管理和优化支持;长期负荷预测(LTLF),跨度数年到数十年,有助于电力分销商进行基础设施扩展和规划。
传统的负荷预测方法,如统计回归(SR)、自回归(AR)模型、自回归综合移动平均(ARIMA)及其季节性变体(SARIMA)等,虽然训练速度快、结构简单,能有效捕捉负荷数据中的线性模式,但其主要局限在于难以有效建模复杂负荷曲线中的非线性动态特征。机器学习(ML)方法,如支持向量机(SVM)、人工神经网络(ANN)等,能够识别输入数据中的非线性模式,从而克服传统方法的局限性,显著提高了负荷预测的准确性、可靠性和灵活性。然而,ML模型面临计算资源需求大、需要大量训练数据、结果解释和模型权重优化复杂等挑战。深度学习(DL)方法利用包含多个隐藏层的复杂神经架构来处理非线性关系,促进有效的特征提取、非线性映射和灵活建模能力。重要的DL方法包括多层感知器(MLP)、卷积神经网络(CNN)、深度信念网络(DBN)、循环神经网络(RNN)及其变体长短期记忆网络(LSTM)和门控循环单元(GRU)等。其中,LSTM和GRU因其在有效建模时间依赖性方面的优势,被认为是STLF的先进模型。
为了进一步提升预测精度,混合模型应运而生。例如,将CNN与LSTM结合用于孟加拉国电力系统的STLF,利用温度和湿度等多维因素,性能优于传统方法;ResNet-LSTM混合模型通过重构输入数据,利用ResNet进行特征提取,并采用LSTM进行STLF,实现了0.571%的平均绝对百分比误差(MAPE);结合卷积双向LSTM与自编码器(CBLSTM-AE)和白鲸优化(BWO)进行超参数调优的模型,在FE和DAYTON数据集上表现出色。此外,可解释人工智能(XAI)方法,如SHapley Additive exPlanations (SHAP),被用于特征选择和时间序列能源预测,提高了模型预测过程的透明度。
本研究旨在解决现有STLF方法在精度和可解释性方面的不足。论文提出了一种新颖的框架,该框架包含:1)一个自编码器(AE),通过将数据集映射到潜在空间来从原始数据集中获取更有意义的特征;2)一个基于卷积和长短期记忆网络技术的深度学习框架,用于改进和自动化预测过程;3)一个可解释人工智能框架,用于理解和解释模型生成的预测,并突出对底层数据集有贡献的重要特征。该框架使用涵盖不同时间跨度用电模式的综合数据集进行评估。结果表明,与传统和最先进的方法相比,所提出的XAE-ConvLSTM在AEP和Panama数据集上均实现了整体性能提升。
为开展研究,作者采用了多项关键技术方法。首先,利用自编码器进行数据降维和特征提取,将高维输入数据映射到低维潜在空间,以获取更本质的特征表示。其次,构建了卷积长短期记忆网络模型,该模型结合了CNN在空间特征提取和LSTM在时间依赖性建模方面的优势,能够有效处理负荷数据的时空特性。研究还采用了可解释人工智能技术,特别是SHAP,来分析不同特征对预测结果的贡献度,增强模型的透明度和可解释性。实验使用了来自美国PJM互联电网AEP和巴拿马地区的公开电力消费数据集,这些数据集包含了小时级的负荷数据以及天气、时间等相关特征。数据集被划分为训练集、验证集和测试集。性能评估采用了均值绝对误差、均方根误差、平均绝对百分比误差和决定系数等指标,以确保评估的全面性和可靠性。
3.1. 自编码器
自编码器是一种人工神经网络,用于学习有效的无监督输入数据编码、降维、特征学习和异常检测。它通过压缩和解码输入数据,可以揭示隐藏的模式和相关性,通过提供对能源需求因素更细致和全面的理解来提高模型性能。自编码器的另一个重要组成部分是异常检测,可以检测和处理能源需求峰值或下降、设备故障以及意外的消耗模式。其内部结构包括编码器、瓶颈层和解码器。编码器函数将输入映射到潜在空间,瓶颈层保存输入的压缩表示,解码器函数将潜在表示映射回原始空间,试图重构输入。通过最小化重构误差,自编码器可以学习到数据的关键特征。
3.2. 卷积神经网络
卷积神经网络是一类深度前馈人工神经网络,使用最少的预处理。它们在时间序列分析和负荷预测等多项任务中表现出卓越性能。CNN能够分析数据中的模式,其架构通常包括输入层、卷积层、激活层、池化层和全连接层。卷积层应用卷积操作后接激活函数,使模型能够从先前的层中学习层次化特征。
3.3. 长短期记忆网络
长短期记忆网络是循环神经网络的变体,用于处理序列数据并克服RNN的局限性,如梯度消失问题。它们能有效捕捉时间序列数据中的时间依赖性,适用于线性回归。LSTM具有记忆细胞、输入门、输出门和遗忘门等独特架构特征。输入门决定新接收输入的重要性,输出门将当前内部状态分配给后续时间步长,遗忘门负责选择应丢弃哪些过去的细节,从而实现长期记忆并调节信息流。这使得LSTM模型成为负荷预测的有效工具。
3.4. 门控循环单元
门控循环单元是RNN架构的一项重大进展。GRU通过利用门控机制来调节跨长时间序列的信息流,从而克服传统RNN的局限性,促进对序列数据的有效建模。GRU通过选择性地保留和更新相关信息来增强未来状态预测的准确性。GRU架构包括更新门和重置门两个主要门控机制以及控制信息流的激活函数。更新门控制先前隐藏状态对当前状态的影响,而重置门管理新输入数据与历史信息的整合。这种门控机制通过在反向传播期间保持稳定的梯度流,有效缓解了传统RNN训练中常见的梯度消失问题。
3.5. 卷积长短期记忆网络
卷积长短期记忆网络是该领域的一项新颖创新,它结合了CNN和LSTM的特性,有效处理时空数据。其独特之处在于通过卷积门操作来同时考虑空间和时间因素。这种架构设计使ConvLSTM能够捕捉多维负荷数据中的复杂模式和联系。ConvLSTM模型使STLF变得可行。它们利用历史负荷数据的时空网格来预测用电量。LSTM细胞采用卷积层来提取空间特征,并采用循环连接来确定时间依赖性。这种组合相比标准方法提高了预测精度。与传统LSTM不同,ConvLSTM在每个门处用卷积运算代替矩阵乘法运算。
3.6. 可解释人工智能
为了提高STLF的可靠性、有效性和鲁棒性,机器学习模型必须是透明、可理解和可解释的。XAI有助于提高模型的准确性和稳定性,并解释天气、用户行为、市场趋势等因素如何影响模型性能。使用SHAP有助于为决策制定、资源分配、优化和操作风险降低提供模型协调的见解。XAI的流程包括预训练数据、测试数据和预测输出,以计算SHAP值。SHAP是一种博弈论方法,通过分析子集的可能组合及其结果来确定不同参与者在回报中的影响、排名和份额。它还为特定预测的所有特征分配关键值,从而表明每个特征对预测结果的贡献大小。
研究结果表明,提出的XAE-ConvLSTM框架在短期负荷预测方面表现出卓越的性能。在AEP数据集上,该模型的平均绝对误差为189.80 ± 0.68%,均方根误差为254.01 ± 0.67%,平均绝对百分比误差为1.29 ± 0.071%,决定系数R2达到0.9892 ± 0.0028%。在Panama数据集上,平均绝对误差为28.22 ± 0.08%,均方根误差为38.60 ± 0.925%,平均绝对百分比误差为2.32 ± 0.040%,决定系数R2为0.9568 ± 0.0019%。与CNN、LSTM、GRU、CNN-LSTM和ConvLSTM等传统深度学习模型相比,XAE-ConvLSTM在各项指标上均有显著提升。通过可解释人工智能技术分析发现,温度是影响负荷预测的最重要因素,其SHAP值达到0.80,季节性因素也为0.638。一天中的时间、工作日和环境影响因素具有中等重要性,而时间因素的影响相对较小。
该研究通过融合自编码器、卷积长短期记忆网络和可解释人工智能技术,提出了一种高效的短期负荷预测框架,显著提升了预测精度和模型可解释性。研究的创新点在于:首先,通过自编码器降低了原始数据集的维度,利用潜在空间特征提高了整体性能;其次,系统评估了多种先进深度学习模型在负荷预测数据集上的性能;最后,通过可解释人工智能技术识别了预测过程中最相关的特征及其权重,增强了模型的透明度。实验结果表明,XAE-ConvLSTM模型在AEP和Panama数据集上均取得了最优的预测效果,为智能电网环境下的能源管理和决策支持提供了可靠的技术支撑。未来研究方向包括在边缘AI中扩展负荷预测的应用,利用分布式架构在边缘节点部署轻量级模型,实现本地化数据的实时处理,以及采用联邦学习在保护隐私的前提下协同提升模型准确性。

生物通微信公众号
微信
新浪微博


生物通 版权所有