新闻快讯

News

一种新型区域集中供热系统热负荷预测组合模型

时间:2023-03-25  点击量:

1366B

建造环境(BERL)课题组王延敏博士在中科院二区期刊《Applied Thermal Engineering》(JCR Q1 IF=6.465)发表了集中供热系统热负荷组合预测模型的研究。

题目

 A novel combined model for heat load prediction in district heating systems

一种新型区域集中供热系统热负荷预测组合模型

作者

Yanmin Wang(王延敏,一作,天大/大连海心), Zhiwei Li(李志伟,天大) Junjie Liu(刘俊杰,通讯作者,天大), Yan Zhao(赵岩,大连海心), Shengbin Sun(孙圣斌,大连海心)

研究亮点

l  提出了一种供热负荷预测的组合策略。

l  在中国东北地区的三个换热站进行了应用。

l  与四个经典的单项模型和三个具有代表性的组合模型进行了比较。

l  与其他模型相比,预测的准确性和稳定性有显著提高。

研究背景

当前全球能源需求持续增长,能源的生产和分配面临巨大挑战。在中国,2020年能源消费总量的21%是建筑能源消费;在建筑能源消费总量中,20%是北方城镇的供热能源消费;集中供热系统消耗的能源占总供热能源消耗的80%。因此,集中供热系统在热能的生产、分配和消费中发挥着重要作用。换热站调节仍然是中国集中供热系统进行控制的主要方法,精确预测换热站的热负荷有助于提高热效率,从而提高集中供热系统的运行效率。

许多研究人员提出了多种热负荷预测模型,以提高预测的准确性和稳定性。文献中介绍的预测模型大致可分为两类:基于物理的模型和数据驱动的模型。基于物理的模型通常也被称为“白盒”模型,利用物理原理和热力学建立热负荷和影响特征之间的关联方程,需要大量集中供热系统的相关参数和信息作为输入来预测输出,昂贵又耗时。

数据驱动模型又被称为“黑盒”模型,是根据历史运行数据寻找热负荷和影响特征之间的潜在关系,主要使用机器学习算法来实现。数据驱动模型包括单项模型和组合模型。

单项模型只使用一种算法来进行热负荷预测。常用的单项模型包括反向传播神经网络(BPNN)、径向基函数神经网络(RBFNN),深度神经网络(DNN),递归神经网络(RNN),支持向量机回归(SVR),极端梯度增强(XGBoost),长短期记忆网络(LSTM)和轻型梯度助推机(LightGBM)等。单项模型在使用中具有很大的灵活性和良好的预测性,但也有明显的局限性。首先,它们依赖于代表不同操作条件的大量数据,输入数据的微小差异可能导致输出值发生显著变化。其次,缺乏合适的超参数调节和初始化通用方法,易导致过拟合、欠拟合和局部优化问题。由于实际应用中的控制策略依赖于预测的可靠性,这些限制会影响预测模型在实际应用中的实时实现。因此,研究者引入了组合模型的概念来克服这些限制。

组合模型分为两种类型,第一种将几个单独模型集合起来,称为集合模型;第二种使用优化改进策略,结合了单个模型和优化方法,称为改进模型。集合模型在同一数据集上训练几个不同的单个模型,然后使用加权平均方法将每个单项模型的预测结果组合起来,以生成最佳输出。在集成模型中,单个模型相互补充,可以解决各种问题,从而比传统的单项模型获得更稳定、更准确的结果。尽管这种新方法具有很好的预测性能,但在实际应用中需要考虑一致性、稳定性和更高的预测精度,需要更多的时间和精力来应对复杂的训练、调节和集成策略,因此在热负荷预测领域并不流行。

为了提高热负荷预测的准确性,缓解其不稳定性,并探索其在实际应用中的效果,本研究开发了一种基于组合预测误差最小平方和(minSSE)算法的新型组合预测模型。三个数据集的多步预测实验结果显示,所提出的模型对一步、两步和三步预测的平均绝对百分比误差值(MAPE)分别达到2.6%、4.9%和7.0%,显著低于四个单项模型和三个具有代表性的组合模型。

主要成果

1.提出了组合预测模型的流程

1EF49

Fig. 1. Flow of the proposed combined model

图1 组合预测模型的流程

组合预测模型分为五个步骤:首先确定输入参数,包括气象参数、历史运行数据和室内温度数据;然后,检测历史数据中的异常值,并用邻近值替换;第三,选择四个典型单项模型(BPNN, RBFNN, SVR, XGBoost)进行预测;第四,使用minSSE算法计算四个单项模型的权重系数;第五,使用权重系数将四个单项预测模型的预测结果组合起来,得到最终的预测结果。

2.试验数据集的选择

Table 1 Statistical indicators for historical heat load of the three datasets.

表1 三个数据集中历史热负荷的统计指标

11D86


选择了中国东北地区的三个换热站,提取了2021年11月5日到2022年4月4日的历史运行数据,得到三个试验数据集。数据每1小时提取一次,共3,624条记录,包含6个特征。2022228日前的2,784条数据作为训练数据,后面840条数据作为测试数据。

3.与四个单项模型预测结果的比较

19F96

Fig. 2. Comparison of the performance between proposed and individual models for 14 days of data for Set 3.

图2 对数据集3中14天数据,组合模型与单项模型的预测性能比较

四个单项模型都表现了较好的预测性能,SVR和RBFNN预测精度最高,然后是BPNN,最差的是XGBoost。与四个单项模型相比,提出模型的MAEMAPECV-RMSE值最小,而R2值最大。因此,提出模型的预测精度优于四个单项模型。原因是每种模型都有自己的优点和缺点,而组合模型可以利用单项模型的大部分优势,抵消单项模型中不相关的误差,能够获得最准确的结果。

4.与三个具有代表性的组合模型预测结果的比较

189A0

Fig. 3. Comparison of the performance between proposed and other combined models for 14 days of data for Set 3.

图3 对数据集3中14天数据,提出模型与其他组合模型的预测性能比较

选择了三个具有代表性的组合模型:熵值法(EVM)、单项预测误差平方和倒数法(recSSE)、简单平均值法(SAM),并与minSSE方法进行了比较。在三个数据集的多步骤预测中,minSSE都有最高的精度,recSSE法是第二有效的方法。EVM和SAM表现出最差的有效性,并且它们的值彼此相似。原因在于每种方法对每个单项模型的权重系数不同,minSSE法对预测精度最高的单项模型能够赋予最高的权重,recSSE较差。EVM和SAM对每个模型的权重系数接近相等,无法获取每个单项模型的优势。

5.提出模型的预测精确性分析

1A633

Fig. 4. One-step prediction results of the proposed model for 14 days of data for the three datasets.

图4 对三个数据集14天的数据,提出模型的单步预测结果说明

对三个数据集,一步预测的结果最好,MAPE的平均值为2.6%,R2的平均值为0.99。预测曲线与实际曲线的拟合效果也很好,表明提出模型对三个数据集的预测精度相对较高。三步预测结果最差,但MAPE的平均值也低于7%,R2的平均值高于0.93,表明三个数据集的预测精度也相对较好。

6.提出模型的预测稳定性分析

72C5

Fig. 5. Comparison of prediction stability of various models.

图5 不同模型的预测稳定性比较

与各种单项模型相比,在所有多步预测中,提出模型的误差上界和下界之间的距离较小,误差分布更加集中,表明提出模型可以获得最优的预测稳定性。原因在于单项模型存在容易导致预测结果不稳定的缺点,提出模型可以利用各种单项模型的优点并消除其缺点,以确保预测结果更加稳定。与其他组合模型相比,无论预测步骤如何,提出模型的预测稳定性都显著提高,原因在于提出模型可以更好地为具有高稳定性和低稳定性的单项模型分配更高和更低的权重。

 

文章引用格式:

Y. Wang, Z. Li, J. Liu, Y. Zhao, S. Sun, A novel combined model for heat load prediction in district heating systems, Appl. Therm. Eng., (2023) 120372. https://doi.org/10.1016/j.applthermaleng.2023.120372.

 

稿件编辑:王延敏

稿件审核:刘俊杰、田媛、何明桐