一种融合人口和用电负荷的多变量预测方法与流程

2022-12-20 01:33:08 来源：中国专利 TAG：

1.本发明涉及用电量预测技术领域，更具体的说是涉及一种融合人口和用电负荷的多变量预测方法。

背景技术：

2.目前，电力消耗预测是一个重要的领域，不仅是对于电气领域公用事业，同样也是对电力消费者而言。在近年来，电力应用领域增加了负荷消耗预测，并将其作为电力公司的电能分配和调度的一部分来作用于电力系统的配电。在耗电方面，精确的预测出用电量能够更好地管理用电使用，同样保障电力负荷稳定的供应也是电力系统中重要的问题之一。
[0003][0004]
因此，提供一种包含人口流动预测指标的用电量预测，使最终电量结果更加稳定可靠，准确。同时，针对人口流动预测和用电量预测的结果，提供了一种模型融合的思路，使预测结果更为精确是本领域技术人员亟需解决的问题。

技术实现要素：

[0005]
有鉴于此，本发明提供了一种融合人口和用电负荷的多变量预测方法，通过获取并处理城市的人口历史数据集、城市天粒度的数据集以及该城市的气象数据集；获取相应的时序特征和气象特征；根据预测时段和预测频度确定训练集、测试集和验证集；基于xgboost、prophet和多元线性回归等模型进行预测；根据所得预测结果进行模型融合或者结果修正，从而提高预测的精准度。
[0006]
为了实现上述目的，本发明采用如下技术方案：
[0007]
一种融合人口和用电负荷的多变量预测方法，包括以下步骤：
[0008]
s1、获取人口流动数据、天粒度电量预测数据以及气象数据；
[0009]
s2、对所有数据进行特征划分，构建对于预测模型可用的数据集；
[0010]
s3、基于预测周期进行数据划分，选取训练集、测试集和验证集；
[0011]
s4、基于人口流动数据集、输入特征和输出特征，通过树模型、prophet 模型和多元线性回归模型进行建模，得到人口流动预测结果，并对人口流动预测结果极性线性融合；
[0012]
s5、基于用电量数据集、人口流动预测结果和气象数据，通过树模型、 prophet模型和多元线性回归模型进行建模，得到天粒度的居民用电量预测结果，并对居民用电量预测结果进行模型融合或结果修正。
[0013]
优选的，所述步骤s1具体包括：
[0014]
获取当天该地人口净迁入数为人口流动数据，获取当天该地居民最大用电负荷为用电量，获取当天最高温度、最低温度为气象数据。
[0015]
优选的，所述步骤s2具体包括：
[0016]
通过查询日历数据库获得每个预测日为星期几；通过查询日历数据库获得每个预测日为当月第几天；通过查询日历数据库获得每个预测日是否是节假日；通过查询日历数
据库获得每个预测日所处的第几周；通过查询日历数据库获得每个预测日所处的月份；通过查询日历数据库获得每个预测日为当年第几天；通过查询日历数据库获得每个预测日为当年第几季度；通过查询天气数据库获得每个预测日当天最高温度；通过查询天气数据库获得每个预测日当天最低温度。
[0017]
优选的，所述步骤s3具体包括：
[0018]
构建迁入人口数为人口流动数据的输出特征；构建每日居民用电最大负荷的输出特征，预测周期为14日；从构建的输入特征-输出特征选取t-365至 t-3日组成训练样本集，t 1到t 14日为测试样本集，t-2至t日为验证样本集；
[0019]
其中，训练样本集所对应时间段要早于测试样本集所对应时间段，测试样本集时间段符合预测时段和预测周期。
[0020]
优选的，所述步骤s4具体包括：
[0021]
s41、xgboosted模型：
[0022]
s411、确定n个样本(xi,yi),i＝1,2....n，xi为样本输入特征，yi为样本输出特征，从目标函数的基本形式入手，一个树模型对于某个样本的预测值使用k个加性函数来预测输出，公式为：
[0023][0024]
其中，fk是基学习器，最终模型是多个基学习器，最终模型是多个基学习器，是回归树的空间，这里q表示将输入特征映射到相应叶索引的每个树的结构，t表示树中叶子的数量，每个基学习器fk对应一个独立的树结构q和叶权重ω，每个回归树在每个叶子结点上都包含一个分数，我们使用ωi表示第i个叶子上的权重，对于给定的事例，我们将使用树中的决策规则，由q给出，将其分类为树叶并通过将相应树叶中的得分相加，由ω给出，来计算最终预测，为了学习模型中的函数集，我们将最小化以下正则化目标：
[0025][0026]
这里，l是一个可微的凸损失函数，用于测量预测和目标yi之间的差异。第二项ω为惩罚模型的复杂性，即回归树函数；
[0027]
s412、将最初的目标函数可以写成：
[0028][0029]
其中，是前t-1个集成学习器对样本的预测值；f
t
(xi)是当前学习器对样本的预测值；ω(f
t
)是第t个学习器的正则项；
[0030]
s413、对目标函数进行泰勒二阶展开：
[0031][0032]
其中，为l函数对的一阶导数，的一阶导数，为l函数对的二阶导数；
[0033]
s414、将正则项标准化为如下的式子：
[0034][0035]
t表示叶子结点的个数，模型中将叶子结点的个数作为l1的正则项，将叶子结点的权重值作为l2的正则项，γ和λ都视为正则项常数，wj为最优权重；
[0036]
s415、将叶子结点的权重值作为叶子结点的输出score，即预测值；
[0037]
s42、基于prophet的预测模型具体步骤如下：
[0038]
s421、确定prophet模型中的趋势项、周期项、节假日项、误差项：
[0039]
p(t)＝g(t) s(t) h(t) ε
t
[0040]
g(t)表示趋势项，即时间序列在非周期上面的变化趋势；s(t)表示周期项，即季节项，h(t)表示节假日项，即当天是否存在节假日；ε
t
表示误差项；
[0041]
趋势项g(t)是一个重要项，g(t)有两个重要函数，一个是基于分段线性函数，另一个是基于逻辑回归函数；
[0042]
s422、确定趋势项g(t)基于分段逻辑回归增长模型：
[0043][0044]
其中
[0045]
a(t)＝(a1(t),
…
,as(t))
t
[0046]
δ＝(δ1,
…
,δs)
t
[0047]
γ＝(γ1,
…
,γ2)
t
[0048]
c(t)表示模型容量，k表示增长率，δ表示增长率的变化量，随着t的增加， g(t)趋于c(t)；
[0049]
对于趋势相g(t)基于分段线性函数如：
[0050]
g(t)＝(k a(t)δ*t (m a(t)
t
γ)
[0051]
k表示增长率，δ表示增长率的变化量，m表示offset pa-rameter；
[0052]
s423、对于周期s(t)中的周期性函数通过正玄或余玄函数来表示；用傅立叶级数来模拟时间序列的周期性：
[0053][0054]
其中，拟合季节性需要2n个参数，历史和未来数据中每个值构建一个季节性向量
矩阵来实现的，对于以年为周期的序列p＝365.25，年度季节性n＝10；对于以周为周期的序列，n＝3，参数形成向量
[0055]
β＝(a1,b1,
…
,an,bn)
t
[0056]
当n＝10时
[0057][0058]
当n＝3时
[0059][0060]
因此，时间序列的季节项是:x(t)＝x(t)β，β的初始化是β～noemal(0,σ2)，σ＝seasonalitu_prior_scale，σ值越大，表示季节的效果越明显；
[0061]
s424、节假日项h(t)模型如下，假设有l个节假日，则节假日效应模型为：
[0062][0063][0064]
k的初始化是k～normal(0，v2)，v＝holidays_prior_scale，默认值是 10，当值越大时，表示节假日对模型的影响越大；
[0065]
s43、多元线性回归模型基本构造步骤如下：
[0066]
s431、设m个输出特征y1,
…
,ym，解释变量为x1,
…
,x
p-1
，考虑解释变量与响应变量之间的关系,假设有如下总体回归模型：
[0067]
y1＝β
01
β
11
x1 ... β
(p-1)1
x
p-1
e1[0068]
y2＝β
02
β
12
x1 ... β
(p-1)2
x
p-1
e2[0069]
...
[0070]
ym＝β
0m
β
1m
x1 ... β
(p-1)m
x
p-1
em[0071]
假设每个指标yi和解释变量之间存在线性关系，对于误差项：
[0072]
e＝[e1,e2,...,em]
′
满足假设ee＝0，cov(e)＝∑(δ
ij
)
[0073]
其中p为解释变量个数，β0为常数项，β1,β2...β
p-1
为回归系数；
[0074]
s432、假设有n个样本点{x,y}，每个样本点的自变量有m个{x1,x2,
…
}，则可以定义：
[0075][0076]
其中：w为m维列向量，x也为m维列向量，y为实数；
[0077]
将上述式改写为平方形式，为欧几里得距离，其公式为：
[0078]
[0079]
其次，让该代价函数值最小：
[0080][0081]
argmin函数表示当括号内的函数方程式最小时返回此时的变量，也就是标准线性回归结果；
[0082]
其中，ridge回归的代价函数与标准回归函数一致，同为欧几里得距离的平方和，只是在此基础上加上了l2-范数的平方作为惩罚项，l2-范数的含义为向量w每个元素的平方和然后开平方，ridge回归的结果，公式为：
[0083][0084]
lasso回归同ridge回归一样加上了正则项，将带惩罚系数μ的w向量的 l1-范数作为惩罚项，l1-范数的含义为向量w每个元素绝对值的和，即为l1 正则化，同样通过解析代价函数最小时的w即为lasso结果。
[0085][0086]
elastic net结合以上两者，融合l1和l2正则项，通过两个参数μ1和μ2来控制惩罚项的大小：
[0087][0088]
分别使用时序模型prophet和树模型xgboost对日度流动人口进行预测，最后对结果进行线性融合：
[0089][0090]
其中为已有日度流动人口数据依照步骤s42中prophet预测流程所得结果，为已有日度流动人口数据依照步骤s41中xgboost 预测流程所得结果，w1和w2为加权参数，其中，w1 w2＝1，参数w1确定为 0.7，参数w2为0.3。
[0091]
优选的，所述步骤s5具体包括：
[0092]
s51、给定训练集
[0093]
d＝{(x1,y1),(x2,y2),
……
,(xn,yn)},xi∈χ,gbdt算法进行优化：
[0094]
初始化提升树模型:
[0095][0096]
其中l(yi,c)为决策树表示的基模型，c为决策树参数，f0(x)为初始提升树；
[0097]
对以下决策树棵树h＝1,2,
……
,h，有
[0098]
对每个样本i＝1,2,
……
,n，计算负梯度拟合的残差：
[0099][0100]
其中，f
h-1
(x)表示截止到第h-1棵树的累计预估结果，为常数；
[0101]
将上一步得到的残差作为样本新的真实值，并将数据(xi,r
hi
),i＝ 1,2,
……
,n作为下一棵树的训练数据，得到一棵新的回归树fh(x)，其对应的叶子结点区域为r
hj
,j＝1,2,
……
,j，其中j为回归树t的叶子结点的个数；
[0102]
对叶子节点j＝1,2,
……
,j计算最优拟合值：
[0103][0104]
更新提升树模型：
[0105][0106]
得到最终的梯度提升树：
[0107][0108]
由此，得到用电量天粒度的预测结果；
[0109]
针对天粒度居民用电量，分别使用多元回归模型elasticnet和树模型 gbdt、xgboost对天粒度用电负荷进行预测，最后对不同模型预测结果进行线性融合，其中elasticnet主要用于学习用电负荷与人口数、温度之间的相关性，gbdt和xgboost则主要用于引入时序特征的影响，
[0110][0111]
其中为天粒度居民用电量依照步骤s51中gbdt预测流程所得结果，为天粒度居民用电量依照步骤s41中xgboost预测流程所得结果，为天粒度居民用电量依照步骤s43中elasticnet预测流程所得结果，w1,w2,w3为各模型的加权参数，由此，得到最终用电量预测结果。
[0112]
经由上述的技术方案可知，与现有技术相比，本发明公开提供了一种融合人口和用电负荷的多变量预测方法，通过获取并处理城市的人口历史数据集、城市天粒度的数据集以及该城市的气象数据集；获取相应的时序特征和气象特征；根据预测时段和预测频度确定训练集、测试集和验证集；基于 xgboost、prophet和多元线性回归等模型进行预测；根据所得预测结果进行模型融合或者结果修正，从而提高预测的精准度。
附图说明
[0113]
为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
[0114]
图1附图为本发明提供的方法流程结构示意图。
具体实施方式
[0115]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0116]
本发明实施例公开了一种融合人口和用电负荷的多变量预测方法，包括以下步骤：
[0117]
s1、获取人口流动数据、天粒度电量预测数据以及气象数据；
[0118]
s2、对所有数据进行特征划分，构建对于预测模型可用的数据集；
[0119]
s3、基于预测周期进行数据划分，选取训练集、测试集和验证集；
[0120]
s4、基于人口流动数据集、输入特征和输出特征，通过树模型、prophet 模型和多元线性回归模型进行建模，得到人口流动预测结果，并对人口流动预测结果极性线性融合；
[0121]
s5、基于用电量数据集、人口流动预测结果和气象数据，通过树模型、 prophet模型和多元线性回归模型进行建模，得到天粒度的居民用电量预测结果，并对居民用电量预测结果进行模型融合或结果修正。
[0122]
为进一步优化上述技术方案，步骤s1具体包括：
[0123]
获取当天该地人口净迁入数为人口流动数据，获取当天该地居民最大用电负荷为用电量，获取当天最高温度、最低温度为气象数据。
[0124]
为进一步优化上述技术方案，步骤s2具体包括：
[0125]
通过查询日历数据库获得每个预测日为星期几；通过查询日历数据库获得每个预测日为当月第几天；通过查询日历数据库获得每个预测日是否是节假日；通过查询日历数据库获得每个预测日所处的第几周；通过查询日历数据库获得每个预测日所处的月份；通过查询日历数据库获得每个预测日为当年第几天；通过查询日历数据库获得每个预测日为当年第几季度；通过查询天气数据库获得每个预测日当天最高温度；通过查询天气数据库获得每个预测日当天最低温度。
[0126]
为进一步优化上述技术方案，步骤s3具体包括：
[0127]
构建迁入人口数为人口流动数据的输出特征；构建每日居民用电最大负荷的输出特征，预测周期为14日；从构建的输入特征-输出特征选取t-365至 t-3日组成训练样本集，t 1到t 14日为测试样本集，t-2至t日为验证样本集；
[0128]
其中，训练样本集所对应时间段要早于测试样本集所对应时间段，测试样本集时间段符合预测时段和预测周期。
[0129]
为进一步优化上述技术方案，步骤s4具体包括：
[0130]
s41、xgboosted模型：
[0131]
s411、确定n个样本(xi,yi),i＝1,2....n，xi为样本输入特征，yi为样本输出特征，从目标函数的基本形式入手，一个树模型对于某个样本的预测值使用k个加性函数来预测输出，公式为：
[0132][0133]
其中，fk是基学习器，最终模型是多个基学习器，最终模型是多个基学习器，是回归树的空间，这里q表示将输入特征映射到相应叶索引的每个树的结构，t表示树中叶子的数量，每个基学习器fk对应一个独立的树结构q和叶权重ω，每个回归树在每个叶子结点上都包含一个分数，我们使用ωi表示第i个叶子上的权重，对于给定的事例，我们将使用树中的决策规则，由q给出，将其分类为树叶并通过将相应树叶中的得分相加，由ω给出，来计算最终预测，为了学习模型中的函数集，我们将最小化以下正则化目标：
[0134][0135]
这里，l是一个可微的凸损失函数，用于测量预测和目标yi之间的差异。第二项ω为惩罚模型的复杂性，即回归树函数；
[0136]
s412、将最初的目标函数可以写成：
[0137][0138]
其中，是前t-1个集成学习器对样本的预测值；f
t
(xi)是当前学习器对样本的预测值；ω(f
t
)是第t个学习器的正则项；
[0139]
s413、对目标函数进行泰勒二阶展开：
[0140][0141]
其中，为l函数对的一阶导数，的一阶导数，为l函数对的二阶导数；
[0142]
s414、将正则项标准化为如下的式子：
[0143][0144]
t表示叶子结点的个数，模型中将叶子结点的个数作为l1的正则项，将叶子结点的权重值作为l2的正则项，γ和λ都视为正则项常数，wj为最优权重；
[0145]
s415、将叶子结点的权重值作为叶子结点的输出score，即预测值；
[0146]
s42、基于prophet的预测模型具体步骤如下：
[0147]
s421、确定prophet模型中的趋势项、周期项、节假日项、误差项：
[0148]
p(t)＝g(t) s(t) h(t) ε
t
[0149]
g(t)表示趋势项，即时间序列在非周期上面的变化趋势；s(t)表示周期项，即季节项，h(t)表示节假日项，即当天是否存在节假日；ε
t
表示误差项；
[0150]
趋势项g(t)是一个重要项，g(t)有两个重要函数，一个是基于分段线性函数，另一个是基于逻辑回归函数；
[0151]
s422、确定趋势项g(t)基于分段逻辑回归增长模型：
[0152][0153]
其中
[0154]
a(t)＝(a1(t)，...，as(t))
t
[0155]
δ＝(δ1，...，δs)
t
[0156]
γ＝(γ1，...，γ2)
t
[0157]
c(t)表示模型容量，k表示增长率，δ表示增长率的变化量，随着t的增加， g(t)趋于c(t)；
[0158]
对于趋势相g(t)基于分段线性函数如：
[0159]
g(t)＝(k a(t)δ*t (m a(t)
t
γ)
[0160]
k表示增长率，δ表示增长率的变化量，m表示offsetpa-rameter；
[0161]
s423、对于周期s(t)中的周期性函数通过正玄或余玄函数来表示；用傅立叶级数来模拟时间序列的周期性：
[0162][0163]
其中，拟合季节性需要2n个参数，历史和未来数据中每个值构建一个季节性向量矩阵来实现的，对于以年为周期的序列p＝365.25，年度季节性n＝10；对于以周为周期的序列，n＝3，参数形成向量
[0164]
β(a1,b1,
…
，an，bn)
t
[0165]
当n＝10时
[0166][0167]
当n＝3时
[0168][0169]
因此，时间序列的季节项是:x(t)＝x(t)β，β的初始化是β～noemal(0,σ2)，σ＝seasonalitu_prior_scale，σ值越大，表示季节的效果越明显；
[0170]
s424、节假日项h(t)模型如下，假设有l个节假日，则节假日效应模型为：
[0171][0172][0173]
k的初始化是k～normal(0，v2)，v＝holidays_prior_scale，默认值是 10，当值越大时，表示节假日对模型的影响越大；
[0174]
s43、多元线性回归模型基本构造步骤如下：
[0175]
s431、设m个输出特征y1,
…
,ym，解释变量为x1,
…
,x
p-1
，考虑解释变量与响应变量之间的关系,假设有如下总体回归模型：
[0176]
y1＝β
01
β
11
x1 ... β
(p-1)1
x
p-1
e1[0177]
y2＝β
02
β
12
x1 ... β
(p-1)2
x
p-1
e2[0178]
...
[0179]
ym＝β
0m
β
1m
x1 ... β
(p-1)m
x
p-1
em[0180]
假设每个指标yi和解释变量之间存在线性关系，对于误差项：
[0181]
e＝[e1,e2,...,em]
′
满足假设ee＝0，cov(e)＝∑(δ
ij
)
[0182]
其中p为解释变量个数，β0为常数项，β1,β2...β
p-1
为回归系数；
[0183]
s432、假设有n个样本点{x,y}，每个样本点的自变量有m个{x1,x2,
…
}，则可以定义：
[0184][0185]
其中：w为m维列向量，x也为m维列向量，y为实数；
[0186]
将上述式改写为平方形式，为欧几里得距离，其公式为：
[0187][0188]
其次，让该代价函数值最小：
[0189][0190]
argmin函数表示当括号内的函数方程式最小时返回此时的变量，也就是标准线性回归结果；
[0191]
其中，ridge回归的代价函数与标准回归函数一致，同为欧几里得距离的平方和，只是在此基础上加上了l2-范数的平方作为惩罚项，l2-范数的含义为向量w每个元素的平方和然后开平方，ridge回归的结果，公式为：
[0192]
[0193]
lasso回归同ridge回归一样加上了正则项，将带惩罚系数μ的w向量的 l1-范数作为惩罚项，l1-范数的含义为向量w每个元素绝对值的和，即为l1 正则化，同样通过解析代价函数最小时的w即为lasso结果。
[0194][0195]
elastic net结合以上两者，融合l1和l2正则项，通过两个参数μ1和μ2来控制惩罚项的大小：
[0196][0197]
分别使用时序模型prophet和树模型xgboost对日度流动人口进行预测，最后对结果进行线性融合：
[0198][0199]
其中为已有日度流动人口数据依照步骤s42中prophet预测流程所得结果，为已有日度流动人口数据依照步骤s41中xgboost 预测流程所得结果，w1和w2为加权参数，其中，w1 w2＝1，参数w1确定为 0.7，参数w2为0.3。
[0200]
为进一步优化上述技术方案，步骤s5具体包括：
[0201]
s51、给定训练集
[0202]
d＝{(x1,y1),(x2,y2),
……
,(xn,yn)},xi∈χ,gbdt算法进行优化：
[0203]
初始化提升树模型:
[0204][0205]
其中l(yi,c)为决策树表示的基模型，c为决策树参数，f0(x)为初始提升树；
[0206]
对以下决策树棵树h＝1,2,
……
,h，有
[0207]
对每个样本i＝1,2,
……
,n，计算负梯度拟合的残差：
[0208][0209]
其中，f
h-1
(x)表示截止到第h-1棵树的累计预估结果，为常数；
[0210]
将上一步得到的残差作为样本新的真实值，并将数据(xi,r
hi
),i＝ 1,2,
……
,n作为下一棵树的训练数据，得到一棵新的回归树fh(x)，其对应的叶子结点区域为r
hj
,j＝1,2,
……
,j，其中j为回归树t的叶子结点的个数；
[0211]
对叶子节点j＝1,2,
……
,j计算最优拟合值：
[0212][0213]
更新提升树模型：
[0214][0215]
得到最终的梯度提升树：
[0216][0217]
由此，得到用电量天粒度的预测结果；
[0218]
针对天粒度居民用电量，分别使用多元回归模型elasticnet和树模型 gbdt、xgboost对天粒度用电负荷进行预测，最后对不同模型预测结果进行线性融合，其中elasticnet主要用于学习用电负荷与人口数、温度之间的相关性，gbdt和xgboost则主要用于引入时序特征的影响，
[0219][0220]
其中为天粒度居民用电量依照步骤s51中gbdt预测流程所得结果，为天粒度居民用电量依照步骤s41中xgboost预测流程所得结果，为天粒度居民用电量依照步骤s43中elasticnet预测流程所得结果，w1,w2,w3为各模型的加权参数，由此，得到最终用电量预测结果。
[0221]
s1.获取某地2020年以来人口流动历史数据集，包含每日净迁入人口数及当天日期，如表1所示；
[0222]
表1某地人口流动数据示例
[0223]
日期净迁入人口数2020/1/139402020/1/219362020/1/346602020/1/4-17362020/1/59935......2022/2/26-148472022/2/27-165782022/2/28-127722022/3/1-84422022/3/2-12996
[0224]
s2.对步骤s1获取的人口流动数据集进行处理，通过查询日历数据库获得每个预测日为星期几，每个预测日为当月第几天，每个预测日是否是节假日，每个预测日所处的自然周，每个预测日所处的月份，每个预测日为当年第几天，每个预测日为当年第几季度；通过查询人口数据库获得每个预测日的人口净迁入数；通过查询天气数据库获得每个预测日当天最高温度和最低温度，从而构建城市人口流动预测数据集，如表2所示；
[0225]
表2某地人口特征衍生数据示例
[0226][0227]
s3.根据预测时段、预测周期以及步骤s2得到的处理过后的数据集，选取人口流动预测训练集，测试集和验证集，其中预测周期为14天。预测时段选取2020年11月5日至2021年11月4日组成训练样本集，2021年11月8日至2021年11月21日为测试样本集，2021年11月5日至2021年11月7日为验证样本集，如表3所示。
[0228]
表3某地人口数据集划分示例某地人口数据训练集示例
[0229]
为加权参数，分别取0.7和0.3。
[0239]
由此，得到人口流动的最终预测结果，采用平均绝对百分比误差(meanabsolute percentage error)作为评判标准，公式如下所示，对比结果如表4所示，融合模型的效果明显优于单体模型。
[0240][0241]
表4某地人口流动预测mape对比实例
[0242]
模型mape融合模型4.51prophet4.85xgboost5.42
[0243]
s5.获取2020年以来居民用电量天粒度历史数据集、气象数据以及s4预测的人口流动数据，如表5所示；
[0244]
表5某地用电数据示例
[0245][0246]
s6.对步骤s5获取的居民用电量数据集进行处理，通过查询日历数据库获得预测天为星期几，预测天为当月第几天，预测天是否是节假日，预测天所处的自然周，预测天所处的月份，预测天为当年第几天，预测天为当年第几季度；通过查询人口数据库获得预测天的净迁入人口数；通过查询天气数据库获得预测天当天最高温度，预测天当天最低温度。对已经得到的特征衍生数据、气象数据，人口流动数据集和人口流动预测结果作为输入特征，从而构建居民用电量预测数据集，如表6所示；
[0247]
表6某地用电特征衍生数据示例
[0248][0249]
s7.根据预测时段，预测周期以及步骤s6得到的处理过后的数据集，选取用电量预测训练集，测试集和验证集，并对居民用电进行分析。其中预测用电量预测周期为14日。构建天粒度最大负荷作为输出特征；最后，从构建的输入特征-输出特征选取t-365至t-3日组成训练样本集，t 1到t 14日为测试样本集，t-2至t日为验证样本集。其中，训练样本集所对应时间段要早于测试样本集所对应时间段，测试样本集时间段要求符合要求的预测时段和预测周期，如表7所示；
[0250]
表7某地用电数据集划分示例某地用电数据训练集示例
[0251][0252]
某地用电数据验证集示例
[0253][0254][0255]
某地用电数据测试集示例
[0256][0257]
s8.根据步骤s6和步骤s7得到的用电量数据集、输入特征和输出特征，日常时期居民用电负荷变化幅度不大，并且时序周期性不强，导致lstm等时序模型预测效果不佳。分别使用多元回归模型elasticnet和树模型gbdt、 xgboost对日粒度用电负荷进行预测，其中elasticnet主要用于学习用电负荷与人口数、温度之间的相关性，gbdt和xgboost则主要用于引入时序特征的影响。针对天粒度居民用电分析进行线性融合：
[0258][0259]
其中为gbdt预测结果，为xgboost预测结果，为elasticnet预测结果，w1,w2,w3为各模型的加权参数，分别取。由此得到结合人口流动数据的天粒度和小时粒度的最终预测结果。采用平均绝对百分比误差(mean absolute percentage error)作为评判标准，公式如下所示，对比结果如表8所示，融合模型的效果明显优于单体模型。
[0260][0261]
表8某地用电预测mape对比实例
[0262]
模型mape融合模型2.36gbdt2.62xgboost3.92elasticnet4.82
[0263]
本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。
[0264]
对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：车辆的用户交互行为采集方法及装置与流程

一种融合人口和用电负荷的多变量预测方法与流程

相关文献

最热文献