一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种配电网业扩配套容量时序建设规模预测方法与流程

2022-06-12 00:15:05 来源:中国专利 TAG:


1.本发明涉及配电网领域,尤其涉及一种配电网业扩配套容量时序建设规模预测方法,主要适用于提高预测精度。


背景技术:

2.业扩配套电网工程是供电企业中非常重要的项目,旨在满足客户新装、增容用电需求,由供电企业负责建设电压等级在35kv及以下电压等级的配电网新建、扩建及改造项目。现有的业扩配套项目容量建设主要依据专家经验法,专家对于不同地市配电网业扩配套项目建设容量是根据实际经验和对预测对象的熟悉程度来制定的,不同的专家得到的结果并不完全一样,主观随意性较大,缺乏科学测算体系。此外,各地市配电网的业扩配套项目建设规模具有一定不确定性,仅凭专家主观臆断难以全面考虑业扩配套容量建设的时序特征,容易导致各行业客户在用电报装接入环节执行不到位。因此,亟需构建业扩配套容量时序建设规模预测模型,科学预测各地市不同行业客户的业扩配套工程容量建设时序与计划规模,提升预测精度。


技术实现要素:

3.本发明的目的是克服现有技术中存在的预测精度低的缺陷与问题,提供一种预测精度高的配电网业扩配套容量时序建设规模预测方法。
4.为实现以上目的,本发明的技术解决方案是:一种配电网业扩配套容量时序建设规模预测方法,包括以下步骤:
5.s1、对业扩配套容量时序建设规模影响指标进行相关性分析,得到对业扩配套项目影响最大的影响指标为时序影响因素和历史建设容量;
6.s2、从海量历史业扩配套容量建设规模数据库中筛选出类似业扩配套容量建设项目,提取类似业扩配套容量建设项目的时序影响因素数据和历史建设容量数据;
7.s3、先对步骤s2中提取的时序影响因素数据和历史建设容量数据进行预处理,再对数据集进行归一化处理,然后将数据集划分为训练集和测试集;
8.s4、构建基于可解释循环神经网络的配电网业扩配套容量时序建设规模预测模型,该预测模型包括输入层、线性层、非线性特征提取层与线性回归层;
9.所述输入层用于输入类似业扩配套容量建设项目的时序影响因素数据和历史建设容量数据;
10.所述线性层用于将输入层的各数据进行线性组合;
11.所述非线性特征提取层采用legendre多项式提取非线性特征并作为线性回归层的输入;
12.所述线性回归层用于将非线性特征进行线性组合,形成最终的预测结果;
13.s5、对预测模型的权重参数施加相应惩罚约束得到改进后的预测模型;
14.s6、将步骤s3中训练集的数据输入改进后的预测模型中进行训练得到训练后的预
测模型,将步骤s3中测试集的数据输入训练后的预测模型得到预测结果;
15.s7、判断预测结果与真实值偏差是否在允许范围内,若是,则输出预测结果;否则返回步骤s4。
16.步骤s1中,所述影响指标包括负荷密度、负荷利用率、户均配变容量、售电量、日最大负荷和历史建设容量;所述时序影响因素包括负荷密度、户均配变容量和日最大负荷。
17.步骤s2中,通过k-means聚类算法从海量历史业扩配套容量建设规模数据库中筛选类似业扩配套容量建设项目。
18.步骤s3中,先采用四分位间距方法检测异常值,再将异常点从数据集中去除,然后采用二次插值方法填充数据间隙,再采用min-max标准化方法对数据集进行归一化,使不同维度的数据分布到[0-1]之间,然后将数据集进行划分,65%作为训练集,35%作为测试集。
[0019]
步骤s4中,输入层的输入为当前时刻的特征向量x
t
和预测模型上一时刻的记忆值向量h
t-1
,将时序影响因素数据和历史建设容量数据的典型特征进行排序得到一个特征向量x-t
,即:
[0020][0021]
预测模型上一时刻的记忆值向量h
t-1
为:
[0022][0023]
式中,为t时刻第i个特征向量的值,d为特征向量的个数,为t-1时刻第i个隐层神经元的值,k为隐层神经元的个数;
[0024]
线性层由k个节点组成,每个节点分别对时序影响因素数据和历史建设容量数据进行线性加权,并将各节点的线性加权值作为对应非线性特征提取层的输入,即:
[0025][0026]
式中,βj为线性层第j个节点输入数据的投影权值,为t时刻线性层第j个节点的线性加权值;
[0027]
非线性特征提取层由k个子网络构成,各子网络的输入和输出是单一变量,子网络之间互不连接,子网络与线性层的节点构成映射关系;子网络对线性层各节点的输出进行单变量激活处理,输出相应的激活值并将其作为对应线性回归层的输入;单变量激活处理过程如下所示:
[0028][0029]
式中,gj(
·
)为第j个节点对应的激活函数;
[0030]
线性回归层由单个节点构成,线性回归层的输入是非线性特征提取层所有节点的激活值,输出是经过该层线性变换与线性组合后的值,也即输出激活函数的线性组合:
[0031][0032]
式中,y
t
为预测结果,γk为缩放参数,μ为移位参数。
[0033]
步骤s5中,对预测模型的权重参数施加相应惩罚约束的方式如下:
[0034]
(1)对投影权值与缩放参数进行正则化处理:
[0035][0036][0037]
式中,β
ij
为输入层第i个神经元与线性层第j个神经元之间的投影权值,γj为第j个神经元的缩放参数;t1、t2均为参数的正则化强度,t1≥1,t2≥0;
[0038]
(2)对激活函数实施粗糙度惩罚约束:
[0039]
∫[g
″j(z)]2dfj(z)≤t3[0040]
式中,z为特征变量训练值,fj(
·
)为第j个投影变量的累积分布函数;t3为参数的正则强度,t3≥0;
[0041]
(3)对投影权值实施正交约束:
[0042]
β
t
β=ik[0043]
式中,ik为k阶全一矩阵;
[0044]
(4)规范化约束:
[0045]
∫gj(z)dfj(z)=0
[0046]
∫gj(z)2dfj(z)=1。
[0047]
步骤s7中,采用平均绝对误差、均方根误差、变异系数和决定系数综合评价预测结果:
[0048][0049][0050][0051]
[0052]
式中,oj为第i个样本的配电网业扩配套容量时序建设规模实际值,为第i个样本的配电网业扩配套容量时序建设规模预测值,n为样本数,mae为平均绝对误差,rmse为均方根误差,cv为变异系数,r2为决定系数。
[0053]
与现有技术相比,本发明的有益效果为:
[0054]
本发明一种配电网业扩配套容量时序建设规模预测方法中,基于可解释循环神经网络算法,将影响业扩配套容量时序建设规模的负荷密度、户均配变容量、日最大负荷、历史建设容量等数据作为配电网业扩配套容量时序建设规模预测特征参数,通过对特征参数的预处理、惩罚约束、误差估计和算法结构调整,挖掘各类型因素与业扩配套容量建设时序与计划规模的内在规律,实现对业扩配套容量建设规模动态时序变化过程的推演;另外,为改善可解释循环神经网络的稀疏程度及平滑性能,对网络结构的权重参数施加了相应的惩罚约束,使得可解释循环神经网络在追求预测结果可解释性与预测精度的同时,提高了预测算法结构的灵活性。
附图说明
[0055]
图1是本发明一种配电网业扩配套容量时序建设规模预测方法的流程图。
[0056]
图2是本发明中基于可解释循环神经网络的配电网业扩配套容量时序建设规模预测模型示意图。
[0057]
图3是本发明的实施例中的业扩配套容量时序建设规模曲线图。
具体实施方式
[0058]
以下结合附图说明和具体实施方式对本发明作进一步详细的说明。
[0059]
参见图1、图2,一种配电网业扩配套容量时序建设规模预测方法,包括以下步骤:
[0060]
s1、对业扩配套容量时序建设规模影响指标进行相关性分析,得到对业扩配套项目影响最大的影响指标为时序影响因素和历史建设容量;
[0061]
s2、从海量历史业扩配套容量建设规模数据库中筛选出类似业扩配套容量建设项目,提取类似业扩配套容量建设项目的时序影响因素数据和历史建设容量数据;
[0062]
s3、先对步骤s2中提取的时序影响因素数据和历史建设容量数据进行预处理,再对数据集进行归一化处理,然后将数据集划分为训练集和测试集;
[0063]
s4、构建基于可解释循环神经网络的配电网业扩配套容量时序建设规模预测模型,该预测模型包括输入层、线性层、非线性特征提取层与线性回归层;
[0064]
所述输入层用于输入类似业扩配套容量建设项目的时序影响因素数据和历史建设容量数据;
[0065]
所述线性层用于将输入层的各数据进行线性组合;
[0066]
所述非线性特征提取层采用legendre多项式提取非线性特征并作为线性回归层的输入;
[0067]
所述线性回归层用于将非线性特征进行线性组合,形成最终的预测结果;
[0068]
s5、对预测模型的权重参数施加相应惩罚约束得到改进后的预测模型;
[0069]
s6、将步骤s3中训练集的数据输入改进后的预测模型中进行训练得到训练后的预
测模型,将步骤s3中测试集的数据输入训练后的预测模型得到预测结果;
[0070]
s7、判断预测结果与真实值偏差是否在允许范围内,若是,则输出预测结果;否则返回步骤s4。
[0071]
步骤s1中,所述影响指标包括负荷密度、负荷利用率、户均配变容量、售电量、日最大负荷和历史建设容量;所述时序影响因素包括负荷密度、户均配变容量和日最大负荷。
[0072]
步骤s2中,通过k-means聚类算法从海量历史业扩配套容量建设规模数据库中筛选类似业扩配套容量建设项目。
[0073]
步骤s3中,先采用四分位间距方法检测异常值,再将异常点从数据集中去除,然后采用二次插值方法填充数据间隙,再采用min-max标准化方法对数据集进行归一化,使不同维度的数据分布到[0-1]之间,然后将数据集进行划分,65%作为训练集,35%作为测试集。
[0074]
步骤s4中,输入层的输入为当前时刻的特征向量x
t
和预测模型上一时刻的记忆值向量h
t-1
,将时序影响因素数据和历史建设容量数据的典型特征进行排序得到一个特征向量x
t
,即:
[0075][0076]
预测模型上一时刻的记忆值向量h
t-1
为:
[0077][0078]
式中,为t时刻第i个特征向量的值,d为特征向量的个数,为t-1时刻第i个隐层神经元的值,k为隐层神经元的个数;
[0079]
线性层由k个节点组成,每个节点分别对时序影响因素数据和历史建设容量数据进行线性加权,并将各节点的线性加权值作为对应非线性特征提取层的输入,即:
[0080][0081]
式中,βj为线性层第j个节点输入数据的投影权值,为t时刻线性层第j个节点的线性加权值;
[0082]
非线性特征提取层由k个子网络构成,各子网络的输入和输出是单一变量,子网络之间互不连接,子网络与线性层的节点构成映射关系;子网络对线性层各节点的输出进行单变量激活处理,输出相应的激活值并将其作为对应线性回归层的输入;单变量激活处理过程如下所示:
[0083][0084]
式中,gj(
·
)为第j个节点对应的激活函数;
[0085]
线性回归层由单个节点构成,线性回归层的输入是非线性特征提取层所有节点的激活值,输出是经过该层线性变换与线性组合后的值,也即输出激活函数的线性组合:
[0086][0087]
式中,y
t
为预测结果,γk为缩放参数,μ为移位参数。
[0088]
步骤s5中,对预测模型的权重参数施加相应惩罚约束的方式如下:
[0089]
(1)对投影权值与缩放参数进行正则化处理:
[0090][0091][0092]
式中,β
ij
为输入层第i个神经元与线性层第j个神经元之间的投影权值,γj为第j个神经元的缩放参数;t1、t2均为参数的正则化强度,t1≥1,t2≥0;
[0093]
(2)对激活函数实施粗糙度惩罚约束:
[0094]
∫[g
″j(z)]2dfj(z)≤t3[0095]
式中,z为特征变量训练值,fj(
·
)为第j个投影变量的累积分布函数;t3为参数的正则强度,t3≥0;
[0096]
(3)对投影权值实施正交约束:
[0097]
β
t
β=ik[0098]
式中,ik为k阶全一矩阵;
[0099]
(4)规范化约束:
[0100]
∫gj(z)dfj(z)=0
[0101]
∫gj(z)2dfj(z)=1。
[0102]
步骤s7中,采用平均绝对误差、均方根误差、变异系数和决定系数综合评价预测结果:
[0103][0104][0105][0106]
[0107]
式中,oj为第i个样本的配电网业扩配套容量时序建设规模实际值,为第i个样本的配电网业扩配套容量时序建设规模预测值,n为样本数,mae为平均绝对误差,rmse为均方根误差,cv为变异系数,r2为决定系数。
[0108]
本发明的原理说明如下:
[0109]
将与业扩配套项目相关的负荷密度、户均配变容量、日最大负荷等时序影响因素数据和历史建设容量数据作为预测方法的输入特征,通过本设计预测方法的特征变换与特征提取,对各类影响因素进行量化解析,挖掘不同行业各类型客户业扩配套历史容量建设时序与计划规模的内在规律,从而实现对未来各地市配电网业扩配套容量建设时序规模的按月推演。
[0110]
预测模型可解释性与预测模型的复杂度通常会相互冲突,但预测模型越复杂其预测精准性往往会越高,因此为提高可解释循环神经网络算法预测的精准性同时又不失算法的可解释性,本设计通过对可解释循环神经网络结构的权重参数施加相应惩罚约束,改善了神经网络的稀疏程度及平滑性能,在追求网络预测精度灵活性的同时保持其良好的可解释性。为提高网络稀疏程度,对投影权值与缩放参数的正则化处理;为改善网络平滑性能,对激活函数实施粗糙度惩罚约束;为减轻多重共线性因素对模型预测造成的影响,从而避免出现完全相同的投影权值,需对投影权值实施正交约束;为提高网络稀疏性,对投影权值和缩放参数进行了处理,易造成激活函数不可识别,因此,为增强网络的可识别性,施加适当的规范化约束。
[0111]
实施例:
[0112]
参见图1,一种配电网业扩配套容量时序建设规模预测方法,包括以下步骤:
[0113]
s1、对业扩配套容量时序建设规模影响指标进行相关性分析,得到对业扩配套项目影响最大的影响指标为时序影响因素和历史建设容量;
[0114]
所述影响指标包括负荷密度、负荷利用率、户均配变容量、售电量、日最大负荷和历史建设容量;
[0115]
对业扩配套容量时序建设规模影响指标使用spss软件进行相关性分析,结果如表1所示;
[0116]
表1业扩配套容量时序建设规模影响指标相关性分析结果表
[0117][0118]
分析表1中皮尔逊相关系数可知,历史建设容量是对预测结果影响最大的因素,负荷利用率和售电量的相关性系数最小,因此,选取负荷密度、户均配变容量、日最大负荷等时序影响因素数据和历史建设容量数据作为业扩配套容量时序建设规模预测算法的输入;
[0119]
s2、通过k-means聚类算法从海量历史业扩配套容量建设规模数据库中筛选出类似业扩配套容量建设项目,提取类似业扩配套容量建设项目的时序影响因素数据和历史建设容量数据;
[0120]
s3、先对步骤s2中提取的时序影响因素数据和历史建设容量数据进行预处理,再对数据集进行归一化处理,然后将数据集划分为训练集和测试集;
[0121]
先采用四分位间距方法检测异常值,再将异常点从数据集中去除,然后采用二次插值方法填充数据间隙,再采用min-max标准化方法对数据集进行归一化,使不同维度的数据分布到[0-1]之间,然后将数据集进行划分,65%作为训练集,35%作为测试集;
[0122]
s4、构建基于可解释循环神经网络的配电网业扩配套容量时序建设规模预测模型,参见图2,该预测模型包括输入层、线性层、非线性特征提取层与线性回归层;
[0123]
所述输入层用于输入类似业扩配套容量建设项目的时序影响因素数据和历史建设容量数据;
[0124]
输入层的输入为当前时刻的特征向量x
t
和预测模型上一时刻的记忆值向量h
t-1
,将时序影响因素数据和历史建设容量数据的典型特征进行排序得到一个特征向量x
t
,即:
[0125][0126]
预测模型上一时刻的记忆值向量h
t-1
为:
[0127][0128]
式中,为t时刻第i个特征向量的值(即第i个输入神经元的值),d为特征向量的个数,为t-1时刻第i个隐层神经元的值,k为隐层神经元的个数;
[0129]
所述线性层用于将输入层的各数据进行线性组合;
[0130]
线性层由k个节点组成,每个节点分别对时序影响因素数据和历史建设容量数据进行线性加权,并将各节点的线性加权值作为对应非线性特征提取层的输入,即:
[0131][0132]
式中,βj为线性层第j个节点输入数据的投影权值,为t时刻线性层第j个节点的线性加权值;
[0133]
所述非线性特征提取层采用legendre多项式提取非线性特征并作为线性回归层的输入;
[0134]
非线性特征提取层由k个子网络构成,各子网络的输入和输出是单一变量,子网络之间互不连接,子网络与线性层的节点构成映射关系;为增加神经网络的非线性,子网络一般采用非线性激活函数,子网络对线性层各节点的输出进行单变量激活处理,输出相应的激活值并将其作为对应线性回归层的输入;单变量激活处理过程如下所示:
[0135][0136]
式中,gj(
·
)为第j个节点对应的激活函数;
[0137]
所述线性回归层用于将非线性特征进行线性组合,形成最终的预测结果;
[0138]
线性回归层(即神经网络输出层)由单个节点构成,一般采用一个线性激活函数,线性回归层的输入是非线性特征提取层所有节点的激活值,输出是经过该层线性变换与线性组合后的值,也即输出激活函数的线性组合:
[0139][0140]
式中,y
t
为预测结果,γk为缩放参数,μ为移位参数;
[0141]
s5、对预测模型的权重参数施加相应惩罚约束得到改进后的预测模型;
[0142]
对预测模型的权重参数施加相应惩罚约束的方式如下:
[0143]
(1)对投影权值与缩放参数进行正则化处理:
[0144][0145][0146]
式中,β
ij
为输入层第i个神经元与线性层第j个神经元之间的投影权值,γj为第j个神经元的缩放参数;t1、t2均为参数的正则化强度,t1≥1,t2≥0;
[0147]
(2)对激活函数实施粗糙度惩罚约束:
[0148]
∫[g
″j(z)]2dfj(z)≤t3[0149]
式中,z为特征变量训练值,fj(
·
)为第j个投影变量的累积分布函数;t3为参数的正则强度,t3≥0;
[0150]
(3)对投影权值实施正交约束:
[0151]
β
t
β=ik[0152]
式中,ik为k阶全一矩阵;
[0153]
(4)规范化约束:
[0154]
∫gj(z)dfj(z)=0
[0155]
∫gj(z)2dfj(z)=1;
[0156]
s6、将步骤s3中训练集的数据输入改进后的预测模型中进行训练得到训练后的预测模型,将步骤s3中测试集的数据输入训练后的预测模型得到预测结果;
[0157]
s7、判断预测结果与真实值偏差是否在允许范围内,若是,则输出预测结果;否则返回步骤s4;
[0158]
采用平均绝对误差、均方根误差、变异系数和决定系数综合评价预测结果:
[0159][0160]
[0161][0162][0163]
式中,oj为第i个样本的配电网业扩配套容量时序建设规模实际值,为第i个样本的配电网业扩配套容量时序建设规模预测值,n为样本数;mae为平均绝对误差,测量预测结果与实际值的接近程度;rmse为均方根误差,衡量数据围绕最佳拟合线的集中程度;cv为变异系数,描述了预测模型的适应度,其值越低,残差相对于预测结果越小,表明模型拟合越好;r2为决定系数,其值越大,表明拟合精度越高。
[0164]
以某地市一个住宅小区为例,通过k-means聚类算法从海量历史业扩配套容量建设数据库中筛选类似小区业扩配套容量建设项目,并提取类似业扩配套容量建设项目的时序影响因素数据和历史建设容量数据,以上述基于可解释循环神经网络的配电网业扩配套容量时序建设规模预测方法为基础,以一年12个月为业扩配套容量建设工期进行仿真分析,如图3所示。
[0165]
运用统计学中常用的四个指标综合评价方法的整体预测性能,由上述公式计算可得,mae为52.08kva,rmse为58.40kva,cv为5.47%,r2为0.9726。结果表明本设计所提出的基于可解释循环神经网络的配电网业扩配套容量时序建设规模预测方法具有较高的预测精度。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献