一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于两阶段集成聚类的区域能源负荷用电模式挖掘算法的制作方法

2022-02-20 12:52:42 来源:中国专利 TAG:


1.本发明涉及数据挖掘与处理技术领域,尤其是涉及一种基于两阶段集成聚类的区域能源负荷用电模式挖掘算法。


背景技术:

2.用户用电模式的聚类挖掘分析,不仅是能源管理系统中实现电力数据挖掘的基础,也是作为负荷数据预处理的一种重要手段。合理细致的用电负荷聚类划分,能够实现需求侧能源高效的管理、用电用户精细分类、分时电价管理、异常用电检测等切实需求。因此,对于负荷曲线的聚类算法的研究以及相关技术的应用有着重要的研究意义。
3.对用户的用电行为聚类,通常可以概括为两类研究方向,一种是以单用户或者用户群体的长时间段负荷为数据,通过对其进行纵向聚类,用以识别其在不同时间区间内的不同用电行为,可用于异常用电检测;另一种是对多用户不同用电数据进行横向聚类,以区分各不同的用电模式,通常用于实现用户用电数据的差异化、精细化的管理。本章采用负荷横向聚类的方式,为后续负荷预测精度的提升打下优质数据基础。
4.对于区域能源负荷预测研究而言,一个区域中包含了大量变电站,而以这些变电站作为输送电单元,可以划分出更多细致的用电区域。由于这些区域所涵盖的用电用户的不同,使得这些变电站所记录的日负荷也出现明显不同的用电特性。
5.全区域整体的日负荷需求呈现较为明显的双峰特性,但是细分至各变电站个体,每个变电站的日负荷又呈现明显的不同。若对于区域内全部的变电站单独的进行预测并再综合的话,不仅需要耗费大量的精力建模、调参、计算,而且会存在较大的累计误差,但是如果对于区域内所有变电站的负荷汇总视为一个整体后都直接进行预测,又会导致各个曲线的日趋势特征相互抵消,影响,从而影响到整体的预测精度。因此,对这些变电站根据其用电模式实现负荷聚类,再针对每类用电模式实现特征化的预测,对实现负荷预测精度提高有着重要作用。


技术实现要素:

6.为了解决现有技术问题,本发明的目的在于克服已有技术存在的不足,提供一种基于两阶段集成聚类的区域能源负荷用电模式挖掘算法,具有着更好的聚类性能,并且对区域能源负荷用电模式的精准聚类划分,能够为短期负荷预测提供优质的数据基础。
7.为达到上述发明创造目的,本发明采用如下技术方案:
8.一种基于两阶段集成聚类的区域能源负荷用电模式挖掘算法,具体包括以下步骤:
9.s1.对于区域能源负荷用电原始数据进行预处理,填补缺失值,选定特征日用电模式,归一化处理,以及曲线平滑,得到待聚类样本集合;优选得到待聚类样本n集合;
10.s2.基于先验的自适应方式,选定最终聚类数以及相关参数;
11.s3.对待聚类样本集合进行bootstarp重采样,重复多次,得到最终待聚类初始样
本;
12.s4.分别对样本利用已经整定好参数的基聚类模型进行第一阶段聚类,每类聚类数和聚类中心,并以这个聚类中心作为第二阶段聚类的数据集;
13.s5.基于上述得到的聚类中心的数据集,利用凝聚式层次聚类的方式,将其聚类至最优的类别,作为最终的聚类数;
14.s6.将原样本数据集中的对象,根据就近原则,将其归到距离其最近的聚类中心,完成集成聚类。
15.优选地,在所述步骤s1中,对于区域能源负荷用电原始数据进行预处理方法是基于变电站颗粒度的区域能源负荷数据预处理,其处理方法如下:
16.s1-1.基于变电站用电特征的普遍模式选取,采用提取的全部历史日负荷数据的均值以作为该电站普遍日趋势模式;
17.s1-2.用电模式数据归一化,对数据采取了最大-最小的归一化方法;与全局最大-最小归一化不同,此方法主要针对每个变电站都采用最大-最小归一化,从而避免数量级不同的电站之间的相互影响,有效地提取日负荷模式。
18.优选地,在所述步骤s3中,bootstarp重采样,它通过对原样本进行有放回的随机采样,并保证样本中每个对象被抽中的概率均相等,直至采样样本与原样本等大。
19.优选地,在所述步骤s4中,第一阶段聚类,基于模糊c均值的第一阶段聚类算法,对每组数据给予其对于每一个簇类的隶属度,区间[0,1],最后根据就近原则或最大隶属度原则来确定每个数据的最终的划分。
[0020]
优选地,在所述步骤s4中,第二阶段聚类,层次聚类的第二阶段聚类算法,且为自下而上的凝聚型,先将样本中所有用电模式视为单独一类,以一定的判定准则,在每轮迭代过程中,将相似度最高的2个用电模式归为同一类;直至聚到指定类数。
[0021]
优选地,基于两阶段集成聚类的区域能源负荷用电模式挖掘算法,具体包括以下步骤:
[0022]
s1.对于原数据进行预处理,填补缺失值,选定特征日用电模式,归一化处理,以及曲线平滑,得到待聚类样本n集合;
[0023]
s2.基于先验的自适应方式,选定最终聚类数k以及m参数;
[0024]
s3.对待聚类样本集合n进行bootstarp重采样,重复m次,m=10,得到最终m个待聚类初始样本;
[0025]
s4.分别对10个样本利用已经整定好参数的基聚类模型进行第一阶段聚类,每类聚类数s,(s≥k,)得到共计s
×
m个聚类中心,并以这s
×
m个聚类中心作为第二阶段聚类的数据集;
[0026]
s5.基于上述得到的s
×
m个聚类中心的数据集,利用凝聚式层次聚类的方式,将其聚类至最优的k类,作为最终的聚类数;
[0027]
s6.将原样本数据集中的对象,根据就近原则,将其归到距离其最近的聚类中心,完成集成聚类。
[0028]
优选地,所述的基于变电站颗粒度的区域能源负荷数据预处理,其处理方法为如下:
[0029]
a1.基于变电站用电特征的普遍模式选取:
[0030]
考虑到单一变电站所输送区域的用电水平和行为在工作日与休息的不同日期类别、春夏秋冬的不同季节下都会有一定的不同;此外,随着时间推移,站内各组成用户的结构也会有一定的变化。选取某单日负荷用于聚类会使得聚类结果存在较为明显的波动性;
[0031]
因此,本发明采用提取的全部历史日负荷数据的均值以作为该电站普遍日趋势模式;
[0032]
对于单一电站,其全部历史数据的日24点用电模式可以视为矩阵l:
[0033][0034]
则其代表特征日曲线ld:
[0035][0036]
式中m为历史天数;
[0037]
对全部n个电站均进行普遍日趋势提取,得到最终的待聚类数据集d:
[0038][0039]
a2.用电模式数据归一化:
[0040]
考虑到不同变电站在用电需求上有一定的区别,但是不同用电量的变电站可能处于相似日负荷模式,相近用电需求变电站可能处于完全不同的日负荷模式;因此,本发明对数据采取了最大-最小(max-min)的归一化方法;与全局最大-最小归一化不同,本发明主要针对每个变电站都采用最大-最小归一化,从而避免数量级不同的电站之间的相互影响,有效地提取日负荷模式;
[0041]
即对于上述模提取后的数据集d,有:
[0042][0043]
分别对每个变电站进行归一化有:
[0044][0045]
式中为r号变电站l时刻归一化后的值,为r号变电站普遍日负荷的峰值,为r号变电站普遍日负荷的谷值。
[0046]
优选地,所述步骤s3中采用的booststrap重采样,又称为自助采样法,它通过对原样本进行有放回的随机采样,并保证样本中每个对象被抽中的概率均相等,直至采样样本与原样本等大;即样本中包含n个对象,对该样本有放回的抽样n次;新的采样样本中仍然包含n个对象;由于bootstrap采样采用的是有放回采样且每次抽样互相独立,所以针对变电站负荷数据进行单次采样生成的新样本中,会一定程度上包含重复用户,也会存在部分用户用电模式未被抽选的情况;针对单次采样中,变电站未被选择的概率为:
[0047][0048]
由于抽取样本之间相互独立,抽取m个样本不包含变电站xi的概率p:
[0049][0050]
当n

∞时,有
[0051]
为确保重采样后的样本集合中覆盖原样本中的所有信息,当m=10,覆盖率可达99.99%,因此m取10次为佳,即对原样本进行10次重采样,能够保证原负荷数据中,所有变电站的用电模式样本被采集覆盖。
[0052]
优选地,所述步骤s4中的基于模糊c均值(fcm)的第一阶段聚类算法,在应用于负荷背景下,基于用电模式的fcm聚类划分算法有如下几个概念:
[0053]
(1)样本数据集d
[0054]
在fcm聚类中,对于待聚类的n个样本的负荷数据集根据其各种特征参数,有待聚类数据矩阵如式:
[0055][0056]
式中l
dl
代表l号变电站数据,每一个变电站的24个数据分别为该变电站代表用电模式的24点日负荷数据;
[0057]
(2)聚类中心矩阵v
[0058]
fcm聚类将n个样本划分成c个簇类,其中2≤c≤n,c个簇类的中心矩阵v则为:
[0059][0060]
其中c为簇类数,且t=1,2,

,24;
[0061]
(3)隶属度矩阵u
[0062]
模糊聚类作为一种软聚类算法,不同于硬聚类严格划分每一样本的归属,而是采用了模糊数据集中隶属度的概念,每一个样本所代表的用电模式,都以一定的隶属度,从属
于某一类,有隶属度矩阵u:
[0063][0064]
对于第k个负荷样本lk从属于第i类有隶属度u
ik
,满足以下约束条件:
[0065][0066]
(4)目标函数j
[0067]
在已知上述聚类中心矩阵v,以及隶属度矩阵u下,对于整体优化的目标函数j有:
[0068][0069]
式中ci代表第i类的聚类中心,||l
j-ci||2为样本j与第i类的聚类中心之的欧式距离,u
ij
为样本j对簇类i隶属度,且u
ij
∈[0,1],m为模糊加权指数,其取值直接影响最终的聚类效果,通常认为m∈[1.5,2.5]为佳,本发明中取值为2;
[0070]
根据fcm聚类算法的目标函数可知,其目的在寻找最优的(u,v)组合,使得目标函数jm在满足约束条件下达到最小;由于(u,v)在初始时都是未知,因此,在求解过程中需要反复迭代及修正,fcm算法具体步骤如下:
[0071]
a1.对于样本数据集,利用先验方式,确定合适的聚类数c,确定模糊加权指数m,以及迭代终止条件;最大迭代次数停止阈值k或停止阈值ε;随机初始化隶属度矩阵于取值范围[0,1];
[0072]
a2.l为迭代次数,聚类中心v
i(l)
为第l步迭代结果,具体迭代公式如下:
[0073][0074]
a3.修正隶属度矩阵u
(l)
,
[0075][0076]
式中
[0077]
则当前轮迭代的目标函数值为:
[0078]
[0079]
a4.当迭代轮数到达指定最大迭代次数m时,或者|j
(l)-j
(l-1)
|<εj,εj为指定停止阈值。迭代停止,否则将重复第二步与第三步,直至满足停止条件;此时能够得到当前数据集的最终的聚类中心v,以及各数据对各聚类中心的隶属度矩阵u;
[0080]
具体对于数据的划分有2种方式,一种为就近原则,将样本划入距离最近的聚类中心所处类,即对于样本lk,若有:
[0081]
l
k-vj||=min
1≤i≤c
||l
i-vi||
[0082]
则将lk归为第j类,另一种为最大隶属度原则,将样本划入其隶属度最大的一类,即在隶属度矩阵中,若满足u
jk
=max
i≤i≤c
(u
ik
),则将样本归为第j类。本发明中采用第二种最大隶属度的划分方式。
[0083]
优选地,所述步骤s5中基于层次聚类的第二阶段聚类算法,考虑到变电站负荷特性,因此采用凝聚型层次聚类,层次聚类会先将样本中所有用电模式视为单独一类,以一定的判定准则,在每轮迭代过程中,将相似度最高的2个用电模式归为同一类。直至聚到指定类数。
[0084]
其具体算法步骤为:
[0085]
a1.视负荷样本中所有用电模式为单独一类,并计算各用电模式日曲线之间的邻近度矩阵,即对于样本d:
[0086][0087]
其中n代表样本个数,计算各样本之间的邻近度;
[0088]
本发明计算邻近度矩阵采用类平均,它定义簇邻近度为取自两簇之间所有点的邻近度的平均值,具体计算公式为:
[0089][0090]
其中x,y分别为簇类ci,cj中的样本点,mi,mj为簇类ci,cj中的样本数;
[0091]
基于类平均邻近度计算,可得原样本的邻近度矩阵:
[0092][0093]
其中p
ij
为用电模式i与用电模式j之间的类平均邻近度;
[0094]
a2.根据邻近度矩阵得到该轮迭代中,将最相似的2组用电模式簇类归为一类,并得到新的一簇类;
[0095]
a3.针对迭代后的各簇类,重新计算彼此之间的邻近度矩阵;
[0096]
a4.重复步骤2、步骤3,直至满足停止阈值、规定簇类数。
[0097]
本发明与现有技术相比较,具有如下显而易见的突出实质性特点和显著优点:
[0098]
1.本发明方法对数量大、价值大、密度低的电力大数据进行有效的数据处理,剔除噪声、异常值,填补缺失值,挖掘数据关联性与价值,从而为后续的负荷预测打下数据基础,是提高负荷预测精度上限的关键之一;本发明基于高质量、有价值的负荷数据,能实现高精度的负荷预测;
[0099]
2.本发明结合划分聚类与层次聚类的各自优点,提出两阶段的集成聚类算法,并以层次聚类作为第二阶段聚类的基模型;考虑划分聚类在便捷快速的同时,精度上往往存在一定的欠缺,而层次聚类在精度提高的同时,由于自身迭代方式导致时间复杂度较大;
[0100]
3.本发明弥补了划分聚类容易陷入局部最优解,对噪声离群点敏感,和层次聚类对于大数据集,由于自身算法复杂度过高,运行效率不理想的缺点。从而提出以划分聚类作为第一阶段基聚类模型,得到初步聚类结果,然后采用层次聚类对结果进行第二阶段聚类,从而得到最终的聚类结果;
[0101]
4.本发明方法简单易行,成本低,适合推广使用。
附图说明
[0102]
图1为本发明优选实施例的整体流程示意图。
[0103]
图2为本发明优选实施例的最优k值选定流程示意图。
[0104]
图3为本发明优选实施例的fcm算法的chi与k值。
[0105]
图4为本发明优选实施例的负荷曲线聚类示意图。
[0106]
图5为本发明优选实施例的五类负荷曲线聚类中心示意图。
[0107]
图6为本发明优选实施例的聚类结果类别ⅰ曲线示意图。
[0108]
图7为本发明优选实施例的聚类结果类别ⅱ曲线示意图。
[0109]
图8为本发明优选实施例的聚类结果类别ⅲ曲线示意图。
[0110]
图9为本发明优选实施例的聚类结果类别ⅳ曲线示意图。
[0111]
图10为本发明优选实施例的聚类结果类别

曲线示意图。
[0112]
图11为本发明优选实施例的各类别变电站数柱状图示意图。
具体实施方式
[0113]
以下结合具体的实施例子对上述方案做进一步说明,本发明的优选实施例详述如下:
[0114]
实施例一:
[0115]
在本实施例中,参见图1,一种基于两阶段集成聚类的区域能源负荷用电模式挖掘算法,具体包括以下步骤:
[0116]
s1.对于区域能源负荷用电原始数据进行预处理,填补缺失值,选定特征日用电模式,归一化处理,以及曲线平滑,得到待聚类样本集合;
[0117]
s2.基于先验的自适应方式,选定最终聚类数以及相关参数;
[0118]
s3.对待聚类样本集合进行bootstarp重采样,重复多次,得到最终待聚类初始样本;
[0119]
s4.分别对样本利用已经整定好参数的基聚类模型进行第一阶段聚类,每类聚类数和聚类中心,并以这个聚类中心作为第二阶段聚类的数据集;
[0120]
s5.基于上述得到的聚类中心的数据集,利用凝聚式层次聚类的方式,将其聚类至最优的类别,作为最终的聚类数;
[0121]
s6.将原样本数据集中的对象,根据就近原则,将其归到距离其最近的聚类中心,完成集成聚类。
[0122]
本实施例基于两阶段集成聚类的区域能源负荷用电模式挖掘算法,具有更好的聚类性能,并且对区域能源负荷用电模式的精准聚类划分,能够为短期负荷预测提供优质的数据基础。
[0123]
实施例二:
[0124]
本实施例与实施例一基本相同,特别之处在于:
[0125]
在本实施例中,在所述步骤s1中,对于区域能源负荷用电原始数据进行预处理方法是基于变电站颗粒度的区域能源负荷数据预处理,其处理方法如下:
[0126]
s1-1.基于变电站用电特征的普遍模式选取,采用提取的全部历史日负荷数据的均值以作为该电站普遍日趋势模式;
[0127]
s1-2.用电模式数据归一化,对数据采取了最大-最小的归一化方法;与全局最大-最小归一化不同,此方法主要针对每个变电站都采用最大-最小归一化,从而避免数量级不同的电站之间的相互影响,有效地提取日负荷模式。
[0128]
在本实施例中,在所述步骤s3中,bootstarp重采样,它通过对原样本进行有放回的随机采样,并保证样本中每个对象被抽中的概率均相等,直至采样样本与原样本等大。
[0129]
在本实施例中,在所述步骤s4中,第一阶段聚类,基于模糊c均值的第一阶段聚类算法,对每组数据给予其对于每一个簇类的隶属度,区间[0,1],最后根据就近原则或最大隶属度原则来确定每个数据的最终的划分。
[0130]
在本实施例中,在所述步骤s4中,第二阶段聚类,层次聚类的第二阶段聚类算法,且为自下而上的凝聚型,先将样本中所有用电模式视为单独一类,以一定的判定准则,在每轮迭代过程中,将相似度最高的2个用电模式归为同一类;直至聚到指定类数。
[0131]
本实施例方法结合划分聚类与层次聚类的各自优点,提出两阶段的集成聚类算法,并以层次聚类作为第二阶段聚类的基模型。考虑划分聚类在便捷快速的同时,精度上往往存在一定的欠缺,而层次聚类在精度提高的同时,由于自身迭代方式导致时间复杂度较大。
[0132]
实施例三:
[0133]
本实施例与上述实施例基本相同,特别之处在于:
[0134]
在本实施例中,
[0135]
本实施例针对的电力数据属于无监督数据,所以在评估具体聚类效果时,采用了广为使用的2个内部评价聚类的指标,分别为davies-bouldin index(dbi)和calinski-harabasz index(chi),通过利用chi来作为最优k值选定的判断指标,以dbi作为聚类结果的评价指标:
[0136]
(1)dbi:
[0137]
dbi指标即戴维森堡丁指数,又被称作分类适确性指标,它是由david l.davies和
donald w.bouldin在1979年提出:
[0138][0139]
a)dbi定义了一个分散度指标值si:
[0140][0141]
其中ti表示第i类中的类内数据数;ai表示第i类中的簇类中心;xj表示第i类中第j个数据,q为衡量指标,当q取1时,si表示一个类内点与簇类中心聚类均值,当q取2时,si表示类内点与簇类中心的标准差;
[0142]
b)dbi定义了一个距离值m
ij

[0143][0144]
其中ai表示第i类的簇类中心,aj表示第j类的簇类中心;p为衡量指标,m
ij
为第i类与第j类簇类中心的距离;
[0145]
c)dbi定义了相似度度量值r
ij

[0146][0147]
用以衡量第i类与第j类簇类的相似度;
[0148]
d)得到最后的dbi指标
[0149][0150]
其中ri=maxinum of r
ij
,i≠j表示第i类与其他类相似度最大的值;
[0151]
可以看到dbi最终指标越小,表示各簇类之间的相似性越小,聚类效果越好;
[0152]
(2)chi:
[0153]
chi即calinski-harabasz index,它是一种基于类间数据的分离程度与类内数据紧凑程度的内部评价指标:
[0154][0155]
a)chi定义了簇内平方误差和,within-groups sum ofsquared error(wgss),用来度量簇内的紧密程度;
[0156][0157]
其中k表示样本最终聚类数,表示第i类簇内样本的平均距离,ni表示第i类的样本数量;
[0158]
b)chi定义了簇间平方误差和,between-groups sum ofsquared error(bgss),用来度量簇间的分离程度;
[0159][0160]
其中表示所有样本间的平均距离;
[0161]
chi通过计算wgss来度量类内的紧密程度,通过计算bgss来度量类间的数据的分离程度,整体指标由分离度与紧密度的比值得到,可以看到ch越大表示类内的数据越紧凑,类间数据越分散,聚类效果越好。
[0162]
本实施例首先采用划分聚类(fcm)算法对重采样后的样本进行第一阶段聚类。对于划分聚类而言,则必须先给定具体聚类数k,不同的k值对于聚类结果有着明显的影响,直接关系到最终聚类效果。因此,需要选定较为合适的k值作为最终聚类数。
[0163]
考虑到所采用的变电站负荷数据,属于无监督数据,即事先无从得知其数据具体相关类别。因此,本发明主要采用chi作为评价指标,通过先验的方式,来选取对于本章所用数据的最优k值选定,具体流程如图2所示。
[0164]
对于本发明所使用的电力数据,采用了基于chi指标的先验方式来选定。即对于选取的未知聚类数据,给定一定区间的k数,通过遍历的方式,来找到最优的k,使得聚类指标值达到最大。对于提到的fcm聚类算法根据上述方式,进行k值选取,可以得到图3,ch指标随着k值的变化而随之变化,并且对于fcm聚类算法在k等于5时,取到最大值。因此,对于本章所采用的负荷数据的最终聚类数设定为五类。
[0165]
在实施方案中,基于聚类相关原理,对于原电力数据集进行无监督的聚类。分别采用了以下五种方式进行聚类:
[0166]
(1)直接采用k-means聚类算法;
[0167]
(2)直接采用fcm聚类算法;
[0168]
(3)直接采用hierarchical层次聚类算法;
[0169]
(4)基于k-means与hierarchical层次聚类的集成聚类算法;
[0170]
(5)基于fcm与hierarchical层次聚类的集成聚类算法。
[0171]
基于以上5种方法,分别对电力数据进行无监督聚类分析,并基于dbi指标对聚类结果进行评价,性能结果有表1:
[0172]
表1.基于dbi指标聚类结果对比表
[0173][0174]
由表1可以得出以下结论:
[0175]
(1)传统k-means,虽然简单快速,但是聚类结果的有效性,簇类质量相较于其余几种聚类算法要略差一些;
[0176]
(2)由于本章所使用的是变电站的数据,考虑到变电站本身其输送电区域也包含着各类型的用电模式,具体呈现出其区域内主要用电模式的日负荷趋势,这使得fcm中模糊数据的概念对于本章数据有着良好的适应性,聚类质量相较于k-means有直观的提升;
[0177]
(3)层次聚类相较于划分聚类,在聚类质量上有一定程度的提升;并且从以第一阶段基模型选用k-means与fcm的集成聚类方法中可以看到,相较于单一聚类模型,采用集成聚类的方式能够有效的提高聚类质量。并且相比于直接采用k-means或fcm聚类,dbi分别提
升了25.04%和10.55%;
[0178]
(4)第一阶段聚类模型的选取也会直接影响到最终聚类结果的质量,fcm聚类效果相比于k-means更优,也因此以fcm作为第一阶段聚类的基模型的集成聚类算法取得了最好的dbi值。
[0179]
基于fcm与层次聚类的集成聚类算法最终将本章研究的电力负荷数据聚为五类。聚类结果如图4所示,五类负荷的聚类中心曲线图如图5所示。
[0180]
结合相关电力背景可做出如下分析:
[0181]
(1)类别ⅰ,如图6所示。该类负荷整体处于较高水准,负荷波动较小,一般在5时-11时到达第一个用电峰值,午后电力略有降低,随后至20时到达第二个峰值,该类用电行为通常为三班制的生产型工业用电,全天处于较高的用电水准,存在午后员工午休以及夜班生产强度降低的情况,使得负荷需求降低的情况。具体如针织、塑胶、制衣厂等生产工厂。
[0182]
(2)类别ⅱ,如图7所示。该类负荷呈现明显的迎峰型,5时开始用电需求开始快速增长,至9、10时到达用电峰值,白天保持高用电水准,直至16时后,用电量开始递减直至次日5时。该类用电行为通常为集中型的生产的工业用电,如金属制品、医药物流等相关公司。
[0183]
(3)类别ⅲ,如图8所示。该类负荷呈现明显的避峰行为,16时开始用电量速度增长,至19、20时达用电峰值并保持高用电水准,直至第二日凌晨5时,用电量开始迅速降低,白天保持低用电水准。该类用电行为通常为面包厂、制冰厂等具有明显行业特征的工业用电行为,通过错峰用电以实现于低电价时段生产。
[0184]
(4)类别ⅳ,如图9所示。该类负荷呈现一定的双峰型,5时为日用电谷值,白天用电水平有一定的提高,但总体趋于平稳。午后15、16时开始用电需求递增,至20时到达峰值,随后入夜递减至次日5时。该类用电行为通常为企业用电,用电水平与员工上下班以及考虑午休等用电行为相符。
[0185]
(5)类别

,如图10所示。该类负荷呈现较为明显的双峰型,4、5时为日用电谷值,用电需求开始递增至7、8时迎来第一个用电峰值,随后用电量下降且白天用电需求一直保持与夜间相似的用电水准,至午后16、17时开始用电需求快速增长至20时,随后一直降低至次日5时。该类用电行为通常为居民用电,用电行为与工作日特性相匹配,并且室内也存在一定的如冰箱这类常开电器,使得白天与夜间保持一定的用电水准。
[0186]
综上可将本实施方案的变电站按编号1-100分至如下5类,具体如表2所示:
[0187]
表2.变电站聚类结果表
[0188][0189]
由表2可知,基于集成聚类的聚类算法将本实施方案的变电站数据大致分为了5大类,每类都有一定的用户基数,并且ⅳ类用户数量最多。最终各类别变电站数如图11所示。
[0190]
本实例考虑到区域能源负荷的特性,相较于传统的直接负荷预测而言,提出了优先针对区域能源负荷进行用电模式聚类划分的方式以提高预测精度,并且具体阐述了划分聚类中fcm和层次聚类模型。考虑到fcm模型存在多极值情况下容易陷入局部最优解以至聚类精度有所不足,以及层次聚类直接对数据进行聚类,容易导致时间复杂度过大的问题,提出了基于bagging思想的集成聚类(ec,ensemble clustering)模型。首先基于booststrap法对原样本进行重采样,得到m个采样样本,对于m个样本分别利用fcm模型进行第一阶段聚类,得到s个聚类中心,对于得到的m
×
s个聚类中心数据集再使用层次聚类的方式,使其聚到最优簇类数k。实例表明,本发明提出的集成聚类算法,聚类效果相比于单一聚类算法聚类有着更优的聚类结果,在dbi上也有一定的提升。本发明对区域能源负荷用电模式的聚类挖掘结果将为第四章负荷预测研究提供优质的数据基础。
[0191]
总之,上述实施例基于两阶段集成聚类的区域能源负荷用电模式挖掘算法,booststarp法对原负荷样本进行重采样,用于降低结果陷入局部最优解的风险;结合变电站负荷构成特性,选用模糊c均值(fcm)算法作为第一阶段聚类模型,实现对重采样样本的初步聚类与数据降维;采用高精度的层次聚类对初步聚类结果进行第二阶段聚类,实现区域能源负荷用电模式的有效划分。与现有技术相比,本发明上述实施例提出的两阶段集成聚类算法相较于传统单一聚类算法有着更好的聚类性能,并且对区域能源负荷用电模式的精准聚类划分,能够为短期负荷预测提供优质的数据基础。
[0192]
上面对本发明实施例结合附图进行了说明,但本发明不限于上述实施例,还可以根据本发明的发明创造的目的做出多种变化,凡依据本发明技术方案的精神实质和原理下做的改变、修饰、替代、组合或简化,均应为等效的置换方式,只要符合本发明的发明目的,只要不背离本发明的技术原理和发明构思,都属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献