一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于符号聚合近似表示的多元负荷分类方法和系统与流程

2021-12-01 01:34:00 来源:中国专利 TAG:


1.本发明涉及电力系统负荷分析领域,更具体的说是涉及一种基于符号聚 合近似表示的多元负荷分类方法和系统。


背景技术:

2.近年来,由于化石能源的紧缺和环境污染严重威胁人类生存,世界各地 都开始大力发展可再生新能源,如风电、光伏、水电和生物电等等。但是风 电和光伏具有时段发电特性,比如风电在风大的季节和时段发电多,光伏在 阳光充足的白天发电多,晚上不发电,往往造成在用电高峰,新能源发电较低, 在用电低谷,新能源发电较高,造成新能源削减。新能源并网后电力系统电 能利用效率大幅下降,电力时段供需不平衡。因此,除了考虑发电端能源互 补,更需要着重分析用户负荷运行特性,挖掘用户负荷可调节潜力,并基于 用户负荷特性开展负荷分时电价和负荷响应管理工作,鼓励高峰用电用户在 低谷和平段用电,从而使电力系统安全平稳运行,消纳更多新能源。
3.在电力供需不平衡时,电力系统往往根据用户级别实行拉闸限电,将高 峰部分负荷转移到低谷用电,从而削峰填谷,平滑负荷曲线,使得电力供需 平衡。但是很显然通过拉闸限电和新能源场站削减的处理方法,破坏了用户 电力需求,降低电力能源利用率。从电力系统优化的角度出发,解决电力系 统供需不平衡的,需要对源荷两端进行变化特性研究,其中,进行负荷分类, 制定有关的负荷和能源管理是其中的研究重点。
4.发明专利(cn111553434a)公开了一种电力系统负荷分类方法及系统, 该方法包括:获取待分析的电力系统负荷数据,得到样本矩阵;所述电力系 统负荷数据包括n条负荷曲线,每条负荷曲线包括p个采样点对应的电力负荷 数据;所述样本矩阵中第i行第j列的元素表示第i条负荷曲线中第j个采样点的 电力负荷值;对所述电力系统负荷数据进行标准化处理,得到标准化数据; 采用主成分分析法对所述标准化数据进行分析,得到包括m个主成分分量的主 成分矩阵;根据所述主成分矩阵,利用凝聚层次聚类方法确定k个初始聚类; 根据所述k个初始聚类和所述主成分矩阵,利用k

means聚类方法确定所述电 力系统负荷数据中每条负荷曲线的分类结果。可以降低运算时间,提高电力 系统负荷分类的效率。
5.然而上述方法首先没有对负荷用电时段进行分类,无法通过负荷用电时 段分类结果,知道用户主要用电时段是多少,从而无法确保用电负荷分类的 准确性;其次上述方法运用的是无监督聚类算法,没有固定标签,有新用户 数据需要重新分类。
6.因此,如何对负荷用电时段进行分类,提供一种能够对负荷用电时段进 行分类且具有有效监督的多元负荷分类方法和系统是本领域技术人员亟需解 决的问题。


技术实现要素:

7.有鉴于此,本发明提供了一种基于符号聚合近似表示的多元负荷分类方 法和系统,解决背景技术提到的技术问题。
8.为了实现上述目的,本发明采用如下技术方案:
9.一种基于符号聚合近似表示的多元负荷分类方法,包括:
10.s1、获取一定时间区间内的用户用电数据并进行处理;
11.s2、使用k均值聚类算法,对处理后的用电数据进行聚类,获取典型的 用户日负荷特性数据;
12.s3、将日负荷特性数据用符号聚合近似进行表示,根据符号聚合近似表 示对典型日负荷数据进行分类。
13.优选的,步骤s1具体包括以下步骤:
14.s11、收集每个用户的历史日负荷数据;
15.s12、以用户id和时间为标识,对历史日负荷数据进行清理,处理成时 间序列;
16.s13、对每个用户负荷数据进行归一化处理。
17.优选的,s2中所述典型的用户日负荷特性数据,包括用户日负荷曲线
18.优选的,步骤s2具体包括:
19.s21、剔除日负荷全为0值的日负荷数据,并生成日负荷数据样本集;
20.s22、根据用户日负荷时间跨度确定k均值聚类方法中的k值;
21.s23、确定k均值聚类目标函数,并根据目标函数获取聚类结果;
22.s24、剔除聚类结果中的边缘值;
23.s25、在剩余样本集中选取离平均负荷最近的负荷数据为典型日负荷数 据。
24.优选的,步骤s22中k均值聚类方法的k值的具体计算公式为:
[0025][0026]
式中,d表示用户日负荷时间跨度的天数。
[0027]
优选的,s23具体步骤包括:从总数为m的日负荷数据样本集中随机选 取样本作为初始中心质点,确定k均值聚类目标函数j为
[0028][0029]
式中x
i
为第i个样本值,m为样本总量,i为第i个样本,u
c
(i)为所属c 类i样本质心值;对目标函数迭代优化:寻找k个质心,使得j值最小,直到 目标函数稳定,或超过最大迭代次数,获得聚类结果。
[0030]
优选的,步骤s3具体包括以下步骤:
[0031]
用a和b组成的时间序列表示典型日负荷数据,将典型日负荷数据进行 分类,其中a表示用户在该时段用电,b表示用户在该时段空闲。
[0032]
优选的,所述典型日负荷数据分为以下6类:
[0033]
第1类

纯谷段用电型:只在谷时用电;
[0034]
第2类

谷段用电且平段补电型:在谷段和平段都用电;
[0035]
第3类

全天用电型:谷平峰段都用电;
[0036]
第4类

白天用电型:只在平峰段用电;
[0037]
第5类

谷段用电且峰段补电型:在谷段和峰段都用电;
[0038]
第6类

空闲型:全天均不用电;
[0039]
其公式表示为:
[0040][0041]
其中y为类别,i
v
为低谷是否有用电,i
p
为平时段是否有用电,i
h
为高峰 时段是否有用电,有用电时i
v
、i
p
与i
h
值为1,否则为0,统计用户是否有用 电用该时段符号近似表示的序列中是否有a来进行统计,有a则表示有用电, 没有a则表示没用电,m表示第m个用户。
[0042]
一种基于符号聚合近似表示的多元负荷分类系统,包括数据处理模块, 典型日负荷绘制模块,符号聚合近似表示的多元负荷分类模块;
[0043]
所述数据处理模块,获取一定时间段内的用户历史用电数据,对数据进 行数据清洗,转化为序列向量做输入数据;
[0044]
所述典型日负荷绘制模块,接收用户历史用电数据,使用k均值聚类算 法,对所求时间区间内的用户数据进行聚类,从而获得用户典型日负荷曲线;
[0045]
所述符号聚合近似表示的多元负荷分类模块,将用户日负荷曲线特性用 符号聚合近似表示,通过符号统计给日负荷特性数据打上初始类别标签,并 对用户典型日负荷特性进行分类。
[0046]
经由上述的技术方案可知,与现有技术相比,本发明的有益效果至少包 括:
[0047]
1、用典型日负荷数据表示用户用电行为,可以有效的归纳用户用电规律。
[0048]
2、用符号聚合近似表示典型日负荷用电数据,进行归纳统计,将自定义 初始类别标签不同但特性相似的典型日负荷数据分为一类,可以快速对庞大 的用户用电数据进行时段分类,很好的了解用户用电时段,精确了解每一个 用户的用电习惯,实现高效的电网管理。
附图说明
[0049]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面 描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不 付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0050]
图1附图为本发明提供的系统结构示意图;
[0051]
图2附图为本发明提供的数据处理流程示意图;
[0052]
图3附图为本发明提供的典型日负荷绘制流程示意图;
具体实施方式
[0053]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0054]
如图1所示,本发明实施例公开了一种基于符号聚合近似表示的多元负 荷分类方法,方法的整体步骤如下:
[0055]
s1、首先获得用户历史用电曲线数据,进行数据清洗,转化为序列向量 做输入数据;如图2所示具体步骤包括:
[0056]
s11、收集每个用户一定时间段的历史日负荷数据,
[0057]
s12、以用户id和时间为唯一标识,对数据进行清理,处理成时间序列。
[0058]
s13、对每个用户负荷数据进行归一化,如公式1所示:
[0059][0060]
其中x为要归一化的用户功率值,min为用户用电功率最小值,max为用 户用电功率最大值,x
*
为归一化结果。
[0061]
s2、接下来使用k均值聚类算法,对所求时间区间内的用户数据进行聚 类,从而获得用户典型日负荷曲线;如图3所示具体步骤包括:
[0062]
s21、剔除日负荷全为0值的日负荷;
[0063]
s22、以用户日负荷时间跨度确定k均值聚类方法的k值,d为用户的典 型日负荷曲线代表的时间跨度,若d=10,则代表用户在10日内的典型日负荷 曲线,若日负荷数据只有9天的数据,则d=9。假如用户日负荷时间跨度大于 30日,k取4,小于10日,k取1,具体取值方法如公式2所示:
[0064][0065]
s23、从样本中随机选取样本作为初始中心质点u,k均值聚类目标函数 如公式3所示,通过对目标函数迭代优化,寻找k个质心,使得j值最小,直 到目标函数稳定,或超过最大迭代次数,最终获得聚类结果。k均值聚类目标 函数j为:
[0066][0067]
式中x
i
为第i个样本值,m为样本总量,i为第i个样本,u
c
(i)为所属c 类i样本质心值。
[0068]
s24、剔除边缘值。对于k均值聚类的结果,剔除5%的边缘值。由一般 误差都属于正太概率分布可知,95%概率下的样本可以代表整个样本的情况, 所以剔除每类5%的边缘值合理。
[0069]
s25、在剩余样本集中以选取离平均负荷最近的负荷为典型日负荷曲线, 如公式4
所示。
[0070][0071]
其中l为典型曲线,x为剔除掉畸变数据的样本值,为x的均值,i为 第i个样本值。
[0072]
s3、最后将用户典型日负荷曲线特性用符号聚合近似表示,给典型日负 荷特性数据打上类别标签,完成典型日负荷特性数据的分类。具体实施步骤 如下:
[0073]
s31、使用符号聚合近似表示方法表示日负荷特性。符号聚合近似表示方 法为:用a和b组成的时间序列表示用户日负荷曲线特性,a表示用户在该时 段用电,b表示用户在该时段空闲,这里将用户用电低于用户最大负荷功率 10%的时段标记为b。
[0074]
s32、通过步骤s31获得的符号表示的日负荷特性,将典型日负荷特性划 分为6类,并打上相应的类别标签。将有用电的日负荷曲线分为纯谷段用电 型,谷段用电且平段补电型,全天用电型,白天用电型、谷段用电且峰段补 电型,并用符号a聚合近似表示不同的用电时段;假如全天没有用电,即为 空闲状态则表示为用电曲线全部为b。具体如下:
[0075]
第1类

纯谷段用电型:只在谷时用电,即只有谷段有a;
[0076]
第2类

谷段用电且平段补电型:在谷段和平段都用电,即只有谷平段有 a;
[0077]
第3类

全天用电型:谷平峰段都用电,即谷平峰段有a;
[0078]
第4类

白天用电型:只在平峰段用电,即只有平段有a;
[0079]
第5类

谷段用电且峰段补电型:在谷段和峰段都用电,即只有谷峰段有 a;
[0080]
第6类

空闲型:全天均不用电,即全天用电曲线为b
[0081]
分类结果可以用公式5表示
[0082][0083]
其中y为类别,i
v
为低谷是否有用电,i
p
为平时段是否有用电,i
h
为高峰 时段是否有用电,有用电时i
v
、i
p
与i
h
值为1,否则为0,统计用户是否有用 电用该时段符号近似表示的序列中是否有a来进行统计,有a则表示有用电, 没有a则表示没用电,m表示第m个用户。
[0084]
本发明实施例还公开了一种基于符号聚合近似表示的多元负荷分类系 统,包含数据处理模块,典型日负荷绘制模块,符号聚合近似表示的多元负 荷分类模块,系统的整体流程如下:
[0085]
首先数据处理模块,获得用户历史用电曲线数据,进行数据清洗,转化 为序列向量做输入数据;
[0086]
接下来典型日负荷绘制模块,使用k均值聚类算法,对所求时间区间内 的用户数据进行聚类,从而获得用户典型日负荷曲线;
[0087]
最后是符号聚合近似表示的多元负荷分类模块,将用户日负荷曲线特性 用符号
聚合近似表示,通过符号统计给日负荷特性数据打上初始类别标签, 将自定义初始类别标签不同但特性相似的负荷分为一类,对用户典型日负荷 特性数据进行分类。
[0088]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都 是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。 对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述 的比较简单,相关之处参见方法部分说明即可。
[0089]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用 本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易 见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下, 在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例, 而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献