一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于大数据的电网运行管理方法、装置、设备及存储介质与流程

2022-06-29 17:43:30 来源:中国专利 TAG:


1.本发明涉及电网运行管理领域,尤其涉及一种基于大数据的电网运行管理方法、装置、设备及计算机可读存储介质。


背景技术:

2.近几年来,智慧城市的建设吸引了人们的广泛关注,智能电网作为智慧城市的重要组成部分,在智慧城市的建设过程中发挥着不可忽视的作用。智慧城市的建设要求具有更智能化的电力系统,随着大数据技术的逐渐成熟,运用大数据技术解决电力行业的问题,尤其是使用数据挖掘技术对电力数据进行挖掘研究成为了智能电网建设的热点之一。由于我国电力需求侧的增长速度将要超过发电量的增长,如何实现电力系统的安全稳定运行成了电网建设的重点。电力系统运行过程中,由于环境的复杂多变和社会的快速发展,可能会出现一系列影响电力系统稳定运行的异常用电行为。这些异常不仅影响着电网的规划建设以及电力的调度安排,甚至误导地区经济计划的制定,阻碍社会的发展。电力系统的持续可靠运行,不仅关系着千家万户的日常生活和企业的经营发展,同时也关系着国家的长治久安。因此,保证电力系统的安全可靠运行是保障国计民生的重要要求。


技术实现要素:

3.本发明的主要目的在于提供一种基于大数据的电网运行管理方法,旨在解决现有技术中如何实现电力系统的安全稳定运行的技术问题。
4.为实现上述目的,本发明提供一种基于大数据的电网运行管理方法,所述基于大数据的电网运行管理方法包括:获取电力负荷数据,通过对所述电力负荷数据进行预处理操作,清理所述电力负荷数据中的异常数据;对预处理操作后的电力负荷数据进行波动区间的密度聚类,得到供异常检测的离群序列和供预测使用的负荷序列聚集簇,根据所述离群序列建立异常行为检测模型,根据所述负荷序列聚集簇建立负荷预测模型;使用所述异常行为检测模型对离群序列进行异常行为检测,得到异常行为序列,使用所述负荷预测模型对负荷序列聚集簇进行负荷的短期预测,得到预测序列,基于所述异常行为序列和所述预测序列对电网运行进行管理。
5.可选地,所述异常数据包括噪声数据和缺失值数据,所述清理所述电力负荷数据中的异常数据的步骤,包括:根据预设时间序列模型,对所述噪声数据和所述缺失值数据进行清理。
6.可选地,所述根据预设时间序列模型,对所述噪声数据和所述缺失值数据进行清理的步骤,包括:若清理的数据对象为所述噪声数据,则在基于负荷序列的前后波动性关系和负荷间的距离检测到噪声数据后,采用当前负荷相对前一预设时间周期的时间序列的变化数据
进行修复;若清理的数据对象为所述缺失值数据,则在所述负荷序列中获取缺失值前后相邻预设时间周期相同时间点的负荷数据,并根据相同时间点的负荷数据计算得到负荷均值,基于后一个时间周期相对前一时间周期的负荷量变化率得到负荷变化量,在负荷均值基础上加上负荷变化量以填充所述缺失值数据。
7.可选地,所述使用所述异常行为检测模型对离群序列进行异常行为检测,得到异常行为序列的步骤,包括:读取用户信息,得到用户在预设读取周期内的负荷序列,对所述负荷序列进行聚类分析得到相似类别组,基于所述相似类别组判断所述负荷序列中是否存在离群序列;若存在离群序列,则使用预设历史数据模型对所述离群序列进行计算得到历史匹配度,使用预设相似用户模型对所述离群序列进行计算得到相似匹配度;基于所述历史匹配度和所述相似匹配度得到最终匹配度,对所述离群序列进行所述最终匹配度的匹配处理,得到所述异常行为序列。
8.可选地,所述使用所述负荷预测模型对负荷序列聚集簇进行负荷的短期预测,得到预测序列的步骤,包括:判断待短期预测的目标日期是否为假期,若待短期预测的目标日期是假期,则提取待短期预测的目标日期前两天的波动序列和上一年同期序列,输出预测序列。
9.可选地,在所述判断待短期预测的目标日期是否为假期之后的步骤,还包括:若待短期预测的目标日期不是假期,则在所述负荷序列聚集簇中选取与所述目标日期相邻的预设数量的负荷序列,判断所述预设数量的负荷序列与所述待短期预测的负荷序列是否处于相同时间段;若所述预设数量的负荷序列与所述待短期预测的负荷序列处于相同时间段,则从选取的负荷序列中截取与所述目标日期相距预设间隔时间的负荷序列,作为参考序列,基于所述参考序列输出所述预测序列;若所述预设数量的负荷序列与所述待短期预测的负荷序列不处于相同时间段,则从所述负荷序列聚集簇中剔除所述待短期预测的负荷序列。
10.可选地,所述对所述电力负荷数据进行预处理操的步骤包括:采用以下预处理操作中的一种或多种,对所述电力负荷数据通过填写缺失值、光滑噪声数据以及删除离群点进行数据清洗;或者,对所述电力负荷数据,通过去重处理进行数据集成;或者,对所述电力负荷数据,通过压缩进行数据规约;或者,对所述电力负荷数据,通过数据离散化和分层处理进行数据变换处理。
11.此外,为实现上述目的,本发明还提供一种基于大数据的电网运行管理装置,所述装置包括:预处理模块,用于获取电力负荷数据,对所述电力负荷数据进行预处理操作,清理所述电力负荷数据中的异常数据;密度聚类模块,用于对预处理操作后的电力负荷数据进行波动区间的密度聚类,建立异常行为检测模型和负荷预测模型;
检测预测模块,用于使用所述异常行为检测模型对离群序列进行异常行为检测,得到异常行为序列,使用所述负荷预测模型对负荷序列聚集簇进行负荷的短期预测,得到预测序列,基于所述异常行为序列和所述预测序列对电网运行进行管理。
12.此外,为实现上述目的,本发明还提供一种基于大数据的电网运行管理设备,所述基于大数据的电网运行管理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于大数据的电网运行管理程序,所述基于大数据的电网运行管理程序被所述处理器执行时实现如上述的基于大数据的电网运行管理方法的步骤。
13.此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于大数据的电网运行管理程序,所述基于大数据的电网运行管理程序被处理器执行时实现如上所述的基于大数据的电网运行管理方法的步骤。
14.本发明实施例提出的一种基于大数据的电网运行管理方法、设备及计算机可读存储介质,鉴于负荷数据的来源多种多样,为提高数据的可用性,对电力数据使用时间序列分析的方法进行了预处理;对于异常行为的检测采用的是对用电负荷的波动区间进行密度聚类得到离群点,然后利用该用户的历史用电信息和该用户的相似用户的用电负荷特征曲线进行匹配处理,经分析得到离群点的异常嫌疑度;由于电力调度离不开电力负荷的预测,根据电力负荷的预测需求,根据需求,提出基于时间序列的密度聚类预测方法。该方法以用电序列的起始时间、波动时间跨度、起始用电量、平均用电量、平均增长率等指标表示用电模式,并对用电模式进行聚类得到相似负荷聚集簇,结合回归方法对用户负荷进行短期预测。在异常检测时,现有技术中很少考虑相似用户之间的关联性,当同一相似类型的用户的用电行为均发生变化时,如果只考虑单个用户的用电行为,有可能会造成误判,影响异常的检测效果。为此,提出基于密度聚类的多用户异常用电行为检测方法。在负荷预测方面,为提高了预测时间精度,提出一种采用负荷波动区间聚类的方法进行用电负荷的短期预测。从而实现了异常用电行为的检测和电力负荷的短期预测,为电网的安全可靠运行提供保证。
附图说明
15.图1是本发明实施例方案涉及的硬件运行环境的运行设备的结构示意图;图2为本发明基于大数据的电网运行管理方法一实施例的流程示意图;图3为本发明基于大数据的电网运行管理方法一实施例的基于密度聚类异常负荷行为检测流程图;图4为本发明基于大数据的电网运行管理方法一实施例的负荷预测流程图。
16.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
17.应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
18.参照图1,图1为本发明实施例方案涉及的硬件运行环境的终端结构示意图运行设备的结构示意图。
19.如图1所示,该运行设备可以包括:处理器1001,例如中央处理器(central processing unit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏
(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(wireless-fidelity,wi-fi)接口)。存储器1005可以是高速的随机存取存储器(random access memory,ram)存储器,也可以是稳定的非易失性存储器(non-volatile memory,nvm),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
20.本领域技术人员可以理解,图1中示出的结构并不构成对运行设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
21.如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及基于大数据的电网运行管理程序。
22.在图1所示的运行设备中,网络接口1004主要用于与其他设备进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明运行设备中的处理器1001、存储器1005可以设置在运行设备中,所述运行设备通过处理器1001调用存储器1005中存储的基于大数据的电网运行管理程序,并执行以下操作:获取电力负荷数据,通过对所述电力负荷数据进行预处理操作,清理所述电力负荷数据中的异常数据;对预处理操作后的电力负荷数据进行波动区间的密度聚类,得到供异常检测的离群序列和供预测使用的负荷序列聚集簇,根据所述离群序列建立异常行为检测模型,根据所述负荷序列聚集簇建立负荷预测模型;使用所述异常行为检测模型对离群序列进行异常行为检测,得到异常行为序列,使用所述负荷预测模型对负荷序列聚集簇进行负荷的短期预测,得到预测序列,基于所述异常行为序列和所述预测序列对电网运行进行管理。
23.进一步地,处理器1001可以调用存储器1005中存储的基于大数据的电网运行管理程序,还执行以下操作:所述异常数据包括噪声数据和缺失值数据,所述清理所述电力负荷数据中的异常数据的步骤,包括:根据预设时间序列模型,对所述噪声数据和所述缺失值数据进行清理。
24.进一步地,处理器1001可以调用存储器1005中存储的基于大数据的电网运行管理程序,还执行以下操作:所述根据预设时间序列模型,对所述噪声数据和所述缺失值数据进行清理的步骤,包括:若清理的数据对象为所述噪声数据,则在基于负荷序列的前后波动性关系和负荷间的距离检测到噪声数据后,采用当前负荷相对前一预设时间周期的时间序列的变化数据进行修复;若清理的数据对象为所述缺失值数据,则在所述负荷序列中获取缺失值前后相邻预设时间周期相同时间点的负荷数据,并根据相同时间点的负荷数据计算得到负荷均值,基于后一个时间周期相对前一时间周期的负荷量变化率得到负荷变化量,在负荷均值基础上加上负荷变化量以填充所述缺失值数据。
25.进一步地,处理器1001可以调用存储器1005中存储的基于大数据的电网运行管理程序,还执行以下操作:
读取用户信息,得到用户在预设读取周期内的负荷序列,对所述负荷序列进行聚类分析得到相似类别组,基于所述相似类别组判断所述负荷序列中是否存在离群序列;若存在离群序列,则使用预设历史数据模型对所述离群序列进行计算得到历史匹配度,使用预设相似用户模型对所述离群序列进行计算得到相似匹配度;基于所述历史匹配度和所述相似匹配度得到最终匹配度,对所述离群序列进行所述最终匹配度的匹配处理,得到所述异常行为序列。
26.进一步地,处理器1001可以调用存储器1005中存储的基于大数据的电网运行管理程序,还执行以下操作:判断待短期预测的目标日期是否为假期,若待短期预测的目标日期是假期,则提取待短期预测的目标日期前两天的波动序列和上一年同期序列,输出预测序列;进一步地,处理器1001可以调用存储器1005中存储的基于大数据的电网运行管理程序,还执行以下操作:在所述判断待短期预测的目标日期是否为假期之后的步骤,还包括:若待短期预测的目标日期不是假期,则在所述负荷序列聚集簇中选取与所述目标日期相邻的预设数量的负荷序列,判断所述预设数量的负荷序列与所述待短期预测的负荷序列是否处于相同时间段;若所述预设数量的负荷序列与所述待短期预测的负荷序列处于相同时间段,则从选取的负荷序列中截取与所述目标日期相距预设间隔时间的负荷序列,作为参考序列,基于所述参考序列输出所述预测序列;若所述预设数量的负荷序列与所述待短期预测的负荷序列不处于相同时间段,则从所述负荷序列聚集簇中剔除所述待短期预测的负荷序列。
27.进一步地,处理器1001可以调用存储器1005中存储的基于大数据的电网运行管理程序,还执行以下操作:所述对所述电力负荷数据进行预处理操的步骤包括:采用以下预处理操作中的一种或多种,对所述电力负荷数据通过填写缺失值、光滑噪声数据以及删除离群点进行数据清洗;或者,对所述电力负荷数据,通过去重处理进行数据集成;或者,对所述电力负荷数据,通过压缩进行数据规约;或者,对所述电力负荷数据,通过数据离散化和分层处理进行数据变换处理。
28.本发明实施例提供了一种基于大数据的电网运行管理方法,参照图2,图2为本发明一种基于大数据的电网运行管理方法第一实施例的流程示意图。
29.本实施例中,所述基于大数据的电网运行管理方法包括:步骤s10:获取电力负荷数据,通过对所述电力负荷数据进行预处理操作,清理所述电力负荷数据中的异常数据。
30.在本实施例中,电力负荷数据的采集是通过采集网络、终端设备采集实现的。电力负荷数据的采集方法种类有很多,比如配、用电调度控制中心,抄表系统,路灯的智慧控制系统,发电设施的监控安防系统等。根据所要采集的电力负荷数据信息在电网系统的发、输、配、用四个环节所处位置的不同,从而导致电力负荷数据的各个采集系统,其功能需求
各不相同。在发电过程中,根据不同来源的电力负荷数据,比如水力发电、风能发电、火力发电、核能以及其他新能源发电方式等,因为不一样的发电原理或方式,使得整个管理控制系统的建设也会各不相同;而在输电环节,输电距离和线路的不同会造成管理方式、变电站建设数目等不同;在配电环节,不同区域不同时间段的用电需求和用电级别存在较大的差别,要求建设差异化的调度、管理监控系统;在用电环节,根据不同类型的用户用电类别,需要不同程度的监控管理,比如用户用电量的变化情况。
31.电力系统的智能化管理要求电力数据的及时反馈,电力负荷数据的采集就显得尤为重要。电力负荷数据极易受到噪声干扰,同时还存在着缺失值和不一致数据,再加上数据来源的不同,容易导致采集到的数据的可用性较低,增大了数据挖掘的难度,影响挖掘的效果。使用挖掘技术时鉴于数据的来源可能差异很大,数据的格式、量纲等各不相同,为提高数据可用性需要预先进行负荷数据的预处理,进而提高数据挖掘的质量。通常数据质量会受到很多因素的影响,比如准确性、完整性、一致性、时效性、可信性和可解释性,一般可以认为能满足应用要求的数据就是高质量的数据。
32.步骤s20:对预处理操作后的电力负荷数据进行波动区间的密度聚类,得到供异常检测的离群序列和供预测使用的负荷序列聚集簇,根据所述离群序列建立异常行为检测模型,根据所述负荷序列聚集簇建立负荷预测模型。
33.聚类分析是通过一定的计算方法将数据对象集划分成多个内部数据高度相似的组或簇的过程,对于不同簇之间的对象具有较大的差别,即主要通过最大化类内相似性、最小化类间相似性的原则对数据进行处理。现有技术中存在有许多的聚类方法,根据聚类方式所用思想的不同,可以将基本的聚类方法分为以下几种:划分方法:划分方法是通过对给定的数据集构建小于对象数目的若干个分区,每个分区表示一个至少包含一个对象的簇。层次方法:层次方法根据数据集建立不同的层次划分,根据所采用的方法的不同,主要分为凝聚类方法和分裂方法。基于网格的方法:通过把对象空间转化为有限数目的单元组成的网络结构,然后在网格内进行后续的操作。基于密度的方法:由于使用对象距离进行聚类的方法只能发现球状簇,难以发现任意形状的簇,于是基于密度的聚类方法便应运而生了。
34.鉴于正常情况下的电力负荷数据包含着多维数据,在聚类过程中可能会形成各种形状的簇,为了更好地检测异常用电行为,在本实施例中,采用dbscan(density based spatial clustering of applications with noise,基于密度的聚类方法),该方法是一种具有噪声应用的基于高密度连通区域的密度聚类方法,它通过用户设定的参数大于零来确定每个对象的邻域半径,使用参数min pts指定聚集簇的密度阈值。
35.步骤s30:使用所述异常行为检测模型对离群序列进行异常行为检测,得到异常行为序列,使用所述负荷预测模型对负荷序列聚集簇进行负荷的短期预测,得到预测序列,基于所述异常行为序列和所述预测序列对电网运行进行管理。
36.在本实施例中,电力异常不止包括设备故障、窃电等造成的用电数据中某些维度信息明显偏离该维度的统计情况,而且还包括用电数据符合统计规律但是违背用户的行为规律的情况。对于前一种情况,通过设定各维度的阈值信息可以很好地检测出异常,而对于后一种则要使用数据挖掘方法对用电数据进行处理分析。由于用户的用电行为在时间上和空间上具有一定的相似性,在时间上体现为用户当前的用电行为和历史上某时段的用电行为具有相似性,在空间上体现为在同一地区的同类型的用户具有相似的用电规律。因此可
以利用历史用电信息,根据电力系统中用户用电行为本身的特征,通过数据挖掘的方法实现用户的异常行为检测。在数据挖掘技术中,密度聚类dbscan方法具有能够发现任意形状的聚集簇且具有较好的抗干扰性的特点,比较适用于用电负荷的聚类。
37.在本实施例中,由于用电负荷在时间上和空间上有着自身的特点,利用时间上的周期性,根据负荷序列可以得到负荷序列的变化趋势。负荷序列数据是一种区间数据,区间数据通常表述成n维空间中的几何体或者是空间分布的笛卡尔乘积。区间数据的表示方法有两种,一种是根据数值的上界和下界,另一种是区间的中点和区间半径。使用时间序列进行预测时,可以将若干个连续的负荷序列作为一个整体考虑,每两个连续日的负荷数据当做一种负荷模式。对于今日的负荷模式在概率上可以认为很大程度上影响明天的负荷模式,使用若干相似的负荷模型,根据它们的负荷规律来预测待预测日的负荷变化情况。
38.在本实施例中,首先针对电力负荷的特性对电力负荷数据、电力异常的种类、电力负荷预测的要求等进行分析;然后对电力负荷数据进行预处理,清理数据中的空值和噪声数据,提高数据可用性;接着使用密度聚类技术对负荷序列进行波动区间的聚类,以便于建立相应的异常行为检测模型和负荷预测模型;利用建立的模型对用户的用电负荷进行异常行为检测和负荷的短期预测,并对检测到的结果进行分析,以便于向管理部门提供信息支持。
39.在本实施例中,鉴于负荷数据的来源多种多样,为提高数据的可用性,对电力数据使用时间序列分析的方法进行了预处理;对于异常行为的检测采用的是对用电负荷的波动区间进行密度聚类得到离群点,然后利用该用户的历史用电信息和该用户的相似用户的用电负荷特征曲线进行匹配处理,经分析得到离群点的异常嫌疑度;由于电力调度离不开电力负荷的预测,根据电力负荷的预测需求,根据需求,提出基于时间序列的密度聚类预测方法。该方法以用电序列的起始时间、波动时间跨度、起始用电量、平均用电量、平均增长率等指标表示用电模式,并对用电模式进行聚类得到相似负荷聚集簇,结合回归方法对用户负荷进行短期预测。在异常检测时,现有技术中很少考虑相似用户之间的关联性,当同一相似类型的用户的用电行为均发生变化时,如果只考虑单个用户的用电行为,有可能会造成误判,影响异常的检测效果。为此,提出基于密度聚类的多用户异常用电行为检测方法。在负荷预测方面,为提高了预测时间精度,提出一种采用负荷波动区间聚类的方法进行用电负荷的短期预测。从而实现了异常用电行为的检测和电力负荷的短期预测,为电网的安全可靠运行提供保证。
40.可选地,所述异常数据包括噪声数据和缺失值数据,所述清理所述电力负荷数据中的异常数据的步骤,包括:根据预设时间序列模型,对所述噪声数据和所述缺失值数据进行清理。
41.在本实施例中,电力负荷数据的主要参数包括用户id、用户类别、用户家庭情况信息、用电类别、台区号、日期时间、电压值、电流值、用电量、功率(有功功率和无功功率)、线损值等。电力系统中的异常数据可以分为两种情况,一种是数值型错误,包括噪声数据和缺失值;另一种是因为运行环境变化引起的整个状态的迁移,这种情况体现了电力模式的变化,具有研究价值,在消除噪声因素影响之后可以进一步使用挖掘方法深入研究。
42.为提高电力负荷分析的效果,应保证负荷数据的可靠性。通常电力负荷数据受到多种因素的影响,产生噪声数据、缺失值等问题的错误数据,对这种错误性数据依据时间序
列建立相应的模型,,其中:表示当前负荷序列,表示不包含异常值类型的负荷序列,n表示异常值个数,和表示负荷异常值的影响因子,表示的是时刻的脉冲函数。
43.可选地,所述根据预设时间序列模型,对所述噪声数据和所述缺失值数据进行清理的步骤,包括:若清理的数据对象为所述噪声数据,则在基于负荷序列的前后波动性关系和负荷间的距离检测到噪声数据后,采用当前负荷相对前一预设时间周期的时间序列的变化数据进行修复;若清理的数据对象为所述缺失值数据,则在所述负荷序列中获取缺失值前后相邻预设时间周期相同时间点的负荷数据,并根据相同时间点的负荷数据计算得到负荷均值,基于后一个时间周期相对前一时间周期的负荷量变化率得到负荷变化量,在负荷均值基础上加上负荷变化量以填充所述缺失值数据。
44.在本实施例中,对负荷数据进行预处理时,根据异常类型的不同分别设计相应的处理方法。
45.对于噪声数据,噪声数据在整个负荷曲线上表现为偏离曲线正常的波动范围,乃至出现毛刺等现象。这类异常的检测可以根据负荷序列的前后波动性关系和负荷间的距离来检测。即取负荷序列中到中心负荷点s最近的k个负荷的距离表示该序列的密度区域,那么密度越大的点的区域半径越小,以负荷点到中心点的距离d与密度区域半径r中的较大者作为该中心点s的可达距离。负荷的异常程度可以通过负荷点到中心点的相对距离体现,再设定异常的阈值便可通过判定得到数据异常的负荷点。
46.对于缺失值,由于电力负荷数据一般具有波动周期特性,按照该特性分别计算缺失值前后相邻两日相同时间点的负荷、缺失值前后两个时间点的负荷的均值,结合后一日相对前一日的负荷变化率法,以负荷均值加上负荷变化量填充空缺值。
47.可选地,对预处理操作后的电力负荷数据进行波动区间的密度聚类,建立异常行为检测模型和负荷预测模型的步骤,包括:对预处理操作后的电力负荷数据进行波动区间的密度聚类,得到供异常检测的离群序列和供预测使用的负荷序列聚集簇;根据所述离群序列建立异常行为检测模型,根据所述负荷序列聚集簇建立负荷预测模型。
48.在本实施例中,电力负荷数据在时间上和空间上有着自身的规律和相似性,时间上体现为当前时间段的用电负荷情况与历史上的某些时间段具有很大的相似性,空间上体现为当前用户与同地区同类型的用户具有相似的用电行为。因此,利用电力负荷数据进行聚类分析,可以得到同类型的相似用电行为的负荷聚集簇和出现频率较少的离群用电数据。根据聚类结果的离群数据进一步分析可以实现用电异常行为的检测,而利用聚集簇中的数据结合回归思想以及时间序列分析方法则可以得到超短期的负荷预测结果,实现负荷预测的目的。对于预处理之后的电力负荷数据进行波动区间的密度聚类,得到供异常检测的离群负荷序列和供预测使用的负荷序列聚集簇,然后进一步进行分析处理。
49.可选地,所述使用所述异常行为检测模型对离群序列进行异常行为检测,得到异常行为序列的步骤,包括:读取用户信息,得到用户在预设读取周期内的负荷序列,对所述负荷序列进行聚类分析得到相似类别组,基于所述相似类别组判断所述负荷序列中是否存在离群序列;若存在离群序列,则使用预设历史数据模型对所述离群序列进行计算得到历史匹配度,使用预设相似用户模型对所述离群序列进行计算得到相似匹配度;基于所述历史匹配度和所述相似匹配度得到最终匹配度,对所述离群序列进行所述最终匹配度的匹配处理,得到所述异常行为序列。
50.在本实施例中,正常用电情况下,用户的电压、电流、功率因数、用电量、线损是保持相对稳定的,一旦某个属性值的变化幅度过大,就意味着可能发生了异常。电压、电流、功率因数、用电量、线损均有可能产生电力异常情况。用户的用电异常可能是线路故障、断线、供电故障、计量表故障、外部干扰、数据传输错误、偷电等多种因素造成的。电力异常一般具有持续性,很多时候出现的不止是一种异常,很有可能多种异常同时发生。如图3所示,对用电用户的划分需要考虑很多因素,通常一个用户的用电信息中包含着用电类别、电压等级、功率因数、日用电量、日平均负荷、日最大负荷、日最小负荷、日峰谷差、峰总比、平总比、谷总比、负荷率、负荷曲线等信息。另外,不同用户之间还要考虑台区、天气、温度等环境因素影响。
51.在使用用户历史用电数据进行异常检测时,鉴于同地区地理、气候条件等外部环境因素基本相同,相同用电类型的用户具有相似的用电行为,用户本身的用电行为在时间维度上具有相似性,即历史用电负荷数据呈现一定的聚类特性,因此可以据此分别建立用户用电模型。用户在一月内各周及同一周内的每天同时段的用电行为具有一定的相关性,因此提取用户异常序列所在周内每天同时段的用电负荷序列,以及该月内相同星期相同时间段的用电序列建立用户历史用电模型。相似类型用户的用电模型选取离群序列同时段的负荷序列表示。相似用户是综合考虑了用户的用电环境和用户自身特征等因素进行选取的,体现着某一类用户的用电行为特征,对于判定的相似用户来说,某一用户的用电行为特征能够代表该类用户的用电行为。
52.对于用户的异常用电行为,采用数据库中的用户信息进行聚类处理得到相似用户类别组。然后,再对所要考察的用户进行历史负荷数据的量化、聚类处理,如果聚类结果中出现了离群的负荷序列,将该序列加入离群序列库。根据该离群序列构建该用户的历史用电数据模型和相似用户用电模型,并对离群负荷序列进行匹配处理,根据匹配结果确定离群嫌疑度,最终判定该用电行为的是否异常。
53.在本实施例中,使用数据挖掘的方法对用户的异常用电行为进行了检测,提出了用电异常行为的基于密度聚类的检测算法,该算法利用历史数据聚类得到不同的用户类型组和负序列聚集簇,将离群负荷序列与该用户历史用电模型和相似用户用电模型进行匹配,实现多用户的用电行为检测。
54.可选地,所述使用所述负荷预测模型对负荷序列聚集簇进行负荷的短期预测,得到预测序列的步骤,包括:判断待短期预测的目标日期是否为假期,若待短期预测的目标日期是假期,则提取待短期预测的目标日期前两天的波动序列和上一年同期序列,基于所述波动序列和所述
上一年同期序列输出预测序列。
55.在本实施例中,一般情况下负荷预测时越靠近待预测时间的聚集簇中负荷序列越相似于待预测的负荷序列,即负荷预测中的近大远小特点。用户正常用电时,前一时段的用电行为对后一时段的用电行为具有一定的相关性,按照时间序列的思想,可以利用前一天前后两个相同时间段的用电关联特点,根据待预测前一序列的用电波动情况来推测接下来的用电情况。这种方法很难保证前一日的前后时间段的用电行为与待预测用电行为一定相似,具有一定的局限性。
56.在进行预测时,选取待预测时间点前一时刻的波动区间,利用该用电模式所在聚集簇中的负荷进行预测。对于非假期的待预测序列从聚集簇中选取距待预测时间最近的30条同时段的负荷序列,剔除序列中时间距离超过一周且不是一月内相同星期数的负荷序列,即保留本周内及本月内与待预测日相同星期天数的序列。然后将保留序列的下一时间段的负荷序列提取出来作为参考序列。对于假期日的待预测序列,从聚集簇中选择待预测日前两天内以及上一年与待测日期相同日期及前两天的负荷序列,同样根据选择的序列提取下一时间段的负荷序列作为参考序列。
57.可选地,在所述判断待短期预测的目标日期是否为假期之后的步骤,还包括:若待短期预测的目标日期不是假期,则在所述负荷序列聚集簇中选取与所述目标日期相邻的预设数量的负荷序列,判断所述预设数量的负荷序列与所述待短期预测的负荷序列是否处于相同时间段;若所述预设数量的负荷序列与所述待短期预测的负荷序列处于相同时间段,则从选取的负荷序列中截取与所述目标日期相距预设间隔时间的负荷序列,作为参考序列,基于所述参考序列输出所述预测序列;若所述预设数量的负荷序列与所述待短期预测的负荷序列不处于相同时间段,则从所述负荷序列聚集簇中剔除所述待短期预测的负荷序列。
58.在本实施例中,如图4所示,进行负荷预测时,先从数据库中读取用户的历史用电负荷信息,将负荷数据进行预处理、负荷区间进行划分,并计算区间的指标。然后根据待预测时刻的上一波动序列的聚类结果,判断待预测日期是否假期之后,再从聚集簇中选取参考序列。对于待预测日期不是假期,从聚集簇中选择距待预测日期最近的30条序列,然后从中选取与待预测时间处于最近一周或者最近一月内具有相同星期天数的序列作为参考序列,构建预测模型;对于待预测日是假期时,则提取待预测前两天下一波动序列和上一年同期最近三天与待预测同时段的负荷序列构建预测模型,最终进行负荷的预测,得到负荷预测的结果。
59.在本实施例中,根据历史用电负荷具有的周期性和规律性,按照负荷的变化趋势划分出序列的波动区间,对波动区间提取出负荷区间的特征表示为用电模式并进行密度聚类。根据聚类结果从聚集簇中选取相似负荷序列,确定参考序列,再结合时间序列和回归思想建立负荷预测模型进行负荷的预测,实现了负荷的超短期负荷预测,为电力管理部门提供了基于用电模式的预测方法。
60.可选地,所述对所述电力负荷数据进行预处理操的步骤包括:采用以下预处理操作中的一种或多种,对所述电力负荷数据通过填写缺失值、光滑噪声数据以及删除离群点进行数据清
洗;或者,对所述电力负荷数据,通过去重处理进行数据集成;或者,对所述电力负荷数据,通过压缩进行数据规约;或者,对所述电力负荷数据,通过数据离散化和分层处理进行数据变换处理。
61.在本实施例中,可以采取的数据预处理的方法有很多,通常数据预处理的主要步骤可以分为数据清洗、集成、规约和变换。具体的,数据清洗是通过填写缺失值,光滑噪声数据,识别或删除离群点,解决不一致来实现的。数据集成则是针对来源于不同系统、数据库或文件的数据,在表示同一概念时在不同数据库中具有不同的名字,导致数据的不一致性和冗余的问题进行的处理。数据规约主要用来简化数据集,包括使用数据编码方案以使得原始数据得到简化、压缩的维规约;通过以回归与对数线性模型为代表的参数模型和以聚类、抽样与数据聚集为代表的非参数模型的方法用较小的方式代替表示原数据的数值规约两种形式。数据变换是为了实现在多个抽象层上使用离散化和概念分层进行强有力的数据挖掘而进行的规范化、数据离散化和概念分层的数据形式的改变。
62.此外,本发明实施例还提供一种基于大数据的电网运行管理装置,所述装置包括:预处理模块,用于获取电力负荷数据,对所述电力负荷数据进行预处理操作,清理所述电力负荷数据中的异常数据;密度聚类模块,用于对预处理操作后的电力负荷数据进行波动区间的密度聚类,建立异常行为检测模型和负荷预测模型;检测预测模块,用于使用所述异常行为检测模型对离群序列进行异常行为检测,得到异常行为序列,使用所述负荷预测模型对负荷序列聚集簇进行负荷的短期预测,得到预测序列,基于所述异常行为序列和所述预测序列对电网运行进行管理。
63.此外,本发明实施例还提供一种基于大数据的电网运行管理设备,所述基于大数据的电网运行管理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于大数据的电网运行管理程序,所述基于大数据的电网运行管理程序被所述处理器执行时实现如上述的基于大数据的电网运行管理方法的步骤。
64.此外,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于大数据的电网运行管理程序,所述基于大数据的电网运行管理程序被处理器执行时实现如上所述的基于大数据的电网运行管理方法的步骤。
65.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
66.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
67.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,
计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
68.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献