一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于任意分割异常线损数据修复方法、系统、设备及介质与流程

2023-02-01 23:49:30 来源:中国专利 TAG:


1.本发明属于配网线损管理技术领域,具体涉及一种基于任意分割异常线损数据修复方法、系统、设备及介质。


背景技术:

2.近几年,配网智能程度逐渐加强,但在线损计算系统中,因数据来源于调度、营销、设备等多业务系统,基础数据冗余大,管理上条块分割使得数据对应和共享难度大,特别是高比例分布式电源接入后,线损计算源端数据的质量问题进一步加剧,数据的一致性、完整性及有效性难以保证。
3.相关学者提出了一种快速在线辨识多端直流配网故障位置和严重程度的方法。首先,建立了描述直流线路对线路两端注入故障电流的极对地和极对极故障动态响应的通用模型。在此基础上,采用卡尔曼滤波器对故障位置和电阻进行估计。最后,对某三端直流配网模型中的各种故障场景进行实时仿真,证明了该方法的有效性。此外,相关学者基于高精度pmu提供的大量历史电压数据,挖掘配网拓扑结构和电压之间的相关性,实现了配网的故障拓扑辨识。国内学者徐玮韡针对配网多数据源的现状,在电力系统综合数据平台收集多个异构系统信息的基础上,通过决策树理论构建数据质量标签,并基于质量标签对不良数据进行修补。叶锋分析了实际电力系统中负荷异常数据的主要成因,并针对两类主要的坏数据各自的特点,分别使用不同的方法处理负荷预测样本数据。刁赢龙提出一种面向大规模配网负荷数据的在线清洗与修复方法,包括基于密度的负荷数据流异常辨识方法和基于协同过滤推荐算法的负荷数据修复方法,实现了配网大规模、混杂、不精确的监测或采集负荷数据在线清洗;上述方案均难以提升线损数据处理的准确率。
4.基于上述背景,目前研究缺乏有效的异常数据检测技术,同时未对配网失真数据类型的差异化处理,难以提升线损数据处理的准确率、容错率以及同时率。


技术实现要素:

5.为克服上述现有技术的不足,本发明提出一种基于任意分割异常线损数据修复方法,包括:
6.利用局部异常因子算法从配电网所有节点中筛选含有异常线损数据的异常节点;
7.根据拓扑关系和节点之间的关系,对所述异常节点进行任意分割,并以满足理论线损校验计算为目标对所述任意分割进行调整,确定任意分割区域;
8.基于所述任意分割区域,识别各任意分割区域中异常线损数据的异常类型,并根据所述异常类型对所述异常线损数据进行修复。
9.优选的,所述利用局部异常因子算法从配电网所有节点中筛选含有异常线损数据的异常节点,包括:
10.获取配电网所有节点的数据;所述数据包括下述中的一种或多种:节点电压、电流和功率;
11.通过给每个数据都分配一个依赖于相邻区域密度的离群因子的离群程度值,计算每个数据周围数据点的平均密度与所述数据密度的比值;
12.根据每个数据周围数据点的平均密度与数据密度的比值,计算出每个配电网节点的局部异常因子;
13.根据所述局部异常因子确定含有异常线损数据的异常节点。
14.优选的,所述局部异常因子算法的计算式如下:
[0015][0016]
其中,lofk(e)为配电网节点e的局部异常因子,ρk(e)为配电网节点e的第k邻域的局部可达密度,ρk(fi)为第i天在k邻域的同期线损数据到配电网节点e的中心局部可达密度,nk(e)为配电网节点e的邻域,k为配电网节点的总数,fi为数据点第i天同期线损数据;
[0017]
所述局部可达密度的计算式如下:
[0018][0019]
其中,dk(e,fi)为配电网节点e到对应的第i天同期线损数据的距离与配电网节点的第k距离中最大的一个。
[0020]
优选的,所述根据所述局部异常因子确定含有异常线损数据的异常节点,包括:
[0021]
当所述局部异常因子在正常阈值范围外时,则将所述配电网节点数据所在的节点确定为异常节点。
[0022]
优选的,所述根据拓扑关系和节点之间的关系,对所述异常节点进行任意分割,并以满足理论线损校验计算为目标对所述任意分割进行调整,确定任意分割区域,包括:
[0023]
根据拓扑关系设置的指标和预设的目标,对所述异常节点进行任意分割区域初次划分,确定初次划分区域;
[0024]
对所述初次划分区域内的异常节点和邻近节点进行理论线损校验计算,确定任意分割的分割结果。
[0025]
优选的,所述根据拓扑关系设置的指标和预设的目标,对所述异常节点进行任意分割区域初次划分,确定初次划分区域,包括:
[0026]
根据站、线、变和户的拓扑关系设置指标;所述指标包括下述中的一种或多种:电压等级、配变数量和节点间线路长度;
[0027]
以区域内部节点之间连接线路的权值最大化和区域外部边界节点之间连接线路的权值最小化为预设的目标,并采用模块度的gn算法对异常节点进行划分,得到初始分区;
[0028]
基于所述初始分区的电压等级、配变数量和异常节点的异常线损数据,采用模糊c均值聚类算法进行聚类,确定初次划分区域。
[0029]
优选的,所述以区域内部节点之间连接线路的权值最大化和区域外部边界节点之间连接线路的权值最小化为预设的目标,并采用模块度的gn算法对异常节点进行划分,得到初始分区,包括:
[0030]
将所有异常节点初始化为各个独立区域;
[0031]
分别计算每个区域的模块度,通过所述模块度判断各个区域是否存在可合并成新
区域的待合并区域;当存在所述待合并区域时,则合并所述待合并区域,直到模块度达到最大,得到满足所述目标的初始分区。
[0032]
优选的,所述模块度的计算公式如下:
[0033][0034][0035]
其中,c表示初始分区,p为配电网所有节点组成的网络中各区域内节点的集合;kb为节点b的度,表示与点b相连的所有边的权重之和;m为网络中所有边的权重之和,m为模块度,且取值范围为(-1,1);k
ab
为节点a与节点b连接线路的权值,ce为各个区域的集合,p
a,b
为属于同区域c的节点a和b;δ(z,o)是以z与o为输入的克罗内克函数表达式,表示若节点z、o属于同个区域,则取1,否则为0;
[0036]
所述节点i与节点j连接线路的权值的计算式如下:
[0037][0038]
其中,k
ab
为节点a、b连接线路的权值,k
ab
的权值取决于连接线路的长度,节点a、b相距越远,边权重越小;l
ab
代表节点a、b之间线路长度,l1为设定的线路长度的第一阈值,l2为设定的线路长度的第二阈值,l
*
为连接线路的中间权值,且0<l
*
<1。
[0039]
优选的,所述模糊c均值聚类算法的模型如下:
[0040][0041][0042]
maxx
pq
{|u
pq(t)-u
pq(t 1)
|}<ε
[0043]
其中,ξ指隶属矩阵,u
pq
为第p个台区配变x
p
属于第q类的隶属度值;台区是指台变供电的区域范围;s为配变数量,q为电压等级的类别,x
p
表示第p个台区配变;v为聚类中心矩阵,且v=[v1,v2,...,vs],v1为第1簇的类中心,v2为第2簇的类中心,vs为第s簇的类中心;r为加权系数,d
pq
=||x
p-vq||指台区配变x
p
到类中心vq的欧氏距离,t为迭代步数,ε为误差
阈值;
[0044]
所述隶属度值的计算式如下:
[0045][0046][0047]
其中,w为配变数据类型维度,v
l
表示第l簇的中心,l为变量,且1≤l≤n。
[0048]
优选的,所述对所述初次划分区域内的异常节点和邻近节点进行理论线损校验计算,确定任意分割的分割结果,包括:
[0049]
根据所述划分区域内的异常节点和邻近节点进行理论线损校验计算,得到理论线损值;
[0050]
计算所述理论线损值和同期值的差值;
[0051]
当所述差值不在预设的阈值范围内时,将所述线损数据划分为异常线损数据。
[0052]
优选的,所述理论线损校验计算的计算式如下:
[0053][0054]
其中,δay为理论线损值,u为结构系数;g为均方根电流与平均电流之比,t为运行时长,d为每月的天数,d1为每天理论运行的小时数,δa
dbα
为第α类电能表月损耗,δa为第α类电能表的个数,r
eq
为线路等值电阻,i
av
为平均电流;
[0055]
所述线路等值电阻的计算式如下:
[0056][0057]
其中,u
β
为第β段线路的结构系数;q
β
为第β段线路的用户电能表的抄见电量之和;r
β
为第β段线路的电阻;θ为用户电能表个数;为线路总段数,g
γ
为第γ个用户电能表的抄见电量。
[0058]
优选的,所述基于所述任意分割区域,识别各任意分割区域中异常线损数据的异常类型,并根据所述异常类型对所述异常线损数据进行修复,包括:
[0059]
通过检查异常线损数据的类型,并对所述类型进行标记,建立训练样本集;
[0060]
根据所述训练样本集,采用k-means聚类进行异常线损数据类型分类,确定所述异常线损数据的异常类型;
[0061]
根据所述异常类型对异常线损数据进行修复;
[0062]
其中,所述异常类型至少包括下述的一种或者多种:异常、冗余和失真;
[0063]
所述修复至少包括下述的一种或多种:纠错、冗余数据融合和修补。
[0064]
优选的,所述根据所述异常类型对异常线损数据进行修复,包括:
[0065]
当所述异常类型为异常时,则通过拉格朗日缺失数据插值法进行纠错;
[0066]
当所述异常类型为冗余时,则通过卡尔曼滤波进行冗余数据融合;
[0067]
当所述异常类型为失真时,则通过随机森林算法进行修补。
[0068]
优选的,所述通过拉格朗日缺失数据插值法进行纠错,包括:
[0069]
将异常节点的配电变压器作为异常对象,根据检测到的异常对象在预设的缺失时间和缺失剩余时间的异常数据,构建拉格朗日插值函数;通过所述拉格朗日插值函数计算出缺失时刻的异常数据;
[0070]
所述异常数据技术领域至少包括下述的一种或多种:配变电压、有功功率和无功功率。
[0071]
优选的,所述通过卡尔曼滤波进行冗余数据融合,包括:
[0072]
以异常节点的配电变压器作为冗余对象,检测所述冗余对象的异常数据的冗余量测值;
[0073]
通过卡尔曼滤波方法对量测的冗余对象的异常数据进行滤波处理,得到滤波后的数据估计值;
[0074]
将所述滤波数据估计值按照量测协方差分配权重,并进行数据融合,得到融合后的异常数据的融合数据估计值。
[0075]
优选的,所述通过随机森林算法进行修补,包括:
[0076]
以异常节点的配电变压器作为失真对象,检测所述失真对象在预设时间的异常数据的缺失量测值;
[0077]
将所述失真对象在预设时间外的异常数据分为训练集和测试集,根据所述训练集确定对应的cart决策树;
[0078]
通过将所述测试集带入到预设的随机森林模型,确定所述cart决策树的根、节点和权重信息,并对所述预设时间的数据进行预测。
[0079]
本发明还提出一种基于任意分割异常线损数据修复系统,包括:
[0080]
异常节点模块:用于利用局部异常因子算法从配电网所有节点中筛选含有异常线损数据的异常节点;
[0081]
分割模块:用于根据拓扑关系和节点之间的关系,对所述异常节点进行任意分割;并以满足理论线损校验计算为目标对所述任意分割进行调整,确定任意分割区域;
[0082]
修复模块:用于基于所述任意分割区域,识别各任意分割区域中异常线损数据的异常类型,并根据所述异常类型对所述异常线损数据进行修复。
[0083]
优选的,所述异常节点模块具体用于:
[0084]
获取配电网所有节点的数据;所述数据包括下述中的一种或多种:节点电压、电流和功率;
[0085]
通过给每个数据都分配一个依赖于相邻区域密度的离群因子的离群程度值,计算每个数据周围数据点的平均密度与所述数据密度的比值;
[0086]
根据每个数据周围数据点的平均密度与数据密度的比值,计算出每个配电网节点的局部异常因子;
[0087]
根据所述局部异常因子确定含有异常线损数据的异常节点。
[0088]
优选的,所述异常节点模块中局部异常因子算法的计算式如下:
[0089][0090]
其中,lofk(e)为配电网节点e的局部异常因子,ρk(e)为配电网节点e的第k邻域的局部可达密度,ρk(fi)为第i天在k邻域的同期线损数据到配电网节点e的中心局部可达密度,nk(e)为配电网节点e的邻域,k为配电网节点的总数,fi为数据点第i天同期线损数据;
[0091]
所述局部可达密度的计算式如下:
[0092][0093]
其中,dk(e,fi)为配电网节点e到对应的第i天同期线损数据的距离与配电网节点的第k距离中最大的一个。
[0094]
优选的,所述异常节点模块中根据所述局部异常因子确定含有异常线损数据的异常节点,包括:
[0095]
当所述局部异常因子在正常阈值范围外时,则将所述配电网节点数据所在的节点确定为异常节点。
[0096]
优选的,所述分割模块具体用于:
[0097]
根据拓扑关系设置的指标和预设的目标,对所述异常节点进行任意分割区域初次划分,确定初次划分区域;
[0098]
对所述初次划分区域内的异常节点和邻近节点进行理论线损校验计算,确定任意分割的分割结果。
[0099]
优选的,所述分割模块中根据拓扑关系设置的指标和预设的目标,对所述异常节点进行任意分割区域初次划分,确定初次划分区域,包括:
[0100]
根据站、线、变和户的拓扑关系设置指标;所述指标包括下述中的一种或多种:电压等级、配变数量和节点间线路长度;
[0101]
以区域内部节点之间连接线路的权值最大化和区域外部边界节点之间连接线路的权值最小化为预设的目标,并采用模块度的gn算法对异常节点进行划分,得到初始分区;
[0102]
基于所述初始分区的电压等级、配变数量和异常节点的异常线损数据,采用模糊c均值聚类算法进行聚类,确定初次划分区域。
[0103]
优选的,所述分割模块中以区域内部节点之间连接线路的权值最大化和区域外部边界节点之间连接线路的权值最小化为预设的目标,并采用模块度的gn算法对异常节点进行划分,得到初始分区,包括:
[0104]
将所有异常节点初始化为各个独立区域;分别计算每个区域的模块度,通过所述模块度判断各个区域是否存在可合并成新区域的待合并区域;当存在所述待合并区域时,则合并所述待合并区域,直到模块度达到最大,得到满足所述目标的初始分区。
[0105]
优选的,所述分割模块中模块度的计算公式如下:
[0106]
[0107][0108]
其中,c表示初始分区,p为配电网所有节点组成的网络中各区域内节点的集合;kb为节点b的度,表示与点b相连的所有边的权重之和;m为网络中所有边的权重之和,m为模块度,且取值范围为(-1,1);k
ab
为节点a与节点b连接线路的权值,ce为各个区域的集合,p
a,b
为属于同区域c的节点a和b;δ(z,o)是以z与o为输入的克罗内克函数表达式,表示若节点z、o属于同个区域,则取1,否则为0;
[0109]
所述节点i与节点j连接线路的权值的计算式如下:
[0110][0111]
其中,k
ab
为节点a、b连接线路的权值,k
ab
的权值取决于连接线路的长度,节点a、b相距越远,边权重越小;l
ab
代表节点a、b之间线路长度,l1为设定的线路长度的第一阈值,l2为设定的线路长度的第二阈值,l
*
为连接线路的中间权值,且0<l
*
<1。
[0112]
优选的,所述分割模块中模糊c均值聚类算法的模型如下:
[0113][0114][0115]
maxx
pq
{|u
pq(t)-u
pq(t 1)
|}<ε
[0116]
其中,ξ指隶属矩阵,u
pq
为第p个台区配变x
p
属于第q类的隶属度值;台区是指台变供电的区域范围;s为配变数量,q为电压等级的类别,x
p
表示第p个台区配变;v为聚类中心矩阵,且v=[v1,v2,...,vs],v1为第1簇的类中心,v2为第2簇的类中心,vs为第s簇的类中心;r为加权系数,d
pq
=||x
p-vq||指台区配变x
p
到类中心vq的欧氏距离,t为迭代步数,ε为误差阈值;
[0117]
所述隶属度值的计算式如下:
[0118]
[0119][0120]
其中,w为配变数据类型维度,v
l
表示第l簇的中心,l为变量,且1≤l≤n。
[0121]
优选的,所述分割模块中对所述初次划分区域内的异常节点和邻近节点进行理论线损校验计算,确定任意分割的分割结果,包括:
[0122]
根据所述划分区域内的异常节点和邻近节点进行理论线损校验计算,得到理论线损值;
[0123]
计算所述理论线损值和同期值的差值;
[0124]
当所述差值不在预设的阈值范围内时,将所述线损数据划分为异常线损数据。
[0125]
优选的,所述分割模块中理论线损校验计算的计算式如下:
[0126][0127]
其中,δay为理论线损值,u为结构系数;g为均方根电流与平均电流之比,t为运行时长,d为每月的天数,d1为每天理论运行的小时数,δa
dbα
为第α类电能表月损耗,δ
α
为第α类电能表的个数,r
eq
为线路等值电阻,i
av
为平均电流;
[0128]
所述线路等值电阻的计算式如下:
[0129][0130]
其中,u
β
为第β段线路的结构系数;q
β
为第β段线路的用户电能表的抄见电量之和;r
β
为第β段线路的电阻;θ为用户电能表个数;为线路总段数,g
γ
为第γ个用户电能表的抄见电量。
[0131]
优选的,所述修复模块具体用于:
[0132]
通过检查异常线损数据的类型,并对所述类型进行标记,建立训练样本集;
[0133]
根据所述训练样本集,采用k-means聚类进行异常线损数据类型分类,确定所述异常线损数据的异常类型;
[0134]
根据所述异常类型对异常线损数据进行修复;
[0135]
其中,所述异常类型至少包括下述的一种或者多种:异常、冗余和失真;
[0136]
所述修复至少包括下述的一种或多种:纠错、冗余数据融合和修补。
[0137]
优选的,所述修复模块中根据所述异常类型对异常线损数据进行修复,包括:
[0138]
当所述异常类型为异常时,则通过拉格朗日缺失数据插值法进行纠错;
[0139]
当所述异常类型为冗余时,则通过卡尔曼滤波进行冗余数据融合;
[0140]
当所述异常类型为失真时,则通过随机森林算法进行修补。
[0141]
优选的,所述修复模块中通过拉格朗日缺失数据插值法进行纠错,包括:
[0142]
将异常节点的配电变压器作为异常对象,根据检测到的异常对象在预设的缺失时间和缺失剩余时间的异常数据,构建拉格朗日插值函数;通过所述拉格朗日插值函数计算出缺失时刻的异常数据;
[0143]
所述异常数据技术领域至少包括下述的一种或多种:配变电压、有功功率和无功
功率。
[0144]
优选的,所述修复模块中通过卡尔曼滤波进行冗余数据融合,包括:
[0145]
以异常节点的配电变压器作为冗余对象,检测所述冗余对象的异常数据的冗余量测值;
[0146]
通过卡尔曼滤波方法对量测的冗余对象的异常数据进行滤波处理,得到滤波后的数据估计值;
[0147]
将所述滤波数据估计值按照量测协方差分配权重,并进行数据融合,得到融合后的异常数据的融合数据估计值。
[0148]
优选的,所述修复模块中通过随机森林算法进行修补,包括:
[0149]
以异常节点的配电变压器作为失真对象,检测所述失真对象在预设时间的异常数据的缺失量测值;
[0150]
将所述失真对象在预设时间外的异常数据分为训练集和测试集,根据所述训练集确定对应的cart决策树;
[0151]
通过将所述测试集带入到预设的随机森林模型,确定所述cart决策树的根、节点和权重信息,并对所述预设时间的数据进行预测。
[0152]
本发明还提出一种计算机设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;
[0153]
当所述一个或多个程序被所述一个或多个处理器执行时,实现如上述的一种基于任意分割异常线损数据修复方法。
[0154]
本发明还提出一种计算机可读存储介质,其上存有计算机程序,所述计算机程序被执行时,实现如上述的一种基于任意分割异常线损数据修复方法。
[0155]
与最接近的现有技术相比,本发明具有的有益效果如下:
[0156]
本发明提供了一种基于任意分割异常线损数据修复方法、系统、设备及介质,包括:利用局部异常因子算法从配电网所有节点中筛选含有异常线损数据的异常节点;根据拓扑关系和节点之间的关系,对所述异常节点进行任意分割,并以满足理论线损校验计算为目标对所述任意分割进行调整,确定任意分割区域;基于所述任意分割区域,识别各任意分割区域中异常线损数据的异常类型,并根据所述异常类型对所述异常线损数据进行修复。本发明基于配电网拓扑结构对节点配变进行任意分割,并基于任意分割区域对异常数据按异常类型进行快速修复,实现了对配网失真数据类型的差异化处理,提高对异常线损的识别精度,保证线损数据的一致性、完整性及有效性。
附图说明
[0157]
图1为本发明提供的一种基于任意分割异常线损数据修复方法流程示意图;
[0158]
图2为本发明提供的一种基于任意分割异常线损数据修复方法中具体示例的流程图;
[0159]
图3为本发明提供的一种基于任意分割异常线损数据修复系统的功能图。
具体实施方式
[0160]
下面结合附图对本发明的具体实施方式做进一步的详细说明。
[0161]
实施例1:
[0162]
本发明提供一种基于任意分割异常线损数据修复方法,如图1所示,包括:
[0163]
步骤1:利用局部异常因子算法从配电网所有节点中筛选含有异常线损数据的异常节点;
[0164]
步骤2:根据拓扑关系和节点之间的关系,对所述异常节点进行任意分割,并以满足理论线损校验计算为目标对所述任意分割进行调整,确定任意分割区域;
[0165]
步骤3:基于所述任意分割区域,识别各任意分割区域中异常线损数据的异常类型,并根据所述异常类型对所述异常线损数据进行修复。
[0166]
具体的,如图2所示,首先遍历电网所有节点配变,计算出各节点数据的lofk(e)值,当lofk(e)远大于1时,则初步定位异常节点,采用gn社区算法和模糊c均值聚类算法实现“任意分割”初步划分,再进行理论线损校验计算,得到任意分割最终划分结果,然后对异常线损数据基于标签训练样本集的k-means聚类,最后根据异常线损数据的数据类型进行修复;
[0167]
具体的,步骤1通过给每个数据都分配一个依赖于相邻区域密度的离群因子的离群程度值,计算每个数据周围数据点的平均密度与改数据密度的比值,通过判断局部异常因子数值来判断数据点是否为异常数据。数据点的局部可达密度ρk(e)和局部异常因子lofk(e)为:
[0168][0169][0170]
其中,lofk(e)为配电网节点e的局部异常因子,ρk(e)为配电网节点e的第k邻域的局部可达密度,ρk(fi)为第i天在k邻域的同期线损数据到配电网节点e的中心局部可达密度,nk(e)为配电网节点e的邻域,k为配电网节点的总数,fi为数据点第i天同期线损数据;dk(e,fi)为配电网节点e到对应的第i天同期线损数据的距离与配电网节点的第k距离中最大的一个。
[0171]
具体的,步骤2中基于模块度的gn社区发现算法,对各异常节点进行初步分区,将其划分为内部紧密联系、对外稀疏耦合的子区域,其判据相关定义如下:
[0172]
1.1模块度m的计算公式为:
[0173][0174]
[0175]
式中,c表示社区,p为网络中社区的集合,ca表示节点a所属的社区,cb表示节点b所属的社区,δ(ca,cb)是以ca与cb为输入的克罗内克函数,表示若节点a、b属于同个社区,则取1,否则为0;ka为节点a的度,表示与点a相连的所有边的权重之和,m为网络中所有边的权重之和,m为模块度,且取值范围为(-1,1);k
ab
为节点a与节点b连接线路的权值,ce为各个社区的集合,p
a,b
为属于同社区c的节点a和b;δ(z,o)为克罗内克函数表达式。
[0176]
1.2节点之间边的权重的设定依据:
[0177][0178]
式中,k
ab
为节点a、b连接线路的权值,k
ab
的权值取决于连接线路的长度,节点a、b相距越远,边权重越小;l
ab
代表节点a、b之间线路长度,l1为设定的线路长度的第一阈值,l2为设定的线路长度的第二阈值。
[0179]
1.3gn社区算法首先需对台区配变之间的连线删除,保证区域之间的连线先删除,区域内的连线最晚被删除。其次,将所有节点初始化为各个独立区域,再判断各个区域是否可合并成新区域,若模块度m增加则可行,最后多次迭代合并区域步骤,直到模块度m达到最大,停止区域合并,得到区域划分结果。
[0180]
具体的,步骤2基于gn社区算法划分结果,采用模糊c-均值聚类以各区域配变电压等级、配变数量和节点异常因素三个指标进行聚类,得到“任意分割”区域初次分割结果。
[0181]
2.1模糊c-均值聚类模型为:
[0182][0183][0184]
其中,ξ指隶属矩阵,u
pq
为第p个台区配变x
p
属于第q类的隶属度值;台区是指台变供电的区域范围;s为配变数量,q为电压等级的类别,x
p
表示第p个台区配变;v为聚类中心矩阵,且v=[v1,v2,...,vs],v1为第1簇的类中心,v2为第2簇的类中心,vs为第s簇的类中心;r为加权系数,d
pq
=||x
p-vq||指台区配变x
p
到类中心vq的欧氏距离。
[0185]
2.2隶属度值u
pq
与簇中心vq计算公式为:
[0186][0187]
[0188]
其中,w为配变数据类型维度,v
l
表示第l簇的中心,l为变量,且1≤l≤n。
[0189]
2.3终止条件为:
[0190]
maxx
pq
{|u
pq(t)-u
pq(t 1)
|}<ε
[0191]
式中,t为迭代步数,ε为误差阈值。
[0192]
具体的,步骤2中对划分区域内的异常节点和邻近节点进行理论线损校验计算,动态调整“任意分割”区域规模,理论线损校验计算原则如下:
[0193]
3.1等值电阻法对低压网线损理论计算式如下:
[0194][0195]
其中,δay为理论线损值,u为结构系数;g为均方根电流与平均电流之比,t为运行时长,d为每月的天数,d1为每天理论运行的小时数,δa
dbα
为第α类电能表月损耗,δa为第α类电能表的个数,r
eq
为线路等值电阻,i
av
为平均电流。
[0196]
3.2req即为线路等值电阻,其计算公式为
[0197][0198]
其中,u
β
为第β段线路的结构系数;q
β
为第β段线路的用户电能表的抄见电量之和;r
β
为第β段线路的电阻;θ为用户电能表个数;为线路总段数,g
γ
为第γ个用户电能表的抄见电量。
[0199]
通过对δay与同期值比较,判断差值是否超出阈值,若超出阈值则判定为异常数据,若没超出阈值,则判定为正常数据。
[0200]
具体的,步骤3中考虑线损数据异常、冗余、缺失等失真情况,采取基于标签训练样本集的k-means聚类的数学驱动模型,实现线损数据异常类型的快速定位;
[0201]
采取基于标签训练样本集的k-means聚类的数学驱动模型。在线损数据异常识别的早期阶段,没有足够的带标签的线损正常或异常样本数据集,馈线上各节点的标签是不可知的。为此,首先对于数据异常情况,电网工作人员需要对异常数据类型检查确认,并对线损数据的异常类型进行标记(异常、冗余或失真),建立含标签的训练样本集,再采用k-means聚类对数据类型进行分类。
[0202]
具体的,步骤3中对异常线损数据,按照异常类型分别采用拉格朗日插值法对异常数据进行纠错、采用卡尔曼滤波技术对冗余数据融合、采用随机森林算法对异常数据的修补,实现异常线损数据的快速修复;具体包括:
[0203]
4.1拉格朗日缺失数据插值
[0204]
假设在区间[a
*
,b
*
]上,存在一个函数f(x
*
)是连续可实现的,且已知y
i*
=f
*
(x
i*
),其中x
0*
,x
1*
,x
2*
,x
3*
,...,x
n*
为区间[a
*
,b
*
]上的部分数据点。假设f(x
*
)在区间[a
*
,b
*
]上有定义,x
0*
,x
1*
,x
2*
,x
3*
,...,x
n*
实在区间[a
*
,b
*
]上的n
*
1个互异节点,且这些点在函数f
*
(x
i*
)上的函数值y
0*
,y
1*
,y
2*
,y
3*
,...,x
n*
已知,存在函数p
*
(x
*
),满足如下公式:
[0205]
p
*
(x
i*
)=f
*
(x
i*
)i=0,1,2,...n
[0206]
p
*
(x
i*
)是函数f
*
(x
i*
)的插值函数,函数f
*
(x
i*
)表示被插值函数,区间[a
*
,b
*
]表示插值区间,x
0*
,x
1*
,x
2*
,x
3*
,...,x
n*
表示插值节点。
[0207]
插值算法指求解上述插值函数的算法。如果对固定点x
k*
求解在函数f
*
(x
k*
)上的数值解,x
k*
表示一个插值节点,称f(x
k*
)≈p(x
k*
)是在x
k*
点上的插值。如果插值节点x
k*
在区间[min(x
0*
,x
1*
,x
2*
,x
3*
,...,x
n*
,max(x
0*
,x
1*
,x
2*
,x
3*
,...,x
n*
]范围内,则称为内插值;如果插值节点x
k*
在区间[min(x
0*
,x
1*
,x
2*
,x
3*
,...,x
n*
),max(x
0*
,x
1*
,x
2*
,x
3*
,...,x
n*
)]范围外,则属于外插值。当利用插值法求解的p
*
(x
*
)的最高次数小于或者等于n时,具体表达式如下所示:
[0208]
p
*
(x
*
)=a0 a1x
*
.... a
n-1
x
*n-1
anx
*n
[0209]
4.2卡尔曼滤波冗余数据融合
[0210]
卡尔曼滤波过程具体可分为预测和校正两部分。预测部分可写为:
[0211][0212][0213]
式中:为k时刻先验状态估计量;为k一1时刻后验状态估计量;a上一状态到当前状态的状态转移矩阵;b为控制输入到当前状态的状态转移矩阵;uk为控制输入矩阵;为先验估计误差协方差矩阵;p
k-1
为后验估计误差协方差矩阵;q为过程噪声协方差矩阵。
[0214]
校正部分可写为:
[0215][0216][0217][0218]
式中:kk为卡尔曼增益矩阵;h为量测矩阵;r为量测噪声协方差;zk为k时刻量测量;i为单位矩阵。
[0219]
4.3随机森林失真数据修补
[0220]
原始训练样本集sk由两类数据构成:一类为sk中系统采集的时序数据,作为预测模型的输出:另一类为与之对应的m种关联因素的时序数据,作为预测模型的输入。利用bootstrap抽样方法从sk中随机选取w个训练样本子集s
k1
,s
k2
...,s
kw
(各子集都包含上述两类数据),用于构建w棵分类回归树(classification and regression tree,cart)。将w棵决策树的误差估计取平均,可得到随机森林的泛化误差估计值,并以此对预测模型的精度进行量化度量。
[0221]
对每一个训练样本子集,以gini系数最小为原则,采用cart算法生成一棵决策树,共生成w棵决策树,从而形成“森林”。在每一棵决策树构建时,从m种采集线损数据关联因素中随机选取f种作为随机特征变量,参与决策树节点分裂过程,其中f取小于等于log2(w 1)的最大正整数。此外,整个随机森林中决策树的棵数w需根据预测结果进行调整。
[0222]
当w棵cart决策树构建完成后,利用测试集数据进行仿真。将测试集中与用电量yk相关的关联因素数据xk作为输入,得到各决策树模型的预测结果序列{f
k1
(xk),f
k2
(xk),...,f
kw
(xk)}。基于随机森林算法的预测模型最终输出的预测结果采用投票方式产生:
[0223][0224]
式中:fk为面向群体gk的组合预测模型;f
ki
为单棵决策树预测模型;i为示性函数。将各群体的用电量预测模型fk进行线性组合,即可得到采集数据预测模型。
[0225]
实施例2:
[0226]
本发明提供一种基于任意分割异常线损数据修复系统,如图3所示,包括:
[0227]
异常节点模块:用于利用局部异常因子算法从配电网所有节点中筛选含有异常线损数据的异常节点;
[0228]
分割模块:用于根据拓扑关系和节点之间的关系,对所述异常节点进行任意分割;并以满足理论线损校验计算为目标对所述任意分割进行调整,确定任意分割区域;
[0229]
修复模块:用于基于所述任意分割区域,识别各任意分割区域中异常线损数据的异常类型,并根据所述异常类型对所述异常线损数据进行修复。
[0230]
具体的,异常节点模块具体用于:
[0231]
获取配电网所有节点的数据;所述数据包括下述中的一种或多种:节点电压、电流和功率;
[0232]
通过给每个数据都分配一个依赖于相邻区域密度的离群因子的离群程度值,计算每个数据周围数据点的平均密度与所述数据密度的比值;
[0233]
根据每个数据周围数据点的平均密度与数据密度的比值,计算出每个配电网节点的局部异常因子;
[0234]
根据所述局部异常因子确定含有异常线损数据的异常节点。
[0235]
具体的,异常节点模块中局部异常因子算法的计算式如下:
[0236][0237]
其中,lofk(e)为配电网节点e的局部异常因子,ρk(e)为配电网节点e的第k邻域的局部可达密度,ρk(fi)为第i天在k邻域的同期线损数据到配电网节点e的中心局部可达密度,nk(e)为配电网节点e的邻域,k为配电网节点的总数,fi为数据点第i天同期线损数据;
[0238]
所述局部可达密度的计算式如下:
[0239][0240]
其中,dk(e,fi)为配电网节点e到对应的第i天同期线损数据的距离与配电网节点的第k距离中最大的一个。
[0241]
具体的,异常节点模块中根据所述局部异常因子确定含有异常线损数据的异常节点,包括:
[0242]
当所述局部异常因子在正常阈值范围外时,则将所述配电网节点数据所在的节点确定为异常节点。
[0243]
具体的,分割模块具体用于:
[0244]
根据拓扑关系设置的指标和预设的目标,对所述异常节点进行任意分割区域初次划分,确定初次划分区域;
[0245]
对所述初次划分区域内的异常节点和邻近节点进行理论线损校验计算,确定任意分割的分割结果。
[0246]
具体的,分割模块中根据拓扑关系设置的指标和预设的目标,对所述异常节点进行任意分割区域初次划分,确定初次划分区域,包括:
[0247]
根据站、线、变和户的拓扑关系设置指标;所述指标包括下述中的一种或多种:电压等级、配变数量和节点间线路长度;
[0248]
以区域内部节点之间连接线路的权值最大化和区域外部边界节点之间连接线路的权值最小化为预设的目标,并采用模块度的gn算法对异常节点进行划分,得到初始分区;
[0249]
基于所述初始分区的电压等级、配变数量和异常节点的异常线损数据,采用模糊c均值聚类算法进行聚类,确定初次划分区域。
[0250]
具体的,分割模块中以区域内部节点之间连接线路的权值最大化和区域外部边界节点之间连接线路的权值最小化为预设的目标,并采用模块度的gn算法对异常节点进行划分,得到初始分区,包括:
[0251]
将所有异常节点初始化为各个独立区域;分别计算每个区域的模块度,通过所述模块度判断各个区域是否存在可合并成新区域的待合并区域;当存在所述待合并区域时,则合并所述待合并区域,直到模块度达到最大,得到满足所述目标的初始分区。
[0252]
具体的,分割模块中模块度的计算公式如下:
[0253][0254][0255]
其中,c表示初始分区,p为配电网所有节点组成的网络中各区域内节点的集合;kb为节点b的度,表示与点b相连的所有边的权重之和;m为网络中所有边的权重之和,m为模块度,且取值范围为(-1,1);k
ab
为节点a与节点b连接线路的权值,ce为各个区域的集合,p
a,b
为属于同区域c的节点a和b;δ(z,o)是以z与o为输入的克罗内克函数表达式,表示若节点z、o属于同个区域,则取1,否则为0;
[0256]
所述节点i与节点j连接线路的权值的计算式如下:
[0257][0258]
其中,k
ab
为节点a、b连接线路的权值,k
ab
的权值取决于连接线路的长度,节点a、b相距越远,边权重越小;l
ab
代表节点a、b之间线路长度,l1为设定的线路长度的第一阈值,l2为设定的线路长度的第二阈值,l
*
为连接线路的中间权值,且0<l
*
<1。
[0259]
具体的,分割模块中模糊c均值聚类算法的模型如下:
[0260][0261][0262]
max x
pq
{|u
pq(t)-u
pq(t 1)
|}<ε
[0263]
其中,ξ指隶属矩阵,u
pq
为第p个台区配变x
p
属于第q类的隶属度值;台区是指台变供电的区域范围;s为配变数量,q为电压等级的类别,x
p
表示第p个台区配变;v为聚类中心矩阵,且v=[v1,v2,...,vs],v1为第1簇的类中心,v2为第2簇的类中心,vs为第s簇的类中心;r为加权系数,d
pq
=||x
p-vq||指台区配变x
p
到类中心vq的欧氏距离,t为迭代步数,ε为误差阈值;
[0264]
所述隶属度值的计算式如下:
[0265][0266][0267]
其中,w为配变数据类型维度,v
l
表示第l簇的中心,l为变量,且1≤l≤n。
[0268]
具体的,分割模块中对所述初次划分区域内的异常节点和邻近节点进行理论线损校验计算,确定任意分割的分割结果,包括:
[0269]
根据所述划分区域内的异常节点和邻近节点进行理论线损校验计算,得到理论线损值;
[0270]
计算所述理论线损值和同期值的差值;
[0271]
当所述差值不在预设的阈值范围内时,将所述线损数据划分为异常线损数据。
[0272]
具体的,分割模块中理论线损校验计算的计算式如下:
[0273][0274]
其中,δay为理论线损值,u为结构系数;9为均方根电流与平均电流之比,t为运行时长,d为每月的天数,d1为每天理论运行的小时数,δa
dbα
为第α类电能表月损耗,δa为第α类电能表的个数,r
eq
为线路等值电阻,i
av
为平均电流;
[0275]
所述线路等值电阻的计算式如下:
[0276][0277]
其中,u
β
为第β段线路的结构系数;q
β
为第β段线路的用户电能表的抄见电量之和;r
β
为第β段线路的电阻;θ为用户电能表个数;为线路总段数,g
γ
为第γ个用户电能表的抄见电量。
[0278]
具体的,修复模块具体用于:
[0279]
通过检查异常线损数据的类型,并对所述类型进行标记,建立训练样本集;
[0280]
根据所述训练样本集,采用k-means聚类进行异常线损数据类型分类,确定所述异常线损数据的异常类型;
[0281]
根据所述异常类型对异常线损数据进行修复;
[0282]
其中,所述异常类型至少包括下述的一种或者多种:异常、冗余和失真;
[0283]
所述修复至少包括下述的一种或多种:纠错、冗余数据融合和修补。
[0284]
具体的,修复模块中根据所述异常类型对异常线损数据进行修复,包括:
[0285]
当所述异常类型为异常时,则通过拉格朗日缺失数据插值法进行纠错;
[0286]
当所述异常类型为冗余时,则通过卡尔曼滤波进行冗余数据融合;
[0287]
当所述异常类型为失真时,则通过随机森林算法进行修补。
[0288]
具体的,修复模块中通过拉格朗日缺失数据插值法进行纠错,包括:
[0289]
将异常节点的配电变压器作为异常对象,根据检测到的异常对象在预设的缺失时间和缺失剩余时间的异常数据,构建拉格朗日插值函数;通过所述拉格朗日插值函数计算出缺失时刻的异常数据;
[0290]
所述异常数据技术领域至少包括下述的一种或多种:配变电压、有功功率和无功功率。
[0291]
具体的,修复模块中通过卡尔曼滤波进行冗余数据融合,包括:
[0292]
以异常节点的配电变压器作为冗余对象,检测所述冗余对象的异常数据的冗余量测值;
[0293]
通过卡尔曼滤波方法对量测的冗余对象的异常数据进行滤波处理,得到滤波后的数据估计值;
[0294]
将所述滤波数据估计值按照量测协方差分配权重,并进行数据融合,得到融合后的异常数据的融合数据估计值。
[0295]
具体的,修复模块中通过随机森林算法进行修补,包括:
[0296]
以异常节点的配电变压器作为失真对象,检测所述失真对象在预设时间的异常数据的缺失量测值;
[0297]
将所述失真对象在预设时间外的异常数据分为训练集和测试集,根据所述训练集确定对应的cart决策树;
[0298]
通过将所述测试集带入到预设的随机森林模型,确定所述cart决策树的根、节点和权重信息,并对所述预设时间的数据进行预测。
[0299]
实施例3:
[0300]
基于同一种发明构思,本发明还提供了一种计算机设备,该计算机设备包括处理
器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor、dsp)、专用集成电路(application specificintegrated circuit,asic)、现成可编程门阵列(field-programmable gatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行计算机存储介质内一条或一条以上指令从而实现相应方法流程或相应功能,以实现上述实施例中一种基于任意分割异常线损数据修复方法的步骤。
[0301]
实施例4:
[0302]
基于同一种发明构思,本发明还提供了一种存储介质,具体为计算机可读存储介质(memory),所述计算机可读存储介质是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质,当然也可以包括计算机设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速ram存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中一种基于任意分割异常线损数据修复方法的步骤。
[0303]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0304]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0305]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0306]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0307]
最后应当说明的是:以上实施例仅用于说明本发明的技术方案而非对其保护范围的限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:本领域技术人员阅读本发明后依然可对申请的具体实施方式进行种种变更、修改或者等同替换,但这些变更、修改或者等同替换,均在申请待批的权利要求保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献