一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种电表数据重构方法及装置与流程

2022-03-16 03:23:59 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其涉及一种电表数据重构方法及装置。


背景技术:

2.完整的电表数据是实现高精度的电表运行状态评估的重要基础。但在实际运行环境中,电表数据在测量、通信、存储等过程均可能收到设备故障、人为干扰等因素的影响,导致出现数据缺失的情况,缺失位置和数量均有可能导致电表数据不能反映电力系统的真实状态。因此,对电表缺失数据进行重构对于实现数字电网具有重要意义。


技术实现要素:

3.本发明实施例提供一种电表数据重构方法及装置,其能对电表的缺失数据进行重构,且重构精度高。
4.本发明实施例提供一种电表数据重构方法,包括:
5.获取含有缺失值的台区电表数据集,并根据所述台区电表数据集每一样本的缺失机制和缺失模式,筛选出待重构数据集;其中,所述待重构数据集包括多个待重构样本,所述台区电表包括总表和至少一个分表;
6.采用预设的下层循环回归重构算法,基于所述待重构数据集对缺失值进行上层重构,得到下层重构结果,并将所述待重构数据集的缺失值替换为所述下层重构结果,得到下层重构数据集;
7.采用预设的上层循环回归重构算法,基于所述下层重构数据集对所述缺失值进行下层重构,得到所述缺失值的双层重构结果;
8.根据能量守恒定律的电表误差求解方程,确定所述缺失值的上下界,并根据所述缺失值的双层重构结果与上下界的比较结果,得到所述缺失值的上下界重构结果;
9.当所述缺失值的上下界重构结果满足预设突变条件时,根据预设的突变处理机制对满足预设突变条件的上下界重构结果进行处理,得到所述缺失值的最终重构结果。
10.作为上述方案的改进,在根据能量守恒定律的电表误差求解方程,确定所述缺失值的上下界,并根据所述缺失值的双层重构结果与上下界的比较结果,得到所述缺失值的上下界重构结果之后,还包括:
11.当所述缺失值的上下界重构结果不满足预设突变条件时,将所述缺失值的上下界重构结果作为所述缺失值的最终重构结果。
12.作为上述方案的改进,所述下层循环回归重构算法具体包括:
13.从所述待重构数据集中筛选出含有缺失值的分表,得到至少一个下层待重构分表,并根据缺失值数量的比较结果,确定下层重构优先级;其中,缺失值数量最少的下层待重构分表的优先级最大;
14.根据下层重构优先级最大最先重构的原则,基于所述待重构数据集依次对每一下层待重构分表的缺失值进行重构,得到所述缺失值的初始下层重构结果,并将所述待重构
数据集的缺失值更新为所述初始下层重构结果,得到初始下层重构数据集;
15.当任一次下层重构得到的初始下层重构结果与上一次下层重构得到的初始下层重构结果的偏差在预设的范围内,将所述初始下层重构结果作为缺失值的下层重构结果,以及所述初始下层重构数据集作为下层重构数据集;否则,将所述待重构数据集更新为所述初始下层重构数据集,并返回所述根据下层重构优先级最大最先重构的原则,基于所述待重构数据集依次对每一下层待重构分表的缺失值进行重构的步骤。
16.作为上述方案的改进,所述根据下层重构优先级最大最先重构的原则,基于所述待重构数据集依次对每一下层待重构分表的缺失值进行重构,得到所述缺失值的初始下层重构结果,并将所述待重构数据集的缺失值更新为所述初始下层重构结果,得到初始下层重构数据集,具体包括:
17.选取下层重构优先级最大的下层待重构分表作为当前下层待重构分表;
18.将所述待重构数据集中的当前下层待重构分表数据替换为总表数据,得到第一状态数据集;
19.基于所述第一状态数据集对所述当前下层待重构分表的缺失值进行重构,得到初始下层重构结果,并将所述待重构数据集中的当前下层待重构分表的缺失值更新为所述初始下层重构结果,得到第二状态数据集;
20.当所有下层待重构分表的缺失值都发生更新,则将所述第二状态数据集作为初始下层重构数据集;否则,根据下层重构优先级指定下一个待重构分表作为当前下层待重构分表,并将所述待重构数据集更新为所述第二状态数据集,返回所述将所述待重构数据集中的当前下层待重构分表数据替换为总表数据,得到第一状态数据集的步骤。
21.作为上述方案的改进,所述上层循环回归重构算法为:
22.将含有缺失值的分表作为上层待重构分表,得到至少一个上层待重构分表;
23.根据缺失值数量的比较结果,确定上层重构优先级;其中,缺失值数量最少的上层待重构分表的优先级最大;
24.根据上层重构优先级最大最先重构的原则,基于所述下层重构数据集依次对每一所述上层待重构分表的缺失值进行重构,得到缺失值的上层重构结果,并将所述下层重构数据集的缺失值更新为所述上层重构结果,得到上层重构数据集;
25.当任一次上层重构得到的上层重构结果与上一次上层重构得到的上层重构结果的偏差在预设的范围内,将所述上层重构结果作为所述缺失值的双层重构结果;否则,更新所述下层重构数据集为上层重构数据集,并返回所述根据上层重构优先级最大最先重构的原则,基于所述下层重构数据集依次对每一所述上层待重构分表的缺失值进行重构的步骤。
26.作为上述方案的改进,所述根据上层重构优先级最大最先重构的原则,基于所述下层重构数据集依次对每一所述上层待重构分表的缺失值进行重构,得到缺失值的上层重构结果,并将所述下层重构数据集的缺失值更新为所述上层重构结果,得到上层重构数据集,具体包括:
27.选取上层重构优先级最大的分表作为当前上层待重构分表数据;
28.将所述下层重构结果中的当前上层待重构分表数据替换为总表数据,得到第三状态数据集;
29.将所述当前上层待重构分表的数据分为完整数据和缺失数据,并将完整数据作为训练集的标签、完整数据所对应的第三状态数据集数据部分作为训练集,和缺失数据所对应的第三状态数据集数据部分作为测试集;
30.将训练集输入到预先建立的机器学习模型中,得到训练后的重构网络;
31.将测试集输入到所述训练后的重构网络中,得到缺失值的上层重构结果,并将下层重构结果中的缺失值更新为所述上层重构结果,得到第四状态数据集;
32.当所有上层待重构分表的缺失值都发生更新,则将所述第四状态数据集作为上层重构结果;否则,根据上层重构优先级指定下一个待上层重构分表作为当前上层待重构分表,并将所述下层重构结果更新为所述第四状态数据集,返回所述将所述下层重构结果中的当前上层待重构分表数据替换为总表数据,得到第三状态数据集的步骤。
33.作为上述方案的改进,所述根据能量守恒定律的电表误差求解方程,确定所述缺失值的上下界,并根据所述缺失值的双层重构结果与上下界的比较结果,得到所述缺失值的上下界重构结果,具体包括:
34.基于能量守恒定律的电表误差求解方程,确定每一待重构样本的缺失值上界;
35.对于每一待重构样本的缺失值,根据所述缺失值的双层重构结果与对应的缺失值上界的第一比较结果,采用预设的且与所述第一比较结果对应的上界约束调整策略对所述缺失值的双层重构结果进行调整,得到缺失值的上界约束重构结果;
36.根据所述缺失值的上界约束重构结果与预设下界约束阈值的第二比较结果,得到与所述第二比较结果对应的缺失值的上下界重构结果。
37.作为上述方案的改进,所述上界约束调整策略为:
38.对于每一待重构样本的缺失值,当所述缺失值的双层重构结果大于对应的缺失值上界时,令所述缺失值的双层重构结果等于所述缺失值上界;
39.对于每一待重构样本的缺失值,当所述待重构样本中所有缺失值的双层重构结果之和大于等于对应的缺失值上界时,根据如下公式调整所述缺失值的双层重构结果,得到所述缺失值的上界约束重构结果;
[0040][0041]
其中,x'j为待重构样本中第j个缺失分表的缺失值的上界约束重构结果,xj为待重构样本中第j个缺失分表的缺失值的上层重构结果,b
up
为缺失值上界,η为预设损失系数,k为待重构样本中含缺失值的电表的数量。
[0042]
作为上述方案的改进,所述预设的突变条件为:所述缺失值所在位置最相邻的2r个同表数据中的最大值和最小值的差值大于预设突变阈值,其中,所述同表数据为所述缺失值所在表的数据,r》=1;
[0043]
则,所述当所述缺失值的上下界重构结果满足预设突变条件时,根据预设的突变处理机制对满足预设突变条件的上下界重构结果进行处理,得到所述缺失值的最终重构结果,具体包括:
[0044]
当所述缺失值所在位置最相邻的2r个同表数据中的最大值和最小值的差值大于预设突变阈值时,计算所述最相邻的2r个同表数据的平均值,将所述平均值作为所述缺失值的最终重构结果。
[0045]
本发明实施例还提供一种电表数据重构装置,包括:
[0046]
待重构数据集筛选模块,用于获取含有缺失值的台区电表数据集,并根据所述台区电表数据集每一样本的缺失机制和缺失模式,筛选出待重构数据集;其中,所述待重构数据集包括多个待重构样本,所述台区电表包括总表和至少一个分表;
[0047]
下层重构数据集获取模块,用于采用预设的下层循环回归重构算法,基于所述待重构数据集对缺失值进行上层重构,得到下层重构结果,并将所述待重构数据集的缺失值替换为所述下层重构结果,得到下层重构数据集;
[0048]
双层重构结果获取模块,用于采用预设的上层循环回归重构算法,基于所述下层重构数据集对所述缺失值进行下层重构,得到所述缺失值的双层重构结果;
[0049]
上下界重构结果获取模块,用于根据能量守恒定律的电表误差求解方程,确定所述缺失值的上下界,并根据所述缺失值的双层重构结果与上下界的比较结果,得到所述缺失值的上下界重构结果;
[0050]
最终重构结果获取模块,用于当所述缺失值的上下界重构结果满足预设突变条件时,根据预设的突变处理机制对满足预设突变条件的上下界重构结果进行处理,得到所述缺失值的最终重构结果。
[0051]
与现有技术相比,本发明实施例提供的电表数据重构方法,其通过获取含有缺失值的台区电表数据集,并根据数据集中样本的缺失机制和缺失模式,筛选出待重构数据集,并采用预设的下层循环回归重构算法和预设的上层循环回归重构算法对缺失值进行双层循环回归重构,得到双层重构结果,并根据能量守恒定律的电表误差求解方程,确定所述缺失值的上下界,以根据缺失值的双层重构结果与上下界的比较结果,得到所述缺失值的上下界重构结果,最后,在检测到所述缺失值的上下界重构结果满足预设突变条件时,根据预设的突变处理机制对满足预设突变条件的上下界重构结果进行处理,得到所述缺失值的最终重构结果。相比于现有的通过神经网络对缺失数据进行重构的方法,本发明不需要海量且完整的数据训练,即能对电表的缺失数据重构且重构精度较高。相应地,本发明实施例还提供一种电表数据重构装置。
附图说明
[0052]
图1是本发明实施例提供的电表数据重构方法的流程示意图;
[0053]
图2是本发明实施例提供的电表数据重构装置的结构框图。
具体实施方式
[0054]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0055]
参见图1,图1是本发明实施例提供的电表数据重构方法的流程示意图。
[0056]
本发明实施例提供的电表数据重构方法,包括步骤s11到步骤s15:
[0057]
步骤s11,获取含有缺失值的台区电表数据集,并根据所述台区电表数据集每一样本的缺失机制和缺失模式,筛选出待重构数据集;其中,所述待重构数据集包括多个待重构
样本,所述台区电表包括总表和至少一个分表。
[0058]
可以理解的是,由于电表数据在测量、通信、存储等过程均可能收到设备故障、人为干扰等因素的影响,导致出现数据缺失的情况,从而出现电表数据中出现缺失值的情况。
[0059]
具体的,在对含有缺失值的台区电表数据采集的过程中,可以以台区供电总表和各个用户用电分表为属性,以设定的数据统计频率所形成数据为样本进行采集。例如,采集频率为1天,那么1天内的总表和各分表数据构成1个样本。
[0060]
示例性的,所述台区电表数据集可以为如下表1的形式:
[0061]
表1
[0062][0063][0064]
其中,null表示缺失值,[a1,null,a3,a]为一个样本。
[0065]
示例性的,所述缺失机制可以按数据分布完整性分类,分为无偏缺失和有偏缺失,其中,无偏缺失是指含有缺失值的台区电表数据集与完整的台区电表数据集具有相同或相似的数据分布,有偏缺失是指含有缺失值的台区电表数据集与完整的台区电表数据集的数据分布相差较大;所述缺失模式可以按分表户变情况分类,分为户变缺失和非户变缺失;其中,户变缺失是指缺失值是由台区分表用户发生户变造成的,非户变缺失是指缺失值是由台区分表用户发生户变以外的原因造成的。
[0066]
则,所述待重构数据集指的是缺失机制为无偏缺失,且缺失模式为非户变缺失的样本分表数据。如上述表1,假设上述表1的缺失值都满足缺失机制为无偏缺失,且缺失模式为非户变缺失,则筛选出的筛选出待重构数据集可参见下表2:
[0067]
表2
[0068]
分表1分表2分表3a1nulla3b1nullb1nullc2c3
[0069]
其中,以上表2中待重构数据集为例,所述步骤s11中的待重构样本包括[a1,null,a3],[b1,null,b1],[null,c2,c3]。
[0070]
步骤s12,采用预设的下层循环回归重构算法,基于所述待重构数据集对缺失值进行上层重构,得到下层重构结果,并将所述待重构数据集的缺失值替换为所述下层重构结果,得到下层重构数据集。
[0071]
步骤s13,采用预设的上层循环回归重构算法,基于所述下层重构数据集对所述缺失值进行下层重构,得到所述缺失值的双层重构结果;
[0072]
步骤s14,根据能量守恒定律的电表误差求解方程,确定所述缺失值的上下界,并根据所述缺失值的双层重构结果与上下界的比较结果,得到所述缺失值的上下界重构结
果;
[0073]
步骤s15,当所述缺失值的上下界重构结果满足预设突变条件时,根据预设的突变处理机制对满足预设突变条件的上下界重构结果进行处理,得到所述缺失值的最终重构结果。
[0074]
在一种可选的实施方式中,所述步骤s12中的下层循环回归重构算法包括:
[0075]
s121,从所述待重构数据集中筛选出含有缺失值的分表,得到至少一个下层待重构分表,并根据缺失值数量的比较结果,确定下层重构优先级;其中,缺失值数量最少的下层待重构分表的优先级最大。
[0076]
具体的,假设有分表1、2、3、4,缺失值数量分别为0、4、1、2;则下层重构优先级为:分表3》分表4》分表2。
[0077]
s122,根据下层重构优先级最大最先重构的原则,基于所述待重构数据集依次对每一下层待重构分表的缺失值进行重构,得到所述缺失值的初始下层重构结果,并将所述待重构数据集的缺失值更新为所述初始下层重构结果,得到初始下层重构数据集。
[0078]
在本发明实施例中,可以利用具有线性关系挖掘优势的方法对每一下层待重构分表的缺失值进行下层循环回归重构,得到缺失值的下层重构结果。具体的,所述具有线性关系挖掘优势的方法主要是通过调整分表之间的权重或者利用分表内部的样本相似性或者分表间的样本相似性实现缺失数据重构,具体包括:分层均值填补法、期望最大化填补法、k最近邻填补法、热卡填充法、冷卡填充法、回归填充法、贝叶斯岭回归法等。这些方法一般操作简单、耗时短、结果稳定、可解释性强。
[0079]
在本发明实施例中,在待重构数据集的基础上,根据下层重构的优先级,依次对分表3、4、2进行下层循环回归重构,并采用预设的填补算法对缺失值进行重构,得到分表3的缺失值的初始下层重构结果、分表4的缺失值的初始下层重构结果和分表2的缺失值的初始下层重构结果,并在分表3、分表4和分表2的缺失值的初始下层重构结果的基础上,更新第一状态数据集,得到初始下层重构结果。
[0080]
s123,当任一次下层重构得到的初始下层重构结果与上一次下层重构得到的初始下层重构结果的偏差在预设的范围内,将所述初始下层重构结果作为缺失值的下层重构结果,以及所述初始下层重构数据集作为下层重构数据集;否则,将所述待重构数据集更新为所述初始下层重构数据集,并返回所述根据下层重构优先级最大最先重构的原则,基于所述待重构数据集依次对每一下层待重构分表的缺失值进行重构的步骤。
[0081]
示例性的,所述任一次下层重构得到的初始下层重构结果与上一次下层重构得到的初始下层重构结果的偏差在预设的范围内,是指:假设对分表3、4、2进行第一次下层重构得到的缺失值的初始下层重构结果分别为a3,a4,a2,第二次下层重构得到的初始下层重构结果分别为b3,b4,b2。则,当|a3-b3|在预设范围内,且|a4-b4|在预设的范围内时,且|a2-b2|在预设的范围内时,则认为分表3、4、2的缺失值收敛于一个更稳定且更优的下层重构结果,结束对分表3、4、2的下层循环回归重构过程,完成对缺失值的下层循环回归重构,获得下层重构数据集。而当|a4-b4|不在预设的范围内时,则将待重构数据集更新为初始下层重构数据集,例如,待重构数据集由[分表1数据、分表2数据、分表3数据、分表4数据]更新为[分表1数据、分表2数据(已重构一次)、分表3数据(已重构一次)、分表4数据(已重构一次)],重新返回所述步骤s122,根据待重构数据集[分表1数据、分表2数据(已重构一次)、分
表3数据(已重构一次)、分表4数据(已重构一次)],重新依次对分表3、4、2进行下层循环回归重构,直到存在任一次下层重构得到的初始下层重构结果与上一次下层重构得到的初始下层重构结果的偏差在预设的范围内。
[0082]
优选的,所述步骤s123具体包括:
[0083]
s1231,选取下层重构优先级最大的下层待重构分表作为当前下层待重构分表;
[0084]
s1232,将所述待重构数据集中的当前下层待重构分表数据替换为总表数据,得到第一状态数据集;
[0085]
s1233,基于所述第一状态数据集对所述当前下层待重构分表的缺失值进行重构,得到初始下层重构结果,并将所述第一状态数据集中的当前下层待重构分表的缺失值更新为所述初始下层重构结果,得到第二状态数据集;
[0086]
s1234,当所有下层待重构分表的缺失值都发生更新,则将所述第二状态数据集作为初始下层重构数据集;否则,根据下层重构优先级指定下一个待重构分表作为当前下层待重构分表,并将所述待重构数据集更新为所述第二状态数据集,返回所述将所述待重构数据集中的当前下层待重构分表数据替换为总表数据,得到第一状态数据集的步骤。
[0087]
示例性的,以待重构数据集为[分表1数据、分表2数据、分表3数据、分表4数据],下层待重构分表为分表3、2、4,其下层重构优先级为:分表3》分表4》分表2为例说明其详细的过程。
[0088]
s1231’,将分表3作为当前下层待重构分表;
[0089]
s1232’,将待重构数据集中的当前下层重构分表数据替换为总表数据,得到第一状态数据集为[分表1数据、分表2数据、总表数据、分表4数据];
[0090]
s1233’,利用第一状态数据集[分表1数据、分表2数据、总表数据、分表4数据]对分表3的每一个缺失值采用预设的填补算法进行重构,得到分表3中的每一个缺失值的初始下层重构结果,并更新得到第二状态数据集[分表1数据、分表2数据、分表3数据(已重构)、分表4数据];
[0091]
s1234’,指定分表4为当前下层待重构分表,更新原始待重构数据集为[分表1数据、分表2数据、分表3数据(已重构)、分表4数据],并基于该数据集并经过步骤s1232~s1233得到分表3的缺失值的初始下层重构结果,并更新得到第二状态数据集为[分表1数据、分表2数据、分表3数据(已重构)、分表4数据(已重构)];
[0092]
s1235’,指定分表2为当前下层待重构分表,并经过步骤s1232~s1233得到分表2的缺失值的初始下层重构结果,并更新得到第二状态数据集为[分表1数据、分表2数据(已重构)、分表3数据(已重构)、分表4数据(已重构)]。
[0093]
在一种可选的实施方式中,所述步骤s13中的上层循环回归重构算法包括s131~s134:
[0094]
s131,将含有缺失值的分表作为上层待重构分表,得到至少一个上层待重构分表;
[0095]
s132,根据缺失值数量的比较结果,确定上层重构优先级;其中,缺失值数量最少的上层待重构分表的优先级最大;
[0096]
s133,根据上层重构优先级最大最先重构的原则,基于所述下层重构数据集依次对每一所述上层待重构分表的缺失值进行重构,得到缺失值的上层重构结果,并将所述下层重构数据集的缺失值更新为所述上层重构结果,得到上层重构数据集;
[0097]
在具体实施时,在对所述上层待重构分表的缺失值进行重构时,可以利用具有非线性关系挖掘优势的方法对缺失值进行重构。其中,具有非线性关系挖掘优势的方法主要通过产生多个重构值并综合处理多个重构值来实现缺失数据重构,具体包括:聚类填补法(及其变形或改进方法)、集成学习方法(包括随机森林方法、极端随机树方法、gbrt、xgboost、lightboost、catboost等方法及其他变形或改进方法)、生成式对抗网络(及其变形或改进方法)、深度自动编码器(及其变形或改进方法)、神经网络方法(及其变形或改进方法)等。这些方法一般重构误差较小,但是需要大量调参、耗时长、计算成本高、结果多变、可解释性较差。
[0098]
值得说明的是,对比利用均值填补法、众数填补法或0值填补法对步骤12所述的待重构数据集进行重构而得到的重构结果,步骤s13所述的下层重构结果误差更小,能够为步骤s14所述的具有非线性关系挖掘优势的方法提供更优的初值,减少训练时间,降低重构误差,从而使得双层重构结果更接近实际值。
[0099]
s134,当任一次上层重构得到的上层重构结果与上一次上层重构得到的上层重构结果的偏差在预设的范围内,将所述上层重构结果作为所述缺失值的双层重构结果;否则,更新所述下层重构数据集为上层重构数据集,并返回所述根据上层重构优先级最大最先重构的原则,基于所述下层重构数据集依次对每一所述上层待重构分表的缺失值进行重构的步骤。
[0100]
进一步的,所述步骤s133包括s1331~s1336:
[0101]
s1331,选取上层重构优先级最大的分表作为当前上层待重构分表数据;
[0102]
s1332,将所述下层重构结果中的当前上层待重构分表数据替换为总表数据,得到第三状态数据集;
[0103]
s1333,将所述当前上层待重构分表的数据分为完整数据和缺失数据,并将完整数据作为训练集的标签、完整数据所对应的第三状态数据集数据部分作为训练集,和缺失数据所对应的第三状态数据集数据部分作为测试集;
[0104]
s1334,将训练集输入到预先建立的机器学习模型中,得到训练后的重构网络;
[0105]
s1335,将测试集输入到所述训练后的重构网络中,得到缺失值的上层重构结果,并将下层重构结果中的缺失值更新为所述上层重构结果,得到第四状态数据集;
[0106]
s1336,当所有上层待重构分表的缺失值都发生更新,则将所述第四状态数据集作为上层重构结果;否则,根据上层重构优先级指定下一个待上层重构分表作为当前上层待重构分表,返回所述将所述下层重构结果中的当前上层待重构分表数据替换为总表数据,得到第三状态数据集的步骤。
[0107]
示例性的,假设经过步骤s1331~s1332,得到第三状态数据集为如下表3的形式:
[0108]
表3
[0109]
分表1分表2总表分表4数据1.1数据2.1数据0.1数据4.1数据1.2数据2.2数据0.2(null)数据4.2数据1.3数据2.3数据0.3数据4.3
[0110]
其中,数据0.2(null)表示原来分表3中为缺少值(缺失数据),并替换为总表数据0.2。
[0111]
则,所述步骤s1333中,所述完整数据为[数据0.1,数据0.3],所述缺失数据所对应的第三状态数据集数据为[数据1.2,数据2.2,数据0.2,数据4.2],所述完整数据所对应的第三状态数据集数据为[数据1.1,数据2.1,数据0.1,数据4.1]和[数据1.3,数据2.3,数据0.3,数据4.3]。
[0112]
在一种可选的实施方式中,所述步骤s14“根据能量守恒定律的电表误差求解方程,确定所述缺失值的上下界,并根据所述缺失值的双层重构结果与上下界的比较结果,得到所述缺失值的上下界重构结果”,具体包括s141~s143:
[0113]
s141,基于能量守恒定律的电表误差求解方程,确定每一待重构样本的缺失值上界。
[0114]
在本发明实施例中,每一待重构样本都有其对应的能量守恒定律的电表误差求解方程。其中,
[0115]
所述能量守恒定律的电表误差求解方程具体为:
[0116][0117]
其中,该方程的所有变量都是指单个重构样本的,y为台区总表的电量(某个待重构样本的总表电量);n为台区分表的数量;k为台区中含缺失值的分表的数量;xi为台区中不含缺失值的分表的电量;xj为台区中含缺失值的分表的电量;eother为台区的其他损耗。
[0118]
则,由上述能量守恒定律的电表误差求解方程,可得到:
[0119][0120]
进而,对于待重构样本,其缺失分表的缺失值上界为:b
up
为待重构样本的缺失值上界。
[0121]
s142,对于每一待重构样本的缺失值,根据所述缺失值的双层重构结果与对应的缺失值上界的第一比较结果,采用预设的且与所述第一比较结果对应的上界约束调整策略对所述缺失值的双层重构结果进行调整,得到缺失值的上界约束重构结果;
[0122]
在一些实施方式中,所述上界约束调整策略包括:
[0123]
对于每一待重构样本的缺失值,当所述缺失值的双层重构结果大于对应的缺失值上界时,令所述缺失值的双层重构结果等于所述缺失值上界;即,当xj》b
up
,则将缺失值的双层重构结果调整为xj=b
up

[0124]
对于每一待重构样本的缺失值,当所述待重构样本中所有缺失值的双层重构结果之和大于等于对应的缺失值上界时,根据如下公式调整所述缺失值的双层重构结果,得到所述缺失值的上界约束重构结果;
[0125][0126]
其中,x'j为待重构样本中第j个缺失分表的缺失值的上界约束重构结果,xj为待重构样本中第j个缺失分表的缺失值的上层重构结果,b
up
为缺失值上界,η为预设损失系数,k为待重构样本中含缺失值的电表的数量。
[0127]
s143,根据所述缺失值的上界约束重构结果与预设下界约束阈值的第二比较结果,得到与所述第二比较结果对应的缺失值的上下界重构结果。
[0128]
在本发明实施例中,基于上界重构结果,为了防止重构值过小,当xj《b
up
/k
×
β,其中β为下界调整系数,则缺失值的双层重构结果调整为xj=b
up
/k,从而得到上下界重构结果;而当xj≥b
up
/k
×
β时,则不需要对缺失值的双层重构结果调整,使得上下界重构结果等于双层重构结果。
[0129]
在一种可选的实施方式中,所述步骤s15中的突变条件为:所述缺失值所在位置最相邻的2r个同表数据中的最大值和最小值的差值大于预设突变阈值,其中,所述同表数据为所述缺失值所在表的数据,r》=1;
[0130]
示例性的,若存在分表3的数据为[数据1,数据2,缺失值,数据4,数据5],则此时r=2,则同表数据为数据1、数据2、数据4、数据5;并进一步找到所述同表数据中的最大值和最小值分别为数据2和数据4,则,所述差值为数据2和数据4的差值;若存在分表3的数据为[缺失值,数据2,数据3,数据4,数据5],则同表数据为数据2、数据3、数据4、数据5。
[0131]
则,所述步骤s14“当所述缺失值的上下界重构结果满足预设突变条件时,根据预设的突变处理机制对满足预设突变条件的上下界重构结果进行处理,得到所述缺失值的最终重构结果”,具体包括:
[0132]
当所述缺失值所在位置最相邻的2r个同表数据中的最大值和最小值的差值大于预设突变阈值时,计算所述最相邻的2r个同表数据的平均值,将所述平均值作为所述缺失值的最终重构结果。
[0133]
在另一些实施方式中,所述方法还包括:当所述缺失值的上下界重构结果不满足预设突变条件时,将所述缺失值的上下界重构结果作为所述缺失值的最终重构结果。
[0134]
在本发明实施例中,引入了突变值处理机制,在检测到缺失值的双层重构结果满足预设突变条件时,如分表3的缺失值的同表数据为数据1、数据2、数据4、数据5,则取数据1、2、4、5的均值作为突变值的最终重构结果。可以理解的是,本发明实施例提出的突变值处理机制,能进一步提高重构精度。
[0135]
参见图2,图2是本发明实施例提供的电表数据重构装置的结构框图。本发明实施例提供的电表数据重构装置10,其用于执行上述实施例提供的电表数据重构方法的全部步骤和流程,包括:
[0136]
待重构数据集筛选模块11,用于获取含有缺失值的台区电表数据集,并根据所述台区电表数据集每一样本的缺失机制和缺失模式,筛选出待重构数据集;其中,所述待重构数据集包括多个待重构样本,所述台区电表包括总表和至少一个分表;
[0137]
下层重构数据集获取模块12,用于采用预设的下层循环回归重构算法,基于所述待重构数据集对缺失值进行上层重构,得到下层重构结果,并将所述待重构数据集的缺失值替换为所述下层重构结果,得到下层重构数据集;
[0138]
双层重构结果获取模块13,用于采用预设的上层循环回归重构算法,基于所述下层重构数据集对所述缺失值进行下层重构,得到所述缺失值的双层重构结果;
[0139]
上下界重构结果获取模块14,用于根据能量守恒定律的电表误差求解方程,确定所述缺失值的上下界,并根据所述缺失值的双层重构结果与上下界的比较结果,得到所述缺失值的上下界重构结果;
[0140]
最终重构结果获取模块15,用于当所述缺失值的上下界重构结果满足预设突变条件时,根据预设的突变处理机制对满足预设突变条件的上下界重构结果进行处理,得到所述缺失值的最终重构结果。
[0141]
需要说明的是,本发明实施例提供的一种电表数据重构装置用于执行上述实施例的一种电表数据重构方法的所有流程步骤,两者的工作原理和有益效果一一对应,这里不再作过多的赘述。
[0142]
本发明提供一种电表数据重构方法及装置,其通过获取含有缺失值的台区电表数据集,并根据数据集中样本的缺失机制和缺失模式,筛选出待重构数据集,并采用预设的下层循环回归重构算法和预设的上层循环回归重构算法对缺失值进行双层循环回归重构,得到双层重构结果,并结合台区的总表和分表的能量守恒关系,确定缺失电表的上下界及上下界重构结果,进一步提高重构精度,最后采用突变处理机制对得到上下界重构结果中的突变值处理,得到最终重构结果。相比于现有的通过神经网络对缺失数据进行重构的方法,本发明不需要海量且完整的数据训练,即能对电表的缺失数据重构且重构精度较高。
[0143]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献