一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种低压台区合理线损值测算方法、系统及计算机设备与流程

2022-05-21 11:01:37 来源:中国专利 TAG:


1.本发明属于电力技术领域,具体涉及一种基于大数据算法的低压台区合理线损测值算方法、系统及计算机设备。


背景技术:

2.在电力台区管理方面,线损率是电网经济运行管理水平和供电企业经济效益的综合反映,线损可以分为技术线损(理论线损)和管理线损。目前采用统一的线损率指标来评价台区线损,基本实现线损统筹管理。随着近年来线损管理水平提升,线损管理的精益化程度要求越来越高,由原有线损率值“一刀切”的评价方式改为“一台区一指标”新管理模式建设,科学指导降损。准确的理论线损计算为“一台区一指标”管理模式、制定降损措施提供重要依据。
3.台区线损受负载率、供电半径、三相不平衡度、用户数、负荷特性、末端电量占比、首端电压、网架结构、功率因素等影响,又由于台区供电方式多样、结构复杂,实际情况中往往无法获取准确的拓扑结构、线路参数以及运行数据,造成难以详细、精确计算低压电力网的电能损耗。


技术实现要素:

4.本发明提供一种低压台区合理线损值测算方法、系统及计算机设备,提取台区线损强相关原始数据,构建台区线损特征指标,对台区分类并分别构建相应的台区合理线损计算模型,从而准确计算台区理论线损,解决现有业务模式中存在的问题。
5.本发明方法所采取的技术方案为:低压台区合理线损值测算方法,包括以下步骤:
6.s1、获取原始数据,原始数据来源包括营销业务应用系统、用电信息采集系统、电网pms2.0系统和营销gis系统;
7.s2、对获取的原始数据进行预处理;
8.s3、根据预处理后的数据,对每个台区提取包括容量类基础指标、运行类指标、台区类别指标和电量类指标在内的多维度特征指标,构建台区线损潜在特征指标体系;
9.s4、根据所构建的台区线损潜在特征指标体系,计算各维度特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序;结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标;
10.s5、构建低压台区分类模型,基于台区上网电量占比、网架结构、供电半径和台区供电量四个指标,采用聚类算法对台区进行分类;
11.s6、分析各类台区的数据样本,筛选各类台区典型样本用于模型训练;
12.s7、针对每类台区,利用mlp神经网络算法,分别构建台区合理线损计算模型。
13.本发明系统所采取的技术方案如下:低压台区合理线损值测算系统,包括:
14.数据获取模块,用于获取原始数据,原始数据来源包括营销业务应用系统、用电信息采集系统、电网pms2.0系统和营销gis系统;
15.预处理模块,用于对获取的原始数据进行预处理;
16.指标体系构建模块,用于根据预处理后的数据,对每个台区提取包括容量类基础指标、运行类指标、台区类别指标和电量类指标在内的多维度特征指标,构建台区线损潜在特征指标体系;
17.特征指标筛选模块,用于根据所构建的台区线损潜在特征指标体系,计算各维度特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序;结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标;
18.台区分类模块,用于构建低压台区分类模型,基于台区上网电量占比、网架结构、供电半径和台区供电量四个指标,采用聚类算法对台区进行分类;
19.样本筛选模块,用于分析各类台区的数据样本,筛选各类台区典型样本用于模型训练;
20.线损计算模块,用于针对每类台区,利用mlp神经网络算法,分别构建台区合理线损计算模型。
21.本发明的计算机设备,包括存储器、处理器以及存储在存储器并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现本发明低压台区合理线损值测算方法。
22.本发明与现有技术相比,具有如下优点和有益效果:
23.本发明基于大数据算法,提取台区线损强相关原始数据,构建台区线损特征指标,通过em聚类算法实现台区分类,基于mlp神经网络算法分别对不同类型的台区构建相应的台区合理线损计算模型,从而准确计算台区理论线损,为“一台区一指标”管理模式、制定降损措施提供重要依据。
附图说明
24.图1为本发明实施例中低压台区合理线损值测算方法的流程示意图;
25.图2为本发明实施例中台区特征指标的重要性排序示意图;
26.图3为本发明实施例中采用无监督的em聚类算法将台区进行分类的结果示意图;
27.图4为本发明实施例中构建的mlp神经网络结构示意图;
28.图5为本发明实施例中mlp神经网络预测结果。
具体实施方式
29.下面将结合实施例及附图对本发明的技术方案做进一步详细的描述,但本发明的实施方式不限于此。
30.实施例1
31.如图1所示,本实施例低压台区合理线损值测算方法,其过程包括数据获取、数据分析及处理、构建台区线损特征指标、构建低压台区分类模型、筛选各类台区训练样本、构建台区合理线损计算模型等步骤,具体如下:
32.步骤1、数据获取:从营销业务应用系统、用电信息采集系统、电网pms2.0系统和营销gis系统等获取原始数据。其中,从营销业务应用系统中主要提取台区、电能表、电表箱、计量点等档案类数据;从用电信息采集系统中主要提取电量、电流、电压等采集数据;从电网pms2.0系统中主要提取线路、变压器等信息数据;从营销gis系统中主要提取表箱和变压
器坐标信息。
33.步骤1.1、营销业务应用系统的数据获取:获取台区档案信息,包括统计日期、单位编号、台区id、台区编号、台区名称、台区容量、安装地址等字段;获取电能表信息,包括电能表标识、资产编号、电能表条形码、计量点标识、供电单位编号、供电区域编码、用户编号、综合倍率等字段;获取表箱信息,包括表箱id、表箱资产编号等字段;获取计量点信息,包括计量点标识、用户标识、用户编号、台区标识、线路标识、抄表段编号、计量点分类、接线方式等字段。
34.步骤1.2、用电信息采集系统的数据获取:获取用户日电量明细数据,包括单位编号、用户编号、电量类型、示数类型、上次示数、本次示数、采集电量、估算电量等字段;获取用户日电压信息,包括计量点标识、供电单位、用户编号、电能表标识、a相电压、b相电压、c相电压等字段;获取台区考核表信息,包括台区标识、ct倍率、pt倍率、自身倍率、a相电压、b相电压、c相电压、a相电流、b相电流、c相电流、有功总功率、无功总功率等字段。
35.步骤1.3、pms2.0系统的数据获取:提取线路信息,包括低压线路id、线路名称、电系铭牌运行库id、设备编码、运行编号、变压器类型、所属变压器、所属地市、运维单位、维护班组、电压等级、运行状态、线路类型、线路总长度、架空线路长度、电缆线路长度等字段;提取变压器线路信息,包括柱上变压器id、电系铭牌运行库id、所属线路、所属杆塔、设备名称、运行编号、电压等级、运维单位、所属地市等字段。
36.步骤1.4、营销gis系统的数据获取:主要提取表箱经纬度空间坐标信息、变压器经纬度空间坐标信息。
37.步骤2、数据分析及处理:对获取的原始数据进行清洗等预处理,主要对数据完整性、一致性、唯一性、空值等方面进行检查。
38.步骤2.1、完整性和唯一性检查:对于档案类数据,首先对数据的完整性进行检查,例如对台区下的所有用户、表计和表箱档案信息进行完整性检查,若缺失记录进行档案数据补全;其次对台区、用户、表计和表箱进行唯一性检查,若出现重复记录,只取其中一条记录。
39.步骤2.2、一致性检查:根据每个变量的合理取值范围和相互关系检查数据是否合乎要求,剔除超出正常范围、逻辑上不合理或者相互矛盾的数据。对于数值型变量,统计变量分布情况,根据业务经验,判断正常值域范围,自动识别每个超出范围的变量值,对于超出范围的实例数据进行筛选排查。例如对于量测采集数据,存在少部分数据的跳变,甚至出现负值,对于这些异常值,直接用空值替换。
40.步骤2.3、空值检查:对于量测采集数据,由于数据采集频率较高,存在部分采集点丢失现象,由于采集类数据存在时间连续性,缺失数据与前后多个采样数据存在强相关性,所以对于数据缺失较少的记录,可以根据缺失数据的前后10个采样点的均值进行空值填充,对于缺失数据较多的记录,核查是否采集传输通讯出现故障,若是由于通讯原因造成的大量缺失数据,待通讯正常后重新传输数据即可。
41.步骤3、构建台区线损潜在特征指标体系:根据经步骤2预处理后的数据,对每个台区提取容量类基础指标、运行类指标、台区类别指标和电量类指标等多维度特征指标,构建台区线损潜在特征指标体系,各维度特征指标及指标描述如下表1所示。
42.表1 台区线损潜在特征指标
[0043][0044][0045]
令εi为三相不平衡度,本实施例采用百分制的形式,则运行类指标中的三相不平衡度的计算公式如下:
[0046][0047]
式中,i
max
是最大一相负荷电流,即三相负荷电流中的最大值;i
av
是三相负荷电流平均值,即a相、b相、c相负荷电流平均值。
[0048]
令台区总表均方根电流i
rms
与三相负荷电流平均值i
av
的等效关系为k,并将等效关系k作为运行类指标中的负荷形状系数,则负荷形状系数的计算公式如下:
[0049][0050]
式中,t是计算周期所确定的电流测点数,i为测点电流序号;ii为第i个测点的电流。
[0051]
将台区类别指标中的供电半径定义为最远表箱到变压器的空间坐标距离,则供电半径的计算公式为:假设最远表箱、变压器这两点的经纬度(即空间坐标)分别为(lon1,lat1)、(lon2,lat2),则供电半径(即最远表箱、变压器两点间的距离)vd计算公式如下:
[0052][0053]
式中,vh为过地球中心最大圆切面弧度,vd为最远表箱、变压器之间的空间坐标距离。
[0054]
步骤4、筛选台区线损特征指标
[0055]
根据步骤3构建的台区线损潜在特征指标体系,计算各维度特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序,如图2所示;结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标,并作为后期模型的输入量。
[0056]
互信息是信息论里的信息度量,是两个随机变量x、y之间共享的信息,互信息越大表明变量x和变量y的相关性越高。互信息也可以表示为由于变量x的引入而使变量y的不确定度减少的量,减少的量越大说明变量x更有利于对变量y的确定。互信息i(x;y)是联合分布p(x,y)与边缘分布p(x)p(y)的相对熵,即:
[0057][0058]
本实施例利用python工具中的sklearn.feature_selection库,计算表1中的台区线损潜在特征指标与台区统计线损率之间的互信息,具体如图2所示。互信息的计算是一次性计算,本实施例主要用于确定模型的输入指标;其中,台区统计线损率根据用电信息采集系统直接获取的数据,由台区总表直接计算得到。
[0059]
1)重要特征指标
[0060]
损失电量、电压降、台区容量、首端电压、供电量、售电量、末端电压对台区线损率影响较大,属于重要特征指标;其中,供电量、售电量和损失电量均是表征台区的电量信息,三者之间存在线性关系,损失电量是基于供电量计算,所以该三个特征指标只需供电量作为特征指标;首端电压、末端电压、电压降用于表征台区电压信息,考虑到末端电压、电压降两个指标难以覆盖全量台区,该三个指标只需首端电压作为特征指标。
[0061]
2)次要特征指标
[0062]
供电半径、三相不平衡、末端电量占比、负荷形状系数、单相表计数、用户数、上网电量占比、三相表计数、网架结构、功率因素对线损率影响一般,属于次要特征指标;其中,用户数、表计数、单相表计数和三相表计数为强线性相关,属于同类特征,只需要用户数作为特征指标。
[0063]
3)一般特征
[0064]
户均容量、光伏用户数、光伏电量和城乡类别对线损率影响较小,属于一般特征,在后期构建模型的时候暂不考虑此类特征指标。
[0065]
综上分析,最终选择首端电压、供电量、供电半径、三相不平衡度、末端电量占比、负荷形状系数、负载率、用户数、上网电量占比、网架结构、功率因素11个特征指标,作为后期模型的输入量。
[0066]
步骤5、构建低压台区分类模型:基于台区上网电量占比、网架结构、供电半径和台区供电量四个指标,采用无监督的em聚类算法将台区进行分类。
[0067]
由于台区线损受到多种因数影响,通过业务经验仅可把握部分特征,难以掌握整体规律,因此本实施例利用台区上网电量占比、网架结构、供电半径和台区供电量指标数据,采用无监督的em聚类算法将低压台区划分为多个类群,以支撑后续阶段中构建台区合理线损计算模型的工作。本实施例中将聚类数目设置为1到25,计算每个聚类数目下的bic值,确定最佳聚类数目。
[0068]
采用em聚类的原因主要是该方法以高斯分布为基础,聚类结果在几何上是椭圆的,适用性更广。em聚类算法主要是计算概率,用一个给定的多元高斯概率分布模型来估计出一个数据点属于一个聚类的概率,即将每一个聚类看作是一个高斯模型,主要由两步交替进行,通过e-step和m-step的不断交替来增加总的对数似然直到模型收敛。
[0069]
以抽取台区上网电量占比大于零的台区(即有源台区)为例,提取台区上网电量占比、网架结构、供电半径和台区供电量指标数据,采用em聚类算法并设置聚类数目为1到25,系统自动计算每个聚类数据下的bic值,输出最佳聚类数目为8,台区聚类结果如图3所示,各类台区主要特征如下表2所示:
[0070]
表2 各类台区主要特征表
[0071]
类别上网电力占比网架结构供电半径(米)台区供电量(kwh)1小(小于5%)架空、混合线路中(400至800)较大(5000至10000)2小(小于5%)架空、混合线路大(大于800)中(2000至5000)3小(小于5%)电缆小(小于400)较大(5000至10000)4小(小于5%)电缆、架空、混合线路小(小于400)超大(大于10000)5小(小于5%)电缆、架空、混合线路中(400至800)超大(大于10000)6大(大于5%)电缆、架空、混合线路中(400至800)小(小于2000)7大(大于5%)混合线路小(小于400)小(小于2000)8小(小于5%)电缆、架空、混合线路大(大于800)小(小于2000)
[0072]
步骤6、筛选各类台区训练样本:分析各类台区的数据样本,筛选各类台区典型样本用于模型训练。
[0073]
抽取台区日线损和月线损数据,筛选台区日线损和月线损趋于稳定的台区为训练样本,具体筛选规则如下:1)剔除月线损率超出0%-10%范围的台区;2)剔除日线损率超出0%-10%范围的天数大于15天的台区;3)剔除日线损超0%-10%范围的天数,以剩余天数内的日线损率的均方差作为台区的日线损波动率σ;4)根据台区聚类结果,求出各类别中台区数在70%时的波动阈值,作为此类台区线损率允许波动的范围5)筛选台区日线损波动率σ<此类台区线损率允许波动的范围的台区,并标记为稳定台区,筛选后的稳定台区为训练样本。
[0074]
步骤7、构建台区合理线损计算模型:针对每类台区,利用mlp神经网络算法,分别构建台区合理线损计算模型。
[0075]
步骤7.1、模型选择:由于台区线损受到多种线损因子的综合影响,且各种线损因子对线损影响表现为非线性,同时mlp神经网络存在较强的自学习和自适应能力、泛化能力和容错能力,所以在构建台区合理线损计算模型时选择mlp神经网络模型,根据经验和多次实验,最终采用含有2个隐层的四层多输入单输出的mlp网络建立台区线损预测模型,如图4所示。
[0076]
步骤7.2模型训练:
[0077]
基于样本数据,首先进行归一化处理,然后对每类台区通过bp算法训练模型参数,在训练过程中,基于交叉验证的网格搜索进行参数寻优,参数设定如下表3所示:
[0078]
表3 网络参数搜索范围
[0079]
参数名称参数范围layer1神经元个数range(6,100,2)layer2神经元个数range(6100,2)activation激活函数[’relu’,’tanh’,’logistic’,’identity’]
[0080]
通过对参数进行网格搜索,计算所有参数(layer1,layer2,activation)的可能组合,得到每类台区合理线损计算模型的最优参数,例如对某类台区进行参数寻优,迭代过程如下所示:
[0081]
0.000597 with:{

activation



relu



hidden_layer_sizes

:(6,6),

solver



lbfgs

}
[0082]
0.000389 with:{

activation



relu



hidden_layer_sizes

:(6,6),

solver



sgd

}
[0083]
0.000289 with:{

activation



relu



hidden_layer_sizes

:(6,6),

solver



adam

}
[0084]
0.000420 with:{

activation



relu



hidden_layer_sizes

:(6,8),

solver



lbfgs

}
[0085]
0.000843 with:{

activation



relu



hidden_layer_sizes

:(6,8),

solver



sgd

}
[0086]
0.900445 with:{

activation



relu



hidden_layer_sizes

:(6,8),

solver



adam

}
[0087]
0.000580 with:{

activation



relu



hidden_layer_sizes

:(6,10),

solver



lbfgs

}
[0088]
通过网格搜索,得到该类台区最优模型参数为:
[0089]
{activation:’relu’,hidden_layer1_sizes’:10,hidden_layer2_sizes’:8}
[0090]
由此得到训练后最优的mlp四层网络模型,并对100个稳定样本台区进行预测,预测值和实际值如图5所示。
[0091]
实施例2
[0092]
与实施例1基于相同的发明构思,本实施例提供低压台区合理线损值测算系统,包括以下模块:
[0093]
数据获取模块,用于获取原始数据,原始数据来源包括营销业务应用系统、用电信息采集系统、电网pms2.0系统和营销gis系统;
[0094]
预处理模块,用于对获取的原始数据进行预处理;
[0095]
指标体系构建模块,用于根据预处理后的数据,对每个台区提取包括容量类基础指标、运行类指标、台区类别指标和电量类指标在内的多维度特征指标,构建台区线损潜在特征指标体系;
[0096]
特征指标筛选模块,用于根据所构建的台区线损潜在特征指标体系,计算各维度
特征指标和台区线损率之间的互信息,实现台区特征指标的重要性排序;结合各维度特征指标之间的相关性,筛选重要特征指标形成台区线损特征指标;
[0097]
台区分类模块,用于构建低压台区分类模型,基于台区上网电量占比、网架结构、供电半径和台区供电量四个指标,采用聚类算法对台区进行分类;
[0098]
样本筛选模块,用于分析各类台区的数据样本,筛选各类台区典型样本用于模型训练;
[0099]
线损计算模块,用于针对每类台区,利用mlp神经网络算法,分别构建台区合理线损计算模型。
[0100]
其中,指标体系构建模块所构建的指标体系中,运行类指标包括三相不平衡度、负荷形状系数;其中三相不平衡度的计算公式如下:
[0101][0102]
式中,εi为三相不平衡度,i
max
是三相负荷电流中的最大值;i
av
是三相负荷电流平均值;
[0103]
令台区总表均方根电流i
rms
与三相负荷电流平均值i
av
的等效关系为k,并将等效关系k作为负荷形状系数,则负荷形状系数的计算公式如下:
[0104][0105]
式中,t是计算周期所确定的电流测点数,i为测点电流序号;ii为第i个测点的电流。
[0106]
此外,台区类别指标包括供电半径,供电半径定义为最远表箱到变压器的空间坐标距离,则供电半径vd的计算公式为:
[0107][0108]
式中,vh为过地球中心最大圆切面弧度,vd为最远表箱、变压器之间的空间坐标距离;最远表箱的空间坐标为(lon1,lat1),变压器的空间坐标为(lon2,lat2)。
[0109]
实施例3
[0110]
与实施例1基于相同的发明构思,本实施例提供相应的计算机设备,包括存储器、处理器以及存储在存储器并可在处理器上运行的计算机程序,处理器执行计算机程序时,实现实施例1中低压台区合理线损值测算方法的各步骤。
[0111]
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献