一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多元线性回归和聚类分析的台区线损预测方法及系统与流程

2021-11-24 23:55:00 来源:中国专利 TAG:


1.本发明涉及一种台区线损预测技术,尤其是涉及一种基于多元线性回归和聚类分析的台区线损预测方法。


背景技术:

2.电网线损率是电力企业一项重要的经济技术指标。线损是在输送和分配电能过程中,电力网中各个元件或设备所产生的功率损失和电能损失以及其他损失。线损率指的是电力网络中损耗的电能与向电力网络供应电能的百分数。以台区为单位对线损率进行分析,可以直接反映配电网规划设计与运行管理水平,而对台区合理线损的预测则是实现线损精益化管理的前提和关键。影响台区线损的因素有很多,甚至有些台区的线损异常是由这些原因叠加造成的。我国对低压客户全面实行分台区管理,台区线损直接反映了一个地区的电网营销管理水平。台区线损管理通过比较理论线损与实际线损的差值,对不合理线损进行分析和预测,提供较为科学有效的降损措施,有利于提升电力部门的管理水平与经济效益,促进电网的建设与改造的科学性与合理性。
3.作为台区线损管理中的重要环节,理论线损的确定对于提高线损管理的精益化水平有着重要的意义,传统对于理论线损的计算主要是通过的基于潮流计算的方法。传统的台区线损管理中采取一刀切的方式,通过人工设定台区合理线损率,缺乏科学依据,也与精益化的管理目标背道而驰。实现台区合理线损的准确快速预测成为亟待解决的重要问题。但是由于低压台区下分支线路复杂,元件多样,设备台账数据不全,理论线损计将非常困难,实时性不高。同时台区线损数据庞大,传统的理论台区线损计算方法的计算量巨大,效率低。


技术实现要素:

4.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于多元线性回归和聚类分析的台区线损预测方法,准确率高,效率高。
5.本发明的目的可以通过以下技术方案来实现:
6.一种基于多元线性回归和聚类分析的台区线损预测方法,其特征在于,包括:
7.采集台区的若干组历史日线损数据,并进行数据预处理,构成线损样本数据集,每组历史日线损数据包括历史日线损率以及对应时间段的历史线损特征集,所述的线损特征集包括若干类线损相关特征;
8.通过聚类算法对线损样本数据集中所有的历史线损特征集进行聚类,获得若干个聚类;
9.对于每个聚类,根据其包含的历史日线损数据,建立日线损率关于线损相关特征的多元线性回归模型;
10.采集待预测日期的待测线损特征集,通过距离计算确定待测线损特征集所属的聚类;
11.将待测线损特征集代入其所属聚类对应的多元线性回归模型,求得台区在待预测日期的预测日线损率;
12.先对历史线损特征集进行第一次分类,再对每一个聚类分别建立多元线性回归模型,再确定待测线损特征集所属聚类,并代入对应的多元线性回归模型进行线损预测,提高了预测准确度,同时无需考虑台区线路结构,计算量小,处理速度快,效率大大提高;
13.由于日线损率受多方面因素影响,所述的线损特征集包括若干类线损相关特征,综合了多种相关特征对日线损率的影响,使预测结果更加准确。
14.进一步地,所述的线损相关特征包括月线损率均值、台区居民用户数量和月线损电量均值中的一种或多种。
15.进一步地,所述的聚类算法为kmeans聚类算法。
16.进一步地,所述的数据预处理包括:
17.删除缺失值和异常值,保留重复值的第一条记录,使得使预测结果更加准确。
18.进一步地,通过岭回归算法建立多元线性回归模型,所述的岭回归算法是一种改良的最小二乘估计法,适用于处理特征数多于样本数的情况,可适用于病态矩阵的分析,所述的回归分析模块作为一种缩减算法,能够筛选出不重要的特征或参数,适用于台区线损预测场景,预测效果好。
19.一种基于多元线性回归和聚类分析的台区线损预测系统,包括数据采集模块、特征聚类模块、回归分析模块和线损预测模块;
20.所述的数据采集模块用于采集台区的若干组历史日线损数据,并进行数据预处理,构成线损样本数据集,每组历史日线损数据包括历史日线损率以及对应时间段的历史线损特征集,所述的线损特征集包括若干类线损相关特征;
21.所述的特征聚类模块用于通过聚类算法对线损样本数据集中所有的历史线损特征集进行聚类,获得若干个聚类;
22.所述的回归分析模块用于对于每个聚类,根据其包含的历史日线损数据,建立日线损率关于线损相关特征的多元线性回归模型;
23.所述的线损预测模块用于获取待预测日期的待测线损特征集,通过距离计算确定待测线损特征集所属的聚类,将待测线损特征集代入其所属聚类对应的多元线性回归模型,求得台区在待预测日期的预测日线损率;
24.先对历史线损特征集进行第一次分类,再对每一个聚类分别建立多元线性回归模型,再确定待测线损特征集所属聚类,并代入对应的多元线性回归模型进行线损预测,提高了预测准确度,同时无需考虑台区线路结构,计算量小,处理速度快,效率大大提高;
25.由于日线损率受多方面因素影响,所述的线损特征集包括若干类线损相关特征,综合了多种相关特征对日线损率的影响,使预测结果更加准确。
26.进一步地,所述的线损相关特征包括月线损率均值、台区居民用户数量和月线损电量均值中的一种或多种。
27.进一步地,所述的聚类算法为kmeans聚类算法。
28.进一步地,所述的数据预处理包括:
29.所述的数据采集模块删除缺失值和异常值,保留重复值的第一条记录,使得使预测结果更加准确。
30.进一步地,所述的回归分析模块通过岭回归算法建立多元线性回归模型,所述的岭回归算法是一种改良的最小二乘估计法,适用于处理特征数多于样本数的情况,可适用于病态矩阵的分析,所述的回归分析模块作为一种缩减算法,能够筛选出不重要的特征或参数,适用于台区线损预测场景,预测效果好。
31.与现有技术相比,本发明具有以如下有益效果:
32.(1)本发明先对历史线损特征集进行第一次分类,再对每一个聚类分别建立多元线性回归模型,再确定待测线损特征集所属聚类,并代入对应的多元线性回归模型进行线损预测,提高了预测准确度,同时无需考虑台区线路结构,计算量小,处理速度快,效率大大提高,由于日线损率受多方面因素影响,所述的线损特征集包括若干类线损相关特征,综合了多种相关特征对日线损率的影响,使预测结果更加准确;
33.(2)本发明通过岭回归算法建立多元线性回归模型,所述的岭回归算法是一种改良的最小二乘估计法,适用于处理特征数多于样本数的情况,可适用于病态矩阵的分析,所述的回归分析模块作为一种缩减算法,能够筛选出不重要的特征或参数,适用于台区线损预测场景,预测效果好。
附图说明
34.图1为本发明的方法流程示意图。
具体实施方式
35.下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
36.实施例1
37.一种基于多元线性回归和聚类分析的台区线损预测方法,如图1,包括:
38.1)采集台区的若干组历史日线损数据,并进行数据预处理,构成线损样本数据集,每组历史日线损数据包括历史日线损率以及对应时间段的历史线损特征集,线损特征集包括月线损率均值、台区居民用户数量和月线损电量均值;
39.2)通过kmeans聚类算法对线损样本数据集中所有的历史线损特征集进行聚类,获得若干个聚类;
40.3)对于每个聚类,根据其包含的历史日线损数据,建立日线损率关于线损相关特征的多元线性回归模型;
41.4)采集待预测日期的待测线损特征集,通过距离计算确定待测线损特征集所属的聚类;
42.5)将待测线损特征集代入其所属聚类对应的多元线性回归模型,求得台区在待预测日期的预测日线损率;
43.先对历史线损特征集进行第一次分类,再对每一个聚类分别建立多元线性回归模型,再确定待测线损特征集所属聚类,并代入对应的多元线性回归模型进行线损预测,提高了预测准确度,同时无需考虑台区线路结构,计算量小,处理速度快,效率大大提高;
44.由于日线损率受多方面因素影响,线损特征集包括若干类线损相关特征,综合了
多种相关特征对日线损率的影响,使预测结果更加准确。
45.数据预处理包括:
46.删除缺失值和异常值,保留重复值的第一条记录,使得使预测结果更加准确。
47.kmeans聚类算法的首要目的是将数量为n的数据集合分为k个类,每个类代表一个簇,kmeans聚类算法的机理为:无论是数据集合还是聚类数目都是提前设定好的,将k个数据对象看作是原始聚类中心,之后利用距离方法将剩余的数据对象进行归类,由此就获得了最基本的聚类分布;针对新类要通过距离的方法对聚类中心点进行再次计算,倘若获取到的新聚类中心点与原始聚类中心点存在明显不同,还需要再进行计算,直至两者一致,此时准则函数收敛值不再发生变化,聚类结束。
48.kmeans聚类算法的实现过程:
49.输入:数据集n={nm|m=1,2,

,n},聚类数目为k;
50.输出:误差平方和准则函数均达到最小的k个聚类;
51.(a)从n={nm|m=1,2,

,n}中任意选出数量为k的样本看作是初始聚类中心,任何一个中心均有其相对应的类别;
52.(b)搜寻剩余样本,求出它与k个旧聚类中心之间形成的间距,并将其归纳到最近的类别中;
53.(c)一次划分结束之后,对各聚类的中心进行再次计算,并将其看作是一个新代表点,求出它与k个新聚类中心形成的距离,将其归纳到最近的类别中;
54.多次执行步骤(c),直至所有聚类均固定不变。
55.对于聚类的数目的确定,则采用mdc类间离散度指标,类间距离mdc表示不同类的聚类中心样本集间的距离的平均值,计算如下:
[0056][0057]
其中,k1和k2代表不同的类别,表示第k1类样本集的聚类中心,表示第k2类样本集的聚类中心,表示第k1类样本集与第k2类样本集的聚类中心的欧几里得距离。
[0058]
多重线性回归的数学模型为:
[0059]
y=β0 β1x1 ... β
p
x
p
ε
[0060]
式中,y为因变量,即日线损率,x1,x2,...,x
p
为p个自变量,本实施例中自变量包括月线损率均值、台区居民用户数量和月线损电量均值,ε为常数项,β1,β2,...,β
p
为偏回归系数。
[0061]
通过岭回归算法建立多元线性回归模型,岭回归算法是一种改良的最小二乘估计法,适用于处理特征数多于样本数的情况,可适用于病态矩阵的分析,回归分析模块作为一种缩减算法,能够筛选出不重要的特征或参数,适用于台区线损预测场景,预测效果好。
[0062]
实施例2
[0063]
一种基于多元线性回归和聚类分析的台区线损预测系统,包括数据采集模块、特征聚类模块、回归分析模块和线损预测模块;
[0064]
数据采集模块用于采集台区的若干组历史日线损数据,并进行数据预处理,构成
线损样本数据集,每组历史日线损数据包括历史日线损率以及对应时间段的历史线损特征集,线损特征集包括月线损率均值、台区居民用户数量和月线损电量均值;
[0065]
特征聚类模块用于通过kmeans聚类算法对线损样本数据集中所有的历史线损特征集进行聚类,获得若干个聚类;
[0066]
回归分析模块用于对于每个聚类,根据其包含的历史日线损数据,建立日线损率关于线损相关特征的多元线性回归模型;
[0067]
线损预测模块用于获取待预测日期的待测线损特征集,通过距离计算确定待测线损特征集所属的聚类,将待测线损特征集代入其所属聚类对应的多元线性回归模型,求得台区在待预测日期的预测日线损率;
[0068]
先对历史线损特征集进行第一次分类,再对每一个聚类分别建立多元线性回归模型,再确定待测线损特征集所属聚类,并代入对应的多元线性回归模型进行线损预测,提高了预测准确度,同时无需考虑台区线路结构,计算量小,处理速度快,效率大大提高;
[0069]
由于日线损率受多方面因素影响,线损特征集包括若干类线损相关特征,综合了多种相关特征对日线损率的影响,使预测结果更加准确。
[0070]
数据预处理包括:
[0071]
数据采集模块删除缺失值和异常值,保留重复值的第一条记录,使得使预测结果更加准确。
[0072]
回归分析模块通过岭回归算法建立多元线性回归模型,岭回归算法是一种改良的最小二乘估计法,适用于处理特征数多于样本数的情况,可适用于病态矩阵的分析,回归分析模块作为一种缩减算法,能够筛选出不重要的特征或参数,适用于台区线损预测场景,预测效果好。
[0073]
实施例1和实施例2提出了一种基于多元线性回归和聚类分析的台区线损预测方法及系统,先对历史线损特征集进行第一次分类,再对每一个聚类分别建立多元线性回归模型,再确定待测线损特征集所属聚类,并代入对应的多元线性回归模型进行线损预测,提高了预测准确度,同时无需考虑台区线路结构,计算量小,处理速度快,效率大大提高,由于日线损率受多方面因素影响,所述的线损特征集包括若干类线损相关特征,综合了多种相关特征对日线损率的影响,使预测结果更加准确。
[0074]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献