一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种配电网故障停电影响指标降维预处理方法及系统与流程

2022-02-22 09:09:36 来源:中国专利 TAG:


1.本技术涉及电力技术领域,尤其涉及一种配电网故障停电影响指标降维预处理方法及系统。


背景技术:

2.配电网的供电可靠性对工业生产及居民用电具有十分重要的影响,自动化项目的投资建设对故障复电的效率及质量产生了积极的作用。为了对配电网自动化实用化的应用成效进行恰当的评估,挖掘各项故障停电影响自变量指标对因变量指标的影响,需要构建若干关联模型。而大部分关联模型在构建过程中要求自变量指标池中指标间具有较低的关联度,并且在自变量组合规模相对历史数据量而言适中的情况下,具备较佳的模型表现。为确保关联模型的挖掘效果具有较高的可信度,在进行关联模型的构建之前,需要对相关指标的历史数据进行预处理,以降低自变量指标池中自变量指标的数量,控制待分析的指标规模。
3.现有方法多关注数据样本内部的取值范围、分散程度限制、平均值或中位数范围限制等,以常规的标准化或归一化方法为主。但是对业务逻辑、客观数据信息的重视程度不足,未充分考虑多元指标之间的相似性及对故障停电影响因变量指标作用的重叠性,预处理后获得的数据与原数据相比在指标规模上并没有明显的区别,用于构建关联模型时可能导致不可预判的非主观性误差,进而导致难以获得较为精确的关联模型。


技术实现要素:

4.本技术提供了一种配电网故障停电影响指标降维预处理方法及系统,用于解决现有技术无法有效减少强关联度的故障停电影响自变量指标数量,导致难以获得较为精确的关联模型的技术问题。
5.有鉴于此,本技术第一方面提供了一种配电网故障停电影响指标降维预处理方法,所述方法包括:
6.s1、根据业务分析需求获取待建模所需的因变量指标池和自变量指标池,其中,所述因变量指标池为所述自变量指标池基于配电网故障停电影响得到的;
7.s2、通过所述因变量指标池和所述自变量指标池获取历史数据;
8.s3、根据所述历史数据对所述因变量指标池中的因变量指标和所述自变量指标池中的自变量指标做0-1标准化处理,得到标准指标数据;
9.s4、基于所述标准指标数据构建系统聚类模型,通过所述系统聚类模型获得配电网故障停电影响的因变量指标和自变量指标的谱系聚类图,基于所述谱系聚类图结合业务需求从所述标准指标数据选取代表性指标,得到降维后的指标。
10.可选地,所述因变量指标池和所述自变量指标池,包括:
11.故障停电平均时户数、故障停电平均持续时间、故障停电平均用户数、故障停电用户平均停电次数、故障停电用户平均每次停电时间、用户平均故障停电时间、用户平均故障
停电次数、用户故障停电时户数占比、大时户故障停电时间占比、累计长时间故障停电用户占比、单次长时间故障停电用户占比、多次故障停电用户占比。
12.可选地,步骤s3,具体包括:
13.基于标准化处理公式,根据所述历史数据对所述自变量指标和所述因变量指标分别进行组内0-1标准化处理,得到标准指标数据;
14.其中,所述标准化处理公式为:
[0015][0016]
其中
[0017][0018]
式中,xi为选定指标第i年的数据值,为选定指标若干年数据的平均值,σ
x
为选定指标若干年数据的标准差。
[0019]
可选地,步骤s4,具体包括:
[0020]
基于所述标准指标数据构造标准化数据资料矩阵;
[0021]
计算所述标准化数据资料矩阵中每个指标历史数据向量两两之间的欧几里得距离,并定义指标组之间的距离计算方式;
[0022]
根据所述欧几里得距离和所述距离计算方式对因变量指标和自变量指标进行系统聚类,构建得到所述谱系聚类图;
[0023]
基于所述谱系聚类图结合业务需求从所述标准指标数据选取代表性指标,得到预处理后的指标。
[0024]
可选地,所述根据所述欧几里得距离和所述距离计算方式对因变量指标和自变量指标进行系统聚类,构建得到所述谱系聚类图,具体包括:
[0025]
s01、设共有p个所述因变量指标和p个所述自变量指标,计算p个指标两两间的距离,获得指标间的第i距离矩阵,i为正整数;
[0026]
s02、对所述第i距离矩阵中距离最小的两个指标组进行合并得到第一合并组,计算所述第一合并组与所述距离矩阵中剩余的指标组的距离,得到第i 1距离矩阵;
[0027]
s03、将i 1赋值为i后重复步骤s02,直至指标组的总个数为1得到所述谱系聚类图。
[0028]
可选地,所述计算所述标准化数据资料矩阵中每个指标历史数据向量两两之间的欧几里得距离,具体包括:
[0029][0030]
式中,为0-1标准化处理后的指标i的第j个数据值,x(i)=(x
i1


,x
in
)
t
为所述历史数据向量,n为每个指标具有的数据值的个数。
[0031]
可选地,所述距离计算方式为:
[0032][0033]
式中,g
p
表示指标组p,gq表示指标组q。
[0034]
本技术第二方面提供一种配电网故障停电影响指标降维预处理系统,所述系统包括:
[0035]
获取模块,用于根据业务分析需求获取待建模所需的因变量指标池和自变量指标池,其中,所述因变量指标池为所述自变量指标池基于配电网故障停电影响得到的;
[0036]
收集模块,用于通过所述因变量指标池和所述自变量指标池获取历史数据;
[0037]
标准化模块,用于根据所述历史数据对所述因变量指标池中的因变量指标和所述自变量指标池中的自变量指标做0-1标准化处理,得到标准指标数据;
[0038]
降维模块,用于基于所述标准指标数据构建系统聚类模型,通过所述系统聚类模型获得配电网故障停电影响的因变量指标和自变量指标的谱系聚类图,基于所述谱系聚类图结合业务需求从所述标准指标数据选取代表性指标,得到降维后的指标。
[0039]
可选地,所述标准化模块,具体用于:
[0040]
基于标准化处理公式,根据所述历史数据对所述自变量指标和所述因变量指标分别进行组内0-1标准化处理,得到标准指标数据;
[0041]
其中,所述标准化处理公式为:
[0042][0043]
其中
[0044][0045]
式中,xi为选定指标第i年的数据值,为选定指标若干年数据的平均值,σ
x
为选定指标若干年数据的标准差。
[0046]
可选地,所述降维模块,具体用于:
[0047]
基于所述标准指标数据构造标准化数据资料矩阵;
[0048]
计算所述标准化数据资料矩阵中每个指标历史数据向量两两之间的欧几里得距离,并定义指标组之间的距离计算方式;
[0049]
根据所述欧几里得距离和所述距离计算方式对因变量指标和自变量指标进行系统聚类,构建得到所述谱系聚类图;
[0050]
基于所述谱系聚类图结合业务需求从所述标准指标数据选取代表性指标,得到预处理后的指标。
[0051]
从以上技术方案可以看出,本技术具有以下优点:
[0052]
本技术提供了一种配电网故障停电影响指标降维预处理方法,申请人发现配电网故障停电影响的因变量指标以及自变量指标的降维预处理,依赖于待建模指标的筛选和系统聚类算法的处理。因此本技术提出了一种基于系统聚类的配电网故障停电影响指标降维预处理方法,其利用0-1标准化或非标准化对历史数据进行变换,然后通过多种组间定义下的系统聚类算法,实现对配电网故障停电影响的因变量指标以及自变量指标的预处理,保
证电网自动化实用化成效评估中关联模型的有效性和精准性。
[0053]
1、本技术的数据预处理方法综合考虑了不同故障停电影响指标在业务逻辑、数据驱动下所呈现的凝聚效应,通过挖掘相同分组内部指标所具备的协同效应,可在精准有效且不损失过多核心信息的前提下,获得核心指标池,完成降维的预处理数据,提高了预处理后的数据对多种关联模型构建算法的相合性,有利于提升电网故障停电影响相关关联模型的有效性,进而未配电网供电可靠性的评估向精细化、智能化、高效化发展提供可能。
[0054]
2、本技术的数据预处理方法通过系统聚类算法处理故障停电影响的因变量指标和过程性指标的降维处理,可有效提取既有指标体系的特征,使预处理后的指标数据可适配更多的供电可靠性评估算法。
[0055]
3、本技术的数据预处理方法将配电网故障停电影响的因变量指标以及自变量指标的历史数据与业务逻辑相结合,客观全面地挖掘指标间的关联度,采用系统聚类算法内部的多种组间距离定义进行谱系聚类图分组的数据降维预处理,可为电网公司进行自动化实用化成效评估时提供必备的待建模数据,提升所构建的关联模型的有效性,进而提高评估体系的精确性,从而最终保障配电网的供电可靠性得以持续稳定提升。
附图说明
[0056]
图1为本技术实施例中提供的一种配电网故障停电影响指标降维预处理方法实施例一的流程示意图;
[0057]
图2为本技术实施例中提供的一种配电网故障停电影响指标降维预处理方法实施例二的的流程示意图;
[0058]
图3为本技术实施例中提供的一种配电网故障停电影响指标降维预处理系统实施例的结构图。
具体实施方式
[0059]
为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0060]
请参阅图1,本技术实施例中提供的一种配电网故障停电影响指标降维预处理方法,包括:
[0061]
步骤101、根据业务分析需求获取待建模所需的因变量指标池和自变量指标池,其中,因变量指标池为自变量指标池基于配电网故障停电影响得到的;
[0062]
需要说明的是,本实施例针对配电网故障停电影响的结果性指标以及过程指标之间的关联模型构建问题,选取结果性指标及潜在的可能与之相关的过程指标,根据业务分析需求获取待建模的因变量及自变量指标池。
[0063]
需要说明的是,待建模的配电网故障停电影响的因变量指标以及自变量指标池是结合业务分析需求所得的最能表征配电网故障停电影响的指标,可能包括但不仅限于以下指标:故障停电平均时户数、故障停电平均持续时间、故障停电平均用户数、故障停电用户平均停电次数、故障停电用户平均每次停电时间、用户平均故障停电时间、用户平均故障停
电次数、用户故障停电时户数占比、大时户故障停电时间占比、累计长时间故障停电用户占比、单次长时间故障停电用户占比、多次故障停电用户占比等,可根据具体业务逻辑遴选确定。
[0064]
步骤102、通过因变量指标池和自变量指标池获取历史数据;
[0065]
可以理解的是,从步骤1中的的因变量指标池和自变量指标池的获取因变量指标的历史数据和自变量指标的历史数据。
[0066]
步骤103、根据历史数据对因变量指标池中的因变量指标和自变量指标池中的自变量指标做0-1标准化处理,得到标准指标数据;
[0067]
需要说明的是,本实施例根据历史数据,对配电网故障停电影响的自变量指标及因变量指标做0-1标准化处理,还可以选择不对自变量指标及因变量指标进行标准化处理,本领域技术人员可以根据实际需要进行选择。
[0068]
步骤104、基于标准指标数据构建系统聚类模型,通过系统聚类模型获得配电网故障停电影响的因变量指标和自变量指标的谱系聚类图,基于谱系聚类图结合业务需求从标准指标数据选取代表性指标,得到降维后的指标。
[0069]
需要说明的是,本实施例步骤104的构建系统聚类模型,获得故障停电影响的结果性和自变量指标的谱系聚类图,基于分类结果进行各组代表性指标的选取,进而完成故障停电影响指标的预处理,其具体实现算法如下:
[0070]
(1)假设选定的故障停电影响的因变量指标和自变量指标组中一共有p个指标,每个指标具有n个数据值,可构成如下原始数据资料矩阵
[0071][0072]
上式中,x
ij
表示可靠性指标i的第j个数据值。记p个指标的历史数据向量为x(i)=(x
i1


,x
in
)
t
,i=1,

,p。
[0073]
(2)基于(1)中p个故障停电影响的因变量指标和自变量指标的n个数据值,构造如下0-1标准化数据资料矩阵:
[0074][0075]
上式中,为0-1标准化处理后的指标i的第j个数据值,其中0-1标准化为:
[0076][0077]
(3)计算(2)中p个指标的历史数据向量为x(i)=(x
i1


,x
in
)
t
两两之间的欧几里得距离,
[0078][0079]
选择指标组与指标组之间的距离计算方式,如最短距离法
[0080][0081]
式中g
p
表示指标组p,gq表示指标组q。
[0082]
(4)根据(3)所计算的指标之间距离以及所定义的指标组之间的距离计算方式,按照以下步骤对全体故障停电影响的结果性和自变量指标进行系统聚类,构建谱系聚类图。
[0083]
a)计算p个指标两两间的距离,获得指标间的距离矩阵
[0084][0085]
b)第一步p个指标各自构成一组,指标组的个数k=p,第i组gi={xi},i=1,

,p。此时组间的距离就是指标数据之间的距离d
ij
,对p个指标执行并组过程的步骤c)和d)。
[0086]
c)对步骤b)得到的距离矩阵d
(j-1
),合并组间距离最小的两个组为一新组。此时组的总个数k减少1,即k=p-j 1。
[0087]
d)计算新组与其它已知组的距离,得到新的距离矩阵d
(j)
。若合并后组的总个数k仍大于1,则重复步骤c)和d),直到组的总个数为1时转到步骤e)。
[0088]
e)绘制谱系聚类图,结合业务分析需求根据谱系聚类图决定分组的个数以及各组内的指标,选取各组的部分代表性指标,完成故障停电影响指标的降维预处理。
[0089]
本技术实施例提供的一种配电网故障停电影响指标降维预处理方法,发明人通过研究发现,配电网故障停电影响的因变量指标以及自变量指标的降维预处理,依赖于待建模指标的筛选和系统聚类算法的处理。因此本技术提出了一种基于系统聚类的配电网故障停电影响指标降维预处理方法,其利用0-1标准化或非标准化对历史数据进行变换,然后通过多种组间定义下的系统聚类算法,实现对配电网故障停电影响的因变量指标以及自变量指标的预处理,保证电网自动化实用化成效评估中关联模型的有效性和精准性。
[0090]
以上为本技术实施例中提供的一种配电网故障停电影响指标降维预处理方法的实施例一,以下为本技术实施例中提供的一种配电网故障停电影响指标降维预处理方法的实施例二。
[0091]
请参阅图2,本技术实施例中提供的一种配电网故障停电影响指标降维预处理方法,包括:
[0092]
步骤201、根据业务分析需求获取待建模所需的因变量指标池和自变量指标池,其中,因变量指标池为自变量指标池基于配电网故障停电影响得到的;
[0093]
步骤201与实施例一步骤101描述相同,请参见步骤101描述,在此不再赘述。
[0094]
步骤202、通过因变量指标池和自变量指标池获取历史数据;
[0095]
步骤202与实施例一步骤102描述相同,请参见步骤102描述,在此不再赘述。
[0096]
步骤203、基于标准化处理公式,根据历史数据对自变量指标和因变量指标分别进
行组内0-1标准化处理,得到标准指标数据;
[0097]
需要说明的是,本实施例步骤203的0-1标准化是通过以下方法实现:
[0098]
基于历史数据,对配电网故障停电得到自变量指标和因变量指标分别进行组内0-1标准化处理,其公式为:
[0099][0100]
上式中,xi为选定指标第i年的数据值,为该指标若干年数据的平均值,σ
x
为该指标若干年数据的标准差,计算公式为:
[0101][0102]
步骤204、基于标准指标数据构造标准化数据资料矩阵;
[0103]
步骤205、计算标准化数据资料矩阵中每个指标历史数据向量两两之间的欧几里得距离,并定义指标组之间的距离计算方式;
[0104]
步骤206、根据欧几里得距离和距离计算方式对因变量指标和自变量指标进行系统聚类,构建得到谱系聚类图;
[0105]
步骤207、基于谱系聚类图结合业务需求从标准指标数据选取代表性指标,得到预处理后的指标。
[0106]
步骤204-207与实施例一步骤104描述相类似,请参见步骤104描述,在此不再赘述。
[0107]
本技术提供的预处理方法是一种基于系统聚类的配电网故障停电影响指标降维预处理方法,其特点是,基于配电网故障停电影响的因变量指标以及自变量指标,根据业务分析需求获得待建模的指标池;基于历史数据,采用系统聚类算法对故障停电影响的因变量指标和自变量指标构建聚类分支树,获得与因变量指标归属相近的自变量指标,完成指标数据的降维预处理。本发明围绕配电网故障停电影响的因变量指标以及自变量指标的预处理,通过系统聚类算法,将指标分为不同指标组(组内指标存在强相关性、组间指标存在弱相关性),进而在各组内选取部分代表性指标,用于构建关联模型。本发明有利于从历史数据记录中挖掘高关联度的故障停电影响指标组,有针对性的进行指标组数据降维预处理,可显著减少强关联度的故障停电影响自变量指标数量,提升建模阶段所构造关联模型的可信程度。
[0108]
以上为本技术实施例中提供的一种配电网故障停电影响指标降维预处理方法的实施例二,以下为本技术实施例中提供的一种配电网故障停电影响指标降维预处理系统的实施例。
[0109]
请参阅图3,本技术实施例中提供的一种配电网故障停电影响指标降维预处理系统,包括:
[0110]
获取模块301,用于根据业务分析需求获取待建模所需的因变量指标池和自变量指标池,其中,因变量指标池为自变量指标池基于配电网故障停电影响得到的;
[0111]
收集模块302,用于通过因变量指标池和自变量指标池获取历史数据;
[0112]
标准化模块303,用于根据历史数据对因变量指标池中的因变量指标和自变量指标池中的自变量指标做0-1标准化处理,得到标准指标数据;
[0113]
降维模块304,用于基于标准指标数据构建系统聚类模型,通过系统聚类模型获得配电网故障停电影响的因变量指标和自变量指标的谱系聚类图,基于谱系聚类图结合业务需求从标准指标数据选取代表性指标,得到降维后的指标。
[0114]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0115]
本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0116]
应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
[0117]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0118]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0119]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0120]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全
部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(英文全称:read-only memory,英文缩写:rom)、随机存取存储器(英文全称:random access memory,英文缩写:ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0121]
以上所述,以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献