一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种配电网规划问题根源精准定位方法及系统与流程

2022-02-22 08:38:11 来源:中国专利 TAG:


1.本技术涉及配电网规划问题技术领域,尤其涉及一种配电网规划问题根源精准定位 方法及系统。


背景技术:

2.配电网规划问题复杂多样,既有已经出现的问题也有在未来一段时间内可能出现的 问题,既有单个配电网设备问题也有一个地区的系统性问题。有些问题之间相互影响, 联系紧密,而有些看似无关的问题之间也可能有着千丝万缕的联系。如何对现有的配电 网规划问题进行合理的改造,凭借主观经验,单纯从一个维度进行问题分析和定位往往 会导致结果失去完备性和系统性,因此有必要通过数据挖掘方法,在大数据下开展多维 度的综合分析定位技术研究,综合基于物理网架结构,研究配电网规划问题的相互关联 特性及其系统查找和精准定位技术,实现对配电网规划问题的全面挖掘和精准揭示。
3.而目前在这方面国内外鲜有相关研究成果,现有技术方案一般根据以往的电网运行 经验,再根据当前实际情况,结合对不同问题的理论分析,人为地关联各问题的关系。 该方法凭借专家经验判断,存在过多的人为主观因素,而且过往经验有可能不适用于当 前日新月异的电网情况。此外,通过这种方法分析过程繁琐,效率低下,需消耗大量人 力资源。


技术实现要素:

4.本技术提供了一种配电网规划问题根源精准定位方法及系统,以解决目前在配电网 规划这方面国内外鲜有相关研究成果,现有技术方案一般根据已有的以往电网运行经验, 再根据当前实际情况,结合对不同问题的理论分析,人为地关联各问题的关系。该方法 凭借专家经验判断,存在过多的人为主观因素,而且过往经验有可能不适用于当前日新 月异的电网情况。此外,通过这种方法分析过程繁琐,效率低下,需消耗大量人力资源 的问题。
5.本技术提供一种配电网规划问题根源精准定位方法,包括:
6.收集整理由电力系统获取的数据,形成规范的问题集;
7.将规范的问题集转化为适用于关联算法的项集和事件集的形式;
8.通过上述关联算法从历年的电网收资数据中挖掘个案问题、同源问题与区域乃至涉 及整个系统的系统问题之间潜在的关联关系;
9.利用提升度和卡方检验筛选关联规则;
10.将算法得到的强关联规则以简洁美观的形式表达。
11.可选的,所述将规范的问题集转化为适用于关联算法的项集和事件集的形式的步骤 包括:
12.以变压器的容量为基准将无功补偿容量百分比化,其中0到10%的档次设为c0,10% 到20%的档次设为c1,20%到30%的档次设为c2,30%以上的档次设为c3;
13.以变压器的容量为基准将负载率百分比化,其中负载率在30%以下的档次设为l0, 30%到50%%的档次设为l1,50%到70%%的档次设为l2,70%以上%的档次设为l3。
14.可选的,所述通过上述关联算法从历年的电网收资数据中挖掘个案问题、同源问题 与区域乃至涉及整个系统的系统问题之间潜在的关联关系的步骤包括:
15.步骤1,将全体设备的可能数据项集合j={j1,j2,j3,

,jn}作为项目集;将不同时 间下的所有实测设备收资数据t={t1,t2,t3,

,tn}作为事务集,如表1,表中第一列为 事务名称,第二列为对应事务所含有的项:
16.表1 事务数据库示例
[0017][0018]
每个实测收资数据即事务都为j的一个子集,不同事务所对应的项集可能相同;
[0019]
步骤2,对于某关联规则x-》y而言,定义支持度为在整体事务集中,包含关联规则 中全部项集的事务数量与全体事务数量之比,即关联规则中的全部项集同时出现的概率:
[0020][0021]
并设置最小支持度,例如support_min=0.2;
[0022]
步骤3,对于关联规则x-》y而言,定义置信度为出现全部前项的条件下,同时出现 前后项的概率,即同时包含x、y的事务集,与只含x的事务集的数量比:
[0023][0024]
并设置最小置信度,例如confidence_min=0.5;
[0025]
步骤4,对于n项一组的项组集cn,定义连接步为找出cn中所有形如(j1、j2、j3
…ꢀ
jn-1)、(j1、j2、j3

jn-2)的只有最后一项不同的两个项组,分别对其求并集,得到(n 1) 项一组的全体项组集ln 1;
[0026]
步骤5,对于n项一组的项组集ln,定义剪枝步为扫描事件集,计算每个项的支持 度,删去支持度低于support_min的项集,得到一个新的项组集cn;
[0027]
步骤6,对j进行剪枝步,得到c1={(ji),i∈[1,n]},存储为1-频繁项集,其中ji 满足:
[0028]
support(ji)≥support_min
[0029]
步骤7,对1-频繁项集执行连接步生成含有2项一组的候选项集l2={(ji,jk),i,j ∈[1,n]};
[0030]
步骤8,对l2执行剪枝步,得到2项一组的2-频繁项集c2;
[0031]
步骤9,重复步骤7和步骤8,对新生成的项集c2依次执行连接步和剪枝步,生成 新
的k-频繁项集(k=3,4,

),直至无法找到(k 1)-频繁项集;
[0032]
步骤10,取频繁项集ci(i=1,2,

,k)中的一个项组作为后件,以剩余的项组作为前 项,计算置信度,若该关联规则的置信度高于最小置信度,则保留该关联规则并保留该 项组;
[0033]
步骤11,依次取其他项组作为后件,重复步骤10,设所有被保留的项组的集合为 s1,对s1执行连接步生成2-项组集s2;
[0034]
步骤12,重复步骤10和步骤11,以s2中的项组为后项,剩余的项组作为前项,计 算置信度和剪枝,生成si(i=1,2,

,k),直至没有满足的置信度的组合或前项为空;
[0035]
步骤13,对所有ci(i=2,3,

,k)执行步骤10,至步骤12;
[0036]
步骤14,输出所有被保留的关联规则。
[0037]
可选的,所述利用提升度和卡方检验筛选关联规则的步骤包括:
[0038]
对输出的关联规则进行提升度检验和卡方检验,过滤掉无效的强关联规则。
[0039]
一种基于apriori算法的配电网规划问题根源精准定位系统,包括数据输入接口、 用户数据输入界面、apriori算法计算模块、数据输出接口和用户界面,其中,
[0040]
所述数据输入接口将电网运维系统和apriori算法计算模块连接起来,被配置为从 电网运维系统获得所需要的数据,所述用户数据输入界面将手动数据输入和apriori算 法计算模块连接起来,被配置为允许用户手动补充个别缺失的数据项,所述apriori算 法计算模块包含数据预处理功能,被配置为将从电网收资得来的各表格整理成规范的问 题项集和事件集的形式,对整理得到的问题项集和事件项集进行数据挖掘,找出其间的 关联关系,所述apriori算法计算模块通过数据输出接口连接有用户界面,所述用户界 面被配置为将算法得到的强关联规则通过简洁美观的形式向用户展示。
[0041]
由以上技术方案可知,本技术提供一种配电网规划问题根源精准定位方法及系统, 包括收集整理由电力系统获取的数据,形成规范的问题集;将规范的问题集转化为适用 于关联算法的项集和事件集的形式;通过上述关联算法从历年的电网收资数据中挖掘个 案问题、同源问题与区域乃至涉及整个系统的系统问题之间潜在的关联关系;利用提升 度和卡方检验筛选关联规则;将算法得到的强关联规则以简洁美观的形式表达。
[0042]
本技术整理了配电网运行过程中已经出现或可能出现的全体问题,处理形成规范化 的问题集,通过机器算法对规范化的问题集进行全面数据挖掘,寻找各问题间可能存在 的关联关系。本技术能够系统地分析配电网规划现存问题及可能出现的问题间的联系, 使规划人员能够系统、高效地对配电网规划方面问题进行改造。
附图说明
[0043]
为了更清楚地说明本技术的技术方案,下面将对实施例中所需要使用的附图作简单 地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。
[0044]
图1为本技术提供的配电网规划问题根源的精准定位方法的实现流程示意图;
[0045]
图2为本技术提供的apriori算法流程示意图;
[0046]
图3为本技术提供的配电网规划问题根源的精准定位系统架构示意图。
前后项的概率,即同时包含x、y的事务集,与只含x的事务集的数量比:
[0066][0067]
并设置最小置信度,例如confidence_min=0.5;
[0068]
步骤4,对于n项一组的项组集cn,定义连接步为找出cn中所有形如(j1、j2、j3
…ꢀ
jn-1)、(j1、j2、j3

jn-2)的只有最后一项不同的两个项组,分别对其求并集,得到(n 1) 项一组的全体项组集ln 1;
[0069]
步骤5,对于n项一组的项组集ln,定义剪枝步为扫描事件集,计算每个项的支持 度,删去支持度低于support_min的项集,得到一个新的项组集cn;
[0070]
步骤6,对j进行剪枝步,得到c1={(ji),i∈[1,n]},存储为1-频繁项集,其中ji 满足:
[0071]
support(ji)≥support_min
[0072]
步骤7,对1-频繁项集执行连接步生成含有2项一组的候选项集l2={(ji,jk),i,j ∈[1,n]};
[0073]
步骤8,对l2执行剪枝步,得到2项一组的2-频繁项集c2;
[0074]
步骤9,重复步骤7和步骤8,对新生成的项集c2依次执行连接步和剪枝步,生成 新的k-频繁项集(k=3,4,

),直至无法找到(k 1)-频繁项集;
[0075]
步骤10,取频繁项集ci(i=1,2,

,k)中的一个项组作为后件,以剩余的项组作为前 项,计算置信度,若该关联规则的置信度高于最小置信度,则保留该关联规则并保留该 项组;
[0076]
步骤11,依次取其他项组作为后件,重复步骤10,设所有被保留的项组的集合为 s1,对s1执行连接步生成2-项组集s2;
[0077]
步骤12,重复步骤10和步骤11,以s2中的项组为后项,剩余的项组作为前项,计 算置信度和剪枝,生成si(i=1,2,

,k),直至没有满足的置信度的组合或前项为空;
[0078]
步骤13,对所有ci(i=2,3,

,k)执行步骤10,至步骤12;
[0079]
步骤14,输出所有被保留的关联规则。
[0080]
参见图2,为本技术提供的apriori算法流程示意图,所述从历年的电网收资数据 中挖掘个案问题、同源问题与区域乃至涉及整个系统的系统问题之间潜在的关联关系的 方法原理为:
[0081]
设j为全体可能的收资数据项的集合,称为项目集;t为不同时间下的所有实测收 资数据,称为事务集。则每个实测收资数据,亦即每个事务,都为j的一个子集。表1 为一个事务集示例。表中第一列为事务名称,第二列为对应事务所含有的项。其中,不 同事务所对应的项集允许相同。算法最终会根据支持度,挖掘出频繁项目集,并进一步 根据置信度从中挖掘出项与项之间的联系,表示成j1-》j5的形式。其中箭头指明两者的 关联因果性,箭头的左右两边是j的不同子集,左侧称为前件,右侧称为后件,且二者 交集为空,即二者不存在相同的项。
[0082]
表1 事务数据库示例
[0083][0084]
其中,频繁项目集的筛选通过支持度来定义划分:对于某关联规则j1-》j5而言,支 持度定义为在整体事务集中,包含关联规则中全部项集的事务数量与全体事务数量之比, 即关联规则中全部项集j1、j5同时出现的概率;在执行频繁项集筛选步骤前,可以人为 设置一个最小支持度support_min,若计算得到关联规则的支持度高于最小支持度,则 认为该规则中所包含的项目的集合为频繁项目集合,并保留该集合,否则删去该集合。
[0085]
apriori原理指出如果一个项集是非频繁集,那么它的所有超集也是非频繁的。因 为若一个项集的概率p(a)《support_min,则必有该项集与其他项集的交集的概率 p(a*b)《support_min。因此,根据此原理来生成项集可以避免列写项的全部排列组合, 从而大大提高运算时间和减少计算机储存空间。
[0086]
计算每个项的支持度并剪枝可以得到1-频繁项集。根据1-频繁项集两两求合集可以 生成含有2个项的项集,对新的项集进行剪枝,就可以得到2-频繁项集。找出只有一项 不同的2-项集的两两组合,求其并集。就可以得到含3个项的项集。随后再进行剪枝得 到3-频繁项集。如此反复直至k-频繁项集为空或生成了n-频繁项集(n为项目集中项的 总数),就可以得到全部的频繁项集。由于任何n项集jn={j1、j2、j3

jn}都必然含有 两个n-1子集{j1、j2、j3

jn-1}、{j1、j2、j3

jn-2},其前n-2项都是相同的,他 们的并集就是集合jn。因此,以上算法能够保证生成所有符合要求的项集组合而不遗漏。
[0087]
然后,对全体频繁项集生成强关联规则。对于给定的频繁项集,逐个取其中的一个 项作为后件,以剩余的项作为前项,计算置信度。若满足要求,保留该项。对所有保留 的项按照生成频繁项集的方法生成2-项集,再计算置信度和剪枝。如此重复直至没有满 足的置信度的组合或前项为空。
[0088]
置信度计算方法如下:对于某关联规则而言,置信度定义为在所有只含关联规则全 部前者项即只含j1的事务集,与同时包含后者项即同时包含j1、j5的事务集的数量比, 即出现全部前项的条件下,同时出现前后项的概率;在执行本步骤前,可以人为设置一 个最小置信度,若关联规则的置信度高于最小置信度,且该规则中所包含的项目的集合 为频繁项目集合,则认为该规则为有效关联规则,并保留该关联规则,否则删去该关联 规则;
[0089]
提升度(lift)的含义是,相比于不使用该规则,使用该规则可以提高多少。换言 之,如果某一规则有用,则该规则的提升度大于1。提升度(lift)的表达式为:
[0090][0091]
根据计算出的提升度的结果(如lift()),可度量x与y的相关性:
据离散化,使其适用于关联算法之中。
[0108]
(1)配电网日常运行中,负载率低于20%称为轻载运行,对于满足条件的数据本实 施例标记为“轻载”;高于80%且小于100%称为重载运行,而高于100%称为过载运行, 本实施例统一此两个运行状态统一标记为“重过载”;此外,本实施例为方便研究其他相 关内容,将负载率介于60%和80%之间的数据标记为“接近重载”。
[0109]
(2)依据dl/t 5729《配电网规划设计技术导则》,结合实际数据情况(采集到的 数据里缺少a 等级线路),对供电区域等级采用“a、b、c、d、e”五级标记。
[0110]
(3)依据《工业与民用配电设备设计手册》要求,城区、近郊中压线路供电半径不 宜大于3公里、6公里。在进行关联规则挖掘前,对超出相应供电半径距离的数据,标 记为“供电半径偏大”,其余的标记为“供电半径正常”。
[0111]
(4)对线路所属网络的性质,分别沿用其原来的“城网”、“农网”标记。
[0112]
(5)依照一般的配电网规划标准,配电网规划一般以中短期规划(5-15年)为主, 对运行年限超过15年规划期限的,本实施例将其划定为“运行年限偏长”,其余的标记 为“运行年限正常”。
[0113]
(6)对于无功补偿量的大小无具体的划分标准,故对无功补偿量在100mvar以内的 标记为“vc0”;补偿量在100-500mvar之间的,标记为“vc1”;补偿量大于500mvar的 标记为“vc2”。以便后续关联规则挖掘。
[0114]
对以上离散化指标数据进行编号,如表2所示。
[0115]
表2 离散化指标数据编号表
[0116][0117]
依据编号表,通过python编程将对应的每条线路指标数据转化为相应的数组形式, 即事务数组。所有的事务数组形成事务数组集,即可用于关联规则挖掘中。
[0118]
2、关联规则挖掘
[0119]
将转化好的事务数组集数据导入编写好的apriori算法之中,即可进行关联规则挖 掘,得到1~3项频繁项集及其支持度、强关联规则(big-rules)及其置信度。本次研究 使用收集、整理得到的某地区台账表数据共315条。由于重过载问题发生频率在该地区 电网中较低,因而本次研究中将apriori算法的最小支持度设置为0.05(即5%),最小 置信度设置为0.6(即60%)。
[0120]
程序输出的部分1~3项频繁项集及其支持度、强关联规则(big-rules)及其置信度 分别展示与表3至6中。
[0121]
表3 输出频繁1-项集及其支持度(部分)
[0122][0123]
表4 输出频繁2-项集及其支持度(部分)
[0124][0125]
表5 输出频繁3-项集及其支持度(部分)
[0126][0127]
表6 输出强关联规则及其置信度(重过载部分)
[0128][0129]
表中,support、confidence分别代表对应项集的支持度及置信度,big rules为程 序生成的强关联规则。
[0130]
基于上述流程,可以初步得到包括关于该地区配电网重过载情况在内的所有关联规 则。对所获得的的关联规则还需进一步检验其有效性及相关性。
[0131]
3、关联规则相关性度量
[0132]
对表6中的关联规则进行提升度(lift)及卡方值的计算,并且由卡方分布表得到 该关联规则成立的可能性(probability)。计算结果如表7所示。
[0133]
表7 强关联规则检验(重过载部分)
规则;将算法得到的强关联规则以简洁美观的形式表达。本技术整理了配电网运行过程 中已经出现或可能出现的全体问题,处理形成规范化的问题集,通过机器算法对规范化 的问题集进行全面数据挖掘,寻找各问题间可能存在的关联关系。本技术能够系统地分 析配电网规划现存问题及可能出现的问题间的联系,使规划人员能够系统、高效地对配 电网规划方面问题进行改造。
[0143]
以上显示和描述了本技术的基本原理和主要特征以及本技术的优点,对于本领域技 术人员而言,显然本技术不限于上述示范性实施例的细节,而且在不背离本技术的精神 或基本特征的情况下,能够以其他的具体形式实现本技术。因此,无论从哪一点来看, 均应将实施例看作是示范性的,而且是非限制性的,本技术的范围由所附权利要求而不 是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括 在本技术内。
[0144]
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包 含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应 当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术 人员可以理解的其他实施方式。
[0145]
本技术提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是 本技术总的构思下的几个示例,并不构成本技术保护范围的限定。对于本领域的技术人 员而言,在不付出创造性劳动的前提下依据本技术方案所扩展出的任何其他实施方式都 属于本技术的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献