一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多标签LightGBM的电能质量复合扰动识别方法

2022-07-13 13:00:54 来源:中国专利 TAG:

基于多标签lightgbm的电能质量复合扰动识别方法
技术领域
1.本发明属于电能质量监测与分析技术领域,具体涉及基于多标签lightgbm的电能质量复合扰动识别方法。


背景技术:

2.近年来,随着大量电力电子器件、无功补偿装置的应用及风能、太阳能等分布式新能源并入配电网,各种电能质量扰动事件频繁发生。不同类型的电能质量扰动会导致电机损耗增加、电缆和变压器过热、电容器故障和电源故障等问题,还可能引发大规模供电中断,导致国民经济的严重损失。在日趋复杂的电力系统实际运行环境下,存在大量的多重电能质量扰动,不同扰动之间的交叉耦合导致了更高的分类难度。


技术实现要素:

3.本发明的目的是提供基于多标签lightgbm的电能质量复合扰动识别方法,降低特征提取复杂度,提高复合扰动识别准确率,有效识别未知类型复合扰动,提高模型的噪声鲁棒性。
4.本发明所采用的技术方案是,基于多标签lightgbm的电能质量复合扰动识别方法,具体按照以下步骤实施:
5.步骤1、分别对包含不同类型的原始电能质量扰动的复合电能质量扰动信号进行s变换,得到多组时-频矩阵,对每组时-频矩阵进行局部奇异值分解得到多个奇异值,以每个时-频矩阵的最大奇异值为特征向量构建原始特征集;
6.步骤2、分别将原始特征集输入lightgbm子分类器获得各特征的total_gain重要度值,对各特征进行序列向前特征选择,构成最优特征子集;
7.步骤3、将原始特征集合作为训练集,分别将训练集和最优特征子集输入识别不同扰动信号的lightgbm子分类器,将每个扰动信号作为一个标签,获得多标签lightgbm模型;
8.步骤4、将待测电能质量扰动信号经s变换与局部奇异值分解,提取待测电能质量扰动信号特征,将提取后的特征输入多标签lightgbm模型,得到电能质量扰动类型。
9.本发明的特点还在于:
10.步骤2具体过程为:将原始特征集合输入lightgbm子分类器获得各时-频域特征的total_gain重要值,total_gain表示特征在分类器学习过程中的总增益,将特征按total_gain重要值从大到小进行排序,并依次加入特征子集中,每加入一个特征,计算在该特征子集下的lightgbm子分类器的识别准确率,重复此过程直到所有特征均加入特征集合中,最终选择准确率最高的特征子集作为各lightgbm子分类器的最优特征子集。
11.步骤3最优特征子集输入识别不同扰动信号的lightgbm子分类器用于使lightgbm子分类器只识别最优特征子集中特征属性。
12.步骤4具体过程为:将待测电能质量扰动信号进行s变换处理,并对s变换后的时-频矩阵进行局部奇异值分解得到特征向量,将提取后的特征输入多标签lightgbm模型,得
到待测电能质量扰动信号中包含的多个标签,通过每个标签对应的干扰信号确定电能质量扰动类型。
13.本发明有益效果是:
14.本发明基于多标签lightgbm的电能质量复合扰动识别方法,降低特征提取复杂度,提高复合扰动识别准确率,有效识别未知类型复合扰动,提高模型的噪声鲁棒性,推动电能质量扰动识别技术的实际应用与发展。
附图说明
15.图1为本发明基于多标签lightgbm的电能质量复合扰动识别方法流程图;
16.图2为本发明实施例中仿真生成的二重、三重、四重扰动信号示意图;
17.图3为本发明实施例中仿真生成的二重、三重、四重扰动信号经s变换后的特征提取结果;
18.图4为本发明实施例中多标签lightgbm分类模型结构示意图;
19.图5为本发明实施例中对原始误识别信号重新识别的示意图。
具体实施方式
20.下面结合附图和具体实施方式对本发明进行详细说明。
21.本发明基于多标签lightgbm的电能质量复合扰动识别方法,具体按照以下步骤实施:
22.步骤1、在不确定信号扰动发生时刻的前提下,为有效提取扰动信号的时-频域特征,用s变换处理包含原始电能质量扰动的复合电能质量扰动信号,得到每个信号对应的时-频矩阵,针对s变换后的各时-频矩阵进行局部奇异值分解,计算每个矩阵的局部奇异值,并以最大局部奇异值为特征向量,构成特征的原始特征集合。
23.s变换是一种时-频分析方法,对信号加上一个窗宽与频率成反比的高斯窗,有效改善了窗函数选择的复杂性和窗宽固定的局限性,能直接反映信号的时-频特性。对于连续时间信号h(t),其s变换s(τ,f)定义为:
[0024][0025][0026]
式(1)、(2)中:w(t,f)为高斯窗函数;τ为控制高斯窗位置的平移因子。
[0027]
设s(τ,f)由时间τ到频率β的傅里叶变换为r(β,f),有
[0028][0029]
式(3)中,h(f)为h(t)的傅里叶变换。通过傅里叶逆变换有
[0030][0031]
式(4)中,f≠0
[0032]
令f

nlt,τ

jt(l为数据长度,t为采样周期),得到s变换的离散形式
[0033][0034]
步骤2、电能质量复合扰动信号经s变换与局部奇异值特征提取后得到多维时-频域特征,较高的特征维度增加了特征储存空间与特征计算时间,冗余特征降低扰动信号分类效率与准确率,因此需要对原始特征集合进行特征选择,将原始特征集合输入lightgbm子分类器获得各时-频特征的total_gain重要值,将total_gain重要值从大到小进行排序,并依次加入特征子集中,每加入一个特征,计算在该特征子集下的lightgbm子分类器的识别准确率,重复此过程直到所有特征均加入特征集合中,最终选择准确率最高的特征子集作为各lightgbm子分类器的最优特征子集。
[0035]
本发明中能够将原始含有75维时-频域特征经特征选择,生成含信噪比为60db至20db随机噪声与随机扰动参数的41类扰动信号。
[0036]
步骤3、将原始特征集合作为训练集,最优特征子集输入识别不同扰动信号的lightgbm子分类器用于使lightgbm子分类器只识别最优特征子集中特征属性,分别将训练集输入识别最优特征子集中特征属性lightgbm子分类器,将每个扰动信号作为一个标签,获得多标签lightgbm模型。
[0037]
lightgbm是一种基于决策树的集成学习梯度提升框架。在训练过程中,传统的boosting算法需要扫描每个特征的所有样本点来选择最好的切分点,lightgbm使用goss和efb对数据进行预处理,构建高压断路器振动信号的轻量化特征,能显著减少搜索时间,提升训练效率。
[0038]
goss的数据采样过程中只保留梯度较大的数据,且不影响数据的总体分布。首先将数据梯度值按绝对值降序排序,选取前a*100%个数据,然后在剩下的较小梯度数据中随机选择b*100%个数据,并且将b*100%个数据乘以一个常数最后使(a b)*100%个数据来计算信息增益。a为大梯度样本的采样比例,b为小梯度样本的采样比例。设a*100%为数据子集a;设b*100%个数据为数据子集b。最后我们在并集a∪b上计算方差增益。goss以较小数据集信息增益确定分割点,计算信息增益计算成本大大减少,不会过多损失训练精度,且效果优于随机采样方法。
[0039]
通过efb方法将稀疏特征进行融合绑定在一起,可以使特征数量大大减少,具体步骤如下:
[0040]
(1)设g=(v,e),把关联矩阵g的每一行看成特征,从而得到|v|个特征,互斥束为图中颜色相同的顶点,将图中的点看做特征,将边看做特征之间的冲突。并按照互斥束的度来进行排序确定特征绑定最优结果。
[0041]
(2)为确保绑定前的原始特征的值可以在特征绑定时被识别,考虑到之后的直方图算法将连续的值保存为离散的桶,为此在特征值中加一个偏置常量,使得不同特征的值分到绑定集合中的不同桶中。
[0042]
lightgbm采用直方图算法对所有特征进行分桶归一化,将原本连续的数据划分到离散的k个桶中。遍历数据时,将离散值作为索引,索引值积累在每个桶中,遍历一次数据就
能够得到每个桶的积累量。新方法的预排序图算法中叶子的直方图可以由其父亲节点直方图与兄弟节点直方图做差得到,仅需遍历每个桶就能得到它兄弟叶子的直方图,减少了计算量和内存的消耗,有效提升了训练效率。应用直方图算法,对于每一维特征,处于一定区间内的值都会被划分进同一个“桶”,从而获得同样的索引,因此可以显著改善断路器振动信号噪声引起的过拟合现象。
[0043]
lightgbm使用带有深度限制的按叶子生长(leaf-wise)的策略,每次从当前所有叶子中进行搜索,找到分裂增益最大的一个叶子进行分裂。同level-wise相比,在分裂次数相同的情况下,leaf-wise能够有效减少计算时间,降低误差和提升精度。但采用leaf-wise生长策略易建成较深的决策树,产生过拟合,因此lightgbm在leaf-wise之上增加了一个最大深度的限制,在保证高效率、高精度的同时防止过拟合。
[0044]
步骤4、对待测电能质量扰动信号进行s变换处理,并对s变换后的时-频矩阵进行局部奇异值分解得到特征向量,将提取后的特征输入多标签lightgbm模型,得到待测电能质量扰动信号中包含的多个标签,通过每个标签对应的干扰信号确定电能质量扰动类型。
[0045]
常见的电能质量单一扰动有七种,可根据定义与特性分为四类,如表1所示。针对7种单重扰动训练基于lightgbm的子分类器m1-m7。每个子分类器均为二分类,即只识别信号中是否含有某一种扰动成分。多重电能质量扰动由来自表1中不同组的单一电能质量扰动组成,包括7个单重扰动(c1-c7)、17个双重扰动(dc1-dc17)、17个三重扰动(tc1-tc17)和6个四重扰动(qc1-qc6)。
[0046]
表1
[0047][0048]
使用matlabr2018b实现电能质量扰动信号仿真,信号基频为50hz,采样率为50khz,采样波形为50个周期。图2展示了仿真生成的含随机扰动参数的二重、三重、四重扰动信号各一组。在不确定信号扰动发生时刻的前提下,为有效提取扰动信号的时-频域特征,用s变换处理包含原始电能质量扰动的复合电能质量扰动信号,得到每个信号对应的时-频矩阵,针对s变换后的各时-频矩阵进行局部奇异值分解,计算每个矩阵的局部奇异值,并以最大局部奇异值为特征向量。图3展示了二重、三重、四重扰动信号各一组的特征提取结果。
[0049]
将原始特征集合输入lightgbm子分类器获得各时-频域不同属性特征的total_gain重要值,对各时-频特征进行序列向前特征选择生成含信噪比为60db至20db间随机值且具有随机扰动参数的41类扰动信号(为验证模型未知扰动能力,六类四重扰动只参与最
终测试而不参与分类器的训练过程),每类信号各生成8000组,其中6000组为训练集,其余2000组为验证集。以识别c1类型的子分类器构建为例,对不同特征子集分别在最优参数值下构建子分类器m1,得到m1对应的各分类器特征重要度指标,并进行前向特征选择,最终根据最高识别准确率确定m1对应的最优特征子集s1。重复以上步骤得到各子分类器m1-m7对应的最优特征子集s1-s7。lightgbm各子分类器的最优特征子集内特征如表2示。
[0050]
表2
[0051][0052]
lightgbm有准确率高,噪声鲁棒性高,分类效率高等显著优点,但无法识别无训练样本未知类型mpqd。ml-lightgbm通过建立不同单重扰动对应的lightgbm子分类器实现了对无训练样本未知类型电能质量复合扰动的准确识别。ml-lightgbm包括7个子分类器(m1-m7),各对应一种基础扰动类型(c1-c7)。其中m1为识别c1扰动的二分类lightgbm子分类器,输出判断节点为o1,将mpqd信号中含有c1扰动的标记为正样本,不含c1扰动的标记为负样本。根据各输出节点o
1-o7的判断结果来确定mpqd识别对象所含扰动成分,基于ml-lightgbm
的多标签mpqd分类模型结构如图4所示。
[0053]
在不同的噪声环境下,采用不同的多标签分类器ml-svm(support vector machines)、ml-gbdt(gradient boosting decision tree)和ml-xgboost(extreme gradient boosting)对有训练样本的复合电能质量扰动信号进行分类,并将其分类结果与新方法进行对比,实验结果如表3所示。ml-lightgbm算法在不同的噪声环境和扰动复杂度下对有训练样本扰动类型的识别准确率均优于其他3种分类器。信噪比从60db降低至20db,ml-lightgbm的总体分类准确率只有1.23%的降低,在信噪比为20db的高噪声情况下依然能保持97.22%的识别准确率,具有较好的噪声鲁棒性。
[0054]
表3
[0055]
[0056][0057]
将提出基于多标签lightgbm模型的电能质量复合扰动识别方法应用于配电网中实测的电能质量信号,验证方法在实际工业环境下的有效性:
[0058]
对某地区某配电网2006年11月的952组实测单相电能质量信号展开识别。在采样率为50khz条件下,采用含60db到20db随机噪声的仿真信号训练好的ml-lightgbm对实测pqd信号开展识别,统计新方法与原始识别结果如表4所示。
[0059]
表4
[0060][0061][0062]
经本发明方法识别后,952组实测信号中共有872组原始识别类型与新方法识别结
果相同,其余80组信号中存在识别错误与缺失的扰动成分。经人工核实,采用本发明扰动识别方法得到的结果全部正确,如图5所示分别展示了其中2组误识别信号,并标记了本方法识别出的所有扰动成分。
[0063]
通过上述方式,本发明公开了基于多标签lightgbm的电能质量复合扰动识别方法,对原始扰动信号进行s变换的时-频域特征高效提取,然后对单一扰动标签对应的lightgbm子分类器分别进行基于total_gain特征重要度的原始特征排序,并以各lightgbm子分类器的分类准确率为决策变量开展前向特征选择,确定与各子分类器相匹配的最优特征子集,根据各最优特征子集构建最优lightgbm子分类器来识别信号中所含的单一扰动成分,并构建含多子分类器的多标签lightgbm来识别电能质量复合扰动。仿真与实测数据实验证明,本方法识别准确率高、抗噪声能力强,并且能有效识别无训练样本未知类型复合扰动数据,避免将未知类型复合扰动误识别为错误的已知类型,能够满足实际工业应用中海量电能质量扰动事件识别效率与精度需求。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献