一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于LightGBM模型的光伏电站逆变器故障诊断方法与流程

2022-08-08 02:54:02 来源:中国专利 TAG:

一种基于lightgbm模型的光伏电站逆变器故障诊断方法
技术领域
1.本发明涉及光伏发电检测技术领域,具体为一种基于lightgbm模型的光伏电站逆变器故障诊断方法。


背景技术:

2.太阳能作为一种新型的绿色可再生能源,与其他新能源相比利用最大,,其环保、绿色、经济的优点,使得太阳能成为今后大力开发的新能源之一。特别是近几十年来,随着科学技术的不断进步,太阳能及其相关产业成为世界发展最快的行业之一。
3.虽然光伏并网发电的技术已经越来越广泛的被应用到世界各国,,但是光伏电站的运行环境并不友好,因此需要耗费大量人力、物力维护光伏电站。进而,能否及时监测和评估光伏电站的运行状态,是避免发生故障的关键,同时对优化光伏电站和提高大规模并网的效率也有重大意义。
4.作为光伏并网发电系统中最为核心的部件,逆变器的能否正常工作直接影响整个电网系统的健康运营,对于普通用户,使光伏逆变器具有智能操控性;对于光伏系统的维护人员,能够远程地,实时地保持光伏逆变器处于安全,可控,高效的状态下运行,已经成为整个光伏产业发展中待解决的问题。


技术实现要素:

5.(一)解决的技术问题
6.针对现有技术的不足,本发明公开了一种基于lightgbm模型的光伏电站逆变器故障诊断方法,以解决上述背景技术中提出的问题。
7.(二)技术方案
8.为实现以上目的,本发明通过以下技术方案予以实现:一种基于lightgbm模型的光伏电站逆变器故障诊断方法,包括以下步骤:
9.s1、数据采集;
10.s2、特征提取;
11.s3、模型选择;
12.s4、模型实现。
13.优选的,所述数据采集中的数据为光伏电站逆变器的运行数据,采集运行过程中的日发电量、月发电量、年发电量、累计总发电量、并网功率(有效功率)、实时功率(视在功率)、直流电流、直流电压、交流电流r、交流电流s、交流电流t、交流电压r、交流电压s、交流电压t、无功功率、功率因素。
14.优选的,所述数据采集间隔时间为75秒,取时间间隔最新数据。
15.优选的,所述数据采集均为随时间变化的数据,对这些逆变器每日的发电数据,提取每日的以下特征数据:
16.日发电电量:发电结束日累计充电电量-发电开始日累计充电电量;
17.日平均功率:实时功率平均值;
18.平均日发电量:日发电量平均值;
19.平均月发电量:月发电量平均值;
20.直流电压极差:最高直流电压-最低直流电压;
21.直流电流极差:最高直流电流-最低直流电流;
22.交流电压r极差:最高交流电压r-最低交流电压r;
23.交流电压r极差:最高交流电压r-最低交流电压r;
24.交流电压s极差:最高交流电压s-最低交流电压s;
25.交流电压s极差:最高交流电压s-最低交流电压s;
26.交流电压t极差:最高交流电压t-最低交流电压t;
27.交流电压t极差:最高交流电压t-最低交流电压t;
28.日平均有效功率:日有效功率平均值;
29.根据逆变器实际状态对数据添加标签,标签为“正常”“故障”两种,将上述特征数据作为输入变量,逆变器实际状态标签为输出变量。
30.优选的,所述模型选择采用lightgbm(light gradient boosting machine)模型,lightgbm是gbdt算法框架下的一种改进实现,一种基于决策树算法的快速、分布式、高性能的gbdt框架,支持高效率的并行训练,并且具有更少的样本、更少的特征、更少的内存等优点。
31.优选的,所述lightgbm使用直方图算法(histogram)在牺牲一定精度的条件下换取计算速度的提升和内存消耗的降低,使用了如下的两种方法:
32.单边梯度采样(gradient-based one-side sampling(goss)):首先根据样本梯度进行排序,选择top a%的大梯度的样本,再随机选择b%的其他样本,组合起来去评估信息增益,减少了样本的量(间接降低小梯度样本的出现几率);
33.互斥特征合并(exclusive feature bundling(efb)):基于图算法,合并了部分特征,减少总特征量。
34.优选的,所述lightgbm采用leaf_wise策略,而xgboost采用level_wise策略,lightgbm通过更改决策树算法的决策规则,直接原生支持类别特征,不需要转化,提高了近8倍的速度,lightgbm原生支持并行学习,目前支持特征并行(featrue parallelization)和数据并行(data parallelization)两种;
35.特征并行的主要思想是在不同机器、在不同的特征集合上分别寻找最优的分割点,然后在机器间同步最优的分割点;
36.数据并行则是让不同的机器先在本地构造直方图,然后进行全局的合并,最后在合并的直方图上面寻找最优分割点。
37.优选的,所述模型实现采用python中lightgbm库以及sklearn库中数据拆分、数据评价等相关函数,包括导入数据

数据特征筛选

划分训练集和测试集

模型参数设置

模型训练并导出模型

模型预测

模型评价

模型更新

模型应用。
38.优选的,所述导入数据:此步骤导入光伏电站逆变器发电数据,并对数据做初步清洗,删除缺失数据;
39.所述数据特征筛选:将日发电量、月发电量、年发电量、累计总发电量、并网功率
(有效功率)、实时功率(视在功率)、直流电流1、直流电压1、交流电流r、交流电流s、交流电流t、交流电压r、交流电压s、交流电压t、无功功率、功率因素等特征数据,并做好标签分类,根据电池状态将数据分别添加健康状态标签;
40.划分训练集和测试集:用sklearn.cross_validation进行训练数据集划分,训练集和交叉验证集比例为8:2,该比例可以根据需要设置,并将划分结果创建成lgb特征的数据集格式;
41.所述模型参数设置:将参数写成字典的形式;
42.所述模型训练并导出模型:直接调用python中lightgbm库,对模型进行训练,并将模型保存至本地;
43.所述模型预测:调用保存的模型对测试集进行分类预测,并与测试集实际结果进行比对;
44.所述模型评价:采用均方根误差指标来评价预测值与真实值之间差距,均方根误差越小,误差越小;
45.所述模型更新:调整模型参数,重复上述步骤,选择均方根误差最小的模型作为最终输出模型;
46.所述模型应用:采集光伏电站最新的运行数据,并进行特征计算算出特征数据,之后将特征数据整理成lgb特征的数据集格式,调用已训练出来的最优模型,判断本次数据反应的逆变器健康状态。
47.本发明公开了一种基于lightgbm模型的光伏电站逆变器故障诊断方法,其具备的有益效果如下:
48.1、该基于lightgbm模型的光伏电站逆变器故障诊断方法,采用大数据分类方法对光伏电站逆变器的健康状态进行评估,从而进行故障诊断。
49.2、该基于lightgbm模型的光伏电站逆变器故障诊断方法,光伏电站逆变器的数据采集点多,采集的逆变器运行数据数量大、种类多、时间跨度长,数据获取简便。
50.3、该基于lightgbm模型的光伏电站逆变器故障诊断方法,采用科学的方法对采集的原始数据进行数据清洗和特征提取,特征间相关性分析可更直观看到特征间相互关系,找出判断逆变器运行状态的重要因素。
51.4、该基于lightgbm模型的光伏电站逆变器故障诊断方法,采用经典的大数据分类模型,模型成熟、预测准确率高。
附图说明
52.图1为本发明流程示意图。
具体实施方式
53.本发明实施例公开一种基于lightgbm模型的光伏电站逆变器故障诊断方法,如图1所示,
54.包括以下步骤:
55.s1、数据采集;
56.s2、特征提取;
57.s3、模型选择;
58.s4、模型实现。
59.数据采集中的数据为光伏电站逆变器的运行数据,采集运行过程中的日发电量、月发电量、年发电量、累计总发电量、并网功率(有效功率)、实时功率(视在功率)、直流电流、直流电压、交流电流r、交流电流s、交流电流t、交流电压r、交流电压s、交流电压t、无功功率、功率因素。
60.数据采集间隔时间为75秒,取时间间隔最新数据。
61.数据采集均为随时间变化的数据,对这些逆变器每日的发电数据,提取每日的以下特征数据:
62.日发电电量:发电结束日累计充电电量-发电开始日累计充电电量;
63.日平均功率:实时功率平均值;
64.平均日发电量:日发电量平均值;
65.平均月发电量:月发电量平均值;
66.直流电压极差:最高直流电压-最低直流电压;
67.直流电流极差:最高直流电流-最低直流电流;
68.交流电压r极差:最高交流电压r-最低交流电压r;
69.交流电压r极差:最高交流电压r-最低交流电压r;
70.交流电压s极差:最高交流电压s-最低交流电压s;
71.交流电压s极差:最高交流电压s-最低交流电压s;
72.交流电压t极差:最高交流电压t-最低交流电压t;
73.交流电压t极差:最高交流电压t-最低交流电压t;
74.日平均有效功率:日有效功率平均值;
75.根据逆变器实际状态对数据添加标签,标签为“正常”“故障”两种,将上述特征数据作为输入变量,逆变器实际状态标签为输出变量。
76.模型选择采用lightgbm(light gradient boosting machine)模型,lightgbm是gbdt算法框架下的一种改进实现,一种基于决策树算法的快速、分布式、高性能的gbdt框架,支持高效率的并行训练,并且具有更少的样本、更少的特征、更少的内存等优点。
77.lightgbm使用直方图算法(histogram)在牺牲一定精度的条件下换取计算速度的提升和内存消耗的降低,使用了如下的两种方法:
78.单边梯度采样(gradient-based one-side sampling(goss)):首先根据样本梯度进行排序,选择top a%的大梯度的样本,再随机选择b%的其他样本,组合起来去评估信息增益,减少了样本的量(间接降低小梯度样本的出现几率);
79.互斥特征合并(exclusive feature bundling(efb)):基于图算法,合并了部分特征,减少总特征量。
80.lightgbm采用leaf_wise策略,而xgboost采用level_wise策略,lightgbm通过更改决策树算法的决策规则,直接原生支持类别特征,不需要转化,提高了近8倍的速度,lightgbm原生支持并行学习,目前支持特征并行(featrue parallelization)和数据并行(data parallelization)两种;
81.特征并行的主要思想是在不同机器、在不同的特征集合上分别寻找最优的分割
点,然后在机器间同步最优的分割点;
82.数据并行则是让不同的机器先在本地构造直方图,然后进行全局的合并,最后在合并的直方图上面寻找最优分割点。
83.模型实现采用python中lightgbm库以及sklearn库中数据拆分、数据评价等相关函数,包括导入数据

数据特征筛选

划分训练集和测试集

模型参数设置

模型训练并导出模型

模型预测

模型评价

模型更新

模型应用。
84.导入数据:此步骤导入光伏电站逆变器发电数据,并对数据做初步清洗,删除缺失数据;
85.数据特征筛选:将日发电量、月发电量、年发电量、累计总发电量、并网功率(有效功率)、实时功率(视在功率)、直流电流1、直流电压1、交流电流r、交流电流s、交流电流t、交流电压r、交流电压s、交流电压t、无功功率、功率因素等特征数据,并做好标签分类,根据电池状态将数据分别添加健康状态标签;
86.划分训练集和测试集:用sklearn.cross_validation进行训练数据集划分,训练集和交叉验证集比例为8:2,该比例可以根据需要设置,并将划分结果创建成lgb特征的数据集格式;
87.模型参数设置:将参数写成字典的形式;
88.模型训练并导出模型:直接调用python中lightgbm库,对模型进行训练,并将模型保存至本地;
89.模型预测:调用保存的模型对测试集进行分类预测,并与测试集实际结果进行比对;
90.模型评价:采用均方根误差指标来评价预测值与真实值之间差距,均方根误差越小,误差越小。
91.模型更新:调整模型参数,重复上述步骤,选择均方根误差最小的模型作为最终输出模型;
92.模型应用:采集光伏电站最新的运行数据,并进行特征计算算出特征数据,之后将特征数据整理成lgb特征的数据集格式,调用已训练出来的最优模型,判断本次数据反应的逆变器健康状态。
93.工作原理:首先导入光伏电站逆变器发电数据,并对数据做初步清洗,删除缺失数据,将日发电量、月发电量、年发电量、累计总发电量、并网功率(有效功率)、实时功率(视在功率)、直流电流1、直流电压1、交流电流r、交流电流s、交流电流t、交流电压r、交流电压s、交流电压t、无功功率、功率因素等特征数据,并做好标签分类,根据电池状态将数据分别添加健康状态标签,用sklearn.cross_validation进行训练数据集划分,训练集和交叉验证集比例为8:2,该比例可以根据需要设置,并将划分结果创建成lgb特征的数据集格式;
94.将参数写成字典的形式,直接调用python中lightgbm库,对模型进行训练,并将模型保存至本地,调用保存的模型对测试集进行分类预测,并与测试集实际结果进行比对,采用均方根误差指标来评价预测值与真实值之间差距,均方根误差越小,误差越小,调整模型参数,重复上述步骤,选择均方根误差最小的模型作为最终输出模型,采集光伏电站最新的运行数据,并进行特征计算算出特征数据,之后将特征数据整理成lgb特征的数据集格式,调用已训练出来的最优模型,判断本次数据反应的逆变器健康状态。
95.采用大数据分类方法对光伏电站逆变器的健康状态进行评估,从而进行故障诊断,光伏电站逆变器的数据采集点多,采集的逆变器运行数据数量大、种类多、时间跨度长,数据获取简便,采用科学的方法对采集的原始数据进行数据清洗和特征提取,特征间相关性分析可更直观看到特征间相互关系,找出判断逆变器运行状态的重要因素,采用经典的大数据分类模型,模型成熟、预测准确率高。
96.以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献