一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种风机变桨子系统故障预警方法与流程

2021-09-07 23:36:00 来源:中国专利 TAG:风机 故障 子系统 预警 检测


1.本发明属于风机故障检测技术领域,具体涉及一种风机变桨子系统故障预警方法。


背景技术:

2.近年来,随着风力发电技术的高速发展,一方面,风电机组的单机容量越来越大,风电场大规模建设并网;另一方面,风机运行时间的不断增长,使得机组疲劳失效时间与维护费用显著增加。风机故障预警指的是采集风机的实时数据,然后采用机理算法、机器学习算法等方法处理这些实时数据,从而得到风机在未来一段时间出现故障的概率,进而来决定在现在或者未来的某个时间点采用何种运维策略。
3.变桨系统作为风力发电机组核心系统,是重要的传动链控制装置,结构复杂且故障率高,为影响风机发电量、能量控制甚至机组安全的重要部件。因此,及时准确发现变桨系统潜在的故障,已成为风电场安全、经济运行的关键问题。目前,针对变桨电机故障的预警方案中,绝大多数是采用门限值法,通过设定单一阈值进行逻辑判断,从而达到预警目的。该类方案一方面没有考虑到设备工况,容易误报警,不利于风电机组稳定运行,另一方面没有利用设备自身的历史数据、归纳运行特征,难以发现潜在故障。


技术实现要素:

4.本发明的目的在于提供一种风机变桨子系统故障预警方法,解决了现有技术中针对变桨电机故障的预警方法存在的准确率低的缺陷。
5.为了达到上述目的,本发明采用的技术方案是:
6.本发明提供的一种风机变桨子系统故障预警方法,包括以下步骤:
7.步骤1,获取变桨子系统原始训练样本,原始训练样本包括若干原始参数字段;
8.步骤2,对原始训练样本进行预处理得到预处理训练样本;
9.步骤3,对预处理训练样本中的原始参数字段进行参数过滤,得到核心参数,根据核心参数得到核心特征样本,核心特征样本包括正常数据样本和故障数据样本;
10.步骤4,故障数据样本进行过采样,以使故障数据样本与正常数据样本达到平衡,得到新核心特征样本;
11.步骤5,对新核心特征样本进行训练,得到变桨子系统预测模型;
12.步骤6,根据变桨子系统预测模型对待预测样本进行预测,得到预测结果。
13.优选地,步骤1中,原始参数字段包括时间数据、主轴转速均值、轮毂温度均值、第一叶片变桨角度均值、第二叶片变桨角度均值、第三叶片变桨角度均值、第一叶片变桨超级电容电压均值、第二叶片变桨超级电容电压均值、第三叶片变桨超级电容电压均值、第一叶片变桨电机温度均值、第二叶片变桨电机温度均值、第三叶片变桨电机温度均值、有功功率均值、机组号、第一变桨行程、第二变桨行程和第三变桨行程。
14.优选地,步骤2中,对原始训练样本进行预处理得到预处理训练样本,具体方法是:
15.依次对原始训练样本进行空值处理、类型转换和标准化转换,得到预处理训练样本。
16.优选地,所述空值处理的具体方法是:
17.按照行维度和列维度交叉的方式对原始训练样本进行空值处理,得到空值处理后的训练样本;
18.类型转换的具体方法是:
19.对空值处理后的训练样本中的原始类型为字符型的原始参数字段进行整形转换,得到连续型数值字段;
20.标准化转换的具体方法是:
21.对每个连续型数值字段采用归一化处理方法进行处理,得到预处理训练样本。
22.优选地,步骤3中,对预处理训练样本中的每个归一化处理的连续型数值字段进行参数过滤,得到核心参数,具体方法是:
23.分别计算预处理训练样本中的每个归一化处理的连续型数值字段对于风机变桨子系统状态预测的重要性分数,并根据每个归一化处理的连续型数值字段的重要性得分筛选得到核心参数。
24.优选地,计算预处理训练样本中的每个归一化处理的连续型数值字段对于风机变桨子系统状态预测的重要性,具体方法是:
25.s31,计算每个归一化处理的连续型数值字段对变桨状态预测影响的方差,根据得到的方差计算对应的每个归一化处理的连续型数值字段的f值和p值;
26.s32,根据s31中得到的每个归一化处理的连续型数值字段的f值和p值计算每个归一化处理的连续型数值字段对变桨状态预测影响的重要性分数。
27.优选地,步骤5中,对核心特征样本进行训练,得到变桨子系统预测模型的具体方法是:
28.将核心特征样本进行随即切分,得到k个子训练样本集;
29.基于决策树分类算法和随机森林算法构建内部弱分类器,并构建内部投票分类器,将弱分类器输入内部投票分类器,对k个子训练样本集训练,得到k个投票分类模型;
30.采用软投票方法对k个投票分类模型在外部再次投票选取得分最高的投票分类模型,得到变桨子系统预测模型。
31.优选地,步骤6中,预测结果包括预测时间、预测状态和预测概率,其中,预测状态为正常状态或故障状态。
32.一种风机变桨子系统故障预警系统,该系统能够所述的一种风机变桨子系统故障预警方法,包括数据采集单元、数据处理单元、样本构建单元、样本处理单元、模型构建单元和预测单元,其中:
33.数据采集单元用于获取变桨子系统原始训练样本,原始训练样本包括若干原始参数字段;
34.数据处理单元用于对原始训练样本进行预处理得到预处理训练样本;
35.样本构建单元用于对预处理训练样本中的原始参数字段进行参数过滤,得到核心参数,根据核心参数得到核心特征样本,核心特征样本包括正常数据样本和故障数据样本;
36.样本处理单元用于对故障数据样本进行过采样,以使故障数据样本与正常数据样
本达到平衡,得到新核心特征样本;
37.模型构建单元用于对新核心特征样本进行训练,得到变桨子系统预测模型;
38.预测单元用于根据变桨子系统预测模型对待预测样本进行预测,得到预测结果。
39.与现有技术相比,本发明的有益效果在于:
40.本发明的风机变桨子系统故障预警方法,建立了基于风机变桨子系统的核心参数的变桨子系统预测模型,以实现对风机变桨的状态、故障发生概率,故障发生时间的预测,能够得到较为精准的预测结果,利于用户对风机的及时维护。
41.进一步的,依次对原始训练样本进行空值处理、类型转换和标准化转换,以使每个原始参数字段的数据服从标准正态分布,以消除每个参数项由于个别业务不相关的大变动数据给模型训练带来的消极影响,提升后续模型训练的效率和模型质量。
42.进一步的,为了同时满足模型的高质量训练和输出核心影响参数的需求,在模型训练预测之前使用过滤法对每个归一化处理的连续型数值字段进行核心参数项选择。
附图说明
43.图1是本发明实施例提供的一种风机变桨子系统故障预警方法的示意图。
具体实施方式
44.为了进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及具体实施方式,对依据本发明提出的一种风机变桨子系统故障预警方法进行详细说明。
45.有关本发明的前述及其他技术内容、特点及功效,在以下配合附图的具体实施方式详细说明中即可清楚地呈现。通过具体实施方式的说明,可对本发明为达成预定目的所采取的技术手段及功效进行更加深入且具体地了解,然而所附附图仅是提供参考与说明之用,并非用来对本发明的技术方案加以限制。
46.实施例一
47.请参见图1,图1是本发明提供的一种风机变桨子系统故障预警方法的示意图。如图所示,本实施例的风机变桨子系统故障预警方法,包括:
48.s1:获取变桨子系统原始训练样本,原始训练样本包括若干原始参数字段;
49.在本实施例中,原始参数字段包括:时间数据、主轴转速均值、轮毂温度均值、第一叶片变桨角度均值、第二叶片变桨角度均值、第三叶片变桨角度均值、第一叶片变桨超级电容电压均值、第二叶片变桨超级电容电压均值、第三叶片变桨超级电容电压均值、第一叶片变桨电机温度均值、第二叶片变桨电机温度均值、第三叶片变桨电机温度均值、有功功率均值、机组号、第一变桨行程、第二变桨行程和第三变桨行程。
50.s2:对原始训练样本进行预处理得到预处理训练样本;
51.在本实施例中,原始训练样本中的各参数字段均为数值型数据,可直接采用标准化处理的方式对数据进行预处理,可以使每个原始参数字段的数据服从标准正态分布,以消除每个参数项由于个别业务不相关的大变动数据给模型训练带来的消极影响,提升后续模型训练的效率和模型质量。
52.需要说明的是,每个原始参数字段原始数据分布指标共包括7项,分别为mean(平
均值)、std(标准差)、min(最小值)、四分位数(25%、50%、75%)和max(最大值)。其中,标准差用于衡量每个参数项数据整体离散程度;四分位数是通过计算每个参数项数据的25%、50%和75%处数据,衡量数据的整体分布状况。
53.具体地,s2包括:
54.依次对原始训练样本进行空值处理、类型转换和标准化转换,得到预处理训练样本。
55.在本实施例中,空值处理步骤包括:对每个原始参数字段进行空值统计,对统计得到的空值数量符合第一条件的字段采用后值填充法进行填充;对统计得到的空值数量符合第二条件的字段进行删除。
56.具体地,按照行维度和列维度交叉的方式对数据进行空值处理,其中:
57.首先,针对每个原始参数字段进行空值的统计,
58.其次,统计每个原始参数字段的空值量的占比;
59.接着,对于空值量占比小于25%的每个原始参数字段采用后值法进行填充,即使用在行维度下一个不为空的数据值进行填充;
60.对于空值量占比大于40%的每个原始参数字段直接删除;
61.对于空值量占比在25%

40%之间的每个原始参数字段,在行维度将该条数据删除。
62.在本实施例中,通过空值处理能够最大程度减轻空值对训练数据质量的影响。
63.进一步地,类型转换步骤包括:对表现为数值型但原始类型为字符型的原始参数字段进行整形转换,转换为连续型数值字段。
64.也就是说转换后的训练样本中的每个原始参数字段均为数值型。
65.可选地,可以采用python自带的类型转换方法进行转换。
66.进一步地,在类型转换后进行,为了降低个别连续型数值字段由于跨度大和离散值过多对模型训练的负面影响,对通过分布观察后的每个连续型数值字段进行标准化转换。
67.具体地,标准化转换步骤包括:对每个连续型数值字段采用归一化处理方法进行处理,以使转换后的每个连续型数值字段服从标准正态分布模型,以得到预处理训练样本。
68.在本实施例中,通过对每个连续型数值字段的每个值减去该字段均值,再除去标准差,得到该连续型数值字段的标准值,其中,每个连续型数值字段预处理过后数据分布指标共包括7项,分别为mean(平均值)、std(标准差)、min(最小值)、四分位数(25%、50%、75%)和max(最大值)。
69.s3:对预处理训练样本中的参数字段进行参数过滤,得到核心参数以及核心特征样本;
70.其中,核心特征样本包括正常数据样本和故障数据样本。
71.在本实施例中,为了同时满足模型的高质量训练和输出核心影响参数的需求,在模型训练预测之前使用过滤法对每个归一化处理的连续型数值字段进行核心参数项选择,即通过计算每个归一化处理的连续型数值字段对于风机变桨子系统的状态预测(故障或正常运行)的重要性,并根据每个归一化处理的连续型数值字段的重要性得分,筛选出核心参数。
72.需要说明的是,在进行参数过滤之前需要对预处理训练样本增加标签列,在本实施例中,正常标签记为1,故障标签记为0。
73.具体地,s3包括:
74.s31:计算变桨子系统每个归一化处理的连续型数值字段对变桨状态预测影响的方差,基于方差分析计算得到各每个归一化处理的连续型数值字段的f值f和p值p;
75.在本实施例中,f值用于表示方差值间接判断因素影响的显著性,即样本整体的f值跟每个原始参数字段方差的调和;p值用于表示统计层面的有效性,用于进一步判断通过f值判断的各因素影响的统计层面的有效性。
76.关于f值f的计算:首先计算基于每个归一化处理的连续型数值字段的样本整体的f值,记为f1,再计算每个归一化处理的连续型数值字段相对于整体样本的f值,记为f2,最后计算每个归一化处理的连续型数值字段f值跟整体f值的调和作为每个样本的输出f值,记为f。
77.p值通过结合参数样本正态分布输出和置信度计算得到,其中,s表示标准差,α表示置信度,α由统计标准给出,在本实施例中取值0.05。
‑‑
每个参数项的期望值,x
a/2
‑‑
每个参数项在二分之一置信度处的取值,n
‑‑
样本数。
78.s32:计算变桨子系统各归一化处理的连续型数值字段对变桨状态预测影响的重要性分数;
79.在本实施例中,重要性分数是由样本整体的f值、各参数的f值和p值计算得到:
80.首先,计算每个归一化处理的连续型数值字段f值跟整体f值的调和值f
j
,计算公式为f
j
=θ*f1*f
i
,θ
‑‑
调和参数1;f1
‑‑
整体参数f值;f
i
‑‑
每个参数f值;
81.其次,计算每个归一化处理的连续型数值字段的调和值与p值的调和值f
k
,计算公式为f
k
=β*f
j
*p,其中,β
‑‑
调和参数2;
82.最后,将所有原始参数字段的调和值相加,并计算每个归一化处理的连续型数值字段调和值在整体的占比,该占比作为每个归一化处理的连续型数值字段的重要性分数。
83.s33:选取归一化处理的连续型数值字段中,满足预设的f值与p值的取值范围,并且重要性分数大于第三条件的归一化处理的连续型数值字段为核心参数,并根据核心参数得到核心特征样本。
84.在本实施例中,根据对变桨子系统各归一化处理的连续型数值字段进行方差分析特征选择过程和结果,参考各归一化处理的连续型数值字段f值的分布区间[18,2],对于变桨子系统,f值需大于3.5,p值需小于0.015。
[0085]
具体地,根据方差分析判断选取参数的原理,在选取核心参数项时,首先结合变桨子系统每个归一化处理的连续型数值字段的f值和p值进行初选,得到12个归一化处理的连续型数值字段进入核心参数备选,再根据重要性分数进行最终选取,在本实施例中,将重要性分数大于0.5的归一化处理的连续型数值字段作为核心参数,其余参数过滤掉。
[0086]
具体地,核心参数包括:有功功率均值、第三叶片变桨角度均值、第一叶片变桨角度均值、轮毂温度均值和主轴转速均值。
[0087]
s4:对故障数据样本进行过采样,以使故障数据样本与正常数据样本达到平衡;
[0088]
在本实施例中,由于变桨子系统的正常数据样本数量与故障数据样本数量的比例
为85:1,该比例过于悬殊,为了达到故障数据样本与正常数据样本的平衡性进而保证变桨系统预测模型的训练效果,将故障数据划分为85份,每份故障数据对应全量的正常运行数据。
[0089]
可选地,可以通过现有故障数据样本的分布特征合成人工的故障数据样本注入到核心特征样本中;或者通过复制或内插的方法产生故障数据样本以实现正常数据样本与故障数据样本达到均衡。
[0090]
s5:采用多重投票法对核心特征样本进行训练,得到变桨子系统预测模型;
[0091]
在本实施例中,采用多重投票法进行模型训练、评估和选取,可以进一步消除样本不平衡性带来的负面影响。
[0092]
具体地,s5包括:
[0093]
s51:将核心特征样本进行随即切分,得到k个子训练样本集;
[0094]
s52:基于决策树分类算法和随机森林算法构建内部弱分类器,并构建内部投票分类器,将弱分类器输入内部投票分类器,对k个子训练样本集训练,得到k个投票分类模型,选取得分最高的弱分类器作为对应投票分类模型的输出;
[0095]
需要说明的是,针对变桨子系统的状态预警的投票分类器模型是基于投票分类算法构建集成二分类模型,使用分类模型的评估标准进行分类预测效果的评估,评估指标包括准确率、召回率和f1分数,当三个评估指标同时达到0.8以上时表明该模型基于当前参数组合的分类预测效果更优,当有一项低于0.75时,则需要继续调参优化。
[0096]
在模型训练过程中,每轮训练需要调整弱分类器算法以及选取最优模型和预测结果的投票选取方式两个参数,其中,弱分类器算法为决策树分类算法和随机森林算法的组合,评估指标为精准度、召回率和f1分数。
[0097]
决策树分类算法是一种逼近离散函数值的方法,它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析,本质上决策树是通过一系列规则对数据进行分类的过程。
[0098]
在本实施例中,采用决策树分类算法,能够同时处理数据型和常规型属性,在相对短的时间内能够对大型数据源做出可行且效果良好的结果,对缺失值不敏感,可以处理不相关特征数据,效率高,而且决策树只需要一次构建,反复使用,需要说明的是,每一次预测的最大计算次数不超过决策树的深度。
[0099]
随机森林分类算法是一个集成的元估计器,它适合数据集的各种子样本上的许多决策树分类器,并使用平均值来提高预测准确性和控制过度拟合,即取所有单个决策树分类器的平均值作为模型最终的预测输出。
[0100]
在本实施例中,采用随机森林分类算法,可以判断特征的重要程度,可以判断出不同特征之间的相互影响,不容易过拟合,而且,训练速度比较快,容易做成并行方法,实现起来比较简单,对于不平衡的数据集来说,它可以平衡误差,如果有很大一部分的特征遗失,仍可以维持准确度。
[0101]
s53:根据内部投票分类器的评估得分,采用软投票方法对k个投票分类模型在外部再次投票选取得分最高的投票分类模型,得到变桨子系统预测模型。
[0102]
在本实施例中,采取软投票的方法,首先获取各个弱分类器对某条数据的预测类别概率,然后计算各个类别概率的平均值,取其中最高的类别概率作为输出的类别。由于软
投票的方法会给与那些高度自信的投票更多的权重,相比于硬投票方法,性能更好。
[0103]
s6:根据变桨子系统预测模型对待预测样本进行预测,得到预测结果。
[0104]
在本实施例中,预测结果包括预测时间、预测状态和预测概率,其中预测状态为正常状态或故障状态,预测概率介于0到1之间。
[0105]
具体地,抽取待预测月份前三个月某型号风机变桨子系统的数据,使用训练得到的变桨子系统预测模型对目标月份该型号风机子系统状况进行预测,得到预测结果。
[0106]
本实施例的风机变桨子系统故障预警方法,建立了基于风机变桨子系统的核心参数的变桨子系统预测模型,以实现对风机变桨的状态、故障发生概率,故障发生时间的预测,可以得到较为精准的预测结果,利于用户对风机的及时维护。
[0107]
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。
[0108]
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜