一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种风机运行健康状态预警方法及系统与流程

2021-10-16 03:50:00 来源:中国专利 TAG:风机 预警 故障 状态 运行


1.本发明属于风机故障检测技术领域,具体涉及一种风机运行健康状态预警方法及系统。


背景技术:

2.风电机组通常由叶片、发电机、偏航和发电机等部件构成,这些部件的可靠性对于机组性能和安全具有重大影响,随着使用年限的增长,以及恶劣工况运行条件所带来的影响,电站发电机组的某些部件,如齿轮箱、发电机及轴承系统等极易发生故障,造成故障停机,轻则影响机组本身的可利用率,重则影响发电量,进而造成开发商不必要的利益损失。
3.发电机组属于机



热强耦合复杂系统,设备与设备之间的强耦合性、机组运行工况的反复多变性都决定了发电机组是一个故障高频发生场所。发电机组故障的产生并非一蹴而就,其生成和发展一般需经由异常、缺陷、故障及事故等几个过程。故障发生时,机组设备观测参数的变化需经由不明显到显著的渐变过程,若能在发电机组故障刚萌生、程度尚且轻微的阶段识别出异常,相比于已经造成严重后果的故障修复具有更重大的意义。
4.传统的基于专家系统的故障预警方法,可针对诸如发电系统等复杂系统,但该方法的知识来源不足以表达和反映事物的特征,而且由于没有利用设备自身的历史数据、归纳运行特征,难以发现潜在故障。


技术实现要素:

5.本发明的目的在于提供一种风机运行健康状态预警方法及系统,解决了现有技术中存在的上述不足。
6.为了达到上述目的,本发明采用的技术方案是:
7.本发明提供的一种风机运行健康状态预警方法,包括以下步骤:
8.步骤1,获取发电机子系统的原始训练样本,原始训练样本包括若干原始参数字段;
9.步骤2,对原始训练样本进行预处理得到预处理训练样本;
10.步骤3,对预处理训练样本中的参数字段进行参数过滤,得到核心特征样本,其中,核心特征样本包括正常数据样本和故障数据样本;
11.步骤4,对故障数据样本进行过采样,得到新的核心特征样本;
12.步骤5,采用基于支持向量机分类算法和随机森林算法的多重投票法对核心特征样本进行训练,得到发电机子系统预测模型;
13.步骤6,根据发电机子系统预测模型对待预测样本进行预测,得到预测结果。
14.优选地,步骤1中,若干原始参数字段分别为数据时间、有功功率均值、发电机转速均值、发电机驱动端轴承温度均值、发电机非驱动端轴承温度均值、发电机定子u相绕组温度均值、发电机定子v相绕组温度均值、发电机定子w相绕组温度均值和机组号。
15.优选地,步骤2中,对原始训练样本进行预处理得到预处理训练样本,具体方法是:
16.依次对原始训练样本进行空值处理、类型转换和标准化转换,得到预处理训练样本。
17.优选地,所述空值处理的具体方法是:
18.按照行维度和列维度交叉的方式对原始训练样本进行空值处理,得到空值处理后的训练样本;
19.类型转换的具体方法是:
20.对空值处理后的训练样本中的原始类型为字符型的原始参数字段进行整形转换,得到连续型数值字段;
21.标准化转换的具体方法是:
22.对每个连续型数值字段采用归一化处理方法进行处理,得到预处理训练样本。
23.优选地,步骤3中,对预处理训练样本中的参数字段进行参数过滤,得到核心特征样本,具体方法是:
24.在预处理训练样本中增加标签列,其中,标签列包括正常标签和故障标签;
25.分别计算预处理训练样本中各个参数字段对齿轮箱状态预测影响的重要性分数;
26.根据各个参数字段对发电机状态预测影响的重要性分数筛选得到核心参数,由核心参数形成核心特征样本。
27.优选地,步骤5中,采用基于支持向量机分类算法和随机森林算法的多重投票法对核心特征样本进行训练,具体方法是:
28.s51:将所述核心特征样本进行随即切分,得到k个子训练样本集;
29.s52:基于支持向量机分类算法和随机森林算法构建内部弱分类器,并构建内部投票分类器,将弱分类器输入内部投票分类器,对所述k个子训练样本集训练,得到k个投票分类模型,选取得分最高的弱分类器作为对应投票分类模型的输出;
30.s53:根据内部投票分类器的评估得分,采用软投票方法对k个投票分类模型在外部再次投票选取得分最高的投票分类模型,得到发电机子系统预测模型。
31.优选地,步骤6中,预测结果包括预测时间、预测状态和预测概率,其中,预测状态为正常状态或故障状态。
32.一种风机运行健康状态预警系统,该系统能够运行所述的一种风机运行健康状态预警方法,包括:
33.数据采集单元,用于获取发电机子系统的原始训练样本,原始训练样本包括若干原始参数字段;
34.数据处理单元,用于对原始训练样本进行预处理得到预处理训练样本;
35.样本构建单元,用于对预处理训练样本中的原始参数字段进行参数过滤,得到核心参数,根据核心参数得到核心特征样本,核心特征样本包括正常数据样本和故障数据样本;
36.样本处理单元,用于对故障数据样本进行过采样,得到新核心特征样本;
37.模型构建单元,用于基于支持向量机分类算法和随机森林算法的多重投票法对核心特征样本进行训练,得到发电机子系统预测模型;
38.预测单元,用于根据发电机子系统预测模型对待预测样本进行预测,得到预测结果。
39.与现有技术相比,本发明的有益效果:
40.本发明提供的一种风机运行健康状态预警方法,建立了基于风机发电机子系统的核心参数的发电机子系统预测模型,以实现对风机发电机的状态、故障发生概率,故障发生时间的预测,可以得到较为精准的预测结果,方便用户对风机的及时维护。
41.进一步的,依次对原始训练样本进行空值处理、类型转换和标准化转换,以使每个原始参数字段的数据服从标准正态分布,以消除每个参数项由于个别业务不相关的大变动数据给模型训练带来的消极影响,提升后续模型训练的效率和模型质量。
42.进一步的,为了同时满足模型的高质量训练和输出核心影响参数的需求,在模型训练预测之前使用过滤法对每个归一化处理的连续型数值字段进行核心参数项选择。
附图说明
43.图1是本发明的流程示意图。
具体实施方式
44.为了进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及具体实施方式,对依据本发明提出的一种风机运行健康状态预警方法进行详细说明。
45.有关本发明的前述及其他技术内容、特点及功效,在以下配合附图的具体实施方式详细说明中即可清楚地呈现。通过具体实施方式的说明,可对本发明为达成预定目的所采取的技术手段及功效进行更加深入且具体地了解,然而所附附图仅是提供参考与说明之用,并非用来对本发明的技术方案加以限制。
46.实施例一
47.请参见图1,图1是本发明实施例提供的一种风机运行健康状态预警方法示意图。如图所示,本实施例的风机运行健康状态预警方法,包括:
48.s1:获取发电机子系统原始训练样本,原始训练样本包括若干原始参数字段;
49.在本实施例中,原始参数字段包括:数据时间、有功功率均值、发电机转速均值、发电机驱动端轴承温度均值、发电机非驱动端轴承温度均值、发电机定子u相绕组温度均值、发电机定子v相绕组温度均值、发电机定子w相绕组温度均值和机组号。
50.s2:对原始训练样本进行预处理得到预处理训练样本;
51.在本实施例中,原始训练样本中的各参数字段均为数值型数据,可直接采用标准化处理的方式对数据进行预处理,可以使每个参数项的数据服从标准正态分布,以消除每个参数项由于个别业务不相关的大变动数据给模型训练带来的消极影响,提升后续模型训练的效率和模型质量。
52.需要说明的是,每个参数项原始数据分布指标共包括7项,分别为mean(平均值)、std(标准差)、mi n(最小值)、四分位数(25%、50%、75%)和max(最大值)。其中,标准差用于衡量每个参数项数据整体离散程度;四分位数是通过计算每个参数项数据的25%、50%和75%处数据,衡量数据的整体分布状况。
53.具体地,s2包括:
54.依次对原始训练样本进行空值处理、类型转换和标准化转换,得到预处理训练样
本。
55.在本实施例中,空值处理步骤包括:对每个原始参数字段进行空值统计,对空值数量符合第一条件的字段采用后值填充法进行填充;对空值数量符合第二条件的字段进行删除。
56.具体地,按照行维度和列维度交叉的方式对数据进行空值处理,首先针对每个原始参数字段进行空值的统计,统计每个参数项的数据空值量的占比,对于缺失占比小于25%的参数项采用后值法进行填充,即使用在行维度下一个不为空的数据值进行填充,将空值占比大于40%的参数项直接删除,对于缺失占比在25%

40%之间的参数项,在行维度将该条数据删除。
57.在本实施例中,通过空值处理能够最大程度减轻空值对训练数据质量的影响。
58.进一步地,类型转换步骤包括:对表现为数值型但原始类型为字符型的原始参数字段进行整形转换,转换为数值型字段。
59.可选地,可以采用python自带的类型转换方法进行转换。
60.进一步地,在类型转换后进行,为了降低个别数值型字段由于跨度大和离散值过多对模型训练的负面影响,对通过分布观察后的字段进行标准化转换。
61.具体地,标准化转换步骤包括:对每个连续型数值变量采用归一化处理方法进行处理,以使转换后的每个字段服从标准正态分布模型,以得到预处理训练样本。
62.在本实施例中,通过对每个值减去该字段均值,再除去标准差,得到该连续型数值变量的标准值,其中,每个参数项预处理过后数据分布指标共包括7项,分别为mean(平均值)、std(标准差)、mi n(最小值)、四分位数(25%、50%、75%)和max(最大值)。
63.s3:对预处理训练样本中的参数字段进行参数过滤,得到核心参数以及核心特征样本;
64.其中,核心特征样本包括正常数据样本和故障数据样本。
65.在本实施例中,为了同时满足模型的高质量训练和输出核心影响参数的需求,在模型训练预测之前使用过滤法进行核心参数项选择,通过计算各个参数项对于状态预测(故障或正常运行)的重要性,并根据各参数项的重要性得分,筛选出核心参数。
66.需要说明的是,在进行参数过滤之前需要对预处理训练样本增加标签列,在本实施例中,正常标签记为1,故障标签记为0。
67.具体地,s3包括:
68.s31:计算发电机子系统各参数项对发电机状态预测影响的方差,基于方差分析计算得到各参数项的f值和p值;
69.在本实施例中,f值用于表示方差值间接判断因素影响的显著性,即样本整体的f值跟每个参数项方差的调和;p值用于统计层面的有效性,用于进一步判断通过f值判断的各因素影响的统计层面的有效性。
70.关于f值计算,首先计算基于每个参数项的样本整体的f值,再计算每个参数项相对于整体样本的f值,最后计算每个参数项f值跟整体f值的调和作为每个样本的输出f值。
71.p值通过结合参数样本正态分布输出和置信度计算得到,其中,s表示标准差,α表示置信度,α由统计标准给出,在本实施例中取值0.05。
72.s32:计算发电机子系统各参数项对发电机状态预测影响的重要性分数;
73.在本实施例中,重要性分数是由样本整体的f值、各参数的f值和p值计算得到。首先,计算每个参数f值跟整体f值的调和,计算公式为fj=θ*f1*fi,其次,计算每个参数项的调和f值与p值的调和,计算公式为fk=β*fj*p,最后将所有参数项的调和值相加并计算每个参数项调和值在整体的占比,该占比作为每个参数项的重要性分数。
74.s33:选取参数字段中,满足预设的f值与p值的取值范围,并且重要性分数大于第三条件的参数字段作为核心参数,并根据所述核心参数得到核心特征样本。
75.在本实施例中,根据对发电机子系统各参数项进行方差分析特征选择过程和结果,参考各参数项f值的分布区间[11,4],对于发电机子系统,f值需大于6.5,p值需小于0.01。
[0076]
具体地,根据方差分析判断选取参数的原理,在选取核心参数项时,首先结合发电机子系统每个参数项的f值和p值进行初选,得到6个参数项进入核心参数项备选,再根据重要性分数进行最终选取,在本实施例中,将重要性分数大于0.5的参数作为核心参数,其余参数过滤掉。
[0077]
具体地,核心参数包括:有功功率均值、发电机转速均值和发电机定子v相绕组温度均值。
[0078]
s4:对故障数据样本进行过采样,以使故障数据样本与正常数据样本达到均衡;
[0079]
在本实施例中,由于发电机子系统的正常数据样本数量与故障数据样本数量的比例为262:1,该比例过于悬殊,为了达到故障数据样本与正常数据样本的平衡性进而保证发电机系统预测模型的训练效果,将故障数据划分为262份,每份故障数据对应全量的正常运行数据。
[0080]
可选地,可以通过现有故障数据样本的分布特征合成人工的故障数据样本注入到核心特征样本中;或者通过复制或内插的方法产生故障数据样本以实现正常数据样本与故障数据样本达到均衡。
[0081]
s5:采用多重投票法对核心特征样本进行训练,得到发电机子系统预测模型;
[0082]
在本实施例中,采用多重投票法进行模型训练、评估和选取,可以进一步消除样本不平衡性带来的负面影响。
[0083]
具体地,s5包括:
[0084]
s51:将所述核心特征样本进行随即切分,得到k个子训练样本集;
[0085]
s52:基于支持向量机分类算法和随机森林算法构建内部弱分类器,并构建内部投票分类器,将弱分类器输入内部投票分类器,对所述k个子训练样本集训练,得到k个投票分类模型,选取得分最高的弱分类器作为对应投票分类模型的输出;
[0086]
需要说明的是,针对发电机子系统的状态预警的投票分类器模型是基于投票分类算法构建集成二分类模型,使用分类模型的评估标准进行分类预测效果的评估,评估指标包括准确率、召回率和f1分数,当三个评估指标同时达到0.8以上时表明该模型基于当前参数组合的分类预测效果更优,当有一项低于0.75时,则需要继续调参优化。
[0087]
在模型训练过程中,每轮训练需要调整弱分类器算法以及选取最优模型和预测结果的投票选取方式两个参数,其中,弱分类器算法为支持向量机分类算法和随机森林算法的组合,评估指标为精准度、召回率和f1分数。
[0088]
支持向量机分类算法是一种分类算法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的,通俗来讲,它是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。
[0089]
在本实施例中,采用支持向量机分类算法,基本上不涉及概率测度及大数定律等,因此不同于现有的统计方法,从它避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预测样本的“转导推理”,大大简化了分类问题,最终决策函数只由少数的支持向量所确定,计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾难”,同时对于正负样本的比例不会过于敏感,可以消除由于正负样本比例不均衡对模型准确度造成的消极影响。
[0090]
随机森林分类算法是一个集成的元估计器,它适合数据集的各种子样本上的许多决策树分类器,并使用平均值来提高预测准确性和控制过度拟合,即取所有单个决策树分类器的平均值作为模型最终的预测输出。
[0091]
在本实施例中,采用随机森林分类算法,可以判断特征的重要程度,可以判断出不同特征之间的相互影响,不容易过拟合,而且,训练速度比较快,容易做成并行方法,实现起来比较简单,对于不平衡的数据集来说,它可以平衡误差,如果有很大一部分的特征遗失,仍可以维持准确度。
[0092]
s53:根据内部投票分类器的评估得分,采用软投票方法对k个投票分类模型在外部再次投票选取得分最高的投票分类模型,得到发电机子系统预测模型。
[0093]
在本实施例中,采取软投票的方法,首先获取各个弱分类器对某条数据的预测类别概率,然后计算各个类别概率的平均值,取其中最高的类别概率作为输出的类别。由于软投票的方法会给与那些高度自信的投票更多的权重,相比于硬投票方法,性能更好。
[0094]
s6:根据发电机子系统预测模型对待预测样本进行预测,得到预测结果。
[0095]
在本实施例中,预测结果包括预测时间、预测状态和预测概率,其中预测状态为正常状态或故障状态,预测概率介于0到1之间。
[0096]
具体地,抽取待预测月份前三个月某型号风机发电机子系统的数据,使用训练得到的发电机子系统预测模型对目标月份该型号风机子系统状况进行预测,得到预测结果。
[0097]
本实施例的风机运行健康状态预警方法,建立了基于风机发电机子系统的核心参数的发电机子系统预测模型,以实现对风机发电机的状态、故障发生概率,故障发生时间的预测,可以得到较为精准的预测结果,方便用户对风机的及时维护。
[0098]
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。
[0099]
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在
不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜