一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种航空发动机故障模式提取方法与流程

2022-12-02 23:04:10 来源:中国专利 TAG:


1.本发明属于自然语言处理领域,具体涉及一种航空发动机故障模式提取方法。


背景技术:

2.航空发动机具有复杂的机械构造,在使用过程中难免会发生故障。在航空发动机发生故障时,如何快速高效地定位故障并给出修理建议一直是困扰相关研究人员的一大难题。
3.随着自然语言处理技术的高速发展,越来越多的研究人员将其应用到航空发动机故障模式抽取中。目前较为主流的方法有两种:1、建立航空发动机知识库来辅助故障模式抽取;2、将航空发动机故障模式的抽取转换成一个实体抽取的任务,通过不断优化模型来提高故障模式抽取的效果。这两种方法更多的是从技术角度去考虑问题,而忽视了航空发动机的故障模式和故障类文档本身的特点。


技术实现要素:

4.本发明的目的在于克服上述现有技术中存在的不足,在深度理解大量航空发动机文档特征后,通过对文档的分析发现航空发动机的故障模式存在一些内在的规律,对这些规律进行总结,并将其应用于模型中,以此来提高航空发动机故障模式的抽取效果,并获取到故障模式之间的因果关系,当故障发生时,可以给出引起当前故障的原因。
5.为实现上述发明目的,本发明提供一种航空发动机故障模式提取方法,包括如下步骤:(1)对故障模式进行基于论元的拆分,通过论元的组合形成故障模式的事件模板;(2)定义事件抽取schema,并根据所述事件抽取schema对故障描述文档进行实体标注和故障模式标注;(3)搭建事件抽取模型,通过步骤(2)中所标注的数据生成训练语料,将所述训练语料输入所述事件抽取模型中进行训练;(4)通过训练后的事件抽取模型从故障描述文档中分别抽取出各论元和整体的故障模式;(5)将抽取出的各论元按照步骤(1)中的事件模板组合成故障模式。
6.进一步地,所述步骤(5)后面还通过知识推理模型的规则推理得到两个不同故障模式之间的因果关系。
7.进一步地,所述知识推理模型采用的推理规则为两个不同故障模式之间的上下文连接词。
8.进一步地,所述上下文连接词为表原因的触发词或表结果的触发词。
9.进一步地,依据步骤(1)中所述的事件抽取schema对步骤(4)中所述的整体故障模式进行校对,舍弃不符合该事件抽取schema的整体故障模式。
10.进一步地,步骤(1)中所述基于论元的拆分为将故障模式拆分成单元、表征信号和故障信号三部分论元。
11.进一步地,步骤(1)中所述事件模板包括以下两种:单元 表征信号 故障信号、单元 故障信号。
12.进一步地,步骤(3)中所述事件抽取模型为ner模型。
13.进一步地,论元抽取和故障模式抽取采用不同的ner模型,其中用于论元抽取的ner模型由实体标注数据进行训练,用于故障模式抽取的ner模型由故障模式标注数据进行训练。
14.进一步地,通过微平均值f1评价所述用于论元抽取的ner模型及所述用于故障模式抽取的ner模型的抽取效果。
15.与现有技术相比,本发明的有益效果为:
16.1、通过对故障模式进行分解,将复杂的命名实体识别任务转换为事件的论元抽取任务,大为简化。
17.2、由于事件schema的存在,不仅提高了故障模式抽取的精确率,同时提高了召回率。
18.3、通过制定推理规则,基于故障模式抽取的效果,可以准确获得故障模式之间的因果关系,从而得到故障发生的原因,有利于快速高效地定位故障并给出维修建议。
附图说明
19.图1为本发明一个实施例的流程图;
20.图2为本发明一个实施例中抽取出的论元组合成不同类型故障模式的示意图。
具体实施方式
21.下面结合附图和具体实施例,对本发明的技术方案做进一步说明。
22.2.如图1所示,本发明的一个实施例,包括如下步骤:(1)对故障模式进行基于论元的拆分,通过论元的组合形成故障模式的事件模板;(2)定义事件抽取schema,并根据所述事件抽取schema对故障描述文档进行实体标注和故障模式标注;(3)搭建事件抽取模型,通过步骤(2)中所标注的数据生成训练语料,将所述训练语料输入所述事件抽取模型中进行训练;(4)通过训练后的事件抽取模型从故障描述文档中分别抽取出各论元和整体的故障模式;(5)将抽取出的各论元按照步骤(1)中的事件模板组合成故障模式。需要说明的是,之所以需要两种来源的故障模式,是因为模型抽取是有误差的,并不是所有的信息都能抽取出来,组合形成的故障模式和整体抽取出来的故障模式都不是完整的,可以将两种来源的故障模式理解为两个集合,最后的结果是取两个集合的并集。
23.在一个实施例中,所述步骤(5)后面还通过知识推理模型的规则推理得到两个不同故障模式之间的因果关系。
24.在一个实施例中,所述知识推理模型采用的推理规则为两个不同故障模式之间的上下文连接词。
25.在一个实施例中,所述上下文连接词为表原因的触发词或表结果的触发词。
26.在一个实施例中,依据步骤(1)中所述的事件抽取schema对步骤(4)中所述的整体故障模式进行校对,舍弃不符合该事件抽取schema的整体故障模式。
27.在一个实施例中,步骤(1)中所述基于论元的拆分为将故障模式拆分成单元、表征信号和故障信号三部分论元。
28.在一个实施例中,步骤(1)中所述事件模板包括以下两种:单元 表征信号 故障信
号、单元 故障信号。
29.在一个实施例中,步骤(3)中所述事件抽取模型为ner模型。
30.在一个实施例中,论元抽取和故障模式抽取采用不同的ner模型,其中用于论元抽取的ner模型由实体标注数据进行训练,用于故障模式抽取的ner模型由故障模式标注数据进行训练。
31.在一个实施例中,通过微平均值f1评价所述用于论元抽取的ner模型及所述用于故障模式抽取的ner模型的抽取效果。
32.为更好地理解本发明的技术方案,下面通过一些应用实例进一步进行解释。
33.1.在对大量的文档进行总结,并且和相关专家交流过后,发现故障模式大致有两种表述方式:发动机某个零件发生了某项故障;发动机某个零件的某项物理性能发生变化,且不符合常规标准。对这两类故障模式进行拆分,可以将航空发动机的故障模式切分为以下三部分论元:单元,表征信号,故障信号。其中单元是指和发动机相关的零件,例如:风扇转子、火花塞、调压活门、主点火电嘴、高压涡轮导向器等,在故障模式中必须存在;表征信号是指压力、浓度、温度、转速等物理属性,在故障模式中可以不存在;故障信号是指损坏、过高、过快等可以表示故障的词汇,也是故障模式中必须存在的词。
34.在进行事件抽取时,将故障信号作为故障模式的触发词,整理出触发词词典,并根据拆分出的论元定义了两种事件模板:单元 表征信号 故障信号;单元 故障信号。具体的故障事件例子如下表所示。
35.表:故障事件实例
36.实例触发词单元论元表征信号论元风扇转子转速太快太快风扇转子转速发动机振动超标超标发动机振动电缆插头松动松动电缆插头无导管漏油漏油导管无
37.2.按照定义好的事件抽取schema对故障文档进行实体标注,同时将故障模式标注出来,搭建命名实体识别(ner)模型,根据标注结果生成ner模型的训练语料,将训练语料加到模型中进行训练,计算各事件抽取中各论元以及故障模式的f1值并不断优化。f1值的计算公式为:
[0038][0039]
其中,prevision是抽取结果的精确率,表示模型判断为正样本的数据中真正的正样本数;recall是抽取结果的召回率,表示所有正样本数据中真正的正样本数。经计算,如果不用本发明的方法,将故障模式作为一个实体进行抽取时,精确率是86.14%,召回率是81.27%,使用本方法后,精确率是97.51%,召回率是95.86%,大幅提高。
[0040]
在抽取论元和故障模式时,由于故障模式和论元肯定会出现实体嵌套的情况,因此本专利将不同的论元和故障模式分开训练,分别生成一个ner模型,利用训练好的模型便可以很好地抽取出相应的论元和故障模式。
[0041]
3.将文档中的文本按照标点符号进行分句,对于切分出的每一个句子,根据定义好的事件schema将模型抽取出的论元组合成故障模式。在组合故障模式时大致会有三种情
况:a.单个句子中只包含一个故障模式;b.单个句子存在多个故障模式;c.句子中有故障信号,但是没有单元。具体的情形分类如图2所示。其中图2(a)单元不存在,图2(b)触发词连在一起,图2(c)句子中存在单个故障模式,图2(d)存在多个故障模式,且单元论元一样,图2(e)存在多个故障模式,且单元论元不一样。
[0042]
对于上述5种不同情形的处理方式也有区别,具体如下:
[0043]
对于图2(a)情形,将表征信号论元和触发词组合,并且加上默认的单元论元——发动机,此时故障模式为:发动机速度超速;
[0044]
对于图2(b)情形,对于这种触发词完全连在一起的,将触发词1和触发词2组合为一个触发词,并与前面的单元论元组合成故障模式,此时的故障模式为:调压活门烧蚀裂纹;
[0045]
对于图2(c)情形,将各论元按照schema组合即可,组合成的故障模式为:风扇转子转速太快;
[0046]
对于图2(d)情形,有多个触发词,且触发词之间没有紧密相连,此时根据触发词将句子继续切分为更细粒度的短句,在进行组合时,如果其中一个短句中没有单元论元,则共用一个单元论元,此时的故障模式有两个:导管油温过高、导管漏油;
[0047]
对于图2(e)情形,有多个触发词和单元论元时,根据触发词对句子进行更细粒度的切分,之后各个细粒度的句子情况变为上述4种,按照这些情形处理即可。
[0048]
4.故障模式的来源有两种,一种是通过上述方法组合成的,另一种是通过模型直接抽取获得。组合生成的故障模式是符合事件抽取schema的。但是通过模型抽取出的故障模式会有错误的数据,因此需要通过事件抽取schema对模型抽取出的故障模式进行校对,如果不符合事件schema,则将其舍弃,这样做可以提高抽取故障模式的精确率。本系统采用bert-bilstm-crf方法作为默认故障模式字段模型。传统的识别实体识别模型只能识别连续的字符串作为实体名称,即bio标注方式下,b后接连续若干个i。航空发动机故障领域论元和触发词之间可能存在其他无关词,如“油管的温度突然升高”。本系统设计一种bio断续标注,i标记之前可以标记o,i属于左侧距离它最近的b。
[0049]
表:断续标记标注方式
[0050][0051]
5.故障模式之间的因果关系可以通过规则推理来获得。本发明的实施例中定义了两种简单的规则:
[0052]
1)故障模式a——表原因的触发词——故障模式b;
[0053]
2)故障模式a——表结果的触发词——故障模式b。
[0054]
通过这两种规则,可以生成故障模式之间的因果关系。其中表原因的触发词有因为、由于、缘于等,表结果的触发词有导致、造成、因此、所以、从而、以至于、那么、于是、以致于、致使、故而、引起、诱使、诱发、使得等。
[0055]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然
可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献