一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

故障预测方法、系统、电子设备和计算机程序产品与流程

2022-06-18 05:51:01 来源:中国专利 TAG:
1.本发明涉及故障预测领域,尤其涉及一种齿轮传动装置的故障预测方法和系统、电子设备、计算机程序产品。
背景技术
::2.齿轮传动装置作为机械设备(例如,风电机组的传动系统,或者轨道列车的传动系统等)的重要部件,在机械领域,如风力发电机、轨道车辆、直升机等设备的机械传动系统中有着广泛的应用,其运行状态正常与否直接决定了整台机械设备的运行情况。然而,由于长期运行在高速、重载或高温等复杂恶劣环境,齿轮传动装置极易发生裂纹或点蚀等故障,一旦齿轮传动装置在运行过程中产生故障,不仅会给生产效益带来一定的损失,而且还会对人身安全造成伤害。因此,为了保障设备正常运行和保护生命财产安全,对齿轮传动装置的运行状态进行及时的评价具有重要的应用价值和意义。3.然而,由于齿轮传动装置不易维护,且维护成本高,传统的点检和停机维修方式并不适用。例如,风力发电机通常都安装在几十米的高空,进入机舱维护十分不易,进一步增加了风力发电机的运行维护成本。再如,轨道列车部件故障检修主要是“经验判断 人工干预”的模式,即业务人员根据经验给出部件故障的业务规则,检修人员对报出故障的部件进行排查、检修。然而上述检修方式无法实现对齿轮传动装置的实时有效的在线检测,无法提前识别齿轮传动装置的故障,从而使得维修存在滞后性,进而导致运营成本的增加。4.近年来,基于振动分析的状态监测(conditionmonitoring,cm)已被广泛应用于监测齿轮传动装置的运行状态。然而,由于齿轮传动装置故障的原因与征兆之间关系存在不确定性,而且由于季节和运行环境等因素也会对正确诊断产生较大影响,导致齿轮传动装置故障错判、漏判率较高,对设备的正常运行造成较大安全隐患。并且,大多数情况下,通常只能提供部件失效的时间,而不是提供健康和故障状态对应的两组样本,这导致分类模型的构建和评估困难。此外,所提供的高频振动数据只是根据故障记录的时间进行分段,没有考虑故障设备之间的差异,或由相应的专家进行手动分析,这既费时又不易扩展到其他齿轮传动装置。5.随着cm数据量的增加,手动分析每个测量值变得具有挑战性,因此专家通常从简短的随机选择的数据片段中得出结论,这些数据片段可能无法准确表示齿轮传动装置的运行状态。因此,运维过程需要借助机器学习技术实现自动化。虽然可用的二元分类器,例如神经网络和支持向量机(svm),通常用于检测旋转机械缺陷。然而,现有的基于机器学习的故障检测方法只有在一个共同的假设下才能很好地工作,即需要标记足够的健康数据/正常数据和故障数据来训练和测试模型,但这并不现实。6.因此,在数据不足的情况下,为了提高性能,最近的一些研究考虑了从多个传动系统收集的数据作为一个整体,以构建一个通用的预测模型,或者基于特定齿轮传动装置的一种单一故障类型构建一个预测模型。例如,申请号为201811498568.5的中国发明专利申请公开了一种基于似然学习机的风机齿轮箱状态识别方法,其通过从风机齿轮箱振动信号中提取峭度作为故障特征量,并对峭度进行学习生成状态监测模型对齿轮箱状态进行判断。然而,无论是构建一个通用的预测模型还是基于一种故障构建一个预测模型,都忽略了因为工作条件、设备新旧程度、故障组件或故障模式、实际工况等因素的影响而导致不同齿轮传动装置之间的个体差异性。故而,若直接将基于一个或多个齿轮传动装置的数据构建的预测模型或诊断模型应用于另一个齿轮传动装置是不合适的。即使将该故障模型应用于另一个齿轮传动装置,实际运行过程中会出现预测结果与实际运行状态不符的情况,这就需要当故障出现后,由工程师不断进行现场调试。例如,首先基于一个或多个风电机组的历史标记数据构建一个故障预测模型,然后将其部署到各个风电机组对应的状态监测系统中,一旦该故障预测模型的预测结果与一个风电机组的实际运行状态不符,则由相应的工程师进行现场调试,当发现调试后的故障预测模型的预测结果与另一个风电机组的实际运行状态不符时,工程师再次进行调试,如此反复。这种方式,不仅增加了工作人员的工作量,而且即使调试之后的故障预测模型也无法适应于各个齿轮传动装置各自的独特性。7.有鉴于此,当前亟需一种能够适应于齿轮传动装置的个体特征的故障预测方法和系统。技术实现要素:8.本发明提供一种齿轮传动装置故障预测方法及系统、电子设备和计算机程序产品,部分地解决或缓解现有技术中的上述不足。9.本发明的第一方面在于,提供一种齿轮传动装置的故障预测方法,其包括步骤:10.基于所获取的训练集构建故障预测模型;所述训练集包括:已标记的第一历史振动数据,所述第一历史振动数据来自于多个第一齿轮传动装置;11.基于预先构建的预热集对所述故障预测模型进行预热,使得所述故障预测模型适应于第二齿轮传动装置的个体特征;其中,所述预热集是基于所述第二齿轮传动装置在第一预设时间段的第二历史振动数据和所述第一历史振动数据所构建的,且所述预热集包括:所述第一历史振动数据适应于所述第二历史振动数据的自适应正常数据和/或自适应故障数据;12.将预热后的所述故障预测模型配置到所述第二齿轮传动装置,以对所述第二齿轮传动装置进行故障预测,得到预测结果,所述预测结果包括:故障判定结果和/或故障发生概率。通过将第一齿轮传动装置的历史振动数据适应于第二齿轮传动装置的历史振动数据,得到预热集,再用该预测集来预热预先构建的故障预测模型,从而使得该故障预测模型适应于该第二齿轮传动装置的个体性特征,进而在提高预测精度的同时,也便于将故障预测模型的规模化部署到各个第二齿轮传动装置上,也即在预测精度和部署速度之间取得平衡。13.其中,所述第一预设时间为3-6个月。14.其中,构建所述预热集的步骤,具体包括:15.利用z分数对所述第二历史振动数据进行分析,得到目标峭度;16.根据所述目标峭度分别标记表示所述第二齿轮传动装置正常的正常数据和/或表示所述第二齿轮传动装置故障的故障数据;17.将所述第一历史振动数据适应于所述第二历史振动数据,得到所述预热集。具体地,将第一历史振动数据按比例适应于第二历史振动数据,从而实现预热。18.本发明的一些实施例中,当所述第二历史振动数据仅包括正常数据时,将所述第一历史振动数据适应于所述第二历史振动数据之前,还包括步骤:19.将所述第一历史振动数据中的故障数据补充至所述第二历史振动数据中作为所述第二齿轮传动装置对应的故障数据。20.本发明的一些实施例中,当所述第二历史振动数据仅包括故障数据时,将所述第一历史振动数据适应于所述第二历史振动数据之前,还包括步骤:21.将所述第一历史振动数据中的正常数据补充至所述第二历史振动数据中作为所述第二齿轮传动装置对应的正常数据。22.本发明的一些实施例中,将所述第一历史振动数据适应于所述第二历史振动数据的步骤之前,还包括步骤:23.分别对所述第一历史振动数据和所述第二历史振动数据进行数据平衡处理。24.进一步地,本发明的一些实施例中,将所述第一历史振动数据适应于所述第二历史振动数据时,按照预设的比例从已标记的所述第二历史振动数据中选取相应比例的正常数据和故障数据作为目标域数据进行适应处理。25.进一步地,本发明的一些实施例中,将剩余的已标记的所述第二历史振动数据作为测试集,并基于所述测试集对预热后的所述故障预测模型的预测性能进行评估,其中,所述预测性能包括:准确率,和/或故障检测率,和/或误报率。26.进一步地,本发明的一些实施例中,该故障预测方法还包括步骤:27.当连续多天判定为故障,则进行预警。28.本发明的第二方面在于,提供一种齿轮传动装置的故障预测系统,其包括:29.数据库,用于存储训练集;所述训练集包括:已标记的第一历史振动数据,所述第一历史振动数据来自于多个第一齿轮传动装置;30.模型构建模块,用于基于所述训练集构建故障预测模型;31.模型预热模块,用于基于预先构建的预热集对所述故障预测模型进行预热,使得所述故障预测模型适应于所述第二齿轮传动装置的个体特征;其中,所述预热集是基于所述第二齿轮传动装置在第一预设时间段的第二历史振动数据和所述第一历史振动数据所构建的,且所述预热集包括:所述第一历史振动数据适应于所述第二历史振动数据的自适应正常数据和自适应故障数据;32.故障预测模块,用于基于预热后的所述故障预测模型和采集到的所述第二齿轮传动装置的实时振动数据进行故障预测,得到故障判定结果和/或故障发生概率。33.在一示例性实施例中,所述模型预热模块具体包括:34.数据标记单元,用于利用z分数对所述第二齿轮传动装置在所述第一预设时间内的第二历史振动数据进行分析,得到目标峭度;并根据所述目标峭度分别标记表示所述第二齿轮传动装置正常的正常数据和表示所述第二齿轮传动装置故障的故障数据;35.预热数据获取单元,用于将所述第一历史振动数据适应于所述第二历史振动数据,得到所述预热集。36.进一步地,在一示例性实施例中,所述故障预测系统还包括:37.数据平衡处理模块,用于所述预热数据获取单元将所述第一历史振动数据适应于所述第二历史振动数据之前,分别对所述第一历史振动数据和所述第二历史振动数据进行数据平衡处理。38.更进一步地,所述数据平衡处理模块具体地用于按照预设的比例范围从已标记的所述第二历史振动数据中选取相应比例的正常数据和/或故障数据进行数据平衡处理。39.在另一些示例性实施例中,所述故障预测系统还包括:40.模型测试模块,用于将剩余的已标记的所述第二历史振动数据作为测试集,并基于所述测试集对预热后的所述故障预测模型的预测性能进行评估。41.进一步地,为了降低误判率,在一些示例性实施例中,所述故障预测系统还包括:42.故障预警模块,用于当所述故障预测模块连续多天判定为故障时,进行预警。43.本发明的第三方面在于,提供一种电子设备,包括:处理器、网络接口以及存储有指令的存储器,其中,所述网络接口用于提供网络通信功能,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码,以执行上述故障预测方法的步骤。44.本发明的第四方面在于,提供一种计算机程序产品,所述计算机程序产品包括指令,所述指令在被电子设备执行时使得所述电子设备执行上述故障预测方法。45.有益效果:46.本发明的齿轮传动装置故障预测方法及系统,基于峭度来自动标记待测齿轮传动装置的第二历史振动数据,然后将第一齿轮传动装置的第一历史振动数据(即源域数据)适应于(或逼近)该第二历史振动数据(即目标域数据),得到预热集,并用该预热集来预热预先构建的故障预测模型,从而使得该故障预测模型能够适应于该待测齿轮传动装置的个体特征(即自适应),也即预热后得到专属于该待测齿轮传动装置的故障预测模型(即由于输入的是预热集,即输入该故障预测模型的数值发生变化,因此,可根据预热集选择不同的分类算法,相应算法的超参数(hyperparameter)也会发生变化,从而到达最佳分类效果),再利用预热后的该专属故障预测模型进行故障预测,由于在待测齿轮传动装置(即第二齿轮传动装置)上部署故障预测模型之前时,该故障预测模型已经适应于各齿轮传动装置自身的个体特征,因此,相较于现有的部署方式(即直接将所构建的故障预测模型部署在相应的传动系统中,当发现预测结果与实际运行结果不一致(例如,预测结果为正常,但实际上齿轮传动装置出现了故障的情况)时,再由工程师进行手动调试),无需再由工程师到不同的运行环境中进行一一调试;并且本发明的该故障预测方法在满足当前行业的基本预测精度的基础上,还能够快速地进行规模化模型部署,也即在速度和精度的层面达到了平衡。47.本发明的故障预测方法根据峭度将待测齿轮传动装置自身的历史振动数据进行正常样本和故障样本的自动划分和标记,并以此构建目标域数据,使得源域数据的适应于(或逼近)目标域数据,也即适应于该待测齿轮传动装置的个体特征,从而更好地反应该待测齿轮传动装置的实际健康状态。48.本发明的故障预测方法利用基于z分数算法自动标记的正常样本和故障样本作为测试集,并对以支持向量机所构建的故障预测模型进行测试分析,证实了即使在只有少量标记数据可用的情况下,本发明的故障预测方法也具有较高的故障检测性能(例如,准确率高(满足行业的基本预测精度需求),故障检测率高,误报率也低)。49.另一方面,本发明使用来自运行中的风力涡轮机的案例研究来检查不同风力涡轮机、组件和故障模式之间的性能,以说明有效性。附图说明50.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图逐一简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。51.图1为本发明一示例性实施例的一种齿轮传动装置故障预测方法的流程示意图;52.图2为本发明又一示例性实施例的一种齿轮传动装置故障预测方法的流程示意图;53.图3为本发明再一示例性实施例的一种齿轮传动装置故障预测方法的流程示意图;54.图4为本发明一示例性实施例的一种齿轮传动装置故障预测系统的功能模块结构示意图;55.图5a为本发明的齿轮传动装置故障预测方法的原理流程图;56.图5b为本发明的齿轮传动装置故障预测方法应用于风电机组的齿轮箱故障预测的流程示意图;57.图6为反映本发明的齿轮传动装置故障预测方法预测平行齿轮时,得到的故障判定结果;58.图7为反映本发明齿轮传动装置故障预测方法预测平行齿轮时,得到的该平行齿轮的故障概率变化示意图;59.图8a为4号风机的齿传动装置中平行齿轮在2018年1月30日至2018年4月30日期间其内齿圈的频谱示意图;60.图8b为4号风机的齿传动装置中平行齿轮在2018年4月30日至2018年6月14日期间其内齿圈的频谱示意图;61.图8c为4号风机的齿传动装置中平行齿轮2018年6月14日至2018年9月12日期间其内齿圈频谱示意图。具体实施方式62.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。63.本文中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。64.本文中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。65.本文中,除非另有明确的规定和限定,术语“安装”、“设置有”、“连接”等,应做广义理解,例如“连接”,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。66.本文中,“齿轮传动装置”是指各机械传动系统中的旋转部件,例如,齿轮,齿轮箱等。67.本文中,“第一齿轮传动装置”是指用于创建故障预测模型时,训练集中作为源域数据的各个第一历史振动数据各自对应的齿轮传动装置。而本文中,“第二齿轮传动装置”则是指将要被部署预测模型,以对其进行预测的待测齿轮传动装置,其不同于第一齿轮传动装置。例如,当采用一个风电机组中1号和2号风机中齿轮传动装置的历史振动数据作为训练集,而4号风机中齿轮传动装置的历史振动数据作为目标域数据,并和上述训练集一起构建预热集,则其中,1号和2号风机的齿轮传动装置即为第一传动齿轮传动装置,4号风机的齿轮传动装置则为第二齿轮传动装置。68.本文中,“个体特征”是指由于不同齿轮传动装置受到不同的应用场景(例如,高山或盆地)、新旧程度、实际工况、运行环境(例如,环境温度和湿度)等因素的影响,因此,不同的齿轮传动装置之间存在一定的差异性,若将每个齿轮传动装置自身作为一个独立个体,则其对应的振动数据都有其自身的特性,也即个体特征。69.本文中,“预热”是指当在一个待测齿轮传动装置上部署故障预测模型之前,将基于该齿轮传动装置在一段时间内的历史振动数据结合训练集(即源域数据)构建的预热集输入该故障预测模型,使得该故障预测模型对该齿轮传动装置的个体特征进行自适应的过程。其中,该预热集是以该齿轮传动装置在该段时间内的第二历史振动数据作为目标域数据,以训练集中的第一历史振动数据作为源域数据,并将源域数据适应于该目标域数据后得到的数据(当然,当第二历史振动数据中缺乏某一类数据时,例如,缺乏正常数据或故障数据,或者正常数据远远少于故障数据,或者故障数据远远少于正常数据的情况下,也可从第一历史振动数据中选取相应类别的数据补充作为目标域数据);当然,也可将该段时间内所有的第二历史振动数据按照一定比例划分为目标域数据集和用于测试预测模型的测试集。70.参数定义:71.f-样本总数:测试集的样本总数;72.正确预测样本数:故障预测模型的预测结果与测试集中的样本实际相吻合的样本数量;其包含两部分:故障样本预测为故障样本,用tp(truepositive)表示;正常样本预测为正常样本数量,用tn(truenegative)表示;73.fp(falsepositive)-误报样本数:将正常的样本预测为故障样本的数量,用表示;74.fn(falsenegative)-漏报样本数:将故障样本预测为正常样本的数量;75.accuracy-准确率:利用测试集对故障预测模型进行测试时,故障预测模型的预测结果与测试集中样本数据实际结果相吻合的程度,其计算公式为:76.accuracy=(tp tn)/(tp tn fp fn)*100%=(tp tn)/f*100%ꢀꢀꢀꢀ(1);77.far(falsealarmrate)-误报率:利用测试集对故障预测模型进行测试时,被该故障预测模型误报成故障的正常样本数占正常样本总数的百分比,其计算公式如下:far=fp/(fp tn)*100%ꢀꢀꢀꢀꢀꢀ(2);78.fdr(faultdetectionrate)-故障检测率:测试集中被正确检测的故障样本数占该测试集中故障样本总数目的百分比,其计算公式如下:fdr=tp/(tp fn)*100%ꢀꢀꢀ(3)。实施例一79.参见图1,为本发明提供的一示例性实施例的一种齿轮传动装置的故障预测方法的流程示意图,具体地,该方法包括步骤:80.s101,基于所获取的训练集构建故障预测模型。81.在一些实施例中,为了保证足够的数据量,预先获取多个第一齿轮传动装置的第一历史振动数据作为训练集来构建故障预测模型,且该训练集预先已完成了标记,如:标记为表示第一齿轮传动装置正常的历史振动数据,即正常数据/正常样本,以及标记为表示第一齿轮传动装置故障的历史振动数据,即故障数据/故障样本。例如,为了保证足够的数据量,由多个风电商家提供500-1000台风电机组中相应齿轮传动装置(即第一齿轮传动装置)的历史振动数据(其包括表示该齿轮传动装置正常的历史振动数据,以及表示该齿轮传动装置故障的历史振动数据,且预先由相应的专家进行标记)作为训练集。82.通常,故障将在被识别前大约六个月开始出现,因此,专家标记第一历史振动数据时,可将故障发生前六个月内的第一个峭度值作为划分故障测量与健康测量的分界点,得到两组标记的正常数据和故障数据,然后使用标记的这两组数据来构建故障预测模型。83.s102,基于预先构建的预热集对步骤s101中所构建的故障预测模型进行预热。84.在一些实施例中,为了使得步骤s101中所构建的故障预测模型能够适应于第二齿轮传动装置的个体特征(即“个体特征自适应”),因此,基于第二齿轮传动装置在第一预设时间段(例如,3-6个月)内运行的第二历史振动数据和上述的第一历史振动数据构建的预热集。具体地,该第二历史振动数据包括:原始的振动信号,从该振动信号中提取到的啮合频率四次谐频及其边带等特征。85.通常,通过状态监测系统中传感器可采集到齿轮传动装置的原始振动信号,包括齿轮振动的加速度数据,从而对该原始振动数据进行时域分析即可提取到相应的啮合频率四次谐频及其边带等特征。86.在一些实施例中,由于峭度是旋转部件早期故障检测中信号脉冲性的一个很好的指标,并且已经表明峭度的增加通常反映了故障的发展,因此,利用峭度来进行正常数据(正常样本)和故障数据(或故障样本)的划分和自动标记。87.具体地,构建预热集的步骤具体包括:先利用z分数对第二齿轮传动装置在第一预设时间段内的第二历史振动数据进行分析,得到目标峭度;根据所识别出的目标峭度分别标记表示第二齿轮传动装置正常的第二历史振动数据(即正常样本)和表示第二齿轮传动装置故障的第二历史振动数据(即故障样本);然后将已标记的第二齿轮传动装置的第二历史振动数据作为目标域数据,将第一齿轮传动装置的第一历史振动数据作为源域数据,并将该源域数据适应于该目标域数据,从而得到源域数据适应于该目标域数据的自适应数据,也即预热集,其包括:源域数据适应于目标域数据的自适应正常数据和自适应故障数据。88.在另一些实施例中,可按照预设的比例(例如50-80%,优选70%)从已标记的第二齿轮传动装置的第一预设时间段内的所有第二历史振动数据中选取相应比例的正常样本(50-80%)和故障样本(50-80%)作为目标域数据;而将剩余的正常样本和故障样本作为测试集。89.当然,也可将所有的第二历史振动数据作为目标域数据,而测试集重新采集新的振动数据,并采用上述的z分数方法自动标注。90.进一步地,由于采集的是第二齿轮传动装置3-6个月的第二历史振动数据,因此,该时间段的第二历史振动数据可能即包含了正常数据,也可能包含了故障数据,当然,也可能只有正常数据,或者只有故障数据,或者,正常数据远远少于故障数据,或者故障数据远远少于正常数据,则:91.当该第二历史振动数据包括了正常数据和故障数据时,可分别从正常数据和故障数据中选取50-80%,作为目标域数据中的正常样本和故障样本;92.当该第二历史振动数据仅仅包括正常数据,无故障数据,或故障数据远远少于正常数据时,则从该正常数据选取50-80%的正常数据作为目标域数据中的正常样本,同时,缺失/缺少的故障数据则直接采用源域数据中相应数量的故障数据作为目标域数据中的故障样本;93.当该第二历史振动数据仅仅包括故障数据,无正常数据,或正常数据远远少于故障数据时,则从中选取50-80%的故障数据作为目标域数据中的故障样本,同时,缺失/缺少的正常数据则直接采用源域数据中相应数量的正常数据作为该目标域数据中的正常样本。94.当然,为了达到数据平衡(即正常数据和故障数据的数据量相同,或者相差不大),因此,在源域数据中所获取的正常数据的量与从第二历史振动数据中选取的50-80%故障数据的数量相同或相近;同理,在源域数据中所获取的故障数据的量与从第二历史振动数据中选取的50-80%正常数据的数量相同或相近。95.在另一些实施例中,为了保证达到数据平衡,进一步提高预测精度,将源域数据适应于目标域数据之前,还需要分别对该源域数据和目标域数据进行数据平衡处理。96.由于样本类别不均衡(例如,只有正常数据或故障数据,或者,正常数据的量远远大于故障数据的量,或者,故障数据的量远远大于正常数据的量)会导致样本量少的分类所包含的特征过少,从而导致预测结果偏移;因此,为了提升预测模型的预测效果,在将第一历史振动数据适应于第二历史振动数据之前,先分别对该第一历史振动数据和第二历史振动数据进行数据平衡处理,使得第一历史振动数据中的正常数据和故障数据的比例近似达到1:1,以及第二历史振动数据中的正常数据和故障数据的比例近似达到1:1,进而减轻数据的不平衡度。97.具体地,通过smote算法对第二历史振动数据中的量少的样本进行重采样,使得正常样本和故障样本的比例近似达到1:1。例如,采用smote算法对第二历史振动数据中少量的故障数据进行分析,并根据已有的少量故障数据(原始样本)插值生成新的故障数据(即新样本)添加到第二历史振动数据中,其计算公式为:98.xnew=x rand(0,1)*|x-xn|99.其中xnew为新样本,x为原始样本,xn为x的近邻样本;rand(0,1)产生0-1之间的随机数。100.由于振动信号的每个时刻都有相应的实际峭度,而z分数是新峭度(也即当前时候对应的实际峭度)远离移动均值μ(移动均值μ是指该振动信号在预设时间段t内所有实际峭度的平均值)的标准差σ数量,因此,可根据z分数来推算该振动信号每个时刻对应的实际峭度的动态阈值可以通过下式(4)计算:thresholdi=z*σ(l,i-1) μ(l,i-1)ꢀꢀ(4)101.其中,i=1,···t(t》1s),thresholdi为第i次测量的动态阈值(也即第i时刻对应实际峭度的动态阈值),l为移动窗口的长度,μ(l,i-1)和σ(l,i-1)分别为根据第一预设时间段t内所采集到的振动信号的所有实际峭度计算得到的均值和标准差,z是预定的z分数(z可由行业经验数据得到)。102.当第i次实际测量到的实际峭度值超过预设的动态阈值thresholdi时,将该实际测量到的实际峭度值作为划分正常数据和故障数据的目标峭度。103.然后将目标峭度大于8的第二历史振动数据标记为故障数据,而将目标峭度小于或等于4的第二历史振动数据标记为正常数据。104.优选地,为了避免在一个移动窗口中出现异常高的值,从而提高均值导致峰值不可见,因此,将动态阈值的最大值设置为5。105.其中,该移动窗口是指具有一定长度的移动窗;由于均值会随着时间的变化而变化,为了得到与当前时刻最接近的均值,因此,窗口会不断移动。例如长度是10秒的移动窗,表示第11秒的值与前10秒的均值比较;第12秒的值与第2~11秒的均值比较。106.s103,将预热后的故障预测模型部署到第二齿轮传动装置,以进行故障预测,得到预测结果。107.在一些实施例中,当将预热后的故障预测模型部署到第二齿轮传动装置上时,可周期性(例如,每小时,或者每周,或者每月等)地实时获取该第二齿轮传动装置的待测实时振动数据,并进行故障预测,得到预测结果,具体地,该预测结果包括:故障判定结果(例如,发生故障,或者未发送故障),和/或故障发生概率。108.参见图2,在另一些实施例中,在执行步骤s103之前,还包括步骤:109.s104,基于预先构建的测试集对步骤s102中预热后的故障预测模型进行预测性能评估。110.在一些实施例中,该测试集是基于第二齿轮传动装置在第一预设时间段内的第二历史振动数据构建的;优选地,将剩余20-50%的正常数据和/或剩余20-50%的故障数据作为测试集输入预热后的故障预测模型,进行性能评估。具体地,对该故障预测模型的准确率、故障检测率和/或误报率进行评估。111.进一步地,在另一些实施例中,为了降低模型误报率,通过设置报警规则,具体地,参见图3,该故障预测方法还包括步骤:判断是否已连续多天(例如,3-5天)判定为故障,若是,进行预警。112.当然,在另一些实施例中,可根据齿轮传动装置的实际运行环境、新旧程度、工作时长和现场工况等因素来设定天数。实施例二113.以风电机组的齿轮箱为例对本发明的故障预测方法进行详细的说明。114.在一些实施例中,本发明实施例的故障预测方法包括离线训练和在线测试,具体,参见图5a,已标注的历史振动数据包括大量源域(sd)数据(例如预先由专家对多个第一传动齿轮装置的第一历史振动数据进行标记得到的)和少量目标域数据(即预先基于目标峭度对第二齿轮传动装置的第二历史振动数据自动标记得到的),分别提取源域特征(即第一历史振动数据的啮合频率四次谐频及其边带)和目标域特征(即第二历史振动数据的啮合频率四次谐频及其边带),并分别得到源域数据的特征和目标域数据的特征的最大值和最小值:115.xsn_max、xsn_min、xsf_min、xsf_min、xtn_max、xtn_min、xtf_min、xtf_min。116.然后,将源域(sd)数据的特征按比例适应目标域(td)特征值的范围(即使得第一齿轮传动装置的第一历史振动数据适应于第二齿轮传动装置的第二历史振动数据,从而实现预热),得到源域数据的正常自适应特征和故障自适应特征分别具体表示为:现预热),得到源域数据的正常自适应特征和故障自适应特征分别具体表示为:117.其中xsn、xsf分别是源域数据中正常样本的特征和故障样本的特征,xtn、xtf分别是目标域数据中正常样本的特征和故障样本的特征,xsn_max、xsn_min分别是源域数据中正常样本的特征的最大值和最小值;xsf_max、xsf_min分别是源域数据中故障样本的特征的最大值和最小值;xtn_max、xtn_min分别是目标域数据中正常样本的特征的最大值和最小值,xtf_max、xtf_min分别是目标域数据中故障样本的特征的最大值和最小值。118.由于需要分别计算正常数据和故障数据的自适应特征xsn_adpt、xsf_adpt,而对于仅包含正常数据或仅包含故障数据的td数据(即目标域数据),由于缺失一个类别的样本(即缺失的正常数据,或者缺失的故障数据),无法根据所缺失类别的样本和上述公式(5)或(6)计算相应的自适应特征,因此,所缺失类型的样本将直接从相应的sd组(即源域数据)中转移作为目标域中所缺失类别的样本,然后使用所有这些自适应特征预热预先基于源域数据训练得到的svm分类器,得到适应于第二齿轮传动装置个体特征的故障预测模型。119.在在线分类过程中,新到达的td样本的特征(即从实时采集到的第二齿轮传动装置的实时振动信号中提取到的啮合频率四次谐频及其边带)输入预热后的故障预测模型,用于健康状态评估,也即对第二传动齿轮装置进行故障预测。120.具体地,参见图5b,该故障预测方法包括步骤:121.s201,基于数据库中存储的1号和2号风电机组的齿轮箱历史监测数据(即第一历史振动数据,包括scada数据与cms数据)作为训练集构建故障预测模型。122.表一训练集数据来源123.如表一所示,该训练集包括:2018年7月25日至2018年12月12日所监测到1号风电机组的齿轮箱的cms数据,以及2018年2月12日至2019年4月13日所监测到1号风电机组的齿轮箱的scada数据;2017年11月1日至2018年8月23日所监测到的2号风电机组的齿轮箱的cms数据,以及2018年1月1日至2018年8月23日所监测到2号风电机组的齿轮箱的scada数据;并且,这些数据已经预先进行标记,并存储在数据库中。124.s202,获取4号风电机组的设备监测数据(即第二历史振动数据),并利用z分数分析得到目标峭度。125.表二预热集数据来源126.如表二所示,目标域数据包括:2017年11月1日至2018年9月4日所监测到4号风电机组的齿轮箱的cms数据,以及2018年1月1日至2018年9月12日所监测到4号风电机组的齿轮箱的scada数据。127.s203,基于步骤s202中得到的目标峭度自动标记4号风电机组的设备监测数据,得到表示该4号风电机组正常的正常数据和表示该4号风电机组故障的故障数据。128.在一些具体实施例中,将目标峭度大于8的第二历史振动数据标记为故障数据,而将目标峭度小于或等于4的第二历史振动数据标记为正常数据。129.s204,将步骤s203中所标记的设备监测数据中正常数据的70%和故障数据的70%作为目标域数据,并将1号和2号风电机组的齿轮箱历史振动数据适应于该目标域数据,得到预热集,其包括源域振动数据适应于该目标域数据的正常自适应特征和故障自适应特征。130.当然,若所获取的4号风电机组的设备监测数据中包含故障数据和正常数据,但相较于故障数据,正常数据的量可以忽略,则认为其仅仅只包含故障数据;或者相较于正常数据,故障数据的量可以忽略,则认为其仅仅只包含正常数据。131.当然,若所获取的4号风电机组的设备监测数据中仅包含正常数据,或仅包含故障数据,则将70%的正常数据或故障数据作为目标域数据中的正常样本或故障样本,而缺失类别的样本则直接从第一历史振动数据中获取即可。132.s205,将步骤s204所得到的预热集输入步骤s201中所构建的故障预测模型进行预热。133.s206,将步骤s203中所标记的设备监测数据中的30%作为测试集,输入步骤s205中预热后的故障预测模型中进行性能评估。134.表四性能测试参数135.如表四所示,预热后的该故障预测模型的准确率高达91.11%,故障检测率高达98.15%,而误报率仅仅19.44%。136.s207,获取4号风电机组的实时振动数据,并输入经步骤s205预热后的故障预测模型中进行故障预测,得到预测结果。137.在一些实施例中,该预测结果为判定结果和故障发生概率,通常当连续三天判定为故障,则进行预警提醒。138.如图6所示,为故障预测模型对4号风机中齿轮传动装置进行预测输出的随时间变化的故障预警情况:0表示未发生故障,即正常,1表示发生故障;圆点表示故障预测模型的预测结果是正确的,三角形表示故障预测模型的预测结果是错误的,例如,三角形a表示实际发生了故障,但故障预测模型判定为未发生故障,三角形b表示实际未发生故障,但故障预测模型判定为发生故障。139.如图7所示,为故障预测模型对4号风机中齿轮传动装置进行预测输出的随时间变化发生故障的概率预测值:图中圆点表示故障预测模型预测得到的相应时间对应的故障概率,图中曲线表示由2018年1月30日至2018年9月12日期间预测得到的各个故障概率进行拟合得到的故障概率曲线。由图7可知,当齿轮箱运行一段时间后,其发生故障的概率越来越大。140.由图6和图7可知,随着故障时间点的临近,故障预测的次数趋于频繁,并且发生故障的概率值也逐渐增大。141.在一些实施例中,每小时(当然,也可根据实际需要设置为两小时,或每天等)采集依次待测齿轮传动装置的振动数据,相应地,在预设的测试时间范围内循环利用本发明的故障预测模型来进行故障预测;并最终以判定是否有故障和故障发生的概率两种形式呈现模型的最终输出结果。142.参见图6和图7可知,2018年1月30日至2018年4月30日期间,预测模型判定第二齿轮传动装置正常,且其发生故障的概率较低,而该时间段内其真实振动信号平行级齿轮高速振动数据频谱幅值如图8a所示:边带幅值与谐频故障相比较小,即齿轮处于正常状态;143.2018年4月30日至2018年6月14日期间,预测模型判定为正常,有几次判定为故障,且其发生故障的概率有所上升,而该时间段内该第二齿轮传动装置的真实振动信号平行级齿轮高速振动数据频谱幅值如图8b所示:边带幅值与谐频故障相比略有增大,即齿轮可能发生初期故障;144.2018年6月14日至2018年9月12日期间,预测模型基本判定为故障,有几次判定为正常,且其发生故障的概率随着时间也越来越高,而该时间段内该第二齿轮传动装置真实振动信号平行级齿轮高速振动数据频谱幅值如图8c所示:边带幅值与谐频故障相比增大明显,即齿轮发生故障。实施例三145.参见图4,本发明还提供了一种齿轮传动装置的故障预测系统,具体地,其包括:146.数据库401,用于存储训练集和第二传动齿轮装置的第二历史振动数据;该训练集包括:已标记的第一历史振动数据,该第一历史振动数据来自于多个第一齿轮传动装置;模型构建模块402,用于基于所获取的训练集构建故障预测模型;模型预热模块403,用于基于预先构建的预热集对模型构建模块所构建的故障预测模型进行预热,使得所述故障预测模型适应于第二齿轮传动装置的个体特征;故障预测模块404,用于基于预热后的故障预测模型和采集到的第二齿轮传动装置的实时振动数据进行故障预测,得到故障判定结果和/或故障发生概率。147.在一些实施例中,上述模型预热模块具体包括:148.数据标记单元,用于利用z分数对第二齿轮传动装置在第一预设时间内的第二历史振动数据进行分析,得到目标峭度;并根据该目标峭度分别标记表示该第二齿轮传动装置正常的振动数据和表示该第二齿轮传动装置故障的振动数据;其中,第一预设时间为3-6个月;149.预热数据获取单元,用于将第一历史振动数据适应于第二历史振动数据,得到预热集。150.在一些实施例中,该系统还包括:数据平衡处理模块,用于预热数据获取单元将第一历史振动数据适应于第二历史振动数据之前,分别对第一历史振动数据和已标记的第二历史振动数据进行数据平衡处理;具体地,用于按照预设的比例范围从已标记的第二历史振动数据中选取相应比例的(50%-80%)正常数据和(50%-80%)故障数据进行数据平衡处理。151.在另一些实施例中,若该第二历史振动数据中的仅包含正常数据,或有少量故障数据,但相较于正常数据的量,故障数据的量可以忽略时,该数据平衡处理单元仅对其中正常数据进行数据平衡处理;同理,若该第二历史振动数据中的仅包含故障数据,或有少量正常数据,但相较于故障数据的量,正常数据的量可以忽略时,该数据平衡处理单元仅对其中故障数据进行数据平衡处理。152.在一些实施例中,该故障预测系统还包括:153.模型测试模块,用于将剩余的已标记的第二历史振动数据作为测试集,并输入所述故障预测模型,以进行预测性能的评估。154.在一些实施例中,该故障预测系统还包括:预警模块,用于当预热后的故障预测模型连续多天(例如,3天,或4天,或5天,当然,具体天数,可根据待测齿轮传动装置的运行环境和新旧程度等实际运行情况进行适应性的调整)的判定结果都是发生故障,则进行预警提醒。155.本公开的实施例的对象编辑方法可以应用于多种电子设备。示例性的,该电子设备例如可以为:移动手机、平板电脑(tabletpersonalcomputer)、数码相机、个人数字助理(personaldigitalassistant,简称pda)、导航装置、移动上网装置(mobileinternetdevice,mid)、可穿戴式设备(wearabledevice)、以及其他能够进行对象编辑的设备等。此外,本公开的实施例的对象编辑方案不仅可以作为输入法的一个功能,也可以作为电子设备的操作系统的一个功能而实施。156.在上述实施例中,可以全部或部分的通过软件,硬件,固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式出现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本公开的实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质,(例如,软盘,硬盘、磁带)、光介质(例如,dvd)或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。157.一般而言,本公开的各种示例实施例可以在硬件或专用电路、软件、逻辑,或其任何组合中实施。某些方面可以在硬件中实施,而其他方面可以在可以由控制器、微处理器或其他计算设备执行的固件或软件中实施。例如,在一些实施例中,本公开的各种示例(例如方法、装置或设备)可以部分或者全部被实现在计算机可读介质上。当本公开的实施例的各方面被图示或描述为框图、流程图或使用某些其他图形表示时,应理解此处描述的方框、装置、系统、技术或方法可以作为非限制性的示例在硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其他计算设备,或其某些组合中实施。158.本发明还提供了存储在非瞬态计算机可读存储介质上的至少一种计算机程序产品。计算机程序产品包括计算机可执行指令,计算机可执行指令诸如包括在目标的物理或者虚拟处理器上的器件中执行的程序模块中,用以执行上文关于图1-图5b描述的示例方法或示例过程。一般而言,程序模块可以包括例程、程序、库、对象、类、组件、数据结构等,其执行特定的任务或者实现特定的抽象数据结构。在各实施例中,程序模块的功能可以在所描述的程序模块之间合并或者分割。用于程序模块的计算机可执行指令可以在本地或者分布式设备内执行。在分布式设备中,程序模块可以位于本地和远程存储介质二者中。159.用于实现本发明的方法的程序代码可以用一种或多种编程语言编写。这些计算机程序代码可以提供给通用计算机、专用计算机或其他可编程的数据处理装置的处理器,使得程序代码在被计算机或其他可编程的数据处理装置执行的时候,引起在流程图和/或框图中规定的功能/操作被实施。程序代码可以完全在计算机上、部分在计算机上、作为独立的软件包、部分在计算机上且部分在远程计算机上或完全在远程计算机或服务器上执行。在本公开的上下文中,计算机程序代码或相关数据可以由任何适当的载体来承载,以使设备、装置或处理器能够执行上文描述的各种过程和操作。载体的示例包括信号、计算机可读介质,等等。160.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如dvd)、或者半导体介质(例如固态硬盘)等。161.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:rom或随机存储记忆体ram、磁碟或者光盘等各种可存储程序代码的介质。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读介质可以包括但不限于电子的、磁的、光学的、电磁的、红外的或半导体系统、装置或设备,或其任何合适的组合。机器可读存储介质的更详细示例包括带有一根或多根导线的电气连接、便携式计算机磁盘、硬盘、随机存储存取器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或闪存)、光纤、便携式压缩盘只读存储器(cd-rom)、光存储设备、磁存储设备,或其任何合适的组合。162.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。163.上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献