一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于列车的牵引系统健康度评估的研究方法与流程

2021-10-20 00:51:00 来源:中国专利 TAG:列车 牵引 评估 方法 研究


1.本发明涉及列车技术领域,具体是一种基于列车的牵引系统健康度评估的研究方法。


背景技术:

2.列车,即成列的车组,分为两大类型,铁路列车:即火车,这是一般形态。公路列车:即组列式汽车、汽车组列、公路车组体,列车具有牵引系统,列车的牵引系统健康度反应处列车运行的安全状况,因此列车的牵引系统健康度的评估极其重要。
3.中国专利号201711070713.5公开了一种列车牵引系统的状态评估与故障预警方法,包括:接收被评估的牵引系统发送的列车运行数据;关联同一列车的不同车、不同架的牵引系统状态信息,对所述运行数据按照预定规则进行偏差分析;根据所述偏差分析的结果进行状态评估;将所述状态评估的结果反馈给所述牵引系统;若所述状态评估的结果属于预设的预警状态,将所述结果对应的故障预警信息通过显示装置进行显示。
4.现有技术的列车的牵引系统健康度评估只能依据系统曝出来的故障进行健康评估,无法对设备在长期运行过程中可能隐藏的健康隐患进行考虑,导致牵引系统健康度评估不准确,且现有技术的评估方法对数据的处理的工作量较大,导致对数据处理的算法开销增加,以及评估效率降低,且现有技术的评估方法对列车故障的分析不敏感,导致列车的牵引系统健康度评估不灵敏。因此,亟需设计一种基于列车的牵引系统健康度评估的研究方法来解决上述的问题。


技术实现要素:

5.本发明的目的在于提供一种基于列车的牵引系统健康度评估的研究方法,以解决上述背景技术中提出的不准确、效率低、不灵敏的问题。
6.本发明的技术方案是:一种基于列车的牵引系统健康度评估的研究方法,包括以下步骤:
7.s1.分析数据,调取牵引系统的设备数据进行分析和处理,通过pce的状态识别出牵引系统的状态,并对牵引系统的状态进行命名;
8.s2.特征提取,获得与设备健康相关的变量,并从设备健康相关的变量中提取特征;
9.s3.建立模型,根据提取的特征建立无监督学习模型和有监督学习模型;
10.s4.模型实践;
11.s4.1,无监督学习模型,通过向模型输入特征数据,然后经模型输出健康类别的类概率值;
12.s4.2,有监督学习模型:利用先验知识,定义一个阈值来划分设备该特征的健康状况,然后输出每一个状态处于故障与非故障的概率值;
13.s5.输出系统健康度得分,在无监督和有监督的模型中,利用模型得到的每一个状
态划分到健康类别的类概率值,再利用类概率值作为该状态的健康度得分。
14.进一步地,在所述s1中,牵引系统的状态进行命名内容为:0=未知,1=hscb断开,2=故障,3=牵引施加,4=牵引未施加,在数据预处理中,将异常为负的电压转化为0,将有发生故障的状态标记为1,没有发生故障的状态标记为0。
15.进一步地,在所述s2中,特征包括:原始特征、时频域特征和相关性特征。
16.进一步地,在所述s4中,无监督学习模型包括高斯混合模型,通过高斯混合模型表示在总体分布中含有k个子分布的概率模型,所述高斯混合模型由k个单高斯模型组合而成,k个所述子模型为高斯混合模型的隐变量,通过高斯概率密度函数参数不同,每一个高斯模型可以看作一种类别,当输入一个样本x,即可通过pdf计算其值,然后通过一个阈值来判断该样本是否属于高斯模型,即可给出样本被划分到每一个类别的类概率信息。
17.进一步地,在所述s4中,有监督学习模型包括逻辑回归模型,在逻辑回归模型中,令g(z)的值分布在(0,1)之间,当g(z)接近于0时样本的标签为0,当g(z)接近于1时样本的标签为类别1。
18.进一步地,所述高斯混合模型的训练方法为:输入特征数据,利用高斯混合模型进行训练,将数据分为两类,一类倾向于识别出特征中的毛刺状态,一类倾向识别非毛刺的数据,将识别出毛刺的一类作为不健康的一类,输出每一个状态划分到健康类别的类概率值。
19.进一步地,所述逻辑回归模型的训练方法为:利用经验知识,定义一个阈值来划分设备该特征的健康状况,此处采用统计学中的sigma准则来作为阈值的划分,将所有特征在区间[μ

3σ,μ 3σ]之外的数据定义成异常,利用有监督的逻辑回归分类算法进行训练,输出每一个状态处于故障与非故障的概率值,利用逻辑回归模型将训练集和测试集以7:3的比例进行模型的训练,通过网格搜索进行调参,获得最佳分类效果的模型参数。
[0020]
进一步地,在所述s7中,当牵引系统本身曝出故障时,认定在该状态下设备的健康度为0,在非牵引状态下和hscb断开的状态下,不考虑该状态的得分,最后牵引系统某一天的得分,综合牵引状态的健康得分与报故障的健康得分平均来综合,若该车在某一天里面没有牵引状态,则用前一天的得分来作为今天的打分。
[0021]
进一步地,所述原始特征包括:列车托架轴的速度、本架轴的速度、本架基轮径值、车架pce心跳、车架本架牵引力、车架电网电压、车架中间电压、车架中间电流、车架逆变电流、车架电机综合速度、车架斩波电流、车架给定牵引制动力、车架电机温度、车架电机转速、车架再生制动能耗脉冲、车架牵引能耗脉冲、车架本架电制动能力值、车架转向架电网电压和车架转向架牵引力完成值;
[0022]
所述时域特征包括:在序列随时间变化的过程中,所具有的与时间相关的一些特征;
[0023]
所述频域特征包括:直流分量dc、幅度、功率谱密度psd,所述功率谱密度包括幅度统计特征和形状统计特征。
[0024]
进一步地,所述频域特征用于发现信号的周期性信息,频域分析通过傅里叶变换来计算,所述直流分量是傅里叶变换后的第一个分量,所述幅度为数据变换后的绝对值,所述功率谱密度用来描述数据在频域的能量分布。
[0025]
本发明通过改进在此提供一种基于列车的牵引系统健康度评估的研究方法,与现有技术相比,具有如下改进及优点:
[0026]
(1)本发明利用从数据中提取原始特征、时频域特征和相关性特征,通过这些变量分析其业务上面的强相关性,使得在某状态下两两检测值相异,即可反应出设备在一定程度隐藏不健康信息。
[0027]
(2)本发明利用降维的方法对特征进行删选,使得数据在低维下更容易处理、更容易使用,在相关特征方面,特别是重要特征更能在数据中明确的显示出来,如果只有两维或者三维的话,更便于同时可视化展示,还能去除数据噪声以及降低算法开销。
[0028]
(3)本发明利用聚类的高斯混合模型进行时间,使得对列车故障的分析更加的敏感,使得列车系统中的稍微的异常特征都能识别出,进而实现了对列车的牵引系统健康度评估更加灵敏的效果。
附图说明
[0029]
下面结合附图和实施例对本发明作进一步解释:
[0030]
图1是本发明的流程图;
[0031]
图2是本发明的高斯混合模型示意图;
[0032]
图3是本发明的逻辑回归模型示意图;
[0033]
图4是本发明的降维示意图;
[0034]
图5是本发明利用高斯混合模型得到的a1

b2子系统二月份的得分图表;
[0035]
图6是本发明利用逻辑回归模型得到的a1

b2子系统二月份的得分图表。
具体实施方式
[0036]
下面将结合附图1至图6对本发明进行详细说明,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0037]
需要说明的是,当组件被称为“固定于”另一个组件,它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“连接”另一个组件,它可以是直接连接到另一个组件或者可能同时存在居中组件。当一个组件被认为是“设置于”另一个组件,它可以是直接设置在另一个组件上或者可能同时存在居中组件。本文所使用的术语“垂直的”、“水平的”、“左”、“右”以及类似的表述只是为了说明的目的。
[0038]
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0039]
本发明通过改进在此提供一种基于列车的牵引系统健康度评估的研究方法,如图1

图6所示,包括以下步骤:
[0040]
s1.分析数据,调取牵引系统的设备数据进行分析和处理,通过pce的状态识别出牵引系统的状态,并对牵引系统的状态进行命名;
[0041]
s2.特征提取,获得与设备健康相关的变量,并从设备健康相关的变量中提取特征;
[0042]
s3.建立模型,根据提取的特征建立无监督学习模型和有监督学习模型;
[0043]
s4.模型实践;
[0044]
s4.1,无监督学习模型,通过向模型输入特征数据,然后经模型输出健康类别的类概率值;
[0045]
s4.2,有监督学习模型:利用先验知识,定义一个阈值来划分设备该特征的健康状况,然后输出每一个状态处于故障与非故障的概率值;
[0046]
s5.输出系统健康度得分,在无监督和有监督的模型中,利用模型得到的每一个状态划分到健康类别的类概率值,再利用类概率值作为该状态的健康度得分。
[0047]
进一步地,在s1中,牵引系统的状态进行命名内容为:0=未知,1=hscb断开,2=故障,3=牵引施加,4=牵引未施加,在数据预处理中,将异常为负的电压转化为0,将有发生故障的状态标记为1,没有发生故障的状态标记为0。
[0048]
进一步地,在s2中,特征包括:原始特征、时频域特征和相关性特征。
[0049]
进一步地,在s4中,无监督学习模型包括高斯混合模型,通过高斯混合模型表示在总体分布中含有k个子分布的概率模型,高斯混合模型由k个单高斯模型组合而成,k个子模型为高斯混合模型的隐变量,通过高斯概率密度函数参数不同,每一个高斯模型可以看作一种类别,当输入一个样本x,即可通过pdf计算其值,然后通过一个阈值来判断该样本是否属于高斯模型,即可给出样本被划分到每一个类别的类概率信息。
[0050]
进一步地,在s4中,有监督学习模型包括逻辑回归模型,在逻辑回归模型中,令g(z)的值分布在(0,1)之间,当g(z)接近于0时样本的标签为0,当g(z)接近于1时样本的标签为类别1。
[0051]
进一步地,高斯混合模型的训练方法为:输入特征数据,利用高斯混合模型进行训练,将数据分为两类,一类倾向于识别出特征中的毛刺状态,一类倾向识别非毛刺的数据,将识别出毛刺的一类作为不健康的一类,输出每一个状态划分到健康类别的类概率值。
[0052]
进一步地,逻辑回归模型的训练方法为:利用经验知识,定义一个阈值来划分设备该特征的健康状况,此处采用统计学中的sigma准则来作为阈值的划分,将所有特征在区间[μ

3σ,μ 3σ]之外的数据定义成异常,利用有监督的逻辑回归分类算法进行训练,输出每一个状态处于故障与非故障的概率值,利用逻辑回归模型将训练集和测试集以7:3的比例进行模型的训练,通过网格搜索进行调参,获得最佳分类效果的模型参数。
[0053]
进一步地,在s7中,当牵引系统本身曝出故障时,认定在该状态下设备的健康度为0,在非牵引状态下和hscb断开的状态下,不考虑该状态的得分,最后牵引系统某一天的得分,综合牵引状态的健康得分与报故障的健康得分平均来综合,若该车在某一天里面没有牵引状态,则用前一天的得分来作为今天的打分。
[0054]
进一步地,原始特征包括:列车托架轴的速度、本架轴的速度、本架基轮径值、车架pce心跳、车架本架牵引力、车架电网电压、车架中间电压、车架中间电流、车架逆变电流、车架电机综合速度、车架斩波电流、车架给定牵引制动力、车架电机温度、车架电机转速、车架再生制动能耗脉冲、车架牵引能耗脉冲、车架本架电制动能力值、车架转向架电网电压和车架转向架牵引力完成值;
[0055]
时域特征包括:在序列随时间变化的过程中,所具有的与时间相关的一些特征;
[0056]
频域特征包括:直流分量dc、幅度、功率谱密度psd,功率谱密度包括幅度统计特征
和形状统计特征。
[0057]
进一步地,频域特征用于发现信号的周期性信息,频域分析通过傅里叶变换来计算,直流分量是傅里叶变换后的第一个分量,幅度为数据变换后的绝对值,功率谱密度用来描述数据在频域的能量分布。
[0058]
实施例一
[0059]
一种基于列车的牵引系统健康度评估的研究方法,包括以下步骤:
[0060]
s1.分析数据,调取牵引系统的设备数据进行分析和处理,通过pce的状态识别出牵引系统的状态,并对牵引系统的状态进行命名;
[0061]
s2.特征提取,获得与设备健康相关的变量,并从设备健康相关的变量中提取特征;
[0062]
s3.建立模型,根据提取的特征建立无监督学习模型和有监督学习模型;
[0063]
s4.模型实践;
[0064]
s4.1,无监督学习模型,通过向模型输入特征数据,然后经模型输出健康类别的类概率值;
[0065]
s4.2,有监督学习模型:利用先验知识,定义一个阈值来划分设备该特征的健康状况,然后输出每一个状态处于故障与非故障的概率值;
[0066]
s5.输出系统健康度得分,在无监督和有监督的模型中,利用模型得到的每一个状态划分到健康类别的类概率值,再利用类概率值作为该状态的健康度得分:
[0067]
进一步地,在s1中,牵引系统的状态进行命名内容为:0=未知,1=hscb断开,2=故障,3=牵引施加,4=牵引未施加,在数据预处理中,将异常为负的电压转化为0,将有发生故障的状态标记为1,没有发生故障的状态标记为0。
[0068]
进一步地,在s2中,特征包括:原始特征、时频域特征和相关性特征。
[0069]
进一步地,在s4中,无监督学习模型包括高斯混合模型,通过高斯混合模型表示在总体分布中含有k个子分布的概率模型,高斯混合模型由k个单高斯模型组合而成,k个子模型为高斯混合模型的隐变量,通过高斯概率密度函数参数不同,每一个高斯模型可以看作一种类别,当输入一个样本x,即可通过pdf计算其值,然后通过一个阈值来判断该样本是否属于高斯模型,即可给出样本被划分到每一个类别的类概率信息。
[0070]
进一步地,在s4中,有监督学习模型包括逻辑回归模型,即:在逻辑回归模型中,令g(z)的值分布在(0,1)之间,当g(z)接近于0时样本的标签为0,当g(z)接近于1时样本的标签为类别1。
[0071]
进一步地,高斯混合模型的训练方法为:输入特征数据,利用高斯混合模型进行训练,将数据分为两类,一类倾向于识别出特征中的毛刺状态,一类倾向识别非毛刺的数据,将识别出毛刺的一类作为不健康的一类,输出每一个状态划分到健康类别的类概率值。
[0072]
进一步地,逻辑回归模型的训练方法为:利用经验知识,定义一个阈值来划分设备该特征的健康状况,此处采用统计学中的sigma准则来作为阈值的划分,将所有特征在区间[μ

3σ,μ 3σ]之外的数据定义成异常,利用有监督的逻辑回归分类算法进行训练,输出每一个状态处于故障与非故障的概率值,利用逻辑回归模型将训练集和测试集以7:3的比例进行模型的训练,通过网格搜索进行调参,获得最佳分类效果的模型参数。
[0073]
进一步地,在s7中,当牵引系统本身曝出故障时,认定在该状态下设备的健康度为0,在非牵引状态下和hscb断开的状态下,不考虑该状态的得分,最后牵引系统某一天的得分,综合牵引状态的健康得分与报故障的健康得分平均来综合,若该车在某一天里面没有牵引状态,则用前一天的得分来作为今天的打分。
[0074]
进一步地,原始特征包括:列车托架轴的速度、本架轴的速度、本架基轮径值、车架pce心跳、车架本架牵引力、车架电网电压、车架中间电压、车架中间电流、车架逆变电流、车架电机综合速度、车架斩波电流、车架给定牵引制动力、车架电机温度、车架电机转速、车架再生制动能耗脉冲、车架牵引能耗脉冲、车架本架电制动能力值、车架转向架电网电压和车架转向架牵引力完成值,如:拖架1轴1速度(总),托架1轴2速度(总),托架2轴1速度(总),托架2轴2速度(总),本架轴1速度(总),本架轴2速度(总),本架基轮径值(总),a1车b2架pce心跳(子),a1车b2架本架牵引力(子),a1车b2架电网电压(子),a1车b2架中间电压(子),a1车b2架中间电流(子),a1车b2架逆变电流(子),a1车b2架电机综合速度(子),a1车b2架斩波电流(子),a1车b2架给定牵引制动力(子),a1车b2架电机1温度t1(子),a1车b2架电机2温度t(子),a1车b2架电机1转速(子),a1车b2架电机2转速(子),a1车b2架再生制动能耗脉冲(子),a1车b2架牵引能耗脉冲(子),_a1车b2架本架电制动能力值(子),a1车b2架本架电制动力(子),a1车b2架转向架2电网电压(子),a1车b2架转向架2牵引力完成值(子),a1车b2架转向架2牵引电制动力完成值(子)等,以及表征状态和故障和系统状态的状态变量;
[0075]
时域特征包括:在序列随时间变化的过程中,所具有的与时间相关的一些特征,我们用n来表示一个时间窗口的大小(即窗口内的数据的行数),用i来表示第i行数据,常用的时域特征有:均值、标准差、众数、最大值、最小值、范围和过均值零点的个数;
[0076]
频域特征包括:直流分量dc、幅度、功率谱密度psd,功率谱密度包括幅度统计特征和形状统计特征;
[0077]
对于幅度统计特征:设c(i)是第i个窗口的频率幅度值,n表示窗口数,则幅度统计特征的几个量计算方式如下:
[0078]
1.均值mean
[0079]
2.标准差
[0080]
3.偏度
[0081]
4.峰度
[0082]
对于形状统计特征:设c(i)是第i个窗口的频率幅度值,n表示窗口数,则形状统计特征的几个量计算方式如下:
[0083]
1.均值
[0084]
2.标准差
[0085]
3.偏度
[0086]
4.峰度
[0087]
进一步地,频域特征用于发现信号的周期性信息,频域分析通过傅里叶变换来计算,直流分量是傅里叶变换后的第一个分量,幅度为数据变换后的绝对值,功率谱密度用来描述数据在频域的能量分布。
[0088]
变量之间的相关特征
[0089]
由于系统之间有着较为复杂的关系,通过不同的变量之间的一定联系来反应牵引系统的健康程度:
[0090]
1.牵引系统牵引力给定值与牵引力实际完成值之间的差异性;
[0091]
2.车辆长时间的产生的轮径磨损;
[0092]
3.同一个转向架的两个车轴的转速之间是相关性。
[0093]
基于上述三种业务提供构建一些表征业务相关性的特征,构建新的特征:牵引力差异值=牵引力给定值

牵引力实际完成值,托架轴1速度差异=拖架1轴1速度

拖架1轴2速度,托架轴2速度差异=拖架轴2轴1速度

托架轴2轴2轴速度,本架轴速度差异=本架轴1速度

本架轴2速度,电机转速差异=a1车b2架电机1转速

a1车b2架电机2转速等,考虑相同的架上面的电机温度也应该是相近的,以及a1车b2架电网电压,a1车b2架中间电压之间在牵引的状态下差异可能也是稳定的,进而构造:电机温度差异,电网电压与中间电压差异等一些衍生特征。
[0094]
特征删选
[0095]
1.方差过滤,这是通过特征本身的方差来筛选特征的类。比如一个特征本身的方差很小,就表示样本在这个特征上基本没有差异,可能特征中的大多数值都一样,甚至整个特征的取值都相同,那这个特征对于样本区分没有什么作用。所以无论接下来的特征工程要做什么,都要优先消除方差为0的特征,有重要参数,表示方差的阈值,表示舍弃所有方差小于参数的特征,不填默认为0,即删除所有的记录都相同的特征。
[0096]
2.pca降维
[0097]
pca(principal component analysis)是一种常见的数据分析方式,常用于高维数据的降维,用于提取数据的主要特征分量见图4。
[0098]
评估得分
[0099]
1.利用高斯混合模型得到的a1

b2子系统二月份的得分为:
[0100]
[0.9188908582317494,0.9412026888664996,0.9859957996253188,0.9447741494142773,0.9755640890769134,0.9494043089575432,0.8650502924720166,0.8650502924720166,0.9752244503295684,0.9514179133547823,0.9471492608035854,0.9471492608035854,0.9276063416864274,0.9466231946786934,0.9585397180830569,0.9494194500779481,0.9603358875864226,0.9220910824044193,0.9286624105720628,
0.8545742567359361,0.9707025944494647,0.941626192837689,0.9332891982589537,0.9138285267950115,0.9138935973857877,0.9101260517919367,0.9237267520029858]。
[0101]
2.利用逻辑回归模型得到的a1

b2子系统二月份的得分为:
[0102]
[0.6402928298015667,0.7754980885875028,0.6228773422754578,0.7377714599106631,0.770152057541923,0.7124376794934434,0.4267749426496583,0.4267749426496583,0.7740790422236641,0.7688245170768129,0.7708252443911504,0.7708252443911504,0.7444706117624396,0.7355017301640461,0.7381279746547131,0.47761596646098137,0.7918574914338976,0.7343446571983123,0.7671602165503911,0.5144322413284456,0.8163304390913007,0.7756993015174029,0.48827376109642984,0.7822657107367167,0.7692934116179976,0.7629457104113786,0.7395129936263205]。
[0103]
通过对上述得分数据进行绘制图表(高斯混合模型得分见图表5,逻辑回归模型得分见图表6),由图表5和图表6可知逻辑回归的效果不是很理想,所以模型分到健康状态的概率很低,所以利用概率进行打分的到的设备的健康度也不是很高,因此利用高斯混合模型进行打分的到的设备的健康度结果较为理想。
[0104]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜