一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种改进后的BP神经网络预测轴温等级的方法

2022-09-07 14:53:30 来源:中国专利 TAG:

一种改进后的bp神经网络预测轴温等级的方法
技术领域
1.本发明涉及轴温检测领域,特别涉及一种改进后的bp神经网络预测轴温等级的方法。


背景技术:

2.红外线轴温探测系统(trace hotbox detection system,简称thds)的热轴预报系统,thds从安装在轨道一侧的探测装置中收集数据,并利用辐射测量技术实时监测轴温,进而检测车辆中可能存在的轴承故障,以确保列车的行车安全。然而,在实际应用过程中,红外线预报的兑现率仍然较低,误报率较高。这是因为列车具有复杂的热轴判别,很多外部环境因素都会影响轴温判别,所以thds根据经验确定了轴温判别的临界点,不能满足实际应用的需要。
3.然而对于bp神经网络应用在轴温检测领域的有以下优势:
4.自学习和自适应能力:能够通过学习自动提取输出、输出数据间的"合理规则”,并自适应的将学习内容记忆于网络的权值中。
5.高泛化能力:在设计模式分类器时,即要考虑网络在保证对所需分类对象进行正确分类,还要关心网络在经过训练后,能否对未见过的模式或有噪声污染的模式,进行正确的分类。也即bp神经网络具有将学习成果应用于新知识的能力。
6.较高的容错能力:bp神经网络在其局部的或者部分的神经元受到破坏后对全局的训练结果不会造成很大的影响,也就是说即使系统在受到局部损伤时还是可以正常工作的。即bp神经网络具有一定的容错能力。


技术实现要素:

7.为了克服现有技术中的不足,本发明提供一种改进后的bp神经网络预测轴温等级的方法,解决现有技术中红外线轴温探测系统(thds)热箱检测精度低的问题。
8.为了达到上述发明目的,解决其技术问题所采用的技术方案如下:
9.一种改进后的bp神经网络预测轴温等级的方法,包括以下步骤:
10.步骤1:确认轴温等级判断标准;
11.步骤2:对收集的数据进行处理;
12.步骤3:搭建检测轴温等级的神经网络并且进行验证。
13.进一步的,所述步骤1具体包括以下内容:
14.轴承温度的正常范围应当是在40摄氏度以下;
15.大于40摄氏度但小于60摄氏度,为微热等级;
16.大于等于60摄氏度但小于75摄氏度,为强热等级;
17.大于等于75摄氏度,为激热等级。
18.进一步的,所述步骤2的具体步骤如下:
19.步骤2.1:获取轴承温度;
20.步骤2.2:确认选取特征的方法,并且选取特征;
21.步骤2.3:处理收集的轴承温度和相关特征,获得训练集和验证集。
22.进一步的,所述步骤2.1具体包括以下内容:
23.利用thds从安装在轨道一侧的探测装置中收集数据,并利用辐射测量技术实时监测轴温,红外探头内的热敏元件把接收到的热能转化为电压信号,根据对应的电压幅值温度表得到列车的轴温。
24.进一步的,所述步骤2.2具体包括以下内容:
25.对收集到与轴温相关的特征利用皮尔逊相关系数法来判断特征和轴温的相关系数γ,γ的范围[-1,1],当相关系数γ越大时,说明这个特征和轴温的相关程度越大;利用这一种方法,通过比对不断去除样本集中与目标特征无关或关系较弱的部分特征,从而剔除了对目标问题的解决没有贡献甚至会产生干扰的数据,其中皮尔逊相关系数的求解公式如下:
[0026][0027]
其中,n代表的是特征样本个数,yi是第i次的轴温,xi是第i次的特征值;
[0028]
选择列车运行速度、载重、外界温度,列车的运行状态、列车的类别、列车运行时间这6个特征。
[0029]
进一步的,所述步骤2.3具体包括以下内容:
[0030]
由于列车的轴温的强热、激热等级等级的数据较少,但在构建bp神经网络模型所需的训练数据中四个等级的样本个数应该差不多,所以我们的训练数据的样本个数较少,当选用较深的bp神经网络会出现过拟合现象,因此在这里使用k-则交叉验证的方法来选取训练数据集和验证数据集,从而减缓模型的过拟合现象,提高整个模型的泛化能力。
[0031]
进一步的,所述步骤3的具体步骤如下:
[0032]
步骤3.1:构建残差块;
[0033]
步骤3.2:构建整个残差网络;
[0034]
步骤3.3:构建模型的评估指标,并对模型进行微调和验证。
[0035]
进一步的,所述步骤3.1具体包括以下内容:
[0036]
当训练模型的时候,随着网络深度到达一定的程度时,会出现梯度消失的现象,而残差块类似与自动控制系统中的前馈反馈相似,将输入残差块的数据x,x∈r
m*n
,m代表的为样本的个数,n可以被看作残差块输入层神经元的个数,x有两个走向,一个是直接通过跳跃路径得到输出y2,另一个是通过主路径再通过一个全连接层后进行批量归一化和激活后在经过一个全连接并且批量归一化得到的输出y1相加激活后,作为这个残差块的输出结果z;
[0037]
同时残差块的构建可以分为两种模式:
[0038]
模式一,残差块的第一层全连接的神经元个数是第二层全连接的神经元个数的一半,同时在跳跃路径上存在一个神经元个数等于第二层全连接的神经元个数的全连接层;
[0039]
模式二,第一层全连接的神经元个数是第二层全连接的神经元个数,此时在跳跃路径上不存在全连接层,直接作为y2和y1相加。
[0040]
进一步的,所述步骤3.2具体包括以下内容:
[0041]
输入轴温数据首先会经过一个含有56个神经元的全连接层,之后通过三个由2个残差块构成stage模块,之后经过三个stage模块,每一个stage模块中含有两个残差块,其中:
[0042]
首先,第一stage模块中的第一个残差块选用的是模式二,即经过后输出矩阵的形状不发生改变的情况;第二个残差块也是选用模式二的;
[0043]
其次,第二stage模块和第三stage模块构造相同,第一个残差块选用的是模式一,第二个残差块选用的是模式二;
[0044]
最后,第三stage模块的输出经过一个模式一的残差块后连接至输出层。
[0045]
进一步的,所述步骤3.3具体包括以下内容:
[0046]
此时的输出层有4个神经元,四个神经元分别代表正常、微热、强热、激热这四种情况出现的概率;因此输入多个样本的数据经过模型可以得到每个样本数据的各个轴温状态可能性的大小,因此可以通过和标签进行对比对从而来评估模型的好坏,通过多次调解超参数来调整模型,使模型达到理想效果。
[0047]
本发明由于采用以上技术方案,使之与现有技术相比,具有以下的优点和积极效果:
[0048]
本发明将利用传感器直接测得得轴温数据和利用皮尔逊相关系数法获取的特征同时作为bp神经网络得输入,并且提供了通过对收集的数据进行k-折交叉验证的办法解决部分轴温等级由于数据不足而导致的bp神经网络的过拟合现象,以及通过残差块来解决由于加深网络深度产生的梯度变得很小或者梯度消失这种现象的方法,从而来进一步提高预测精度。
附图说明
[0049]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。附图中:
[0050]
图1为本发明提供的一种改进后的bp神经网络预测轴温等级的方法的总体流程图示意图;
[0051]
图2为本发明提供的一种改进后的bp神经网络预测轴温等级的方法的k-交叉验证选取训练集和验证集的示意图;
[0052]
图3为本发明提供的一种改进后的bp神经网络预测轴温等级的方法的模式一的残差块的示意图;
[0053]
图4为本发明提供的一种改进后的bp神经网络预测轴温等级的方法的模式二的残差块的示意图;
[0054]
图5为本发明提供了一种改进后的bp神经网络预测轴温等级的方法的模型示意图。
具体实施方式
[0055]
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施
例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0056]
如图1所示,本实施例公开了一种改进后的bp神经网络预测轴温等级的方法,包括以下步骤:
[0057]
步骤1:确认轴温等级判断标准;
[0058]
轴承温度的正常范围应当是在40摄氏度以下;大于40摄氏度但小于60摄氏度,为微热等级;大于等于60摄氏度但小于75摄氏度,为强热等级;大于等于75摄氏度,为激热等级。
[0059]
本实施例中选取的每个等级的轴温范围较大的原因是在该模型中不仅仅考虑到外界温度对我们的轴承温度的影响,同时考虑到了在列车运行过程中的列车的速度以及载重等其他因素对轴温的影响。
[0060]
步骤2:对收集的数据进行处理;
[0061]
进一步的,所述步骤2的具体步骤如下:
[0062]
步骤2.1:获取轴承温度;
[0063]
步骤2.2:确认选取特征的方法,并且选取特征;
[0064]
步骤2.3:处理收集的轴承温度和相关特征,获得训练集和验证集。
[0065]
进一步的,所述步骤2.1具体包括以下内容:
[0066]
利用thds从安装在轨道一侧的探测装置中收集数据,并利用辐射测量技术实时监测轴温,红外探头内的热敏元件把接收到的热能转化为电压信号,根据对应的电压幅值温度表得到列车的轴温。
[0067]
进一步的,所述步骤2.2具体包括以下内容:
[0068]
对收集到与轴温相关的特征利用皮尔逊相关系数法来判断特征和轴温的相关系数γ,γ的范围[-1,1],当相关系数γ越大时,说明这个特征和轴温的相关程度越大;利用这一种方法,通过比对不断去除样本集中与目标特征无关或关系较弱的部分特征,从而剔除了对目标问题的解决没有贡献甚至会产生干扰的数据,其中皮尔逊相关系数的求解公式如下:
[0069][0070]
其中,n代表的是特征样本个数,yi是第i次的轴温,xi是第i次的特征值;
[0071]
选择列车运行速度、载重、外界温度,列车的运行状态(分为了出站加速状态、到站减速状态、中间匀速状态)、列车的类别、列车运行时间这6个特征。
[0072]
本实施例中同时利用到了用thds从安装在轨道一侧的探测装置中收集数据,并利用辐射测量技术实时监测轴温,红外探头内的热敏元件把接收到的热能转化为电压信号,根据对应的电压幅值温度表得到列车的轴温。将thds测得的轴温同样作为一个特征,和之前利用皮尔逊相关系数法得到的与轴温相关最大的六个特征一起输入bp神经网络中进行训练。
[0073]
进一步的,所述步骤2.3具体包括以下内容:
[0074]
如图2所示,由于列车的轴温的强热、激热等级等级的数据较少,但在构建bp神经
网络模型所需的训练数据中四个等级的样本个数应该差不多,所以我们的训练数据的样本个数较少,当选用较深的bp神经网络会出现过拟合现象,因此在这里使用k-则交叉验证的方法来选取训练数据集和验证数据集,从而减缓模型的过拟合现象,提高整个模型的泛化能力。具体实施方式为:将训练数据均匀的分为k份(k一般为5或者10),按顺序在k份中选择一份作为验证集,其余k-1份作为训练数据,带入到模型中得到评估指标,重复k次,最后把k次评估指标的平均值作为最终的评估指标。
[0075]
步骤3:搭建检测轴温等级的神经网络并且进行验证。
[0076]
进一步的,所述步骤3的具体步骤如下:
[0077]
步骤3.1:构建残差块;
[0078]
步骤3.2:构建整个残差网络;
[0079]
步骤3.3:构建模型的评估指标,并对模型进行微调和验证。
[0080]
进一步的,所述步骤3.1具体包括以下内容:
[0081]
如图3,4所示,残差块中的主路径上的含有2层全连接层,其中第一个全连接层有两种选择:其中一种情况为全连接层的神经元个数等于残差块输入层的神经元个数的一半,另一种情况为全连接层的神经元个数等于残差块输入层的神经元个数。第二个全连接层神经元的个数等于残差块中第一个全连接层的神经元个数。而残差块的跳跃路径是否存在全连接层和残差块的输入层的神经元个数是否等于输出层的神经元个数有关,若相等时跳跃路径不存在全连接,不相等时跳跃路径上存在一个神经元个数等于残差块第二个全连接层神经元个数的全连接层。
[0082]
整一个残差块中的具体流程为:首先判断这个残差块的主路径上的第一层全连接的神经元个数,将第一层全连接的神经元个数不等于输入层神经元个数的情况称为模式一,将第一层神经元个数等于输入层神经元个数的情况成为模式二。经过输入层后的数据为x,x∈r
m*n
(x是一个二维的矩阵,x行数为样本个数m,列数为输入神经元的个数n,其中n为偶数)。在模式一的情况下,首先通过主路径上的第一个全连接层以及之后批量归一化层和激活层后变为x1,之后经过得到主路径上的第二个全连接层以及之后的批量归一化层得到y1,输入层后的数据为x同时输入到跳跃路径后经过跳跃路径上的全连接层,得到结果y2,最后残差块的输出为y1 y2后经过激活层的z,此时经过残差块后的输出数据矩阵的形状的列数为输入数据的矩阵列数的一半。模式二的情况与模式一的情况相类似,只是跳跃路径中不存在全连接层,若经过输入层后的数据为x∈r
m*n
,输出的z∈r
m*n
,此时经过残差块后的输出数据矩阵的形状等于输入数据的矩阵形状。
[0083]
进一步的,所述步骤3.2具体包括以下内容:
[0084]
如图5所示,输入轴温数据首先会经过一个含有56个神经元的全连接层,之后通过三个由2个残差块构成stage模块,之后经过三个stage模块,每一个stage模块中含有两个残差块,其中:
[0085]
首先,第一stage模块中的第一个残差块选用的是模式二,即经过后输出矩阵的形状不发生改变的情况;第二个残差块也是选用模式二的;
[0086]
其次,第二stage模块和第三stage模块构造相同,第一个残差块选用的是模式一,
第二个残差块选用的是模式二;
[0087]
最后,第三stage模块的输出经过一个模式一的残差块后连接至输出层。
[0088]
这样构成了主路径上中含有15个全连接层的bp神经网络,同时因为跳跃路径的存在使得底层靠近输入轴温特征的全连接层的每一个权重的梯度随着网络的加深可能出现的梯度较小甚至是梯度消失的问题。
[0089]
进一步的,所述步骤3.3具体包括以下内容:
[0090]
此时的输出层有4个神经元,四个神经元分别代表正常、微热、强热、激热这四种情况出现的概率;因此输入多个样本经过模型后可以得到这些样本正常、微热、强热、激热这四种情况出现的概率,由于训练数据、验证数据给出了这些样本真实的轴温情况标签,因此我们可以遍历整个训练样本,取出每一个样本中概率最大的那个神经元所代表的轴温情况并与真实标签进行对比。得到相同的样本个数,再除以整个训练样本总数的得到模型在训练集上的准确率。在验证数据集上进行同样的操作,得到验证集上的准确率。通过k-折交叉验证的方法判定在验证集上的准确率来调节超参数:学利率和迭代次数,使模型达到我们的理想效果。
[0091]
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献