一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于多头CNN-RNN的轨道电路故障检测方法

2022-08-07 19:56:13 来源:中国专利 TAG:

一种基于多头cnn-rnn的轨道电路故障检测方法
技术领域
1.本发明涉及轨道交通故障处理的技术领域,特别是一种基于多头cnn-rnn的轨道电路故障检测方法。


背景技术:

2.轨道电路在铁路信号系统中承担着检查区间闭塞、传递行车信息以及实现断轨检查等功能,其设备群规模大,单个设备测量点多,数据采样频率高,监测持续时间长,可以获得海量数据,从而将设备故障诊断领域推进到大数据时代。虽然这些数据包含轨道电路运维的整个过程,有价值的故障数据密度较低,但其包含了装备故障演化的机理和本质的各种信息,推动轨道电路故障诊断技术在现有基础上的发展。
3.轨道电路的故障诊断历经故障事后维修、故障预防维修、故障状态监测以及智能管理等阶段。由于轨道电路的故障导向安全原则,在实际中对新技术的应用程度较少,轨道电路的智能化水平相对较低,影响轨道电路向“状态修”的迈进。对于故障的判断和识别是智能管理阶段的面临的主要问题,将深度学习等相关知识和系统学习算法应用于轨道电路的故障诊断,对提高轨道电路的运行质量、降低维护成本的等具有极其重要的理论价值和现实意义,也是今后轨道电路故障诊断的发展趋势。
4.申请公开号为cn 111626416 a的发明专利申请公开了一种基于深度卷积神经网络的轨道电路故障自动诊断方法,获取轨道电路的实时变化数据,建立轨道电路故障类型数据集,将数据集划分为训练样本和测试样本;其次,建立一维的深度卷积神经网络,输入训练集样本训练网络模型,通过测试样本评估网络模型的准确率,得到训练好的一维深度卷积神经网络模型;最后,将轨道电路的实时变化数据输入训练好的深度卷积神经网络模型,通过神经网络建立输入与输出之间的映射关系,输出故障类型,定位故障位置。该方法的缺点是割裂了轨道电路数据在时间上的联系,无法更好的适应轨道电路故障发生机理,在工作环境复杂、故障特征不明显时,无法实现有效的轨道电路故障检测。


技术实现要素:

5.为了解决上述的技术问题,本发明提出了一种基于多头cnn-rnn的轨道电路故障检测方法,采用轨道电路移动窗口的方法处理轨道电路多类型数据,根据多头cnn独立处理不同位置的特征数据,随后采用rnn提取的特征来确定轨道电路运行期间是否发生异常。
6.本发明提供一种基于多头cnn-rnn的轨道电路故障检测方法,包括收集zpw-2000a系列轨道电路系统中的电路特征信号,还包括以下步骤:
7.步骤1:对收集到的轨道电路不同位置的信号进行独立处理,采用多头cnn实现对不同类型数据的处理;
8.步骤2:采用rnn检测窗口提取的特征中找到隐藏的时间模式,按时间顺序处理与每个窗口对应的所有提取特征;
9.步骤3:对窗口处理结果进行分类,根据所有检测设备在特定事件中表现出的时间
行为给出最终结果。
10.优选的是,所述多头cnn使用具有单个通道的多个一维卷积,每个通道使用不同的过滤器集。
11.在上述任一方案中优选的是,在所述步骤2中,时间序列以基于窗口的方式进行处理,所有时间序列都被划分为相同数量的段,窗口的数量为
[0012][0013]
其中,wn表示窗口数量,s
l
表示时间序列中的序列长度,w
l
表示窗口长度,ws表示窗口步长。
[0014]
在上述任一方案中优选的是,每个卷积头逐窗口处理其对应的所述时间序列,每个窗口和传感器数据都会得到一个特征图其中,n为去记录检测位置,w为记录窗口编号。
[0015]
在上述任一方案中优选的是,所述多头cnn的输入数据,每个旋转头需要一个四维输入input_cnn,公式为
[0016][0017]
其中,n_samples表示样本数量,n_channels表示通道数量。
[0018]
在上述任一方案中优选的是,rnn的输入是由多头cnn的最后一层产生的三维矢量,输入input_rnn的公式为
[0019]
input_rnn=(n_samples,wn,p
pl
)
[0020]
其中,p
pl
为cnn最后一层输出向量的最后一个维度。
[0021]
在上述任一方案中优选的是,每个窗口的特征图是由每个检测器产生的特征图的串联形成的,rnn按时间顺序处理提取的特征图,从f1到fw,rnn处理的每个窗口以将与当前窗口对应的相关信息存储在其内部存储器中。
[0022]
在上述任一方案中优选的是,所述步骤3包括对于不平衡数据集上的二元分类进行评估时,选用平均精度用于获得可以与分类器进行比较的特定值。
[0023]
在上述任一方案中优选的是,在每个阈值处实现的精度的加权平均值,将前一个阈值的召回率增加用作权重ap,计算方法为
[0024][0025]
其中,rn为第n个阈值处的召回率,r
n-1
为第n-1个阈值处的召回率,pn为第n个阈值处的精度。
[0026]
在上述任一方案中优选的是,所述步骤3还包括在数据不平衡的情况下,采用精确性和召回率之间的几何平均值作为模型的评价指标,公式为
[0027][0028]
其中,tp表示系统采取的真阳性,fp表示系统采取的假阳性,tn表示系统采取的真
阴性,fn表示系统采取的假阴性。
[0029]
本发明提出了一种基于多头cnn-rnn的轨道电路故障检测方法,对比多头和多通道数据处理模式以及窗口大小对实验的影响,所提出的多头cnn架构在测试场景中都优于传统的多通道cnn。。
附图说明
[0030]
图1为按照本发明的基于多头cnn-rnn的轨道电路故障检测方法的一优选实施例的流程图。
[0031]
图2为按照本发明的基于多头cnn-rnn的轨道电路故障检测方法的轨道电路多头cnn-rnn模型的一实施例的示意图。
[0032]
图3为按照本发明的基于多头cnn-rnn的轨道电路故障检测方法的一优选实施例的多头、多通道模式对比示意图。
[0033]
图4为按照本发明的基于多头cnn-rnn的轨道电路故障检测方法的窗口长度与网络大小关系的一实施例的示意图。
[0034]
图5为按照本发明的基于多头cnn-rnn的轨道电路故障检测方法的窗口长度与训练时间关系的一实施例的示意图。
[0035]
图6为按照本发明的基于多头cnn-rnn的轨道电路故障检测方法的窗口长度与g_mean关系的一实施例的示意图。
具体实施方式
[0036]
下面结合附图和具体的实施例对本发明做进一步的阐述。
[0037]
实施例一
[0038]
如图1所示,执行步骤100,收集zpw-2000a系列轨道电路系统中的电路特征信号。
[0039]
执行步骤110,对收集到的轨道电路不同位置的信号进行独立处理,采用多头cnn实现对不同类型数据的处理。所述多头cnn使用具有单个通道的多个一维卷积,每个通道使用不同的过滤器集。
[0040]
执行步骤120,采用rnn检测窗口提取的特征中找到隐藏的时间模式,按时间顺序处理与每个窗口对应的所有提取特征。时间序列以基于窗口的方式进行处理,所有时间序列都被划分为相同数量的段,窗口的数量为
[0041][0042]
其中,wn表示窗口数量,s
l
表示时间序列中的序列长度,w
l
表示窗口长度,ws表示窗口步长。
[0043]
每个卷积头逐窗口处理其对应的所述时间序列,每个窗口和传感器数据都会得到一个特征图其中,n为去记录检测位置,w为记录窗口编号。
[0044]
所述多头cnn的输入数据,每个旋转头需要一个四维输入input_cnn,公式为
[0045][0046]
其中,n_samples表示样本数量,n_channels表示通道数量。
[0047]
nn的输入是由多头cnn的最后一层产生的三维矢量,输入input_rnn的公式为
[0048]
input_rnn=(n_samples,wn,p
pl
)
[0049]
其中,p
pl
为cnn最后一层输出向量的最后一个维度。
[0050]
执行步骤130,对窗口处理结果进行分类,根据所有检测设备在特定事件中表现出的时间行为给出最终结果。每个窗口的特征图是由每个检测器产生的特征图的串联形成的,rnn按时间顺序处理提取的特征图,从f1到fw,rnn处理的每个窗口以将与当前窗口对应的相关信息存储在其内部存储器中。
[0051]
在本步骤中,对于不平衡数据集上的二元分类进行评估时,选用平均精度用于获得可以与分类器进行比较的特定值。在每个阈值处实现的精度的加权平均值,将前一个阈值的召回率增加用作权重ap,计算方法为
[0052][0053]
其中,rn为第n个阈值处的召回率,r
n-1
为第n-1个阈值处的召回率,pn为第n个阈值处的精度。
[0054]
在数据不平衡的情况下,采用精确性和召回率之间的几何平均值作为模型的评价指标,公式为
[0055][0056]
其中,tp表示系统采取的真阳性,fp表示系统采取的假阳性,tn表示系统采取的真阴性,fn表示系统采取的假阴性。
[0057]
实施例二
[0058]
本发明针对轨道电路故障诊断的方法所存在的问题和缺点,提出了一种多头cnn-rnn的轨道电路故障检测方法,采用轨道电路移动窗口的方法处理轨道电路多类型数据,根据多头cnn独立处理不同位置的特征数据,随后采用rnn提取的特征来确定轨道电路运行期间是否发生异常。
[0059]
为实现以上目的,本发明通过以下技术方案予以实现:
[0060]
一种基于多头cnn-rnn的轨道电路故障检测方法,其特征在于包括如下步骤:
[0061]
步骤1.1:收集zpw-2000a系列轨道电路系统中由11个电流电压传感器进行检测,从而获取11个单变量的时间序列,其值具有不同的尺度。
[0062]
步骤1.2:对收集到的轨道电路不同位置的信号进行独立处理,采用多头cnn实现对不同类型数据的处理。
[0063]
步骤1.3:采用rnn检测窗口提取的特征中找到隐藏的时间模式,按时间顺序处理与每个窗口对应的所有提取特征
[0064]
步骤1.4:对窗口处理结果进行分类,根据所有检测设备在特定事件中表现出的时间行为给出最终结果,如图2所示。
[0065]
在步骤1.2中,多头cnn使用具有单个通道的多个一维卷积,相比多通道cnn处理多个时间序列时,将获得包含所有时间序列主要特征的单个特征图,每个通道使用不同的过
滤器集,多头cnn能更好地保存不同位置之间的数据特性,同时保留数据之间的联系,如图3所示。
[0066]
在步骤1.3中,时间序列以基于窗口的方式进行处理。为了将时间序列划分为更小的段,所有时间序列都被划分为相同数量的段。窗口的数量按式(1)计算。
[0067][0068]
其中,s
l
表示时间序列中的序列长度或数据点的数量,w
l
表示窗口长度,ws表示窗口步长,即在时间序列上滑动窗口所需的步长有多大。当ws<w
l
时,则表示窗口相互重叠。当ws=w
l
时,则表示窗口之间没有重叠。
[0069]
每个卷积头逐窗口处理其对应的时间序列。因此,每个窗口和传感器数据都会得到一个特征图其中,n为去记录检测位置,w为记录窗口编号。在所有窗口上应用卷积后,获得每个时间序列的特征图序列,其中每个特征图在序列中按时间顺序排序。由于这些序列彼此独立,因此它们被连接在一起。通过这种方式,将所有时间序列的特征映射串联起来,得到一系列特征映射。
[0070]
多头cnn的输入数据,每个旋转头需要一个四维输入,由公式(2)给出:
[0071][0072]
其中,n_samples表示样本数量,n_channels表示通道数量,在轨道电路中,均是时间序列,因此n_channels=1。
[0073]
在步骤1.3中,rnn的输入是由多头cnn的最后一层产生的三维矢量。输入大小由公式(3)给出。
[0074]
input_rnn=(n_samples,wn,p
pl
)(3)
[0075]
每个窗口的特征图是由每个检测器产生的特征图的串联形成的。rnn按时间顺序处理提取的特征图,从f1到fw,rnn处理的每个窗口以将与当前窗口对应的相关信息存储在其内部存储器中。
[0076]
根据整个窗口发生的情况做出决定。rnn并不是针对每个窗口做出决策,而是将所有窗口对应的信息作为一个整体进行处理,从而对整个事件进行分类。
[0077]
对于不平衡数据集上的二元分类进行评估时,选用平均精度(averageprecision,ap)用于获得可以与分类器进行比较的特定值。在每个阈值处实现的精度的加权平均值,将前一个阈值的召回率增加用作权重,计算方法如式(4)所示。
[0078][0079]
其中,pn和rn分别是第n个阈值处的精度和召回率。
[0080]
在数据不平衡的情况下,几何平均数是另一个广泛使用的指标。它是精确性和召回率之间的几何平均值。其计算方法如式(5)所示。
[0081][0082]
这些指标是根据混淆矩阵计算出来的,混淆矩阵显示了类别对之间的交叉正确预
测和错误预测,表示系统所采取的真阳性(tp)、假阳性(fp)、真阴性(tn)和假阴性(fn)。
[0083]
与现有的技术相比,具备以下明显的优势和有益效果:
[0084]
(1)在对轨道电路不同位置的数据处理中,采用多头cnn对数据进行独立处理,保证轨道电路不同位置数据的特征。
[0085]
(2)通过滑动窗口处理时间序列,而不是一次处理整个序列,从而保证每个阶段的关键特征均能被捕获。
[0086]
(3)本发明对比多头和多通道数据处理模式以及窗口大小对实验的影响,所提出的多头cnn架构在测试场景中都优于传统的多通道cnn。
[0087]
实施例三
[0088]
本发明提出了一种多头cnn-rnn的轨道电路故障检测方法,步骤如下:
[0089]
步骤1:收集zpw-2000a系列轨道电路系统中由11个电流电压传感器进行检测,从而获取11个单变量的时间序列,其值具有不同的尺度,如表1所示。
[0090][0091][0092]
表1zpw-2000a轨道电路特征信号
[0093]
步骤1.1:数据集中大约有1400个实例对应于两种类型的类:“正常”为负,“异常”为正。数据集包含20%的正实例,为测试不同体系结构在不同不平衡比率下的行为,在原始数据集的基础上生成了四个不同的数据集。这些新数据集分别包含15%、10%、5%和3%的异常。每个数据集的异常选择是随机进行的。
[0094]
步骤1.2:在模型结构训练方面,所有数据集都分为训练、验证、测试集,比例为6:2:2。所考虑的数据集使用划分函数(stratified shuffle split,sss)交叉验证程序进行分区,该验证程序将数据集拆分为训练集、测试集,并重新转换分层随机折叠。由于sss仅将数据集拆分为两个集合,因此我们首先将数据集以6:4的比率划分为训练、测试。然后,将测试集划分为两个大小相等的集,以生成验证集。
[0095]
步骤2:利用多头cnn-rnn的轨道电路故障检测方法,进一步验证模型的性能。对于不平衡数据集上的二元分类进行评估时,选用平均精度(average precision,ap)用于获得
可以与分类器进行比较的特定值。在每个阈值处实现的精度的加权平均值,将前一个阈值的召回率增加用作权重,计算方法如式(1)所示。
[0096][0097]
其中,pn和rn分别是第n个阈值处的精度和召回率。
[0098]
在数据不平衡的情况下,几何平均数是另一个广泛使用的指标。它是精确性和召回率之间的几何平均值。其计算方法如式(2)所示。
[0099][0100]
这些指标是根据混淆矩阵计算出来的,混淆矩阵显示了类别对之间的交叉正确预测和错误预测,表示系统所采取的真阳性(tp)、假阳性(fp)、真阴性(tn)和假阴性(fn)。
[0101]
步骤3:分类器设置,为体验模型的先进性能,设置2组对比试验,分别针对多头和多通道检测、窗口长度影响进行对比分析。
[0102]
步骤3.1:根据轨道电路采集数据的特征是如何独立或作为一组提取的,来分析整个体系结构的性能。在实验中,我们分析conv1d层作为卷积层。多头和多通道之间的主要区别之一是从每个窗口提取的特征数量。
[0103][0104]
表2轨道电路多头和多通道架构每个窗口提取的特征数
[0105]
在表2中,显示了从每个窗口中提取的特征总数,即输出向量的最后一个维度。对于多头卷积,最后一层中每个窗口提取的特征数要高得多,随着传感器的数量线性增加。使用原始数据集和作为多头和多通道conv1d模型的评估指标,指标附有相应的标准偏差,具体如表3所示。
[0106][0107][0108]
表3多头和多通道conv1d模型评价指标
[0109]
在g_mean方面,多头和多通道架构之间存在显著差异。考虑到两种体系结构使用的功能数量,与多通道体系结构相比,多头体系结构获得更好结果的主要原因是前者有更多信息可供决策。因此,对多通道结构进行了匹配,提取的特征数量与多头结构相同。为此,
我们设置fn=400。获得的结果表明,所有卷积层的改善最多为2%。此外,训练时间因此增加了15分钟。其原因是独立地进行提取每个传感器的特征,而不是提取了更多的特征。
[0110]
步骤3.2:窗口长度是需要考虑的参数之一。在实验中,我们分析了随着轨道电路移动窗口长度的变化,模型的网络大小、训练时间和性能发生变化。窗口长度的使用值范围如下:w
l
={25,50,80,100,125,160,200}。轨道电路的窗口长度大小由网络大小和所需训练时间之间的相关性决定的。如图4所示,显示了网络的大小如何随着窗口长度的增加而增加。然而,如图5所示,尽管窗口长度变大,但所需的训练时间会随着窗口长度的增加而减少。这是由于窗口数量w
l
与在每个窗口上应用卷积产生的特征图大小之间的相关性。w
l
越小,特征图的尺寸越小,因此网络尺寸越小。然而,wn增加。相比之下,wn越大,特征图的大小就越大,因此网络规模也越大。然而,wn减小。因此,训练模型所需的时间由划分时间序列的窗口数量给出,而与网络大小无关。可以观察到,包含rnn层的架构具有最少的参数数量。但是,它是收敛速度最慢的架构。
[0111]
如图6所示,除rnn外,无论窗口长度如何,模型的性能都保持稳定。当w
l
=125时,rnn最多可提高4%。总的来说,在轨道电路的检测中,除了网络的大小和训练所需的时间之外,窗口长度的重要性并不突出。实验结果表明,多头cnn-lstm的轨道电路故障诊断能够以有效的方式检测多时间序列上的异常,即使训练数据集中的异常百分比降低到3%。通过统计测试证明,由于独立处理每个传感器数据,所提出的多头cnn架构在测试场景中都优于传统的多通道cnn。
[0112]
为了更好地理解本发明,以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献