一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种数据驱动的货物列车运行预测方法及系统与流程

2022-02-20 13:07:25 来源:中国专利 TAG:


1.本发明涉及轨道运输系统,具体而言涉及一种数据驱动的货物列车运行预测方法及系统。


背景技术:

2.铁路系统运行环境复杂。尤其货运列车,其运输距离长、车次间距小、运输频率高,在运行过程中,不可避免地会受到外界环境、内部系统机械故障以及组织管理等各方面因素的影响而遭遇各种各样的突发状况,导致列车的实际到达时间(实际出发时间)与计划到达时间(计划出发时间)出现偏差。严重的晚点可能会在线路、局部网大面积传播,影响列车运行计划的正常执行,降低运输服务质量。
3.为及时响应列车运输网络上的突发异常,尽可能准确地响应突发异常,妥善安排列车运输网络中的其他受影响车辆,需要对列车运行情况进行评估。
4.现有技术中,国内外既有列车晚点研究多使用传统数学模型驱动的方法或使用仿真手段解决相关问题。然而,使用这些方法建立相关模型时,需要对晚点致因、晚点分布、晚点传播机理、晚点恢复过程等参数具有精确的描述与认识。实际运输过程中,列车运输异常的致因、传播状况及恢复情况通常无法在现场获得准确结论,因此,现有对列车运行状况的评估都是基于一定的假设和前提条件进行的。现有技术中所提供的评估模型和算法具有特定的使用范围要求,因而,在不清楚异常原因的情况下,现有评估模式并不能够准确预测异常状况对运输网络的影响,不能满足实际运输生产过程中的调度需求。


技术实现要素:

5.本发明针对现有技术的不足,提供一种数据驱动的货物列车运行预测方法及系统,本发明通过对突发异常的发生时刻、车次、类型、位置进行采集和预测评估,能够及时准确地获知对应道岔的故障影响状况,从而为调度调整列车运输网络中其他车辆提供数据基础。本发明具体采用如下技术方案。
6.首先,为实现上述目的,提出一种数据驱动的货物列车运行预测方法,其先通过以下第一步至第四步完成对多回归集成学习模型的训练,然后向训练好的多回归集成学习模型中输入货物列车运输网络中实际采集到的突发事件数据,获得对应道岔的故障影响状况的预测值:第一步,采集货物列车运输网络中各类突发事件的基础数据,整理获得分别对应各突发事件的影响状况数据,建立货物列车运输数据集;第二步,对货物列车运输数据集中的各数据进行数据清理,剔除数据集中的异常量和空值,对清理后的数据集进行特征变量提取,对提取所获得的分别对应不同类型突发事件的特征变量按其类别进行one-hot编码和归一化处理,获得标准数据集;第三步,将所述标准数据集分割为训练数据集和测试数据集,构建多回归集成学习模型,使用其中的训练数据集分别对多回归集成学习模型中的各回归模型进行单独训练,直至每一个回归模型分别获得与测试数据集中突发事件的影响状况数据对应一致的预测值;第四步,对第三步中训练所获得的各回归模型进行权重设置,获
得训练好的多回归集成学习模型。
7.可选的,如上任一所述的数据驱动的货物列车运行预测方法,其中,第一步中,所述货物列车运输网络中各类突发事件的基础数据包括:突发事件的发生时刻、车次、事件类型、事件发生线路、事件发生位置、列车限速等级;对应各突发事件的影响状况数据包括:事件持续时间、影响区间数目、影响车站数目、列车晚点时间、晚点列车数量、停运列车数量。
8.可选的,如上任一所述的数据驱动的货物列车运行预测方法,其中,第二步中,所述特征变量中包含有分别对应:事件类型、事件发生线路、列车限速等级和车次数量的数据;第二步中,对特征变量提取所获得的分别对应不同类型突发事件的特征变量按其类别进行one-hot编码和归一化处理,获得标准数据集的具体步骤包括:对事件类型、车次、事件发生线路、事件发生位置所对应的数据进行one-hot编码;对突发事件的发生时刻的数据进行数值映射;对列车限速等级和车次数量所对应的数据,按照其最大值和最小值的范围进行归一化处理。
9.可选的,如上任一所述的数据驱动的货物列车运行预测方法,其中,第三步中,多回归集成学习模型中的各回归模型至少包括:岭回归模型、lasso回归模型、弹性回归模型。
10.可选的,如上任一所述的数据驱动的货物列车运行预测方法,其中,所述岭回归模型采用极小化残差平方和作为目标其中,θ表示正则化参数,β表示回归参数,y表示货物列车运行时间的实际值,x表示特征变量,p表示样本个数。
11.可选的,如上任一所述的数据驱动的货物列车运行预测方法,其中,所述lasso回归模型在目标函数中采用绝对值作为惩罚项,该惩罚项其中,θ表示正则化参数,β表示回归参数,y表示货物列车运行时间的实际值,x表示特征变量,p表示样本个数。
12.可选的,如上任一所述的数据驱动的货物列车运行预测方法,其中,所述弹性回归模型在目标函数中通过折中,采用混合比的形式进行控制正则化参数,其目标函数其中,α表示第一类惩罚函数占的比例,β表示回归参数,y表示货物列车运行时间的实际值,x表示特征变量,p表示样本个数。
13.同时,为实现上述目的,本发明还提供一种数据驱动的货物列车运行预测系统,其包括:数据采集单元,用于采集货物列车运输网络中各类突发事件的基础数据,获取分别对应各突发事件的影响状况数据;数据集预处理单元,用于根据数据采集单元采集获得的基础数据和影响状况数据建立货物列车运输数据集;特征变量提取单元,用于对货物列车运输数据集中的各数据进行数据清理,剔除数据集中的异常量和空值,对清理后的数据集进行特征变量提取,对提取所获得的分别对应不同类型突发事件的特征变量按其类别进行one-hot编码和归一化处理,获得标准数据集;多回归集成学习模型,其使用从标准数据集
分离出的一部分数据作为训练数据集对多回归集成学习模型中的各回归模型进行单独训练,直至每一个回归模型分别获得与标准数据集中剩余的数据所对应的突发事件的影响状况对应一致的预测值,然后对训练所获得的各回归模型进行权重设置,获得训练好的多回归集成学习模型;所述多回归集成学习模型还用于接收货物列车运输网络中实际采集到的突发事件数据,根据训练好的所述多回归集成学习模型计算获得对应道岔的故障影响状况的预测值。
14.可选的,如上任一所述的数据驱动的货物列车运行预测系统,其中,所述数据采集单元设置有数据接口,用于接收以下各类数据:突发事件的发生时刻、车次、事件类型、事件发生线路、事件发生位置、列车限速等级。
15.可选的,如上任一所述的数据驱动的货物列车运行预测系统,其中,所述特征变量提取单元,还包括:ne-hot编码模块,用于对事件类型、车次、事件发生线路、事件发生位置所对应的数据进行one-hot编码;数值映射模块,用于对突发事件的发生时刻的数据进行数值映射;归一化处理模块,用于对列车限速等级和车次数量所对应的数据,按照其最大值和最小值的范围进行归一化处理。
16.有益效果
17.本发明分别对岭回归模型、lasso回归模型、弹性回归模型进行训练然后对各模型分别设置相应的权重,利用加权后的各个回归模型,构建出一个能够弥补单一模型输出偏差,且能够直接通过权重系数的设置直接拟合货物列车运输网络中各类突发事件的多回归集成学习模型。由此,本技术通过该模型计算所获得的对应道岔的故障影响状况的预测值能够在不清楚突发事件原因、机制的情况下,保证模型输出的准确性和及时性。本技术能够更为准确的预测异常状况对运输网络的影响,满足运输生产过程中的调度需求。
18.进一步,为配合上述模型综合对货物列车运输网络中各类突发事件的基础数据进行响应,方便调度中心根据模型输出的对应道岔的故障影响状况的预测值进行相应调度,本技术将事件类型、车次、事件发生线路、事件发生位置所对应的数据进行one-hot编码,将突发事件的发生时刻的数据进行数值映射,将列车限速等级和车次数量所对应的数据,按照其最大值和最小值的范围进行归一化处理从而获得能够综合表征事件类型、事件发生线路、列车限速等级和车次数量的数据的特征变量。由此,本技术能够通过对模型的训练,综合上述各特征变量,准确获得对应突发事件的事件持续时间、影响区间数目、影响车站数目、列车晚点时间、晚点列车数量、停运列车数量的影响状况数据。由此,调度中心能够直接根据上述数据及时调整货物列车运输网络中其他列车的运行,避免突发事件所导致的晚点异常在线路、局部网大面积传播,影响列车运行计划的正常执行,降低运输服务质量。
19.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
附图说明
20.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,并与本发明的实施例一起,用于解释本发明,并不构成对本发明的限制。在附图中:
21.图1是本发明的数据驱动的货物列车运行预测方法的流程示意图;
22.图2是本发明中对多回归集成学习模型进行训练的步骤流程图。
具体实施方式
23.为使本发明实施例的目的和技术方案更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
24.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
25.图1为根据本发明的一种数据驱动的货物列车运行预测方法,其先通过图2所示的流程步骤,根据货物列车运输网络中各类突发事件的基础数据完成对多回归集成学习模型的构建和训练,然后通过向训练好的多回归集成学习模型中输入货物列车运输网络中实际采集到的突发事件数据,获得对应道岔的故障影响状况的预测值。
26.具体参考图2,上述对多回归集成学习模型的训练具体包括以下步骤:
27.第一步,采集货物列车运输网络中各类突发事件的基础数据,如,突发事件的发生时刻、车次、事件类型、事件发生线路、事件发生位置、列车限速等级,同时,对分别对应各突发事件的影响状况数据,如,事件持续时间、影响区间数目、影响车站数目、列车晚点时间、晚点列车数量、停运列车数量等,进行整理,将基础数据与影响状况数据一一对应进行存储,建立货物列车运输数据集;
28.第二步,对货物列车运输数据集中的各数据进行数据清理,剔除数据集中的异常量和空值,对清理后的数据集进行特征变量提取。其中,为准确表征货物列车运输网络中各类突发事件,所述的特征变量中包含有分别对应:事件类型、事件发生线路、列车限速等级和车次数量的数据。然后,对提取所获得的分别对应不同类型突发事件的特征变量按其类别进行one-hot编码和归一化处理,获得标准数据集;
29.第三步,将所述标准数据集分割为训练数据集和测试数据集,构建包含有岭回归模型、lasso回归模型、弹性回归模型的一个多回归集成学习模型,使用其中的训练数据集分别对多回归集成学习模型中的各回归模型进行单独训练,直至每一个回归模型分别获得与测试数据集中突发事件的影响状况数据对应一致的预测值,以完成对各回归模型的独立训练,获得能够分别表征不同货物列车运输网络中各类突发事件的影响状况的三组模型;
30.第四步,对第三步中训练所获得的三组回归模型进行权重设置,可根据突发事件发生概率大小,相应将能够更为准确预测概率较高的突发事件的模型置为具有更大权重,设置将能够更为准确预测概率较小的突发事件的模型具有更小权重;或者,也可以按照模型的准确度,按照与模型匹配的突发事件所对应的特征变量设置权重;或者根据其他先验规律或经验值相应设置各回归模型的权重,输出对应权重的多回归集成学习模型。由此输出的多回归集成学习模型能够准确匹配不同类型的突发事件,以对其进行准确评估。
31.在一些实现方式下,上述的第二步中,对特征变量提取所获得的分别对应不同类型突发事件的特征变量按其类别进行one-hot编码和归一化处理,获得标准数据集的具体步骤可根据特征变量数据的不同含义,而相应设置为:
32.对事件类型、车次、事件发生线路、事件发生位置所对应的数据进行one-hot编码;
33.对突发事件的发生时刻的数据进行数值映射;
34.对列车限速等级和车次数量所对应的数据,按照其最大值和最小值的范围进行归一化处理。
35.由此建立的标准数据集,能够在各类型的回归模型之间实现数据的共用,不会因为各模型输入数据的转换偏差而影响各模型的计算准确度。
36.其中,上述多回归集成学习模型中所采用的岭回归模型,可具体选择通过极小化残差平方和作为目标其中,θ表示正则化参数,β表示回归参数,y表示货物列车运行时间的实际值,x表示特征变量,p表示样本个数。
37.上述多回归集成学习模型中所采用的lasso回归模型,可具体选择通过在目标函数中采用绝对值作为惩罚项,该惩罚项其中,θ表示正则化参数,β表示回归参数,y表示货物列车运行时间的实际值,x表示特征变量,p表示样本个数。
38.上述多回归集成学习模型中所采用的弹性回归模型,可具体选择在目标函数中通过折中方式,采用混合比的形式进行控制正则化参数,其目标函数其中,α表示第一类惩罚函数占的比例,β表示回归参数,y表示货物列车运行时间的实际值,x表示特征变量,p表示样本个数。
39.由此,本发明能够通过模型计算出对应道岔各种故障影响状况的预测值,从而能够在不清楚突发事件原因、突发事件发生机制的情况下,通过对先验模型的训练,保证其能够准确及时输出预测结果。本技术能够根据模型的预测结果,更为准确的评估突发事件所导致的异常状况对运输网络的影响,以及时进行调度调整跟,保证运输生产平稳定有序进行。
40.以上仅为本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些均属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献