一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种多因子预测车辆通过ETC概率的方法与流程

2022-02-22 05:08:49 来源:中国专利 TAG:

一种多因子预测车辆通过etc概率的方法
技术领域
1.本发明涉及车辆行驶领域,具体涉及一种预测车辆通过etc概率的方法。


背景技术:

2.目前对于车辆经过etc(电子不停车收费系统)的数据信息的获取方式,一般采取事后、人工的方式,而包括路段、费用等信息,则是事后定期从路网运营公司或银行获取,然后再进行匹配和结算。
3.这种传统的etc数据的获取和处理方式,一方面数据的获取有较长的滞后性,一方面人工匹配、核算需投入大量的人力,成本较高。
4.本发明提出一种多因子预测车辆通过etc概率的方法,将历史实际发生的etc数据,输入到模型进行训练。根据全量的历史数据,得出在不同种因子组合的情况下,车辆经过etc的概率情况;在新的订单数据产生后,将全部的已知因子数据输入到模型。得出该订单在不同因子组合下,车辆经过etc的概率。最后对各组因子的决策结果进行投票,得出最终通过etc的概率。
5.因为因子数据实时可知,所以对结果的预测也实时可得。解决了传统方案中,滞后性的问题;在得到实际的数据以后,再进行预测值和实际值的比对,保证数据的最终一致并且实际值获取后,会再次进入模型,成为运算的历史数据,进一步加强模型的预测能力。


技术实现要素:

6.目前传统的etc数据的获取和处理方式,有较长的滞后性,且人工匹配、核算需投入大量的人力,成本较高。为解决上述问题本发明提出一种多因子预测车辆通过etc概率的方法,可以根据历史数据和模型算法,预测实时的etc数据,极大降低数据匹配、核对处理的成本;本发明通过对预测结果、实际结果的数据对比,可以不断自我学习,强化模型的运算能力;本发明因为具有实时性,可在第一时间预测etc概率的费用,进行预收费,提升了客户便捷程度,并节省了结算成本。
7.为实现上述目的,本发明提出一种多因子预测车辆通过etc概率的方法,包括以下步骤:s1、根据历史数据,建立基于m个因子预测车辆通过etc概率的决策树模型;s2、将实时数据输入s1中的决策树模型中进行运算,得到实时数据对应的车辆通过etc的预测结果;s3、将实际结果与s2得到的预测结果进行比对,对所述决策树模型进行调整,加强预测的准确率。
8.其中,所述的s1进一步的包括以下步骤:s11、根据历史数据,计算每个因子通过etc的概率值,从而确定全部m个因子的分裂优先级;s12、从m个因子中,随机抽取m个,m的取值范围为2《m《m;根据s11中确定的分裂优
先级,对该些m个因子建立决策树;s13、重复s12的过程,直至遍历全部因子组合,可产生大量决策树,形成随机森林;s14、统计s13中所有决策树的叶节点在全量历史数据中通过etc的概率,得到决策树模型。
9.其中,所述的s11进一步的包括以下步骤:s111、计算每个因子通过etc的概率值;s112、确定全部因子的分裂优先级。
10.其中,所述的s12进一步的包括以下步骤:s121、根据s11中计算得到的每个因子通过etc的概率值,选取m个因子中分裂优先级最高的因子,作为决策树的根节点进行分裂;s122、对该分裂优先级最高的因子的不同取值建立子节点,产生第二层节点;s123、对第二层节点,依据信息增益选择,选取分裂优先级次高的因子进行分裂;s124、重复上述过程,依次按照分裂优先级由高到低选取分裂因子,直至没有因子可以选择为止。
11.其中,在决策树的建立过程中,如果其分支概率超过判定概率p1,则停止分裂,或直至m个因子均已被分裂为止。
12.其中,所述的s2具体包括以下步骤:s21、当一条新的实时数据产生时,将该条数据的全部因子数据,代入s1得到的决策树模型中,可得到每个决策树中,每个符合条件的叶节点通过etc的概率;s22、所有符合条件的叶节点参与投票,得到预测结果和调整参考概率p2;如果其中一个叶节点显示其通过etc的概率超过判定概率p1,则投票结束,预测结果为车辆可通过etc,p2的取值为对所有概率小于判定概率p1的符合条件的叶节点进行等权平均;如果没有叶节点的概率超过了该判定概率p1,预测结果为车辆不能通过etc,p2的取值为对所有符合条件的叶节点进行等权平均。
13.其中,所述的s3具体为,当实际结果发生后,将实际结果回传至s1所述的决策树模型中,和s2得到的预测结果进行比对:如果比对结果一致,则将该条数据存入源数据库存储,s1所述的决策树模型的预测准确率得到进一步加强;如果比对结果不一致,将实际数据及结果回传至s1所述的决策树模型中,定时将新增的数据参与概率运算,更新决策树模型中相关的单因子的概率值,改变决策树分裂顺序,同时改变各叶节点的结果数据,进行决策树模型刷新。
14.其中,如果在比对结果中发现第m 1个因子,则重新运行建模的s1过程,对模型进行扩展。
15.其中,在模型建立过程中,判定概率p1的取值是固定的;在得到实际结果后,可根据预测准确率对判定概率p1的取值进行调整。
16.其中,如果在实际结果与预测结果比对中发现,预测结果的准确率高于产品要求的准确率,则可逐步降低判定概率p1的值,同时保证该调整后的判定概率p1大于所述调整参考概率p2;如果在实际结果与预测结果比对中发现,预测结果的准确率低于产品要求的准确率,则逐步提高判定概率p1的值。
17.综上所述,本发明将历史实际发生的etc数据,输入到模型进行训练。根据全量的历史数据,得出在不同种因子组合的情况下,车辆经过etc的概率情况。最后对各组因子的决策结果进行投票,得出最终通过etc的概率。因为因子数据实时可知,所以对结果的预测也实时可得。解决了传统方案中,滞后性的问题。在得到实际的数据以后,再进行预测值和实际值的比对,保证数据的最终一致。并且实际值获取后,会再次进入模型,成为运算的历史数据,进一步加强模型的预测能力。
18.本发明可以根据历史数据和模型算法,预测实时的etc数据,极大降低数据匹配、核对处理的成本;本发明通过对预测结果、实际结果的数据对比,可以不断自我学习,强化模型的运算能力。
附图说明
19.图1为本发明一种多因子预测车辆通过etc概率的方法的步骤示意图;图2为实施例中根据5个因子得到的决策树。
具体实施方式
20.以下将结合本发明实施例中的图1~图2,对本发明实施例中的技术方案、构造特征、所达成目的及功效予以详细说明。
21.需要说明的是,附图采用非常简化的形式且均使用非精准的比例,仅用以方便、明晰地辅助说明本发明实施方式的目的,并非用以限定本发明实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容能涵盖的范围内。
22.需要说明的是,在本发明中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括明确列出的要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
23.一种多因子预测车辆通过etc概率的方法,如图1所示,包括以下步骤,s1、根据历史数据,建立多因子预测车辆通过etc概率的决策树模型;s11、计算每个因子通过etc的概率值,从而确定全部因子的分裂优先级;s111、计算每个因子通过etc的概率值;假设共有m个因子,本实施例中m为10,10个因子分别为“etc入口通过速度》5km/h(以下简称入口车速》5km/h)”、“etc出口通过速度》5km/h(以下简称出口车速》5km/h)”、“入口拥堵等级《3”、“出口拥堵等级《3”、“驾驶员驾龄》5年”、“驾驶员性别=男”、“通行时下雨”、“通行时间在白天”、“当天为法定节假日”、“道路类别为国道”,其中拥堵等级为1表示严重拥堵、等级为2表示中度拥堵、等级为3表示轻度拥堵、等级为4表示畅通。
24.根据全部历史数据,逐个计算含有每个因子的数据通过etc的概率。例如,从全部历史数据中,抽取全部含有某因子a的数据,其数量为x条;而这x条数据中,最终实际通过etc的数量为y条,则因子a通过etc的概率为y/x。具体的,假设全部历史数据中,符合“入口
车速》5km/h”的数据有500条,从最终的实际情况看,这500条历史数据中,有480条是通过etc的,那么因子“入口车速》5km/h”出现时,其通过etc的概率为480/500,约为96%。
25.重复上述过程,则可得出每个因子通过该etc的概率值。
26.s112、确定全部因子的分裂优先级;按每个因子的概率值从大到小决定分裂优先级,通过etc的概率值越高,则其分裂优先级越高,即优先分裂概率较大的因子,当存在两个因子的概率值相等时,随机选一优先分裂。
27.s12、从m个因子中,随机抽取m个,m的取值范围为2《m《m;根据s11中确定的分裂优先级,对m个因子建立决策树;实际中可以根据m值的大小和运行后的预测结果进行调整,本实施例中,m取5,m个因子分别为“入口车速》5km/h”、“出口车速》5km/h”、“入口拥堵等级《3”、“出口拥堵等级《3”、“驾驶员驾龄》5年”。
28.s121、根据s11中计算得到的每个因子通过etc的概率值,选取s12所述5个因子中概率值最高的因子,即信息增益最大的因子,作为决策树的根节点进行分裂,本实施例中5个因子中分裂优先级最高的为“入口车速》5km/h”;s122、对该分裂优先级最高的因子的不同取值建立子节点,产生第二层节点,在本实施例中,不同取值为符合入口车速》5km/h和不符合入口车速》5km/h;s123、对第二层节点,依据信息增益选择,选取分裂优先级次高的因子进行分裂;本实施例中,即选取“出口车速》5km/h”作为再次分裂的因子;s124、重复上述过程,依次按照分裂优先级由高到低选取分裂因子,直至没有因子可以选择为止;本实施例中,接下来依次选择“入口拥堵等级《3”、“出口拥堵等级《3”、“驾驶员驾龄》5年”作为分裂因子。
29.上述s12过程中,假如不做任何剪枝,m个因子可以形成共有m层的决策树,共发生2
m-1分裂,形成2
m-1
个结果。其中不做任何剪枝指的是依次对各级因子建立子节点,不对各个分支进行省略;对各级因子的不同取值建立的子节点的概率为分支概率。
30.在决策树的建立过程中,如果其分支概率超过判定概率p1,则停止分裂,或直至m个因子均已被分裂为止;本实施例中所述判定概率p1取95%,根据本实施例中选取的5个因子得到的决策树如图2所示。
31.s13、重复s12的过程,直至遍历全部因子组合,可产生大量决策树,形成随机森林;全部因子组合,指的是在全部m个属性中,随机抽取m个属性,一共有多少种组合可能:根据组合数公式,可计算得出全部可能的因子组合数量,即在后续步骤中,会生成多少棵决策树。
32.例如,如果全部有4个因子,从其中随机抽取3个因子形成组合,则有4种组合可能,最终形成4棵决策树;本实施例中m取10,m取5,则最终形成252棵决策树。
33.s14、统计s13中所有决策树的叶节点在全量历史数据中通过etc的概率,得到决策树模型;如图2所示的决策树中,每个分叉的终点为叶节点,每个叶节点代表某些因子组合下车辆通过etc的概率,该概率通过历史数据进行统计计算得到:在全量历史数据中,统计符合“入口车速》5km/h”条件的车辆通过etc的概率为96%,该概率大于设定的判定概率p1,
则停止分裂,得到一叶节点;统计不符合“入口车速》5km/h”但符合“出口车速》5km/h”条件的车辆通过etc的概率为96%,该概率大于设定的判定概率p1,则停止分裂,得到一叶节点;统计不符合“入口车速》5km/h”、不符合“出口车速》5km/h”、符合“入口拥堵《3”的车辆,通过etc的概率小于设定的判定概率p1,则继续分裂;依次类推,得到各个叶节点。
34.图2决策树中该些叶节点代表的意义分别为:叶节点a表示“条件入口车速》5km/h满足时,车辆通过etc的概率为96%”;叶节点b表示“当条件入口车速》5km/h不满足、条件出口车速》5km/h满足时,车辆通过etc的概率为96%”;叶节点c表示“当条件入口车速》5km/h和出口车速》5km/h不满足、入口拥堵《3满足、出口拥堵《3满足、驾龄》5年满足时,车辆通过etc的概率为90%”;叶节点d表示“当条件入口车速》5km/h和出口车速》5km/h不满足、入口拥堵《3满足、出口拥堵《3满足、驾龄》5年不满足时,车辆通过etc的概率为85%”;叶节点e表示“当条件入口车速》5km/h和出口车速》5km/h不满足、入口拥堵《3满足、出口拥堵《3不满足、驾龄》5年满足时,车辆通过etc的概率为85%”;叶节点f表示“当条件入口车速》5km/h和出口车速》5km/h不满足、入口拥堵《3满足、出口拥堵《3不满足、驾龄》5年不满足时,车辆通过etc的概率为80%”;叶节点g表示“当条件入口车速》5km/h和出口车速》5km/h不满足、入口拥堵《3不满足、出口拥堵《3满足、驾龄》5年满足时,车辆通过etc的概率为90%”;叶节点h表示“当条件入口车速》5km/h和出口车速》5km/h不满足、入口拥堵《3不满足、出口拥堵《3满足、驾龄》5年不满足时,车辆通过etc的概率为85%”;叶节点i表示“当条件入口车速》5km/h和出口车速》5km/h不满足、入口拥堵《3不满足、出口拥堵《3不满足、驾龄》5年满足时,车辆通过etc的概率为85%”;叶节点j表示“当条件入口车速》5km/h和出口车速》5km/h不满足、入口拥堵《3不满足、出口拥堵《3不满足、驾龄》5年不满足时,车辆通过etc的概率为80%”。
35.重复上述过程,可得到所有决策树的所有叶节点。
36.s2、将实时数据输入s1中的决策树模型中进行运算,得到实时数据对应的车辆通过etc的预测结果;s21、当一条新的实时数据产生时,将该条数据的全部因子数据,代入s1得到的决策树模型中,可得到每个决策树中,每个符合条件的叶节点通过etc的概率,即得出该条实时数据在不同因子组合下,车辆通过etc的概率。
37.其中,符合条件的叶节点指的是该叶节点的所有因子均在该条数据的因子数据内;例如,一条新的实时数据中的因子包括:不满足入口车速》5km/h、不满足出口车速》5km/h、满足入口拥堵《3、满足出口拥堵《3、满足驾龄》5年、满足驾驶员性别=男、不满足通行时下雨、满足通行时间在白天、满足当天为法定节假日、满足道路类别为国道,在图2显示的决策树中,符合条件的叶节点为c,概率为90%。
38.s22、所有符合条件的叶节点参与投票,得到预测结果与调整参考概率p2:如果其中一个叶节点显示其通过etc的概率超过判定概率p1,则投票结束,此时预测结果为车辆可通过etc,p2的取值为对所有概率小于判定概率p1的符合条件的叶节点进行等权平均;如果没有叶节点的概率超过了该设定的判定概率p1,此时的预测结果为车辆不能通过etc,p2的
取值为对所有符合条件的叶节点进行等权平均。
39.本实施例中p1取值为95%,即若其中一个叶节点显示其通过etc的概率超过95%时,则预测结果为车辆可以通过etc;若所有符合条件的叶节点的概率都小于95%时,则预测结果为车辆不能通过etc。
40.s3、将实际结果与s2得到的预测结果进行比对,对模型进行调整,加强预测的准确率;当实际结果发生后(实际结果为该条新的实时数据对应的车辆能否通过etc的事实结果),将实际结果回传至s1所述的决策树模型中,和s2得到的预测结果进行比对:如果比对结果一致,则将该条数据存入源数据库存储,s1所述的决策树模型的预测准确率得到进一步加强。
41.如果比对结果不一致,则推送到业务系统,发出纠错通知。当实际结果发生后,将实际数据及结果回传至s1所述的决策树模型中,定时将新增的数据参与进概率计算,更新决策树模型中相关的单因子的概率值,改变决策树分裂顺序,同时改变各叶节点的结果数据,进行决策树模型刷新。
42.上述过程中,如果实际结果与预测结果的比对结果一致,则相关因子的概率值将得到提升,模型的预测倾向得到进一步加强。反之,相关单因子的概率值降低,模型中相关因子的分裂优先级、叶节点的结果数据同时变化,模型当前的预测倾向会降低,转而朝其他方向进化。
43.如果发现第m 1个因子,则重新运行建模的s1过程,对模型进行扩展。因为新增因子不会影响已经产生的决策树,所以整体的预测结果可以比较稳定的保持。
44.在本发明中,判定概率p1的取值是固定的,但在实际结果发生后,可对该判定概率p1进行调整,使预测结果的准确率更高:如果在实际结果与预测结果比对中发现,预测结果的准确率极高(高于产品要求的准确率),则可逐步降低判定概率p1的值,同时保证该调整后的判定概率p1大于所述调整参考概率p2;同样的,如果在实际结果与预测结果比对中发现,预测结果的准确率低于产品要求的准确率,则逐步提高判定概率p1的值。
45.尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献