一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据预测方法、装置、物流货量预测方法、介质和设备与流程

2021-12-15 01:11:00 来源:中国专利 TAG:


1.本公开涉及计算机技术领域,更具体地,涉及一种数据预测方法、数据预测装置、物流货量预测方法、物流货量预测装置、计算机存储介质和电子设备。


背景技术:

2.随着计算机技术的发展,机器学习的应用领域也越来越广泛,很多应用场景下需要根据历史数据的发展规律预测未来数据,例如金融市场行情预测、零售行业的需求预测或者为了物流行业的健康持续发展,避免物流服务质量降低以及物流服务速率的降低,准确预测物流货量也显得尤为重要。
3.相关技术中,模型预测过程忽略了预测数据的周期性、趋势性特点,采用单一预存模型进行预测,影响整体数据的预测精准度,导致模型预测结果与真实数据存在较大偏差,并且在相关技术中,将产生的随机误差直接作为入参输入至预测模型进行预测拟合,而因误差项的直接引入降低模型的预测准确率。
4.需要说明的是,在上述背景技术部分发明的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:

5.本公开的目的在于提供一种基于时间序列的数据预测方法及装置、基于时间序列的物流货量预测方法及装置、计算机存储介质和电子设备,进而至少在一定程度上提高具有周期性、趋势性数据的预测准确性。
6.本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
7.根据本公开的一个方面,提供一种基于时间序列的数据预测方法,包括:获取历史时间序列数据,对所述历史时间序列数据进行时间序列分解,得到趋势序列数据、周期序列数据和误差序列数据;对所述误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定所述误差序列数据对应的第一预测结果;采用所述趋势序列数据和周期序列数据对应的预测模型,分别对所述趋势序列数据和周期序列数据进行拟合预测,得到第二预测结果和第三预测结果;将所述第一预测结果、第二预测结果和第三预测结果进行融合处理,得到目标预测结果。
8.在本公开的一种示例性实施例中,所述对所述误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定所述误差序列数据对应的第一预测结果,包括:对所述误差序列数据进行时间序列分解,得到子趋势序列数据、子周期序列数据和子随机误差序列数据;丢弃所述子随机误差序列数据;将所述子趋势序列数据和子周期序列数据进行融合处理,得到子融合序列数据;采用所述子融合序列数据对应的预测模型,对所述子融合序列数据进行拟合预测,得到所述第一预测结果。
9.在本公开的一种示例性实施例中,在采用所述子融合序列数据对应的预测模型,
对所述子融合序列数据进行拟合预测,得到所述第一预测结果之前,所述方法还包括:对所述子融合序列数据进行标注化和归一化处理,并根据标准归一化后的子融合序列数据确定训练集数据和测试集数据。
10.在本公开的一种示例性实施例中,所述子融合序列数据对应的预测模型为正弦波序列表征网络与长短期记忆网络复合模型;所述采用所述子融合序列数据对应的预测模型,对所述子融合序列数据进行拟合预测,得到所述第一预测结果,包括:将所述训练集数据输入至正弦波序列表征网络进行样本扩增,并将样本扩增后的训练集数据输入至长短期记忆网络,以对所述正弦波序列表征网络与长短期记忆网络复合模型进行训练;将所述测试集数据输入至训练后的复合模型,得到所述第一预测结果。
11.在本公开的一种示例性实施例中,所述采用所述趋势序列数据和周期序列数据对应的预测模型,分别对所述趋势序列数据和周期序列数据进行拟合预测,得到第二预测结果和第三预测结果,包括:分别根据所述趋势序列数据和所述周期序列数据确定各自对应的训练集数据和测试集数据;将所述趋势序列数据对应的训练集数据输入至对应的第一预测模型,以对所述第一预测模型进行训练,并将所述趋势序列数据对应的测试集数据输入至训练后的第一预测模型,得到所述第二预测结果;将所述周期序列数据对应的训练集数据输入至对应的第二预测模型,以对所述第二预测模型进行训练,并将所述趋势序列数据对应的测试集数据输入至训练后的第二预测模型,得到所述第三预测结果。
12.在本公开的一种示例性实施例中,在根据所述周期序列数据确定对应的训练集数据和测试集数据之前,所述方法还包括:对所述周期序列数据进行标准化和归一化处理。
13.在本公开的一种示例性实施例中,所述第一预测模型为差分整合移动平均自回归模型、指数平滑模型或theta模型中的一种;所述第二预测模型为正弦波序列表征网络与长短期记忆网络复合模型。
14.在本公开的一种示例性实施例中,所述将所述第一预测结果、第二预测结果和第三预测结果进行融合处理,得到目标预测结果,包括:将所述第一预测结果和第三预测结果进行逆标准化和逆归一化处理;将第二预测结果和处理后的所述第一预测结果、第三预测结果相加,得到所述目标预测结果。
15.根据本公开的一个方面,提供一种基于时间序列的物流货量预测方法,包括:获取历史货量时间序列数据,对所述历史货量时间序列数据进行时间序列分解,得到趋势序列数据、周期序列数据和误差序列数据;对所述误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定所述误差序列数据对应的第一预测结果;采用所述趋势序列数据和周期序列数据对应的预测模型,分别对所述趋势序列数据和周期序列数据进行拟合预测,得到第二预测结果和第三预测结果;将所述第一预测结果、第二预测结果和第三预测结果进行融合处理,得到货量的目标预测结果。
16.在本公开的一种示例性实施例中,对所述误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定所述误差序列数据对应的第一预测结果,包括:对所述误差序列数据进行时间序列分解,得到子趋势序列数据、子周期序列数据和子随机误差序列数据;丢弃所述子随机误差序列数据;将所述子趋势序列数据和子周期序列数据进行融合处理,得到子融合序列数据;采用所述子融合序列数据对应的预测模型,对所述子融合序列数据进行拟合预测,得到所述第一预测结果。
17.在本公开的一种示例性实施例中,所述子融合序列数据对应的预测模型为正弦波序列表征网络与长短期记忆网络复合模型;所述采用所述子融合序列数据对应的预测模型,对所述子融合序列数据进行拟合预测,得到所述第一预测结果,包括:将所述训练集数据输入至正弦波序列表征网络进行样本扩增,并将得到的扩增后的训练集数据输入至长短期记忆网络,以对所述正弦波序列表征网络与长短期记忆网络复合模型进训练;将所述测试集数据输入至训练后的复合模型,得到所述第一预测结果。
18.在本公开的一种示例性实施例中,所述将所述第一预测结果、第二预测结果和第三预测结果进行融合处理,得到货量的目标预测结果,包括:将所述第一预测结果、第二预测结果和第三预测结果相加,得到所述货量的目标预测结果。
19.根据本公开的一个方面,提供一种基于时间序列的数据预测装置,所述装置包括:数据获取模块,用于获取历史时间序列数据,对所述历史时间序列数据进行时间序列分解,得到趋势序列数据、周期序列数据和误差序列数据;序列分解模块,用于对所述误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定所述误差序列数据对应的第一预测结果;拟合预测模块,用于采用所述趋势序列数据和周期序列数据对应的预测模型,分别对所述趋势序列数据和周期序列数据进行拟合预测,得到第二预测结果和第三预测结果;融合处理模块,用于将所述第一预测结果、第二预测结果和第三预测结果进行融合处理,得到目标预测结果。
20.根据本公开的一个方面,提供一种基于时间序列的物流货量预测装置,所述装置包括:时间序列数据获取模块,用于获取历史货量时间序列数据,对所述历史货量时间序列数据进行时间序列分解,得到趋势序列数据、周期序列数据和误差序列数据;时间序列分解模块,用于对所述误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定所述误差序列数据对应的第一预测结果;拟合预测模块,用于采用所述趋势序列数据和周期序列数据对应的预测模型,分别对所述趋势序列数据和周期序列数据进行拟合预测,得到第二预测结果和第三预测结果;预测结果确定模块,用于将所述第一预测结果、第二预测结果和第三预测结果进行融合处理,得到货量的目标预测结果。
21.根据本公开的一个方面,提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的基于时间序列的数据预测方法或上述任一项所述的基于时间序列的物流货量预测方法。
22.根据本公开的一个方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的基于时间序列的数据预测方法或上述任一项所述的基于时间序列的物流货量预测方法。
23.本公开的示例性实施例中的基于时间序列的数据预测方法,通过对时间序列数据进行时间序列分解得到趋势序列数据、周期序列数据和误差序列数据,采用不同的预测模型分别对各序列数据进行预测拟合,其中对误差序列数据再次进行时间序列分解,将得到的多个分解子序列进行拟合处理得到第一预测结果,将第一预测结果与趋势序列数据拟合和周期序列数据拟合得到的第二预测结果和第三预测结果进行融合,得到最终的预测结果。一方面,采用时间序列分解法将时间序列数据分解为多个序列数据,并采用不同的预测
模型分别对各个序列数据进行拟合预测,最后将多个拟合预测结果进行融合,组合预测的方法提高预测的准确性;另一方面,对误差序列数据再次进行时间序列分解,并且也分别进行拟合预测及拟合结果的融合,避免直接将误差项引入至预测模型,一定程度上提高了模型预测准确性。
24.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
25.通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
26.图1示出了根据本公开示例性实施例的基于时间序列的数据预测的流程图;
27.图2示出了根据本公开示例性实施例的获取第一预测结果的流程图;
28.图3示出了根据本公开示例性实施例的基于复合模型确定第一预测结果的流程图;
29.图4示出了根据本公开示例性实施例的对趋势序列数据和周期序列数据进行拟合预测的流程图;
30.图5示出了根据本公开示例性实施例的采用arima对趋势序列数据的拟合预测的流程图;
31.图6示出了根据本公开示例性实施例的基于时间序列的物流货量预测方法流程图;
32.图7示出了根据本公开示例性实施例的时间序列的物流货量预测方法中第一预测结果获取的流程图;
33.图8示出了根据本公开示例性实施例的对子融合序列数据进行拟合预测得到第一预测结果的流程图;
34.图9示出了根据本公开示例性实施例的基于时间序列的物流货量预测方法的流程示意图;
35.图10示出了根据本公开示例性实施例的物流货量预测中训练集数据stl分解的结果示意图;
36.图11示出了根据本公开示例性实施例的对误差序列数据r1再次进行stl分解的结果示意图;
37.图12示出了根据本公开示例性实施例的采用正弦波序列表征网络与长短期记忆网络复合模型对子融合序列数据cs2进行拟合预测的结果示意图;
38.图13示出了根据本公开示例性实施例的采用arima模型对趋势序列数据c1进行拟合预测的结果示意图;
39.图14示出了根据本公开示例性实施例的第一预测结果、第二预测结果和第三预测结果进行加和,得到最终的目标预测结果的示意图;
40.图15示出了根据本公开示例性实施例的仅通过lstm模型对周期序列数据s1进行拟合预测和通过复合模型对周期序列数据s1进行拟合预测的结果示意图;
41.图16示出了根据本公开示例性实施例的趋势序列数据的自相关和偏自相关图;
42.图17示出了根据本公开示例性实施例的基于时间序列的数据预测装置结构示意图;
43.图18示出了根据本公开示例性实施例的基于时间序列的物流货量预测装置结构示意图;
44.图19示出了根据本公开示例性实施例的存储介质的示意图;以及
45.图20示出了根据本公开示例性实施例的电子设备的框图。
46.在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
47.现在将参考附图更全面地描述示例性实施方式。然而,示例性实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施例使得本公开将更加全面和完整,并将示例性实施方式的构思全面地传达给本领域的技术人员。图中相同的附图标记表示相同或类似的结构,因而将省略它们的详细描述。
48.此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知结构、方法、装置、实现或者操作以避免模糊本公开的各方面。
49.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个软件硬化的模块中实现这些功能实体或功能实体的一部分,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
50.很多应用领域,比如金融市场行情预测、零售行业的需求预测、物流货量预测等等,在实现流程自动化的过程中,时间序列预测起着非常重要的作用,比如为了保证服务质量,提前对货量进行预存,根据预测结果提前进行准备,又如在某些在线购物网站,未来一段时间内每一类商品的销量是系列决策比如备货、促销等需要考虑的变量,因此预测技术能力会最终对备货、运输调度、销售收入、库存成本等产生重要影响。因此,如何提高数据的预测准确性,对时序预测技术提出更高要求。
51.在本领域相关技术中,针对具有周期性、趋势性特点的预测数据,往往还是采用单一预测模型,导致在预测准确率上表现不佳,时间序列预测模型很好适用于这种应用场景。
52.时间序列,也称动态数列、时间数列或历史复数,是将同一统计指标的数据按其发生的时间先后顺序排列而成的数列。时间序列分析就是通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势,进行类推或延伸,借以预测下一时间点或下一时间段可能达到的水平。根据预测的时间跨度,时间序列方法可以分为短期预测、中期预测和长期预测。根据所采用的资料分析方法不同,又可分别为简单序时平均数法、加权序时平均数法、简单移动平均法、加权移动平均法、指数平滑法等。
53.然而,相关技术中采用时间序列预测模型通常将随机误差直接输入至预测模型进行预测,因误差项的直接引入降低模型的预测准确率。
54.基于此,在本公开示例性实施例中,首先提供了一种基于时间序列的数据预测方法。参考图1所示,该基于时间序列的数据预测方法包括以下步骤:
55.步骤s110:获取历史时间序列数据,对历史时间序列数据进行时间序列分解,得到趋势序列数据、周期序列数据和误差序列数据;
56.步骤s120:对误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定误差序列数据对应的第一预测结果;
57.步骤s130:采用趋势序列数据和周期序列数据对应的预测模型,分别对趋势序列数据和周期序列数据进行拟合预测,得到第二预测结果和第三预测结果;
58.步骤s140:将第一预测结果、第二预测结果和第三预测结果进行融合处理,得到目标预测结果。
59.根据本示例实施例中的基于时间序列的数据预测方法,一方面,采用时间序列分解法将时间序列数据分解为多个序列数据,并采用不同的预测模型分别对各个序列数据进行拟合预测,最后将多个拟合预测结果进行融合,组合预测的方法提高预测的准确性;另一方面,对误差序列数据再次进行时间序列分解,并且也分别进行拟合预测及拟合结果的融合,避免直接将误差项引入至预测模型,一定程度上提高了模型预测准确性。
60.下面对本公开示例性实施例中的基于时间序列的数据预测方法进行进一步的说明。
61.在步骤s110中,获取历史时间序列数据,对所述历史时间序列数据进行时间序列分解,得到趋势序列数据、周期序列数据和误差序列数据。
62.在本公开的示例性实施例中,历史时间序列数据中的时间可以是年份、季度、月份、天或其他任何时间形式,可以根据实际观察预测时间的不同,确定获取历史时间序列数据的粒度。其中,将获得的历史数据按照时间顺序进行排序,并将具体时间作为索引,对应的数据为值,形成历史时间序列数据。stl(seasonal and trend decomposition using loess,时间序列分解)是以鲁棒局部加权回归作为平滑方法的时间序列分解方法,该方法基于随机过程和梳理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。本公开采用stl方法对历史时间序列数据进行时间序列分解,得到趋势序列数据、周期序列数据和误差序列数据。其中,趋势序列数据部分展示数据随时间的变化,周期序列数据反映数据随时间的周期波动,误差序列数据反映趋势序列数据和周期序列数据不能解释的部分;stl分解可以采用任意周期进行分解,可根据实际处理数据类型和应用场景等选择分解周期,本公开对此不做特殊限定。
63.在步骤s120中,对误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定误差序列数据对应的第一预测结果。
64.在本公开的示例性实施例中,为了避免将随机误差直接作为入参输入至至预测模型进行预测,本公开对误差序列数据再次进行时间序列分解,并对得到的多个分解子序列进行拟合预测。
65.具体而言,图2示出了根据本公开示例性实施例的获取第一预测结果的流程图,如图2所示,该过程包括如下步骤:
66.在步骤s210中,对误差序列数据进行时间序列分解,得到子趋势序列数据、子周期序列数据和子随机误差序列数据。
67.在本公开的示例性实施例中,对误差序列数据进行stl分解也可以采用任意周期进行分解,可根据实际处理数据类型和应用场景等选择分解周期;可选的,对误差序列数据进行stl分解的周期与对历史时间序列数据进行stl分解的周期相同,例如均为t=7天;可选的,对误差序列数据进行stl分解的周期与对历史时间序列数据进行stl分解的周期也可以不同,本公开可以根据实际预测需求确定两次stl分解的周期是否相同,本公开对此不做特殊限定。
68.在步骤s220中,丢弃子随机误差序列数据。
69.在本公开的示例性实施例中,随机误差序列数据存在随机性,为了避免将子随机误差输入至预测模型进行预测,本公开将子随机误差序列进行丢弃,不再继续用于模型的拟合预测,从而避免该部分引入模型,降低模型预测准确率。
70.在步骤s230中,将子趋势序列数据和子周期序列数据进行融合处理,得到子融合序列数据。
71.在本公开的示例性实施例中,将子趋势序列数据和周期序列数据中对应时间的数据值求和,得到子融合序列数据。
72.在步骤s240中,采用子融合序列数据对应的预测模型,对子融合序列数据进行拟合预测,得到所述第一预测结果。
73.在本公开的示例性实施例中,为了方便数据处理和模型拟合预测,在采用子融合序列数据对应的预测模型,对子融合序列数据进行拟合预测之前,先对子融合序列数据进行标准化和归一化处理,并根据标准归一化后的子融合序列数据确定训练集数据和测试集数据。
74.数据标准化和归一化处理是将数据按比例缩放,使之落入一个特定区间,将数据转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。数据标准化处理的方法包括但不限于直线型方法(如极值法、标准差法)、折线型方法(如三折线法)、曲线型方法(如半正态性分布),数据归一化处理是对原始数据进行线性变换,使结果落入[0,1]区间,下面对本公开的标准归一化处理过程进行说明。
[0075]
例如,x表示子融合序列数据中的数据,采用如下标准化公式(1):
[0076]
x

i
=(x
i

μ)/σ
ꢀꢀ
(1)
[0077]
其中,μ和σ分别为x的均值和标准差,x1,x2,x3…
x
n
为数据的序列值;
[0078]
标准化后的序列集合为x’,采用如下公式(2)对标准化后的数据进行归一化处理:
[0079]
x

i
=(x

i

min(x

)/(max(x

)

min(x

))
ꢀꢀ
(2)
[0080]
其中,max为标准化后的序列集合x’中的最大值数据,min为标准化后的序列集合x’中的最小值数据。
[0081]
进一步的,根据标准归一化后的子融合序列数据确定训练集数据和测试集数据。在本公开中将标准归一化后的子融合序列数据按照预设比例划分为训练集数据和测试集数据。举例而言,针对2021年4月1日至5月30日的数据,将其中4月1日至5月23日划分为训练集数据,5月24日至5月30日划分为测试集数据。其中,划分比例可根据实际拟合预测情况确定,例如为8:1、9:1,等等,本公开对此不做特殊限定。
[0082]
在本公开的示例性实施例中,子融合序列数据对应的预测模型为正弦波序列表征网络与长短期记忆网络复合模型,图3示出了根据本公开示例性实施例的基于复合模型确
定第一预测结果的流程图,如图3,采用子融合序列数据对应的预测模型,对子融合序列数据进行拟合预测,得到第一预测结果的过程,包括如下步骤:
[0083]
在步骤s310中,将训练集数据输入至正弦波序列表征网络进行样本扩增,并将样本扩增后的训练集数据输入至长短期记忆网络,以对正弦波序列表征网络与长短期记忆网络复合模型进行训练。
[0084]
在本公开的示例性实施例中,将训练集数据集用正弦波序列表征网络表征相当于时间序列的embedding层(嵌入层),本公开所采用的正弦波序列表征网络具体如下公式(3):
[0085][0086]
其中,τ为输入子融合序列数据,参数h
j
,w
j
,经由模型训练学习得到,k为正弦波表征层输出维度,可以根据实际拟合预测情况设定,例如为16、32、64,等等。
[0087]
长短期记忆网络(lstm,long short

term memory)为rnn(recurrent network,循环神经网络)的一种类型,可以学习长期依赖信息,包括输入层、隐藏层和输出层。
[0088]
需要说明的是,在上述模型训练的过程中,将正弦波序列表征网络的输出作为lstm的输入,lstm的输出维度为1,可以通过已观测到的时间点的数据预测下一时间点的数据,即:
[0089]
y
t
=lstm(x
t
‑1,x
t
‑2,x
t
‑3…
x
t

t
)
ꢀꢀ
(4)
[0090]
其中,y
t
为lstm的输出,x
i
为输入至lstm的样本扩增后的训练集数据。
[0091]
在步骤s320中,将测试集数据输入至训练后的复合模型,得到第一预测结果。在本公开的示例性实施例中,通过将测试集数据输入至训练后的复合模型,得到第一预测结果。
[0092]
当时间序列数据观测数量较少时,训练/测试数据集的划分比较困难,训练集数据少则会导致模型难以训练甚至过拟合,验证集数据过少导致模型选择结果不可靠,本公开通过在lstm网络前增加正弦波序列表征网络,进行样本扩增,扩展特征维度,避免了lstm在训练过程中因样本数量不足导致的过拟合现象,提高预测的准确率。
[0093]
在步骤s130中,采用趋势序列数据和周期序列数据对应的预测模型,分别对趋势序列数据和周期序列数据进行拟合预测,得到第二预测结果和第三预测结果。
[0094]
在本公开的示例性实施例中,采用不同的预测模型对趋势序列数据和周期序列数据进行拟合预测,图4示出了根据本公开示例性实施例的对趋势序列数据和周期序列数据进行拟合预测的流程图,如图4所示,该过程包括如下步骤:
[0095]
在步骤s410中,分别根据趋势序列数据和周期序列数据确定各自对应的训练集数据和测试集数据,具体的,将趋势序列数据和周期序列数据按照预设比例划分为训练集数据和测试集数据,划分比例可根据实际拟合预测情况确定,但划分比例需与误差序列数据的划分比例一致。
[0096]
在步骤s420中,将趋势序列数据对应的训练集数据输入至对应的第一预测模型,以对第一预测模型进行训练,并将趋势序列数据对应的测试集数据输入至训练后的第一预测模型,得到第二预测结果;其中,第一预测模型可以为arima(autoregressive integrated moving average model,差分整合移动平均自回归模型)、指数平滑模型(ets模型)、theta模型等,本公开可根据实际拟合预测需要选择对应的预测模型。下面以arima
对趋势序列数据的拟合预测过程为例进行说明,参见图5,包括如下步骤:
[0097]
在步骤s510中,平稳性检验及差分平稳化。
[0098]
使用单位根检验法检验趋势序列数据的平稳性,若检验为平稳序列,则使用arima(p,0,q)为预测模型;若检验结果为非平稳序列,则对趋势序列数据进行差分处理,直至检验为平稳序列后,使用arima(p,d,q)为预测模型。其中,p为自回归模型阶数,q为移动平均模型阶数,d为差分处理次数;单位根检验法包括adf检验、pp检验、np检验、kpss检验、ers检验,本公开对单位根检验法的类型不做特殊限定。
[0099]
在步骤s520中,确定参数p和q。
[0100]
通过步骤s510已确定d值,可选地,可以绘制趋势序列数据的自相关图acf和偏自相关图pacf,通过观察acf和pacf的截尾情况,判断p和q的值;可选地,也可以采用信息准则aic(akaike information criterion,最小信息化准则)来确定,本公开包括但不限于上述参数p和q的确定方法。
[0101]
在步骤s530中,arima(p,d,q)拟合预测。
[0102]
将平稳化处理后的趋势序列数据对应的训练集数据输入至对应的第一预测模型,以对第一预测模型进行训练,并将平稳化处理后趋势序列数据对应的测试集数据输入至训练后的第一预测模型,得到第二预测结果。
[0103]
在步骤s430中,将周期序列数据对应的训练集数据输入至对应的第二预测模型,以对第二预测模型进行训练,并将趋势序列数据对应的测试集数据输入至训练后的第二预测模型,得到第三预测结果。其中,在将周期序列数据对应的训练集数据输入至对应的第二预测模型之前,先对周期序列数据进行标准化和归一化处理,标准归一化处理过程与步骤s240中的标准归一化处理过程相同,在此不再赘述。
[0104]
在本公开的示例性实施例中,第二预测模型为正弦波序列表征网络与长短期记忆网络复合模型,采用正弦波序列表征网络与长短期记忆网络复合模型对周期序列的拟合预测过程与上述步骤s310相同,在此不再赘述。
[0105]
在步骤s140中,将第一预测结果、第二预测结果和第三预测结果进行融合处理,得到目标预测结果。
[0106]
在本公开的示例性实施例中,由于误差序列数据和周期序列数据进行拟合预测时的数据进行过标准化和归一化处理,为了将第一预测结果、第二预测结果和第三预测结果进行融合处理,首先将第一预测结果和第三预测结果进行逆标准化和逆归一化处理,随后将第二预测结果和处理后的第一预测结果、第三预测结果相加,得到目标预测结果。
[0107]
本公开通过对时间序列数据进行时间序列分解得到趋势序列数据、周期序列数据和误差序列数据,采用不同的预测模型分别对各序列数据进行预测拟合,其中对误差序列数据再次进行时间序列分解,将得到的多个分解子序列进行拟合处理得到第一结果数据,将第一预测结果与趋势序列数据拟合预测和周期序列数据拟合得到的第二预测结果和第三预测结果进行融合,得到最终的预测结果。采用时间序列分解法将时间序列数据分解为多个序列数据,并采用不同的预测模型分别对各个序列数据进行拟合预测,最后将多个拟合预测结果进行融合,组合预测的方法提高预测的准确性;另外,对误差序列数据再次进行时间序列分解,并且也分别进行拟合预测及拟合结果的融合,避免直接将误差项引入至预测模型,一定程度上提高了模型预测准确性。
[0108]
在本公开的示例性实施例中,还提供了基于时间序列的物流货量预测方法,图6示出了根据本公开示例性实施例的基于时间序列的物流货量预测方法流程图,如图6所示,该过程包括如下步骤:
[0109]
在步骤s610中,获取历史货量时间序列数据,对历史货量时间序列数据进行时间序列分解,得到趋势序列数据、周期序列数据和误差序列数据;
[0110]
在步骤s620中,对误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定误差序列数据对应的第一预测结果;
[0111]
在步骤s630中,采用趋势序列数据和周期序列数据对应的预测模型,分别对趋势序列数据和周期序列数据进行拟合预测,得到第二预测结果和第三预测结果;
[0112]
在步骤s640中,将第一预测结果、第二预测结果和第三预测结果进行融合处理,得到货量的目标预测结果。
[0113]
在图6示意性示出的示例实施例中,一方面采用时间序列分解法将历史货量时间序列数据分解为多个序列数据,并采用不同的预测模型分别对各个序列数据进行拟合预测,最后将多个拟合预测结果进行融合,有效针对运输货量具有的周期性、趋势性特点,组合预测的方法提高预测的准确性;另外,对误差序列数据再次进行时间序列分解,并且也分别进行拟合预测及拟合结果的融合,避免直接将误差项引入至预测模型,一定程度上提高了模型预测准确性。
[0114]
此处需要进一步说明的是,上述基于时间序列的数据预测方法中涉及的关于对步骤s110

步骤s140的各方法进行限定以及解释的部分,同样适用于步骤s610

步骤s640,为避免冗余内容过多,此处不再赘述。
[0115]
进一步的,参见图7,对误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定误差序列数据对应的第一预测结果的过程包括:步骤s710,对误差序列数据进行时间序列分解,得到子趋势序列数据、子周期序列数据和子随机误差序列数据;步骤s720,丢弃子随机误差序列数据;步骤s730,将子趋势序列数据和子周期序列数据进行融合处理,得到子融合序列数据;步骤s740,采用子融合序列数据对应的预测模型,对所述子融合序列数据进行拟合预测,得到第一预测结果。
[0116]
需要说明的是,上述基于时间序列的数据预测方法中涉及的关于对步骤s210

步骤s240的各方法进行限定以及解释的部分,同样适用于步骤s710

步骤s740,为避免冗余内容过多,此处不再赘述。
[0117]
再进一步的,本公开中子融合序列数据对应的预测模型为正弦波序列表征网络与长短期记忆网络复合模型;参见图8,采用子融合序列数据对应的预测模型,对所述子融合序列数据进行拟合预测,得到第一预测结果的过程包括如下步骤:步骤s810,将训练集数据输入至正弦波序列表征网络进行样本增强,并将得到的增强后的训练集数据输入至长短期记忆网络,以对正弦波序列表征网络与长短期记忆网络复合模型进训练;步骤s820,将测试集数据输入至训练后的复合模型,得到第一预测结果。
[0118]
需要说明的是,上述基于时间序列的数据预测方法中涉及的关于对步骤s310

步骤s320的各方法进行限定以及解释的部分,同样适用于步骤s810

步骤s820,为避免冗余内容过多,此处不再赘述。
[0119]
下面以某物流公司物流干线每日订单量数据为例,对本公开的基于时间序列的物
流货量预测方法进行说明。其中,将属于同一天的货量汇总为一条数据,将全部的货量数据按照日期顺序进行排序,并选择实际发车日为索引,实际运输货量为值,形成历史货量时间序列数据;选取2021年4月1日至5月30日的历史货量数据,其中4月1日至5月23日为训练集数据,5月24日至5月30日为测试集数据(这里的训练集数据和测试集数据均为标准归一化后的数据)。
[0120]
图9示出了根据本公开示例性实施例的基于时间序列的物流货量预测方法的流程示意图,如图9所示,该方法包括如下过程:
[0121]
首先,将训练集数据(4月1日至5月23日的物流货量订单数据)以周期t=7进行stl分解,得到趋势序列数据c1、周期序列数据s1和误差序列数据r1(参见图10);若stl分解后的误差序列数据r1中存在偏离基线的离散点,即误差序列数据r1仍存在信息量,因此通过对误差序列数据r1再次进行stl分解,得到子趋势序列数据c2、子周期序列数据s2(参见图11)和子随机误差序列数据r2;
[0122]
接着,将子随机误差序列数据r2丢弃,并将子趋势序列数据c2、子周期序列数据s2对应时间点货量加和得到子融合序列数据cs2;并采用正弦波序列表征网络与长短期记忆网络复合模型对子融合序列数据cs2进行拟合预测,输出第一预测结果(如图12);
[0123]
然后,采用arima模型对趋势序列数据c1进行拟合预测,输出第二预测结果(如图13),采用正弦波序列表征网络与长短期记忆网络复合模型对周期序列数据s1进行拟合预测,输出第三预测结果;
[0124]
最后将第一预测结果、第二预测结果和第三预测结果进行加和,得到最终的目标预测结果(如图14)。
[0125]
其中,图15示出了仅通过lstm模型对周期序列数据s1进行拟合预测的结果示意图和通过正弦波序列表征网络与长短期记忆网络复合模型对周期序列数据s1进行拟合预测的结果示意图,对比两图可知,图15下图中采用复合模型对周期序列数据s1进行拟合预测的拟合结果,能更准确地预测数据的波动规律(其中虚线为预测值,实现为真实值)。针对趋势序列数据c1,使用arima模型进行预测,绘制趋势序列数据的自相关和偏自相关图(如图16分别为自相关图和偏自相关图),并通过自相关图和偏自相关图确定参数q=3,p=1和d=0,即使用arima(1,0,3)预测趋势序列数据,得到第二预测结果。最后将第一预测结果、第二预测结果和第三预测结果进行融合处理,得到的货量的目标预测结果。
[0126]
在本公开的示例性实施例中,还提供了一种基于时间序列的数据预测装置,参考图17所示,该基于时间序列的数据预测装置1700可以包括数据获取模块1710、序列分解模块1720、拟合预测模块1730以及融合处理模块1740。具体地,
[0127]
数据获取模块1710,用于获取历史时间序列数据,对所述历史时间序列数据进行时间序列分解,得到趋势序列数据、周期序列数据和误差序列数据;
[0128]
序列分解模块1720,用于对所述误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定所述误差序列数据对应的第一预测结果;
[0129]
拟合预测模块1730,用于采用所述趋势序列数据和周期序列数据对应的预测模型,分别对所述趋势序列数据和周期序列数据进行拟合预测,得到第二预测结果和第三预测结果;
[0130]
融合处理模块1740,用于将所述第一预测结果、第二预测结果和第三预测结果进行融合处理,得到目标预测结果。
[0131]
此外,在本公开的示例性实施例中,还提供了一种基于时间序列的物流货量预测装置。参考图18所示,该基于时间序列的物流货量预测装置1800可以包括时间序列数据获取模块1810、时间序列分解模块1820、拟合预测模块1830以及预测结果确定模块1840。具体地,
[0132]
时间序列数据获取模块1810,用于获取历史货量时间序列数据,对所述历史货量时间序列数据进行时间序列分解,得到趋势序列数据、周期序列数据和误差序列数据;
[0133]
时间序列分解模块1820,用于对所述误差序列数据进行时间序列分解,并对得到的多个分解子序列进行拟合预测,以根据拟合预测结果确定所述误差序列数据对应的第一预测结果;
[0134]
拟合预测模块1830,用于采用所述趋势序列数据和周期序列数据对应的预测模型,分别对所述趋势序列数据和周期序列数据进行拟合预测,得到第二预测结果和第三预测结果;
[0135]
预测结果确定模块1840,用于将所述第一预测结果、第二预测结果和第三预测结果进行融合处理,得到货量的目标预测结果。
[0136]
由于本公开的示例性实施例的基于时间序列的数据预测装置的各个功能模块与上述基于时间序列的数据预测方法的发明实施例中相同,本公开的示例性实施例的基于时间序列的物流货量预测装置的各个功能模块与上述基于时间序列的物流货量预测方法的发明实施例中相同,因此在此均不再赘述。
[0137]
应当注意,尽管在上文详细描述中提及了基于时间序列的数据预测装置和基于时间序列的物流货量预测装置的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0138]
此外,在本公开示例性实施方式中,还提供了一种能够实现上述方法的计算机存储介质。其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施例中,本公开的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。
[0139]
参考图19所示,描述了根据本公开的示例性实施方式的用于实现上述方法的程序产品1900,其可以采用便携式紧凑盘只读存储器(cd

rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0140]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读
存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0141]
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0142]
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0143]
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0144]
此外,在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。
[0145]
下面参照图20来描述根据本公开的这种实施例的电子设备2000。图20显示的电子设备2000仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0146]
如图20所示,电子设备2000以通用计算设备的形式表现。电子设备2000的组件可以包括但不限于:上述至少一个处理单元2010、上述至少一个存储单元2020、连接不同系统组件(包括存储单元2020和处理单元2010)的总线2030、显示单元2040。
[0147]
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元2010执行,使得所述处理单元2010执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施例的步骤。
[0148]
存储单元2020可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)2021和/或高速缓存存储单元2022,还可以进一步包括只读存储单元(rom)2023。
[0149]
存储单元2020还可以包括具有一组(至少一个)程序模块2025的程序/实用工具2024,这样的程序模块2025包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0150]
总线2030可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0151]
电子设备2000也可以与一个或多个外部设备2100(例如键盘、指向设备、蓝牙设备
等)通信,还可与一个或者多个使得用户能与该电子设备2000交互的设备通信,和/或与使得该电子设备2000能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口2050进行。并且,电子设备2000还可以通过网络适配器2060与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器2060通过总线2030与电子设备2000的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备2000使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0152]
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd

rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施例的方法。
[0153]
此外,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0154]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
[0155]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献