一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

物流数据处理方法及装置、存储介质、设备与流程

2021-12-14 21:02:00 来源:中国专利 TAG:


1.本发明实施例涉及大数据处理技术领域,具体而言,涉及一种物流数据处理方法、物流数据处理装置、计算机可读存储介质以及电子设备。


背景技术:

2.随着电子商务的不断发展,各大电商都在物流供应链技术上做出了巨大的投入,而物流供应链的核心之一则是物流货量预测技术,该技术是物流中心招聘以及调拨等决策系统的基石,所以,对未来某一个时间段所需要处理的物流货量的预测是非常重要的。
3.在物流货量预测时,优质的历史时间序列数据对日常需要处理的货量的预测非常重要(比如历史的处理件数)。而实际应用场景中,通常都是选取通用的数据平滑算法对历史时间序列数据进行平滑处理,进而根据平滑处理结果对未来需求进行预测。
4.但是,在上述平滑方法中,存在如下缺点:异常值没有完全平滑,部分异常值还存在,即识别的异常点数量低于实际数据量,进而导致物流货量的预测结果的准确性较低。
5.因此,需要提供一种新的物流数据处理方法及装置。
6.需要说明的是,在上述背景技术部分发明的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:

7.本发明的目的在于提供一种物流数据处理方法、一种物流数据处理装置、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的物流货量的预测结果的准确性较低的问题。
8.根据本公开的一个方面,提供一种物流数据处理方法,包括:
9.基于预设的http接口,从集群中获取历史物流数据,并提取所述历史物流数据中所包括的待预测区域在各个时间段的已处理货量;
10.利用多个数据平滑模型对所述已处理货量进行平滑处理,得到多个当前平滑处理结果,并根据所述已处理货量以及所述当前平滑处理结果,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型;
11.利用所述目标平滑模型对所述已处理货量进行平滑处理,得到目标处理结果;
12.根据所述目标处理结果对所述待预测区域在未来时间段的待处理货量进行预测,并将预测结果发送至所述待预测区域的设备终端,以使得所述设备终端所述预测结果进行显示。
13.在本公开的一种示例性实施例中,所述根据所述已处理货量以及所述当前平滑处理结果,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型,包括:
14.计算所述已处理货量的标准差,以及所述已处理货量与所述当前平滑处理结果之间的差值;
15.根据所述标准差以及所述已处理货量与所述当前平滑处理结果之间的差值,构建
目标函数;
16.根据所述目标函数,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型。
17.在本公开的一种示例性实施例中,所述根据所述目标函数,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型,包括:
18.以使得所述目标函数取得最小值为原则,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型。
19.在本公开的一种示例性实施例中,所述物流数据处理方法还包括:
20.计算所述已处理货量的第一平均值,以及所述当前平滑处理结果的第二平均值;
21.根据所述第一平均值以及所述第二平均值,构建所述目标函数的限制条件;
22.其中,所述以使得所述目标函数取得最小值为原则,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型,包括:
23.在满足所述限制条件的前提下,以使得所述目标函数取得最小值为原则,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型。
24.在本公开的一种示例性实施例中,所述根据所述标准差以及所述已处理货量与所述当前平滑处理结果之间的差值,构建目标函数,包括:
25.根据所述已处理货量与所述当前平滑处理结果之间的差值的和,以及所述已处理货量与所述当前平滑处理结果之间的大小关系,计算所述已处理货量以及所述当前平滑处理结果之间的差值比例;
26.根据所述标准差以及所述差值比例,构建所述目标函数。
27.在本公开的一种示例性实施例中,所述利用所述目标平滑模型对所述已处理货量进行平滑处理,得到目标处理结果,包括:
28.利用所述目标平滑模型对所述已处理货量中所包括的噪音以及异常值进行剔除,得到所述目标处理结果。
29.在本公开的一种示例性实施例中,所述数据平滑模型包括移动平均平滑模型、分位数平滑模型、对数正态分布平滑模型以及局部加权平滑模型中的多种。
30.根据本公开的一个方面,提供一种物流数据处理装置,包括:
31.数据获取模块,用于基于预设的http接口,从集群中获取历史物流数据,并提取所述历史物流数据中所包括的待预测区域在各个时间段的已处理货量;
32.平滑模型确定模块,用于利用多个数据平滑模型对所述已处理货量进行平滑处理,得到多个当前平滑处理结果,并根据所述已处理货量以及所述当前平滑处理结果,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型;
33.平滑处理模块,用于利用所述目标平滑模型对所述已处理货量进行平滑处理,得到目标处理结果;
34.货量预测模块,用于根据所述目标处理结果对所述待预测区域在未来时间段的待处理货量进行预测,并将预测结果发送至所述待预测区域的设备终端,以使得所述设备终端所述预测结果进行显示。
35.根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的物流数据处理方法。
36.根据本公开的一个方面,提供一种电子设备,包括:
37.处理器;以及
38.存储器,用于存储所述处理器的可执行指令;
39.其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的物流数据处理方法。
40.本发明实施例提供的一种物流数据处理方法,一方面,通过基于预设的http接口,从集群中提取历史物流数据中所包括的待预测区域在各个时间段的已处理货量;并利用多个数据平滑模型对已处理货量进行平滑处理,得到多个当前平滑处理结果,并根据已处理货量以及当前平滑处理结果,从各数据平滑模型中选取与历史物流数据对应的目标平滑模型;再利用目标平滑模型对已处理货量进行平滑处理,得到目标处理结果;最后根据目标处理结果对待预测区域在未来时间段的待处理货量进行预测,并将预测结果发送至待预测区域的设备终端,以使得设备终端对预测结果进行显示,由于可以根据已处理货量以及当前平滑处理结果选取与历史物流数据对应的目标平滑模型,因而可以解决现有技术中存在的由于异常值没有完全平滑,部分异常值还存在,即识别的异常点数量低于实际数据量,进而导致物流货量预测结果的准确性较低的问题;另一方面,通过根据目标处理结果对待预测区域在未来时间段的待处理货量进行预测,并将预测结果发送至待预测区域的设备终端,以使得设备终端对预测结果进行显示,进而使得待预测区域可以根据预测结果配备对应的货物分拣设备,避免由于分拣设备配备的过多或者过少进而导致的货物积压或者分拣设备闲置的问题,提高了货物的分拣效率同时提高了用户体验;再一方面,可以基于预设的http接口,从集群中获取历史物流数据,提高了历史物流数据的获取效率,进而可以提高待处理货量的预测效率。
41.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
42.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
43.图1示意性示出据本发明示例实施例的一种物流数据处理方法的流程图。
44.图2示意性示出据本发明示例实施例的一种待平滑处理的时间序列数据示意图。
45.图3示意性示出据本发明示例实施例的一种物流数据处理系统的框图。
46.图4示意性示出据本发明示例实施例的一种根据所述已处理货量以及所述当前平滑处理结果,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型的方法流程图。
47.图5示意性示出根据本发明示例实施例的一种根据标准差以及已处理货量与当前平滑处理结果之间的差值,构建目标函数的方法流程图。
48.图6示意性示出据本发明示例实施例的另一种物流数据处理方法的流程图。
49.图7示意性示出据本发明示例实施例的一种待平滑处理的已处理货量与平滑处理
后的目标处理结果的对比图。
50.图8示意性示出据本发明示例实施例的一种物流数据处理装置的框图。
51.图9示意性示出据本发明示例实施例的一种用于实现上述物流数据处理方法的电子设备。
具体实施方式
52.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本发明的各方面变得模糊。
53.此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
54.本示例实施方式中首先提供了一种物流数据处理方法,该方法可以运行于服务器、服务器集群或云服务器等;当然,本领域技术人员也可以根据需求在其他平台运行本发明的方法,本示例性实施例中对此不做特殊限定。参考图1所示,该物流数据处理方法可以包括以下步骤:
55.步骤s110.基于预设的http接口,从集群中获取历史物流数据,并提取所述历史物流数据中所包括的待预测区域在各个时间段的已处理货量;
56.步骤s120.利用多个数据平滑模型对所述已处理货量进行平滑处理,得到多个当前平滑处理结果,并根据所述已处理货量以及所述当前平滑处理结果,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型;
57.步骤s130.利用所述目标平滑模型对所述已处理货量进行平滑处理,得到目标处理结果;
58.步骤s140.根据所述目标处理结果对所述待预测区域在未来时间段的待处理货量进行预测,并将预测结果发送至所述待预测区域的设备终端,以使得所述设备终端所述预测结果进行显示。
59.上述物流数据处理方法中,一方面,通过基于预设的http接口,从集群中提取历史物流数据中所包括的待预测区域在各个时间段的已处理货量;并利用多个数据平滑模型对已处理货量进行平滑处理,得到多个当前平滑处理结果,并根据已处理货量以及当前平滑处理结果,从各数据平滑模型中选取与历史物流数据对应的目标平滑模型;再利用目标平滑模型对已处理货量进行平滑处理,得到目标处理结果;最后根据目标处理结果对待预测区域在未来时间段的待处理货量进行预测,并将预测结果发送至待预测区域的设备终端,
以使得设备终端对预测结果进行显示,由于可以根据已处理货量以及当前平滑处理结果选取与历史物流数据对应的目标平滑模型,因而可以解决现有技术中存在的由于异常值没有完全平滑,部分异常值还存在,即识别的异常点数量低于实际数据量,进而导致物流货量预测结果的准确性较低的问题;另一方面,通过根据目标处理结果对待预测区域在未来时间段的待处理货量进行预测,并将预测结果发送至待预测区域的设备终端,以使得设备终端对预测结果进行显示,进而使得待预测区域可以根据预测结果配备对应的货物分拣设备,避免由于分拣设备配备的过多或者过少进而导致的货物积压或者分拣设备闲置的问题,提高了货物的分拣效率同时提高了用户体验;再一方面,可以基于预设的http接口,从集群中获取历史物流数据,提高了历史物流数据的获取效率,进而可以提高待处理货量的预测效率。
60.以下,将结合附图对本发明示例实施例物流数据处理方法中包括的步骤进行详细的解释以及说明。
61.首先,对本发明示例实施例中涉及到的名词进行解释。
62.移动平均平滑:固定窗口计算窗口内的均值、标准差,计算3sigma值作为异常值阈值,时序大于阈值的则被定义为异常值,并用均值或者中位数进行填充;其中,3sigma为数值分布在(μ-3σ,μ 3σ)中的概率为0.9974;在正态分布中,σ代表标准差,μ代表均值,x=μ即为图像的对称轴。
63.lowess(locally weighted regression)平滑:局部加权平滑,采用lowess方法对时序拟合,生成新的时序;
64.分位数平滑:计算箱线图异常值阈值,大于阈值的被定义为异常值,采用均值或者中位数进行填充;
65.对数正态分布(lognorm)平滑:是指一个随机变量的对数服从正态分布,则该随机变量服从对数正态分布。对数正态分布从短期来看,与正态分布非常接近。
66.其次,对本发明示例实施例的应用场景进行解释以及说明。
67.在物流货量进行预测时,优质的历史时间序列数据对日常需要处理的物流货量的预测非常重要(比如历史的处理件数),而实际场景中,由于各种因素导致历史时间序列数据中包含一些异常数据点,最优的平滑技术能够最大幅度的减少历史异常点对预测未来需求的冲击。参考图2所示,横轴为时间轴,纵轴为处理的货量,可以看到在20附近有一个极端异常值,对于这种异常值需要采用平滑技术来处理,不然会对需求预测产生极大的影响,容易造成预测偏高,从而增加分拣设备,造成分拣设备的空置。所谓平滑,就是剔除极端异常值,并使用一个可用的值进行填充。
68.现有的平滑方法以及平滑效果都是有差异的,如何根据时间序列数据本身的特点去选取一个合适的平滑算法则成为一个难点。现有方法,通常根据数据集的特点,借助可视化或主观人工经验,为数据集选择一种平滑算法进行平滑处理。
69.但是,选择的平滑算法可能只适合数据集中的部分时间序列数据,而另外一部分时间序列数据并未达到最优效果,进而会导致如下结果:
70.一种是,欠平滑:异常值没完全平滑,部分异常值还存在,即提供的算法不能准确的识别数据中的异常,通常表现为识别的异常点数量低于实际数据量,最终导致预测结果存在偏高风险;
71.另一种是,过平滑:平滑数据点过多,误将正常值当成异常值平滑掉。通常表现为识别的异常点远多于实际数量,最终导致预测结果存在偏低风险;
72.进一步的,当数据集的量级比较少时,可以人工借助可视化或主观经验选择合适的平滑算法,但是当数据量级成倍增长的时候,主观经验方法无论从人力资源还是可用性方面都是不现实的。
73.最后,对本发明示例实施例中所所涉及的物流数据处理系统进行解释以及说明。参考图3所示,该物流数据处理系统可以包括集群310、物流数据分析系统320以及待预测区域的设备终端330。其中,集群分别与物流数据分析系统以及待预测区域的设备终端连接,数据分析系统与待预测区域的设备终端连接。
74.具体的,集群用于存储待预测区域产生的历史物流数据;其中,该历史物流数据的生产过程为:待预测中心的分拣设备对各包裹进行扫描,然后分拣设备将扫描到的各包裹数据上传至待预测区域的设备终端,设备终端对各包裹数据汇总以后,再上传至集群,该集群可以为hadoop集群,也可以为其他集群,本示例对此不做特殊限制。
75.进一步的,该物流数据分析系统可以提供数据获取以及消息推送两种http服务接口,用于获取历史物流数据以及将预测结果推送至待预测区域的设备终端;同时,该物流数据分析系统可以用于实现本发明示例实施例所记载的物流数据处理方法。
76.以下,将对步骤s110-步骤s140进行解释以及说明。
77.在步骤s110中,基于预设的http接口,从集群中获取历史物流数据,并提取所述历史物流数据中所包括的待预测区域在各个时间段的已处理货量。
78.在本示例实施例中,首先,可以利用时间序列数据获取模块通过预设的http接口,从集群中获取预设时间段的历史物流数据,其中,该预设时间段可以按天、小时以及分钟等进行划分;然后,获取历史物流数据中包括的待预测区域在过去一段时间(例如一个月)内每一天的已处理货量,即该待预测区域在每一天所处理包裹的数量。
79.在步骤s120中,利用多个数据平滑模型对所述已处理货量进行平滑处理,得到多个当前平滑处理结果,并根据所述已处理货量以及所述当前平滑处理结果,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型。
80.在本示例实施例中,首先,利用多个数平滑模型对已处理货量进行平滑处理,得到多个当前平滑处理结果;其中,数据平滑模型包括移动平均平滑模型、分位数平滑模型、对数正态分布平滑模型以及局部加权平滑模型中的多种等等;具体的处理方法为:根据上述已处理货量以及历史物流数据中所包括的时间序列(每一天)生成一个矩阵,其中,该矩阵的行为所包括的时间序列,列为每一天各待预测区域所处理的货量。然后,将该矩阵输入至上述数据平滑模型中,得到多个当前平滑处理结果;其中,每一个数据平滑模型对应一个当前平滑处理结果。
81.其次,当得到当前平滑处理结果以后,可以根据已处理货量以及当前平滑处理结果,从各数据平滑模型中选取与历史物流数据对应的目标平滑模型。具体的,参考图4所示,根据所述已处理货量以及所述当前平滑处理结果,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型可以包括步骤s410-步骤s430。其中:
82.在步骤s410中,计算所述已处理货量的标准差,以及所述已处理货量与所述当前平滑处理结果之间的差值。
83.在本示例实施例中,已处理货量的标准差的计算方法可以如下公式(1)所示:
[0084][0085]
其中,σ(δx)为标准差,n为历史货量数据中所包括的天数,x
i
为第i项历史货量数据(第i天的已处理货量),μ1为已处理货量的第一平均值。此处需要说明的是,上述历史货量数据也可以是某一个品类的商品在某一个时间段内的销售量,也可以是其他类型的数据,本示例对此不做特殊限制。
[0086]
在步骤s420中,根据所述标准差以及所述已处理货量与所述当前平滑处理结果之间的差值,构建目标函数;
[0087]
具体的,参考图5所示,根据标准差以及已处理货量与当前平滑处理结果之间的差值,构建目标函数可以包括步骤s510以及步骤s520。其中:
[0088]
在步骤s510中,根据所述已处理货量与所述当前平滑处理结果之间的差值的和,以及所述已处理货量与所述当前平滑处理结果之间的大小关系,计算所述已处理货量以及所述当前平滑处理结果之间的差值比例;
[0089]
在步骤s520中,根据所述标准差以及所述差值比例,构建所述目标函数。
[0090]
以下,将对步骤s510-步骤s520进行解释以及说明。具体的,根据所述差值比例以及所述标准差,构建所述目标函数,具体可以如下公式(1)所示:
[0091][0092]
其中,obj为目标函数,σ(δx)为标准差,x
i
为第i项已处理货量,y
i
为第i项当前平滑处理结果;为已处理货量与当前平滑处理结果之间的差值的和,β为大于零的偏置参数,i(
·
)为指示函数,并且有:
[0093][0094]
为所述差值比例。
[0095]
此处需要补充说明的是,在差值比例的计算过程中,为了避免分母为零的情况,因此加入偏置参数。通过配置该目标函数,可以将噪音以及异常值剔除的更为彻底,提高评估指标的准确性,进而解决欠平滑的问题。
[0096]
在步骤s430中,根据所述目标函数,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型。
[0097]
具体的,以使得所述目标函数取得最小值为原则,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型。
[0098]
进一步的,为了可以进一步的提高所选取的目标平滑模型的准确率,该物流数据处理方法还可以包括:计算所述已处理货量的第一平均值,以及所述当前平滑处理结果的
第二平均值;根据所述第一平均值以及所述第二平均值,构建所述目标函数的限制条件。进一步的,在得到该限制条件以后,可以在满足所述限制条件的前提下,以使得所述目标函数取得最小值为原则,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型。
[0099]
具体的,限制条件可以如下公式(3)所示:
[0100]
s.t.kurtosis(y)≥α*kurtosis(x);
ꢀꢀꢀ
公式(3)
[0101]
其中,s.t.为所述限制条件,α为峰度限制系数,也可以称为峰态限制系数,可以用于表征概率密度分布曲线在平均值处峰值高低的特征数;即峰度反映了峰部的尖度。样本的峰度是和正态分布相比较而言统计量,如果峰度大于三,峰的形状比较尖,比正态分布峰要陡峭;
[0102]
kurtosis(x)为已处理货量的峰度,μ1为第一平均值,x为已处理货量,e(
·
)为指数函数;
[0103]
kurtosis(y)当前平滑处理结果的峰度,μ2为第二平均值,y为当前平滑处理结果。
[0104]
此处需要补充说明的是,通过配置上述限制项,可以解决现有技术中存在的由于平滑数据点过多,误将正常值当成异常值平滑掉,即识别的异常点远多于实际数量,同样导致预测结果的准确性较低的问题,提高了货量预测结果的准确性。
[0105]
基于此,可以根据目标函数以及受限项从预设的平滑模型中选取目标平滑模型,具体选择过程为:将每个预设的平滑模型处理后的当前平滑处理结果使用平滑效果评估指标(目标函数以及受限项)进行评估,在满足评估指标中的受限项的前提下,使目标函数obj取得最小值的平滑模型作为目标平滑模型。
[0106]
在步骤s130中,利用所述目标平滑模型对所述已处理货量进行平滑处理,得到目标处理结果。
[0107]
在本示例实施例中,可以利用所述目标平滑模型对所述已处理货量中所包括的噪音以及异常值进行剔除,得到所述目标处理结果。具体的,此处以目标平滑模型为loess平滑模型为例,对具体的平滑处理过程进行解释以及说明。首先,可以以每一天作为一行,以该待预测区域每一天的已处理货量为一列,构建一个输入矩阵,然后,将该输入矩阵输入至loess平滑模型中,得到平滑以后的目标处理结果。其中,loess是使用加权最小平方法进行局部拟合。其具体的拟合步骤如下:
[0108]
首先,以一个点x1为中心,确定一个区间长度为f的数据,该长度取决于q=fn,其中q是参加局部回归的观察值的个数,f是参加局部回归的观察值的个数占观察值个数的比例,n表示观察值的个数。一般情况f的取值在1/3-2/3之间,q和f无明确的准则。曲线的光滑程度与选取数据比例有关:比例越少,拟合越不光滑(因为过于看重局部性质),反之越光
滑。
[0109]
其次,定义区间内的所有点的权重。权重由权值函数来确定。任一点(x1,y1)的权重是x1处权值函数曲线的高度。权值函数具有以下三方面特性:一方面,点(x1,y1)具有最大权重;另一方面,当x离x1越远,权重逐渐减小;再一方面,加权函数以x1为中心对称。说白了,就是对附近的点赋予更高的权重。
[0110]
进一步的,对于该段数据用权值函数w做一个加权的线性回归,得到x1处的平滑值(x1,y1),其中y1为拟合后曲线的对应值。
[0111]
最后,将上述步骤对每个点都进行一遍,最终将得到一组平滑点(x
i
,y
i
)。将这些平滑点用短直线连接起来,就得到loess曲线,进而得到上述目标处理结果。
[0112]
在步骤s140中,根据所述目标处理结果对所述待预测区域在未来时间段的待处理货量进行预测,并将预测结果发送至所述待预测区域的设备终端,以使得所述设备终端所述预测结果进行显示。
[0113]
在本示例实施例中,当得到上述目标处理结果以后,即可以将上述目标处理结果输入至数据预测模型中,进而输出未来时间段所需处理的货量,然后再对其进行展示,进而使得用户可以根据该预测结果配置所需的分拣设备,该分拣机构可以包括分拣人员、无人导引车等等。
[0114]
以下,结合图6对本发明示例实施例的物流数据处理方法进行进一步的解释以及说明。具体的,本发明的技术关键点在于,通过自动寻找最优平滑模型,为每个历史物流数据都能自动寻找最适合的平滑模型,使得目标处理结果既不会欠平滑也不会过平滑。在自动寻找最优平滑模型时,制定了平滑效果评估指标,通过该评估指标达获取最优的评估算法。具体的,参考图6所示,该物流数据处理方法可以包括以下步骤:
[0115]
步骤s610,获取某个待预测区域过去一段时间每天的已处理货量。
[0116]
步骤s620,自动寻找最优平滑算法。具体的,首先,使用备选平滑算法池中的每个平滑算法,处理输入的已处理货量,得到每个备选平滑算法处理后的一组当前平滑处理结果;其次,最后,将每个备选平滑算法处理后的当前平滑处理结果使用平滑效果评估指标进行评估,在满足评估指标中受限项的前提下,使目标函数obj最小的平滑算法作为最优平滑算法;
[0117]
步骤s630,进行平滑处理:使用最优平滑算法进行平滑处理,得到目标处理结果,该目标处理结果为剔除噪音和异常值后的最优结果;
[0118]
步骤s640,输出最优平滑后的目标处理结果(具体可以参考图7所示,其中,在图7中,线条701表示的是原始货量时间序列数据的示意图,702为采用本技术的平滑方法处理后所得到的货量时间序列数据的示意图),并根据目标处理结果对未来时间段所需处理的货量进行预测。
[0119]
本发明示例实施例所提供的物流数据处理方法,至少具有以下优点:
[0120]
一方面,可以根据每个时间序列数据的特点,为每一个时间序列数据自动寻找一种最优平滑算法,该最优平滑算法可以避免过平滑和欠平滑问题;
[0121]
另一方面,该自动平滑装置不依赖于人的主观经验选择,由系统自动选择,可在分布式计算场景下高效准确的进行,无惧数据量级的增长。
[0122]
本发明示例实施例还提供了一种物流数据处理装置。参考图8所示,该物流数据处
理装置可以包括第一计算模块810、目标函数构建模块820、平滑处理模块830以及货量预测模块840。其中:
[0123]
第一计算模块810可以用于获取原始货量时间序列数据,并计算所述原始货量时间序列数据的标准差;
[0124]
目标函数构建模块820可以用于利用预设的平滑模型对所述原始货量时间序列数据进行平滑处理,并根据所述标准差以及平滑处理后的原始货量时间序列数据,构建目标函数;
[0125]
平滑处理模块830可以用于基于所述目标函数,从所述预设的平滑模型中选取与所述原始货量时间序列数据对应的目标平滑模型,并利用所述目标平滑模型对所述原始货量时间序列数据进行平滑处理,得到目标处理结果;
[0126]
货量预测模块840可以用于根据所述目标处理结果以及所述原始货量时间序列数据,对未来时间段的货量进行预测,并对预测结果进行显示。
[0127]
在本公开的一种示例性实施例中,所述根据所述已处理货量以及所述当前平滑处理结果,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型,包括:
[0128]
计算所述已处理货量的标准差,以及所述已处理货量与所述当前平滑处理结果之间的差值;
[0129]
根据所述标准差以及所述已处理货量与所述当前平滑处理结果之间的差值,构建目标函数;
[0130]
根据所述目标函数,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型。
[0131]
在本公开的一种示例性实施例中,所述根据所述目标函数,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型,包括:
[0132]
以使得所述目标函数取得最小值为原则,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型。
[0133]
在本公开的一种示例性实施例中,所述物流数据处理方法还包括:
[0134]
计算所述已处理货量的第一平均值,以及所述当前平滑处理结果的第二平均值;
[0135]
根据所述第一平均值以及所述第二平均值,构建所述目标函数的限制条件;
[0136]
其中,所述以使得所述目标函数取得最小值为原则,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型,包括:
[0137]
在满足所述限制条件的前提下,以使得所述目标函数取得最小值为原则,从各所述数据平滑模型中选取与所述历史物流数据对应的目标平滑模型。
[0138]
在本公开的一种示例性实施例中,所述根据所述标准差以及所述已处理货量与所述当前平滑处理结果之间的差值,构建目标函数,包括:
[0139]
根据所述已处理货量与所述当前平滑处理结果之间的差值的和,以及所述已处理货量与所述当前平滑处理结果之间的大小关系,计算所述已处理货量以及所述当前平滑处理结果之间的差值比例;
[0140]
根据所述标准差以及所述差值比例,构建所述目标函数。
[0141]
在本公开的一种示例性实施例中,所述利用所述目标平滑模型对所述已处理货量进行平滑处理,得到目标处理结果,包括:
[0142]
利用所述目标平滑模型对所述已处理货量中所包括的噪音以及异常值进行剔除,得到所述目标处理结果。
[0143]
在本公开的一种示例性实施例中,所述数据平滑模型包括移动平均平滑模型、分位数平滑模型、对数正态分布平滑模型以及局部加权平滑模型中的多种。
[0144]
上述物流数据处理装置中各模块的具体细节已经在对应的物流数据处理方法中进行了详细的描述,因此此处不再赘述。
[0145]
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0146]
此外,尽管在附图中以特定顺序描述了本发明中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
[0147]
在本发明的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
[0148]
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
[0149]
下面参照图9来描述根据本发明的这种实施方式的电子设备900。图9显示的电子设备900仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0150]
如图9所示,电子设备900以通用计算设备的形式表现。电子设备900的组件可以包括但不限于:上述至少一个处理单元910、上述至少一个存储单元920、连接不同系统组件(包括存储单元920和处理单元910)的总线930以及显示单元940。
[0151]
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元910执行,使得所述处理单元910执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元910可以执行如图1中所示的步骤s110:获取原始货量时间序列数据,并计算所述原始货量时间序列数据的标准差;步骤s120:利用预设的平滑模型对所述原始货量时间序列数据进行平滑处理,并根据所述标准差以及平滑处理后的原始货量时间序列数据,构建目标函数;步骤s130:基于所述目标函数,从所述预设的平滑模型中选取与所述原始货量时间序列数据对应的目标平滑模型,并利用所述目标平滑模型对所述原始货量时间序列数据进行平滑处理,得到目标处理结果;步骤s140:根据所述目标处理结果对未来时间段所需的货量进行预测,并对预测结果进行显示。
[0152]
存储单元920可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)9201和/或高速缓存存储单元9202,还可以进一步包括只读存储单元(rom)9203。
[0153]
存储单元920还可以包括具有一组(至少一个)程序模块9205的程序/实用工具9204,这样的程序模块9205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
[0154]
总线930可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储
单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
[0155]
电子设备900也可以与一个或多个外部设备1000(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备900交互的设备通信,和/或与使得该电子设备900能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口950进行。并且,电子设备900还可以通过网络适配器960与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器960通过总线930与电子设备900的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备900使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0156]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本发明实施方式的方法。
[0157]
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
[0158]
根据本发明的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0159]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0160]
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0161]
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0162]
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c 等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0163]
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
[0164]
本领域技术人员在考虑说明书及实践这里发明的发明后,将容易想到本发明的其他实施例。本技术旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指出。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献