一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种数据处理的方法和装置与流程

2022-03-23 04:13:44 来源:中国专利 TAG:


1.本发明涉及智慧供应链技术领域,尤其涉及一种数据处理的方法和装置。


背景技术:

2.在零售行业中,物品需求情况的预测是供应链管理的基础,它起到了为库存补调及仿真提供输入数据的作用,其效果的好坏直接决定着后续模型结果的有效性。同时,预测数据也可以向供应链管理人员展示预测数据的预计情况,从而起到决策支持的作用。
[0003] 在现有零售行业中,常使用单一的fforma模型(feature-based forecast model averaging)作为全量时序数据处理的数据处理模型对物品需求情况进行预测,但是单一的数据处理模型对于多种不同类型的时序数据无法进行区分,导致预测结果的准确性低。


技术实现要素:

[0004]
有鉴于此,本发明实施例提供一种数据处理的方法和装置,针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点存在数量突变点的情况进行分析,将待处理的时序数据分割成位于设定时间点之前的第一时序数据以及位于设定时间点之后的第二时序数据,其中,所述数量突变点通过大数据统计学确定出,使得第一时序数据所包括的多个时间点的数据小于数量突变点的数值,第二时序数据所包括的多个时间点的数据等于或大于数量突变点的数值,后续通过第一数据处理模型和第二数据处理模型分别对第一时序数据和第二时序数据进行处理,即实现采用不同数据处理模型对不同阶段的不同数据进行处理,以使处理结果能够更真实反映不同阶段的物品需求情况,最后根据第一数据处理模型的第一处理结果以及第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于第一预测结果设置预测时序内的物品库存。通过上述方法可以达到通过采用不同的处理模型分别处理不同时序数据的目的,提高处理结果的准确性。
[0005]
为实现上述目的,根据本发明实施例的第一方面,提供了一种数据处理的方法。
[0006]
本发明实施例的数据处理的方法包括:确定待处理的时序数据;其中,所述待处理的时序数据指示在历史目标时间段内物品需求量变化情况;针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点存在数量突变点的情况,将所述待处理的时序数据分割出位于所述设定时间点之前的第一时序数据以及位于所述设定时间点之后的第二时序数据;并确定所述第二时序数据所属的目标特征时序簇,利用预设的第一数据处理模型处理所述第一时序数据以及利用与所述目标特征时序簇相匹配的第二数据处理模型处理所述第二时序数据;其中,所述数量突变点通过大数据统计学确定出;根据所述第一数据处理模型的第一处理结果以及所述第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于所述第一预测结果设置所述预测时序内的物品库存。
[0007]
可选地,在所述确定待处理的时序数据之后,进一步包括:针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点不存在数量突变点的情况,利用预设的所述第一数据处理模型处理所述待处理的时序数据;根据所述第一数据处理模型的第二处理结果,确定预测时序内的物品需求情况的第二预测结果,以基于所述第二预测结果设置所述预测时序内的物品库存。
[0008]
可选地,所述第一数据处理模型的第一处理结果包括:所述预测时序内设定时间点之前的物品需求情况的预测结果;所述第二处理模型的处理结果包括:所述预测时序内设定时间点之后的物品需求情况的预测结果;所述确定预测时序内的物品需求情况的第一预测结果,包括:将所述预测时序内设定时间点之前的物品需求情况的预测结果与所述预测时序内设定时间点之后的物品需求情况的预测结果拼接,得到所述第一预测结果。
[0009]
可选地,在所述确定待处理的时序数据之后,进一步包括:在分析所述待处理的时序数据满足正态性假设的情况下,利用buishand统计方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点;在分析所述待处理的时序数据不满足正态性假设的情况下,利用pettitt检验方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点。
[0010]
可选地,所述方法进一步包括:从测试用例全部的物品时序数据中,筛选出具有数量突变点的目标物品时序数据;从所述目标物品时序数据中分割出位于所述设定时间点之后的训练用第二时序数据训练用第二时序数据,其中,所述训练用第二时序数据所包括的多个时间点的数据等于或大于所述目标物品时序数据包括的数量突变点的数值;对所述训练用第二时序数据进行聚类,以得到一个或多个特征时序簇;所述确定所述第二时序数据所属的目标特征时序簇,包括:从一个或多个所述特征时序簇中,为所述第二时序数据选择出其所属目标特征时序簇。
[0011]
可选地,所述为所述第二时序数据选择出其所属目标特征时序簇,包括:针对所述特征时序簇有多个的情况,将所述第二时序数据与各个所述特征时序簇进行匹配;根据匹配的结果,从多个所述特征时序簇筛选出目标特征时序簇。
[0012]
可选地,所述方法进一步包括:从所述目标物品时序数据中分割出位于所述设定时间点之前的训练用第一时序数据,其中,所述训练用第一时序数据包括的多个时间点的数据小于所述目标物品时序数据包括的数量突变点的数值;对所述测试用例中除所述目标物品时序数据之外的其他物品时序数据与所述训练用第一时序数据进行聚类;利用聚类的结果训练预设的第一类待训练模型,得到第一数据处理模型,其中,所述第一类待训练模型基于一个或多个基模型配置得到,所述基模型包括arima、ets、croston、简单移动平均、fbprophet、holt-winters、一阶指数平滑中的一种或多种。
[0013]
可选地,所述方法还包括:针对每一种特征时序簇,利用所述特征时序簇对应的时序数据训练预设的第二类待训练模型,得到与所述特征时序簇相匹配的第二数据处理模型,其中,所述第二类待训练模型基于一个或多个基模型配置得到,所述第二类待训练模型
与所述第一类待训练模型不同。
[0014]
可选地,所述从测试用例全部的物品时序数据中,筛选出具有数量突变点的目标物品时序数据,包括:针对所述测试用例中的每一种仓库物品标识的物品时序数据,执行如下操作:确定数据分割点;在所述数据分割点为所述仓库物品标识的物品时序数据的数量突变点的情况,确定所述仓库物品标识的物品时序数据为所述目标物品时序数据。
[0015]
可选地,所述对所述训练用第二时序数据进行聚类,包括:为预设的距离函数确定序列平移函数和平移距离;利用确定出所述序列平移函数和所述平移距离的距离函数和dbscan算法对所述训练用第二时序数据进行聚类。
[0016]
可选地,所述为所述第二时序数据选择出其所属目标特征时序簇,包括:对所述第二时序数据进行首尾拼接;将拼接后的结果分别与所述一个或多个特征时序簇进行匹配,将匹配值最高的特征时序簇作为所述目标特征时序簇。
[0017]
可选地,所述利用所述特征时序簇对应的时序数据训练预设的第二类待训练模型,包括:对所述特征时序簇包括的训练用第二时序数据进行剪裁,并对剪裁的结果进行拼接,生成新的训练用第二时序数据;利用所述特征时序簇包括的训练用第二时序数据和所述新的训练用第二时序数据,训练预设的第二类待训练模型。
[0018]
为实现上述目的,根据本发明实施例的第二方面,提供了一种数据处理的装置。
[0019]
本发明实施例的数据处理的装置包括:确定模块,用于确定待处理的时序数据,其中,所述待处理的时序数据指示历史目标时间段内物品需求量变化情况;预测模块,用于针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点存在数量突变点的情况,根据所述数量突变点,将所述待处理的时序数据分割出第二时序数据以及第一时序数据;并确定所述第二时序数据所属的目标特征时序簇,利用预设的第一数据处理模型处理所述第一时序数据以及利用与所述目标特征时序簇相匹配的第二数据处理模型处理所述第二时序数据;其中,所述数量突变点通过大数据统计学确定出;根据所述第一数据处理模型的第一处理结果以及所述第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于所述第一预测结果设置所述预测时序内的物品库存。
[0020]
可选地,所述预测模块还用于,在所述确定待处理的时序数据之后,针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点不存在数量突变点的情况,利用预设的所述第一数据处理模型处理所述待处理的时序数据;根据所述第一数据处理模型的第二处理结果,确定预测时序内的物品需求情况的第二预测结果,以基于所述第二预测结果设置所述预测时序内的物品库存。
[0021]
可选地,所述第一数据处理模型的第一处理结果包括:所述预测时序内设定时间点之前的物品需求情况的预测结果;所述第二处理模型的处理结果包括:所述预测时序内设定时间点之后的物品需求情况的预测结果;所述预测模块还用于,将所述预测时序内设定时间点之前的物品需求情况的预测结果与所述预测时序内设定时间点之后的物品需求情况的预测结果拼接,得到所述第一预测结果。
[0022]
可选地,所述装置还包括分析模块,用于在所述确定待处理的时序数据之后,在分析所述待处理的时序数据满足正态性假设的情况下,利用buishand统计方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点;在分析所述待处理的时序数据不满足正态性假设的情况下,利用pettitt检验方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点。
[0023]
可选地,所述预测模块还用于,从测试用例全部的物品时序数据中,筛选出具有数量突变点的目标物品时序数据;所述装置还包括聚类模块,用于从所述目标物品时序数据中分割出位于所述设定时间点之后的训练用第二时序数据训练用第二时序数据,其中,所述训练用第二时序数据所包括的多个时间点的数据等于或大于所述目标物品时序数据包括的数量突变点的数值;对所述训练用第二时序数据进行聚类,以得到一个或多个特征时序簇;所述预测模块还用于,从一个或多个所述特征时序簇中,为所述第二时序数据选择出其所属目标特征时序簇。
[0024]
可选地,所述预测模块还用于,针对所述特征时序簇有多个的情况,所述第二时序数据与各个所述特征时序簇进行匹配;根据匹配的结果,从多个所述特征时序簇筛选出目标特征时序簇。
[0025]
可选地,所述聚类模块还用于,从所述目标物品时序数据中分割出位于所述设定时间点之前的训练用第一时序数据,其中,所述训练用第一时序数据包括的多个时间点的数据小于所述目标物品时序数据包括的数量突变点的数值;对所述测试用例中除所述目标物品时序数据之外的其他物品时序数据与所述训练用第一时序数据进行聚类;利用聚类的结果训练预设的第一类待训练模型,得到第一数据处理模型,其中,所述第一类待训练模型基于一个或多个基模型配置得到,所述基模型包括arima、ets、croston、简单移动平均、fbprophet、holt-winters、一阶指数平滑中的一种或多种。
[0026]
可选地,所述聚类模块还用于,针对每一种特征时序簇,利用所述特征时序簇对应的时序数据训练预设的第二类待训练模型,得到与所述特征时序簇相匹配的第二数据处理模型,其中,所述第二类待训练模型基于一个或多个基模型配置得到,所述第二类待训练模型与所述第一类待训练模型不同。
[0027]
可选地,所述从测试用例全部的物品时序数据中,筛选出具有数量突变点的目标物品时序数据,包括:针对所述测试用例中的每一种仓库物品标识的物品时序数据,执行如下操作:确定数据分割点;在所述数据分割点为所述仓库物品标识的物品时序数据的数量突变点的情况,确定所述仓库物品标识的物品时序数据为所述目标物品时序数据。
[0028]
可选地,所述聚类模块还用于,为预设的距离函数确定序列平移函数和平移距离;利用确定出所述序列平移函数和所述平移距离的距离函数和dbscan算法对所述训练用第二时序数据进行聚类。
[0029]
可选地,所述聚类模块还用于,对所述第二时序数据进行首尾拼接;将拼接后的结果分别与所述一个或多个特征时序簇进行匹配,将匹配值最高的特征时序簇作为所述目标特征时序簇。
[0030]
可选地,所述聚类模块还用于,对所述特征时序簇包括的训练用第二时序数据进行剪裁,并对剪裁的结果进行拼接,生成新的训练用第二时序数据;利用所述特征时序簇包括的训练用第二时序数据和所述新的训练用第二时序数据,训练预设的第二类待训练模型。
[0031]
为实现上述目的,根据本发明实施例的第三方面,提供了一种数据处理的设备。
[0032]
本发明实施例的数据处理的设备包括:一个或多个处理器;存储系统,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的数据处理的方法。
[0033]
为实现上述目的,根据本发明实施例的第四方面,提供了一种计算机可读介质。
[0034]
本发明实施例的计算机可读介质上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的数据处理方法。
[0035]
上述发明中的一个实施例具有如下优点或有益效果:在本发明实施例中,针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点存在数量突变点的情况进行分析,将待处理的时序数据分割成位于设定时间点之前的第一时序数据以及位于设定时间点之后的第二时序数据,其中,数量突变点的数值大于设定时间点之前的每一个时间点的数值,且与设定时间点之前的每一个时间点的数值之间的差值等于或大于预设的突变阈值,使得第一时序数据所包括的多个时间点的数据小于数量突变点的数值,第二时序数据所包括的多个时间点的数据等于或大于数量突变点的数值,后续通过第一数据处理模型和第二数据处理模型分别对第一时序数据和第二时序数据进行处理,即实现采用不同数据处理模型对不同阶段的不同数据进行处理,以使处理结果能够更真实反映不同阶段的物品需求情况,最后根据第一数据处理模型的第一处理结果以及第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于第一预测结果设置预测时序内的物品库存。通过上述方法可以达到通过采用不同的处理模型分别处理不同时序数据的目的,提高处理结果的准确性。
[0036]
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
[0037]
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:图1是本发明实施例的一种数据处理方法的主要流程的示意图;图2是本发明实施例的数据分割的示意图;图3是本发明实施例的针对待处理的时序数据在位于历史目标时间段内的设定时间点不存在数量突变点的情况的主要流程的示意图;图4是本发明实施例的确定数据突变点的主要流程的示意图;图5本发明实施例的得到特征时序簇的主要流程的示意图;图6本发明实施例的对所述目标高数量时序数据进行聚类的主要流程的示意图;图7是本发明实施例的一种为所述高数量时序数据选择出其所属目标特征时序簇的主要流程的示意图;图8本发明实施例的确定第一数据处理模型的主要流程的示意图;
图9是本发明实施例的另一种为所述高数量时序数据选择出其所属目标特征时序簇的主要流程的示意图;图10是本发明实施例的数据剪裁步骤的示意图;图11是本发明实施例的数据剪裁截取过程的示意图;图12是本发明实施例的一种时序数据预测销量的整体流程示意图;图13本发明实施例的一种数据处理装置的主要模块的示意图;图14本发明实施例可以应用于其中的示例性系统架构图;图15适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
[0038]
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0039]
根据本发明实施例的第一方面,提供一种应用于服务器的数据处理方法。
[0040] 在商品零售领域,常在某些时序中出现在特定时间段内物品需求量显著增加的现象,如果无法针对物品需求量的物品进行准确的,将会出现缺货、断货的风险,从而造成了服务水平的降低和成本的升高。对于不同物品的时序,通常以sku(stock keeping unit)作为最小库存单元来表示。现有的fforma架构在预测不同的仓库物品标识时会出现以下问题:(1)物品需求量显著增加的现象常常只存在于部分仓库物品标识中。当模型使用全量仓库物品标识对模型进行训练时,没有物品需求量显著增加的现象的数据会拉低物品需求量显著增加的现象的数据预测值,使得预测值偏低;(2)物品需求量显著增加的现象在不同时序间显示的形态不同,在使用fforma时,无法针对不同时序的商品有区别地挖掘出符合物品需求量显著增加期间时序特点的相关特征;(3)fforma模型的优化难度比较大,很难在短时间内训练并拟合出适合各类物品需求量显著增加的数据模型。
[0041]
图1是本发明实施例的一种数据处理方法的主要流程的示意图。如图1所示,该方法主要包括:步骤s101:确定待处理的时序数据,其中,待处理的时序数据指示在历史目标时间段内物品需求量变化情况;步骤s102:针对待处理的时序数据在位于历史目标时间段内的设定时间点存在数量突变点的情况,根据数量突变点,将待处理的时序数据分割出位于设定时间点之前的第一时序数据以及位于设定时间点之后的第二时序数据,数量突变点通过大数据统计学确定出;步骤s103:确定第二时序数据所属的目标特征时序簇,利用预设的第一数据处理模型处理第一时序数据以及利用与目标特征时序簇相匹配的第二数据处理模型处理第二
时序数据;步骤s104:根据第一数据处理模型的第一处理结果以及第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于第一预测结果设置预测时序内的物品库存。
[0042]
其中,设定时间点可以有两种设定方式。一种设定方式可以为指定一个时间点为设定时间点,例如每个月的20日,也可以是通过对历史时间段内物品需求量变化情况进行大数据统计学分析确定出的数量突变点的时间点为设定时间点,例如通过物品需求量变化情况确定出存在数量突变点的时间点为每个月的10日则确定10日为该设定时间点。值得说明的是,该设定时间点可以根据实际情况进行相应地设定或调整。以使设定时间点可以动态变化,满足不同需求。
[0043]
其中,数量突变点通过大数据统计学确定出,具体是指通过现有的统计方式比如多种均一性统计方法(buishand统计方法)、突变点检验方法(pettitt检验方法)等统计大量的历史时间段内物品需求量变化情况,根据统计的结果,确定出数量突变点。其中,针对统计的结果为多个数量突变点对应多个时间点情况,可选择数值最大的数量突变点为最终的数量突变点,并确定该最终的数量突变点对应的时间点为设定时间点。另外,针对统计的结果为多个数量突变点对应多个时间点情况,也可以选择出现次数最多的时间点位设定时间点,并通过计算出现次数最多的时间点的数量突变点的数值,确定数量突变点的数值或者数量突变点的突变范围等。
[0044]
在本发明实施例中,第二时序数据为在待处理的时序数据中物品需求量突然增加的时序部分,第一时序数据为在待处理的时序数据中除去第二时序数据的时序部分,一般来说,第一时序数据所包括的多个时间点的数值小于数量突变点的数值,第二时序数据所包括的多个时间点的数值等于或大于数量突变点的数值。其中,数据分割的示意图如图2所示。本技术主要是针对月末销量增长迅速的情况对后期的销量进行预测,因此,在本技术实施例中认为在数量突变点之后直至当月月末的时序数据均为第二时序数据。第一时序数据是指月初到数量突变点所对应日期之前的物品销量数据。其中,第二时序数据包括的多个时间点的数据一般等于或者大于数量突变点的数值,第一时序数据包括的多个时间点的数据一般小于数量突变点的数值。值得说明的是,图2示出的分割线是数量突变点之前的一个时间点的销量点。即图2示出的分割线后的点位数量突变点。也就是说,数量突变点包含于第二时序数据中。例如,设定时间点为每个月的20日或者通过历史时间段内物品需求量变化确定出存在数量突变点的时间点位每月的20日,待处理时序数据为2021年1月1日至2021年2月28日的时序数据,假设在设定时间点处,待处理时序数据中存在数量突变点,该数量突变点的销量为30件/天,那么第二时序数据为2021年1月20日至2021年1月31日和2021年2月20日至2021年2月28日时间段内的销量数据,且该销量数据一般等于或大于30件/天,第一时序数据为2021年1月1日至2021年1月19日和2021年2月1日至2021年2月19日时间段内的销量数据,且该销量数据一般小于30件/天。
[0045]
值得说明的是,位于设定时间点之后的第二时序数据可包括有大于设定时间点的数量突变点的数值。
[0046]
其中,步骤s103中的第一数据处理模型是通过从测试用例全部的物品时序数据中分割出的对应于第一时序数据的训练用第一时序数据训练预设的第一类待训练模型得到
的,第二数据处理模型通过从测试用例全部的物品时序数据中分割出的对应于第二时序数据的训练用第二时序数据训练预设的第二类待训练模型得到的。
[0047]
在一种可选的实施例中,待处理的时序数据所指示的时间段可以根据需要实际情况进行确定。例如,假设当前日期为2021年6月1日,那么可以采用2021年1月1日至2021年6月1日的时序数据作为待处理数据,来对2021年6月2日至2021年12月1日的数据进行预测,也可以采用2021年1月1日至2021年3月1日的时序数据作为待处理数据,来对2021年6月2日至2021年12月1日的数据进行预测。由于某些月份存在商家的优惠活动或大型节日,例如双十一,因此采用相同时间段的时序数据进行预测准确率更高,即采用2020年11月1日至2020年11月30日的数据来对2021年11月1日至2021年11月30日的数据进行预测。
[0048]
对于步骤s103,具体可以包括:将第一时序数据输入第一数据处理模型,并将第二时序数据输入第二数据处理模型,得到预测时序内的物品需求情况的预测结果。例如,针对预测销量预测的应用场景下,设定时间点为每个月的20日,待处理时序数据为2021年1月1日至2021年2月28日的时序数据,假设在设定时间点处,待处理时序数据中存在数量突变点,那么作为第二数据模型输入的第二时序数据为2021年1月20日至2021年1月31日和2021年2月20日至2021年2月28日,作为第一数据模型输入的第一时序数据为2021年1月1日至2021年1月19日和2021年2月1日至2021年2月19日。
[0049]
在一种可选的实施例中,在步骤s101之后,还存在待处理的时序数据在位于历史目标时间段内的设定时间点不存在数量突变点的情况,如图3所示,包括:步骤s301:利用预设的所述第一数据处理模型处理待处理的时序数据;步骤s302:根据第一数据处理模型的第二处理结果,确定预测时序内的物品需求情况的第二预测结果,以基于第二预测结果设置所述预测时序内的物品库存。
[0050]
由于待处理的时序数据中不存在数量突变点,因此无需分别针对第二时序数据和第一时序数据分别进行处理,仅利用处理第一时序数据的第一数据处理模型处理即可。
[0051]
在进一步可选的实施例中,第一数据处理模型的第一处理结果包括:预测时序内设定时间点之前的物品需求情况的预测结果;第二处理模型的处理结果包括:预测时序内设定时间点之后的物品需求情况的预测结果;步骤s104中确定预测时序内的物品需求情况的第一预测结果,进一步包括:将预测时序内设定时间点之前的物品需求情况的预测结果与预测时序内设定时间点之后的物品需求情况的预测结果拼接,得到第一预测结果。
[0052]
示例性地,针对预测销量预测的应用场景下,设定时间点为每个月的20日,待处理时序数据为2021年1月1日至2021年2月28日的时序数据,预测的时序数据为2022年1月1日至2022年2月28日。假设在设定时间点处,待处理时序数据中存在数量突变点,那么作为第二数据模型输入的第二时序数据为2021年1月20日至2021年1月31日和2021年2月20日至2021年2月28日,作为第一数据模型输入的第一时序数据为2021年1月1日至2021年1月19日和2021年2月1日至2021年2月19日。根据第一数据模型可以输出2022年1月1日至2022年1月19日和2022年2月1日至2022年2月19日预测时序内设定时间点之前的物品需求情况的预测结果,根据第二数据模型可以输出2022年1月20日至2022年1月31日和2022年2月20日至2022年2月28日预测时序内设定时间点之后的物品需求情况的预测结果,将上述预测结果进行拼接,即可得到2022年1月1日至2022年2月28日的第一预测结果。
[0053]
在本实施例中,数量突变点为在该点之后的数据显著大于该点之前的数据的点。由于不同的数据参数适用的检验方法不同,因此根据不同的参数选择不同的检验方法可以提高检验的准确性,在本技术实施例中,为了检验在数量突变点之后的数据是否显著大于该点之前的数据,在一种可选的实施例中,如图4所示,包括:步骤s401:在分析待处理的时序数据满足正态性假设的情况下,利用buishand统计方法确定待处理的时序数据在位于历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点;步骤s402:在分析所述待处理的时序数据不满足正态性假设的情况下,利用pettitt检验方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点。
[0054]
对于buishand统计方法,具体步骤如下:将待处理的时序数据定义为序列,其中为设定时间点 的物品需求量数据。若满足正态性假设,则可将序列中每一时间点的物品需求量数据表示为:
ꢀꢀꢀꢀꢀ
式(1)其中, 表示在时间点为i时的参差, 表示均值, 表示设定时间点,表示变化值。如果为设定时间点 的数量突变点的数值, 表示在时间点为i时的物品需求量数据,1
……
n表示历史目标时间段内的n个时间点,那么仅需检测变化值 。此时构造待处理的时序数据的突变点前求和值 用于检验 ,具体 表示如下:
ꢀꢀꢀꢀ
式(2)其中,为待处理的时序数据的均值,。对于同质性数据(即待处理的时序数据在时间范围内分布不发生显著变化),我们期望设定时间点的统计量在0上下波动,此时待处理的时序数据 中没有系统性的偏离均值的特征。若 ,我们将期望在数量突变点前大多数的《0,而数量突变点后的大多数。由于本发明实施例仅需检验在设定时间点处的数量突变点,此时只考虑检验设定时间点的统计量。如果我们无法确定具体的数量突变点,选取。为完成检验,我们将其重缩放,即构造统计量如下:
ꢀꢀꢀꢀꢀꢀ
式(3)其中,表示待处理的时序数据方差,为待处理的时序数据的
数据量。通过对数量突变点前求和值进行检验,进而确定显著性值。
[0055]
在实际应用过程中,如果设定时间点为月末的倒数第10天,那么取历史样本为等长的10天,即可根据历史样本在显著性为95%时所对应的q值为1.22,在判断过程中,如果求得的统计量,则认为在设定时间点存在数量突变点。
[0056]
对于pettitt检验方法,具体步骤如下:将待处理的时序数据定义为序列,构造统计量为:
ꢀꢀꢀꢀꢀ
式(4)其中,表示数量突变点前符号函数求和值,表示设定时间点,表示在时间点j时的物品需求量数据, 为符号函数。与方法1相似,若无法确定数量突变点,选取 。由于只考虑在设定时间点物品需求量显著增加的情况,不考虑物品需求量显著减少的情况,我们期望显著成立。根据pettitt提出的近似公式,计算单边检验的值如下:
ꢀꢀꢀꢀꢀ
式(5)其中, 表示以自然常数e为底的指数函数,取置信度为95%,若,则在设定时间点处存在数量突变点。
[0057]
在一种可选的实施例中,如图5所示,在执行本发明实施例的方法之前,还包括测试过程,具体包括:步骤s501:从测试用例全部的物品时序数据中,筛选出具有数量突变点的目标物品时序数据;步骤s502:从目标物品时序数据中分割出位于设定时间点之后的训练用第二时序数据训练用第二时序数据,其中,训练用第二时序数据所包括的多个时间点的数据等于或大于目标物品时序数据包括的数量突变点的数值;步骤s503:对训练用第二时序数据进行聚类,以得到一个或多个特征时序簇。
[0058]
通过上述步骤s501至s503,步骤s103中确定所述第二时序数据所属的目标特征时序簇,包括:从一个或多个特征时序簇中,为第二时序数据选择出其所属目标特征时序簇。
[0059]
由于现有技术中根据全部的物品时序数据确定fforma模型无法达到准确的预测效果,因此在本技术实施例中需要将具有数量突变点的目标物品时序数据进行筛选,进而将目标物品时序数据中的训练用第二时序数据作为模型输入,可以显著提高预测的准确率。不仅如此,在本技术实施例中,还将训练用第二时序数据进行聚类得到不同的特征时序簇,并将特征时序簇作为模型的输入,可以对具有数量突变点的目标物品时序数据进行进一步的划分,以特征时序簇进行的划分可以将不同特征的时序簇分类输入模型,使得预测更加准确。
[0060]
示例性的,测试用例中全部的物品时序数据共有100个,其中50个时序数据中存在数量突变点,那么该50个时序数据即为目标物品时序数据。假设每个时序数据仅包含一个月的商品销量,那么对于目标物品时序数据中的每一个时序数据,都可以通过数量突变点
分隔出训练用第二时序数据,即可以分割出50个训练用第二时序数据,再通过对50个训练用第二时序数据进行聚类,得到特征时序簇。
[0061]
其中,对于步骤s501,在一种可选的实施例中,具体包括:针对测试用例中的每一种仓库物品标识的物品时序数据,执行:步骤一:确定数据分割点;步骤二:判断数据分割点在仓库物品标识的物品时序数据中是否为数量突变点;若是,则确定仓库物品标识的物品时序数据为目标物品时序数据。
[0062]
此处确定是否为数量突变点的方法与前述步骤s301至步骤s303相同,其中,数据分割点可以通过人为经验获得,也可以通过数据透视的方法得到。
[0063]
对于步骤s503中的聚类过程,在一种可选的实施例中,如图6所示,包括:步骤s601:为预设的距离函数确定序列平移函数和平移距离;步骤s602:利用确定出序列平移函数和平移距离的距离函数和dbscan算法对训练用第二时序数据进行聚类。
[0064]
在本技术实施例中,聚类的目的在于将物品需求量变化情况的图形按照相似程度进行划分。在时序聚类中,由于时序存在着序列长度不等、移位相似和数据尺度等问题,现有技术中采用的欧式距离很难用于描述时序间的相似性。john paparrizos在2015年提出了一种基于形状相似度量的时序聚类算法k-shape,该算法可以较好地刻画时续间的相似距离,并使用类似k-means的思路对时序进行聚类。但是,实验发现此方法存在着计算量较大的问题,更重要的是,由于我们很难有关于时序充分的先验知识,类别量k值很难选取,常常需要通过反复的实验才能确定。因此,在一种可选的实施例中,本发明采用基于shape based distance的dbscan算法进行聚类。
[0065]
具体地,确定序列平移函数如下:
ꢀꢀꢀꢀꢀ
式(6)其中,表示平移量, 表示待平移时序x中时间点为1至n处的物品需求量。基于一个平移量,可以得到两个时序和之间的交叉相关性:
ꢀꢀꢀꢀ
式(7)其中,表示待平移时序y中时间点为i处的物品需求量,表示待平移时序y中时间点为s i处的物品需求量, 为常数,在取最大值得情况下,认为平移量处于最优位置。此时将交叉相关性代入式(8)得到归一化量。
[0066]
ꢀꢀꢀꢀꢀ
式(8)其中,表示时序的范数,示时序的范数。将得到的归一化量代入下式(9),得到平移距离sbd。
[0067]
ꢀꢀꢀꢀꢀꢀ
式(9)进一步地,在dbscan算法中涉及到的两个超参分别为:邻域半径和邻域内的样本个数阈值,可以使用elbow point方法和轮廓系数(silhouette score)确定。
[0068]
通过上述对于距离函数的定义以及距离函数中序列平移函数和平移距离的确定,可以根据时序数据图形变化的相似度对训练用第二时序数据进行更加准确的聚类,同时解决了图形变化相似但由于时间点平移而导致的误差问题。
[0069]
在一种可选的实施例中,在针对特征时序簇有多个的情况时,如图7所示,为所述第二时序数据选择出其所属目标特征时序簇的步骤,可以进一步包括:步骤s701:将第二时序数据与各个特征时序簇进行匹配;步骤s702:根据匹配的结果,从多个特征时序簇筛选出目标特征时序簇。
[0070]
其中,对于匹配结果,可以根据实际应用场景和需求进行设定。在一种可选的实施例中,选取匹配度最高的特征时序簇作为目标特征时序簇。进一步地,对于匹配度,在本技术实施例中可以表示为第二时序数据与各个特征时序簇的相似程度,相似程度越高,匹配度越高。例如,聚类后的特征时序簇共有3个,分别为时序簇1、时序簇2和时序簇3,第二时序数据和3个时序簇的匹配度分别为0.9、0.6和0.1,那么时序簇1则为目标特征时序簇,当出现匹配度相同的情况时,可以择一进行随机选取。
[0071]
在本技术实施例中,不仅可以从目标物品时序数据中分割出训练用第二时序数据,在一种可选的实施例中,如图8所示,还包括:步骤s801:从目标物品时序数据中分割出位于设定时间点之前的训练用第一时序数据,其中,训练用第一时序数据包括的多个时间点的数据小于目标物品时序数据包括的数量突变点的数值;步骤s802:对测试用例中除目标物品时序数据之外的其他物品时序数据与训练用第一时序数据进行聚类;步骤s803:利用聚类的结果训练预设的第一类待训练模型,得到第一数据处理模型,其中,第一类待训练模型基于一个或多个基模型配置得到,基模型包括arima、ets、croston、简单移动平均、fbprophet、holt-winters、一阶指数平滑中的一种或多种。
[0072]
示例性的,针对预测销量预测的应用场景下,测试用例中全部的物品时序数据共有10个,其中目标物品时序数据有2个,即具有数量突变点的时序数据。设定数量突变点对应的时间点为每个月的20日,目标物品时序数据为2021年2月1日至2021年2月28日和2020年3月1日至2020年3月31日的时序数据,剩余8个时序数据中均不存在数量突变点。那么在2个目标物品时序数据中,分别分隔出的训练用第一时序数据为2021年2月1日至2021年2月19日和2020年3月1日至2020年3月19日的数据,此时则将2021年2月1日至2021年2月19日和2020年3月1日至2020年3月19日的数据与剩余8个完整的时序数据进行聚类,并根据聚类的
结果训练预设的第一类待训练模型,得到第一数据处理模型。
[0073]
由于在实际应用场景下,对于第一时序数据通常预测得到的结果相同或相近,因此不需要像第二时序数据一样进行分类处理,仅需要将所有的第一时序数据进行一次聚类,而不需要像第二时序数据一样聚类得到多个不同的时序簇,简化了具体的聚类过程,在不影响预测结果的前提下,减少数据处理量,提高数据处理效率。其中,具体的聚类方法与步骤s601和步骤s602相同。
[0074]
在一种可选的实施例中,针对每一种特征时序簇,利用特征时序簇对应的时序数据训练预设的第二类待训练模型,得到与特征时序簇相匹配的第二数据处理模型,其中,第二类待训练模型基于一个或多个基模型配置得到,第二类待训练模型与所述第一类待训练模型不同。相比于第一类待训练模型,由于第二类待训练模型分析的时序较为复杂,因此配置的基模型相对较多,通常利用多种基模型融合得到。
[0075]
在确定第二时序数据所属的目标特征时序簇的过程中,在一种可选的实施例中,为所述第二时序数据选择出其所属目标特征时序簇的步骤,如图9所示,还包括:步骤s901:对第二时序数据进行首尾拼接;步骤s902:将拼接后的结果分别与一个或多个特征时序簇进行匹配,将匹配值最高的特征时序簇作为目标特征时序簇。
[0076]
示例性的,假设某一时序数据中,包括了2021年3月1日至2021年5月31日的物品需求量变化情况,其中数量突变点所在的设定时间点为月末前10天,也就是第二时序数据分别为2021年3月21日至2021年3月31日、2021年4月20日至2021年4月30日和2021年5月21日至2021年5月31日,其余时间段的时序数据为第一时序数据。那么首尾拼接后的时序数据即为将2021年3月21日至2021年3月31日、2021年4月20日至2021年4月30日和2021年5月21日至2021年5月31日进行首尾拼接,拼接成一条时序较长的新时序。由于存在高数量时序的数据通常具备共性的特征,将每一段高数量时序的数据分别输入模型,通常得到的结果相似或相同,因此通过首尾拼接,可以减少处理大量相似的数据,仅需要对拼接后的时序进行一次模型输入,即可得到准确的预测结果。
[0077]
本技术实施例中,通过对相似时序的数据进行聚类分组训练可以更好地提取出聚类后时序簇的相关特征,可以降低模型的偏移和优化难度,但由于经过聚类后时序数量会有一定的减少,模型容易造成过拟合的现象。因此在一种可选的实施例中,可以通过引入数据增强的方式减少过拟合现象,如图10所示,利用所述特征时序簇对应的时序数据训练预设的第二类待训练模型的步骤中,还包括:步骤s1001:对特征时序簇包括的训练用第二时序数据进行剪裁,并对剪裁的结果进行拼接,生成新的训练用第二时序数据;步骤s1002:利用特征时序簇包括的训练用第二时序数据和新的训练用第二时序数据,训练预设的第二类待训练模型。
[0078]
对于步骤s1001中的截取过程如图11所示,剪裁步骤具体可以包括:步骤s1001-1:设定长度阈值l,滑动长度d,裁剪长度s;步骤s1001-2:选取数据超过l的时序数据,对于未超过该阈值的时序不作处理;
步骤s1001-3:对于中的时序做长度为s的滑窗截取,每个滑窗对应一个新样本;步骤s1001-4:将截取后的数据与未超过阈值的时序组合,作为新的样本集。
[0079]
通过上述的剪裁步骤可以在已有的时序数据的基础上,对样本集的数量进行扩充,使得预设的第二类训练模型在训练后得到更加准确的第二数据处理模型。
[0080]
通常情况下,第一类待训练模型用于训练训练用第一时序数据的聚类结果,仅需要从众多基模型中选取最优的一个基模型就可以达到训练目的,无需复杂繁琐的模型,可以有效提高效率。对于第二类待训练模型,通常为融合模型,即包含有多种基模型的复杂模型,可以根据不同的特征时序簇选取不同的基模型种类,以得到最优的训练模型。
[0081]
进一步地,对于多种基模型,可以根据不同时序簇的特征,对各个基模型设置权重,通过训练过程,不断优化各个基模型的权重,得到仅保留权重较高的基模型。通过基模型的优化也可以减少时序数据过拟合的现象。
[0082]
在一种可选的实施例中,可以将本发明实施例的方法用于商品的销量预测,如图12所示,其中,图12示出了根据时序数据预测销量的整体流程示意图,具体包括:步骤一:判断时序数据中是否有突变点,根据突变点判别结果确认时序数据是否存在高销现象;若存在高销现象,则执行步骤二,若不存在高销现象,则直接执行步骤七;步骤二:对时序数据进行时序分割,以得到高销期间(第二时序数据)和非高销期间(第一时序数据);进一步地,对于高销期间的时序数据执行步骤三至步骤五,具体步骤如下:步骤三:将高销期间的时序数据与聚类结果中的特征时序簇进行匹配,得到目标特征时序簇;步骤四:对目标特征时序簇中的高销时序数据进行时序拼接,得到高销时序数据的拼接结果;步骤五:以高销时序数据的拼接结果作为第一数据处理模型的输入,输出目标销量;在步骤二之后,对于非高销期间的时序数据执行步骤六和步骤七,具体步骤如下:步骤六:对非高销期间的时序进行拼接,得到非高销时序数据的拼接结果;步骤七:以非高销时序数据的拼接结果或当前全部时序数据作为第二数据处理模型的输入,输出目标销量。
[0083]
通过上述步骤,不仅可以将是否存在高销现象的时序数据进行分别处理,也可以将存在高销现象中的高销期间和非高销期间进行分别处理,提高数据处理的准确性。
[0084]
本发明实施例的数据处理的方法,针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点存在数量突变点的情况进行分析,将待处理的时序数据分割成位于设定时间点之前的第一时序数据以及位于设定时间点之后的第二时序数据,其中,第一时序数据所包括的多个时间点的数据小于数量突变点的数值,第二时序数据所包括的多个时间点的数据等于或大于数量突变点的数值,后续通过第一数据处理模型和第二数据处理模型分别对第一时序数据和第二时序数据进行处理,即实现采用不同数据处理模型对不同阶段的不同数据进行处理,以使处理结果能够更真实反映不同阶段的物品需求情况,最后
根据第一数据处理模型的第一处理结果以及第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于第一预测结果设置预测时序内的物品库存。通过上述方法可以达到通过采用不同的处理模型分别处理不同时序数据的目的,提高处理结果的准确性。
[0085]
根据本发明实施例第二方面,提供一种应用于服务器的数据处理的装置。
[0086]
图13是根据本发明实施例第二方面的数据处理装置1300的主要模块的示意图。如图13所示,包括:确定模块1301,用于确定待处理的时序数据,其中,所述待处理的时序数据指示历史目标时间段内物品需求量变化情况;预测模块1302,用于针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点存在数量突变点的情况,将所述待处理的时序数据分割出位于所述设定时间点之前的第一时序数据以及位于所述设定时间点之后的第二时序数据;并确定所述第二时序数据所属的目标特征时序簇,利用预设的第一数据处理模型处理所述第一时序数据以及利用与所述目标特征时序簇相匹配的第二数据处理模型处理所述第二时序数据;其中,所述数量突变点通过大数据统计学确定出;根据所述第一数据处理模型的第一处理结果以及所述第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于所述第一预测结果设置所述预测时序内的物品库存。
[0087]
在一种可选的实施例中,所述预测模块1302还用于,在所述确定待处理的时序数据之后,针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点不存在数量突变点的情况,利用预设的所述第一数据处理模型处理所述待处理的时序数据;根据所述第一数据处理模型的第二处理结果,确定预测时序内的物品需求情况的第二预测结果,以基于所述第二预测结果设置所述预测时序内的物品库存。
[0088]
在一种可选的实施例中,所述第一数据处理模型的第一处理结果包括:所述预测时序内设定时间点之前的物品需求情况的预测结果;所述第二处理模型的处理结果包括:所述预测时序内设定时间点之后的物品需求情况的预测结果;所述预测模块1302还用于,将所述预测时序内设定时间点之前的物品需求情况的预测结果与所述预测时序内设定时间点之后的物品需求情况的预测结果拼接,得到所述第一预测结果。
[0089]
在一种可选的实施例中,所述装置还包括分析模块,用于在所述确定待处理的时序数据之后,在分析所述待处理的时序数据满足正态性假设的情况下,利用buishand统计方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点;在分析所述待处理的时序数据不满足正态性假设的情况下,利用pettitt检验方法确定所述待处理的时序数据在位于所述历史目标时间段内设定时间点存在数量突变点或者不存在数量突变点。
[0090]
在一种可选的实施例中,所述预测模块1302还用于,从测试用例全部的物品时序数据中,筛选出具有数量突变点的目标物品时序数据;所述装置还包括聚类模块,用于从所述目标物品时序数据中分割出位于所述设定
时间点之后的训练用第二时序数据训练用第二时序数据,其中,所述训练用第二时序数据所包括的多个时间点的数据等于或大于所述目标物品时序数据包括的数量突变点的数值;对所述训练用第二时序数据进行聚类,以得到一个或多个特征时序簇;所述预测模块1302还用于,从一个或多个所述特征时序簇中,为所述第二时序数据选择出其所属目标特征时序簇。
[0091]
在一种可选的实施例中,所述预测模块1302还用于,针对所述特征时序簇有多个的情况,所述第二时序数据与各个所述特征时序簇进行匹配;根据匹配的结果,从多个所述特征时序簇筛选出目标特征时序簇。
[0092]
在一种可选的实施例中,所述聚类模块还用于,从所述目标物品时序数据中分割出位于所述设定时间点之前的训练用第一时序数据,其中,所述训练用第一时序数据包括的多个时间点的数据小于所述目标物品时序数据包括的数量突变点的数值;对所述测试用例中除所述目标物品时序数据之外的其他物品时序数据与所述训练用第一时序数据进行聚类;利用聚类的结果训练预设的第一类待训练模型,得到第一数据处理模型,其中,所述第一类待训练模型基于一个或多个基模型配置得到,所述基模型包括arima、ets、croston、简单移动平均、fbprophet、holt-winters、一阶指数平滑中的一种或多种。
[0093]
在一种可选的实施例中,所述聚类模块还用于,针对每一种特征时序簇,利用所述特征时序簇对应的时序数据训练预设的第二类待训练模型,得到与所述特征时序簇相匹配的第二数据处理模型,其中,所述第二类待训练模型基于一个或多个基模型配置得到,所述第二类待训练模型与所述第一类待训练模型不同。
[0094]
在一种可选的实施例中,所述从测试用例全部的物品时序数据中,筛选出具有数量突变点的目标物品时序数据,包括:针对所述测试用例中的每一种仓库物品标识的物品时序数据,执行如下操作:确定数据分割点;在所述数据分割点为所述仓库物品标识的物品时序数据的数量突变点的情况,确定所述仓库物品标识的物品时序数据为所述目标物品时序数据。
[0095]
在一种可选的实施例中,所述聚类模块还用于,为预设的距离函数确定序列平移函数和平移距离;利用确定出所述序列平移函数和所述平移距离的距离函数和dbscan算法对所述训练用第二时序数据进行聚类。
[0096]
在一种可选的实施例中,所述聚类模块还用于,对所述第二时序数据进行首尾拼接;将拼接后的结果分别与所述一个或多个特征时序簇进行匹配,将匹配值最高的特征时序簇作为所述目标特征时序簇。
[0097]
在一种可选的实施例中,所述聚类模块还用于,对所述特征时序簇包括的训练用第二时序数据进行剪裁,并对剪裁的结果进行拼接,生成新的训练用第二时序数据;利用所述特征时序簇包括的训练用第二时序数据和所述新的训练用第二时序数据,训练预设的第二类待训练模型。
[0098]
图14示出了可以应用本发明实施例的数据处理的方法或数据处理装置的示例性系统架构1400。
[0099]
如图14所示,系统架构1400可以包括终端设备1401、1402、1403,网络1404和服务器1405。网络1404用以在终端设备1401、1402、1403和服务器1405之间提供通信链路的介质。网络1404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0100]
用户可以使用终端设备1401、1402、1403通过网络1404与服务器1405交互,以发送任务执行请求或接收请求的响应信息等。终端设备1401、1402、1403上可以安装有各种通讯客户端应用,例如在线服务应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0101]
终端设备1401、1402、1403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0102]
服务器1405可以是提供各种服务的服务器,例如对用户利用终端设备1401、1402、1403所发送的在线服务请求提供支持的后台管理服务器、或者对数据进行处理的服务器。后台管理服务器可以对接收到的时序数据等数据进行分析等处理,并将处理结果(例如输出的物品需求情况的预测结果)反馈给终端设备。
[0103]
需要说明的是,本发明实施例第一方面所提供的数据处理的方法一般由服务器1405执行,相应地,本发明实施例第二方面所提供的数据处理的装置一般设置于服务器1405中。
[0104]
应该理解,图15中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0105]
下面参考图15,其示出了适于用来实现本发明实施例的终端设备的计算机系统1500的结构示意图。图15示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0106] 如图15所示,计算机系统1500包括中央处理单元(cpu)1501,其可以根据存储在只读存储器(rom)1502中的程序或者从存储部分1508加载到随机访问存储器(ram)1503中的程序而执行各种适当的动作和处理。在ram 1503中,还存储有系统1500操作所需的各种程序和数据。cpu 701、rom 1502以及ram 1503通过总线1504彼此相连。输入/输出(i/o)接口1505也连接至总线1504。
[0107]
以下部件连接至i/o接口1505:包括键盘、鼠标等的输入部分1506;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1505;包括硬盘等的存储部分1508;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1509。通信部分1509经由诸如因特网的网络执行通信处理。驱动器1510也根据需要连接至i/o接口1505。可拆卸介质1511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1510上,以便于从其上读出的计算机程序根据需要被安装入存储部分1508。
[0108]
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1509从网络上被下载和安装,和/或从可拆卸介质1511被安装。在该计算机程序被中央处理单元(cpu)1501执行时,执行本发明的系统中限定的上述功能。
[0109]
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便
携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、系统或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0110]
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0111]
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括确定模块和预测模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,确定模块还可以被描述为“用于确定待处理的时序数据的模块”。
[0112]
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:确定待处理的时序数据;其中,所述待处理的时序数据指示在历史目标时间段内物品需求量变化情况;针对所述待处理的时序数据在位于所述历史目标时间段内的设定时间点存在数量突变点的情况,根据所述数量突变点,将所述待处理的时序数据分割出第二时序数据以及第一时序数据;并确定所述第二时序数据所属的目标特征时序簇,利用预设的第一数据处理模型处理所述第一时序数据以及利用与所述目标特征时序簇相匹配的第二数据处理模型处理所述第二时序数据;根据所述第一数据处理模型的第一处理结果以及所述第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于所述第一预测结果设置所述预测时序内的物品库存。
[0113]
本发明实施例的数据处理的方法和装置,针对所述待处理的时序数据在位于所述
历史目标时间段内的设定时间点存在数量突变点的情况进行分析,将待处理的时序数据中的第二时序数据和第一时序数据分别通过第一数据处理模型和第二数据处理模型进行处理,最后根据第一数据处理模型的第一处理结果以及第二数据处理模型的处理结果,确定预测时序内的物品需求情况的第一预测结果,以基于第一预测结果设置预测时序内的物品库存。通过上述方法可以达到通过采用不同的处理模型分别处理不同时序数据的目的,提高处理结果的准确性。
[0114]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献