一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

流量预测方法以及装置与流程

2022-06-05 10:31:06 来源:中国专利 TAG:


1.本说明书实施例涉及计算机技术领域,特别涉及一种流量预测方法。


背景技术:

2.随着计算机技术和互联网技术的快速发展,网上用户的数量得到了快速增长,广告行业也从传统的线下广告模式,逐步转变为线上广告模式,同时,由于大数据分析技术的运用,线上广告模式相比于传统的线下广告模式也体现了巨大的优越性。
3.通过实时竞价方式投放在线广告,能够更为准确地将广告预算投入到更有可能产生回报的广告展现机会上,从而使广告收益得到优化,广告投放方需要为每个广告营销设置投放周期内的预算,因此在预算有限的情况下,对每次广告展现机会进行出价并给出合理的竞标价格是实时竞价的关键,需要满足广告预算的计划,同时也需要保证在广告活动周期内的相对平稳的预算消耗。为了实现该目标,需要针对各种历史行为数据进行分析,对流量的变化趋势进行预测来得到一个符合消耗趋势的分配计划来满足广告需求。


技术实现要素:

4.有鉴于此,本说明书实施例提供了一种流量预测方法。本说明书一个或者多个实施例同时涉及一种流量预测装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
5.根据本说明书实施例的第一方面,提供了一种流量预测方法,包括:
6.获取目标对象在各指定时间段的历史流量值,其中,所述指定时间段基于当前时间段从预设历史时长内确定;
7.根据所述历史流量值,确定目标流量特征,并确定所述当前时间段的目标时间特征;
8.将所述目标流量特征和所述目标时间特征输入预训练的流量预测模型,得到所述目标对象在所述当前时间段的目标流量值,所述流量预测模型基于携带有标签流量值的样本特征对训练得到,所述样本特征对包含样本流量特征和样本时间特征。
9.可选地,所述目标流量特征包括第一流量特征和第二流量特征;
10.所述根据所述历史流量值,确定目标流量特征,包括:
11.从所述各指定时间段的历史流量值中,提取第一时间段的第一历史流量值,根据所述第一历史流量值,确定所述第一流量特征,其中,所述第一时间段为所述各指定时间段中与所述当前时间段具有相同时间范围的时间段;
12.从所述各指定时间段的历史流量值中,提取第二时间段的第二历史流量值,根据所述第二历史流量值,确定所述第二流量特征,其中,所述第二时间段为所述各指定时间段中与所述当前时间段相邻的时间段。
13.可选地,所述根据所述第二历史流量值,确定所述第二流量特征,包括:
14.计算所述第二历史流量值的平滑度;
15.根据所述平滑度,确定所述第二流量特征。
16.可选地,所述根据所述平滑度,确定所述第二流量特征,包括:
17.根据所述平滑度,判断所述第二历史流量值是否符合预设平滑条件;
18.根据判断结果,确定所述第二流量特征。
19.可选地,所述计算所述第二历史流量值的平滑度,包括:
20.计算所述第二历史流量值的加权和与方差;
21.根据所述加权和与方差,确定所述第二历史流量值的平滑度。
22.可选地,所述确定所述当前时间段的目标时间特征,包括:
23.将各指定时间段与所述当前时间段进行对比,根据对比结果确定所述当前时间段的目标时间特征。
24.可选地,所述将所述目标流量特征和所述目标时间特征输入预训练的流量预测模型之前,还包括:
25.获取携带有标签流量值的样本特征对;
26.将所述样本特征对中的所述样本流量特征和所述样本时间特征输入至预先拟合的回归模型中,得到所述样本特征对的预测流量值;
27.根据所述预测流量值与所述标签流量值,计算损失值;
28.若所述损失值大于预设阈值,则调整所述回归模型的参数,并返回执行所述获取携带有标签流量值的样本特征对的步骤,直至达到训练停止条件,停止训练,确定完成训练的回归模型为流量预测模型。
29.根据本说明书实施例的第二方面,提供了一种流量预测装置,包括:
30.获取模块,被配置为获取目标对象在各指定时间段的历史流量值,其中,所述指定时间段基于当前时间段从预设历史时长内确定;
31.确定模块,被配置为根据所述历史流量值,确定目标流量特征,并确定所述当前时间段的目标时间特征;
32.预测模块,被配置为将所述目标流量特征和所述目标时间特征输入预训练的流量预测模型,得到所述目标对象在所述当前时间段的目标流量值,所述流量预测模型基于携带有标签流量值的样本特征对训练得到,所述样本特征对包含样本流量特征和样本时间特征。
33.根据本说明书实施例的第三方面,提供了一种计算设备,包括:
34.存储器和处理器;
35.所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述流量预测方法的步骤。
36.根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述流量预测方法的步骤。
37.根据本说明书实施例的第五方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述流量预测方法的步骤。
38.本说明书一个或多个实施例提供的流量预测方法,获取目标对象在各指定时间段的历史流量值,其中,所述指定时间段基于当前时间段从预设历史时长内确定;根据所述历史流量值,确定目标流量特征,并确定所述当前时间段的目标时间特征;将所述目标流量特
征和所述目标时间特征输入预训练的流量预测模型,得到所述目标对象在所述当前时间段的目标流量值,所述流量预测模型基于携带有标签流量值的样本特征对训练得到,所述样本特征对包含样本流量特征和样本时间特征。通过各指定时间段的历史流量值,确定目标流量特征和目标时间特征,来预测目标对象的流量走势,也即流量值,提取特征少,计算量大大降低,能满足实时计算的需求。
附图说明
39.图1是本说明书一个实施例提供的一种流量预测方法的流程图;
40.图2是本说明书一个实施例提供的另一种流量预测方法的流程图;
41.图3是本说明书一个实施例提供的一种流量预测方法的处理过程流程图;
42.图4是本说明书一个实施例提供的一种流量预测装置的结构示意图;
43.图5是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
44.在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
45.在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
46.应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
47.首先,对本说明书一个或多个实施例提供的流量预测方法进行说明。
48.随着计算机技术和互联网技术的快速发展,网上用户的数量得到了快速增长,广告行业也从传统的线下广告模式,逐步转变为线上广告模式,同时,由于大数据分析技术的运用,线上广告模式相比于传统的线下广告模式也体现了巨大的优越性。
49.通过实时竞价方式投放在线广告,能够更为准确地将广告预算投入到更有可能产生回报的广告展现机会上,从而使广告收益得到优化,广告投放方需要为每个广告营销设置投放周期内的预算,因此在预算有限的情况下,对每次广告展现机会进行出价并给出合理的竞标价格是实时竞价的关键,需要满足广告预算的计划,同时也需要保证在广告活动周期内的相对平稳的预算消耗。为了实现该目标,需要针对各种历史行为数据进行分析,对流量的变化趋势进行预测来得到一个符合消耗趋势的分配计划来满足广告需求。
50.传统的流量预测,主要根据对请求的特征提取进行预测,可能存在成千上万种特征,如果不进行降维处理,运算量过大将很难进行运算。因此,现有技术主要从用户特征、上
下文、广告属性等上万个特征中,抽取出具有代表性的基准特征进行流量预测,当产生一次预测时,通过这几种基准特征为标准建立模型来预测流量值,这种方法需要极大的训练样本和训练时间,需要较大的计算成本以及服务器资源。
51.因此,本说明书一个或多个实施例提供的流量预测方法,获取目标对象在各指定时间段的历史流量值,其中,所述指定时间段基于当前时间段从预设历史时长内确定;根据所述历史流量值,确定目标流量特征,并确定所述当前时间段的目标时间特征;将所述目标流量特征和所述目标时间特征输入预训练的流量预测模型,得到所述目标对象在所述当前时间段的目标流量值,所述流量预测模型基于携带有标签流量值的样本特征对训练得到,所述样本特征对包含样本流量特征和样本时间特征。通过各指定时间段的历史流量值,确定目标流量特征和目标时间特征,来预测目标对象的流量走势,也即流量值,提取特征少,计算量大大降低,能满足实时计算的需求。
52.在本说明书中,提供了一种流量预测方法,本说明书同时涉及一种流量预测装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
53.参见图1,图1示出了根据本说明书一个实施例提供的一种流量预测方法的流程图,具体包括以下步骤。
54.步骤102:获取目标对象在各指定时间段的历史流量值,其中,所述指定时间段基于当前时间段从预设历史时长内确定。
55.具体的,对象是指与流量相关的任意一个事物,如广告位、直播、频道视频等;目标对象是指待进行流量预测的对象;时间段是指将一天的24小时分为多个时间段中的任意一个时间段,如将24小时分为12个时间段,则每个时间段为120分钟;当前时间段为此时此刻所处的时间段,也即当前时刻对应的时间段;预设历史时长是指当前时刻之前的一段时间,如当前时刻之前的7天,又如当前日期之前的5天,再如当前时间段之前的48个时间段组成的一段时间;指定时间段是指在预设历史时长内基于当前时间段确定的时间段,例如当前时间段为2月14日的第5个时间段,预设历史时长为2月11日至2月13日,则指定时间段可以时与当前时间段关联的时间段,如2月11日至2月13日三天内的第5个时间段,又如2月11日至2月13日三天内的第4个时间段;流量值是指对象在一段时间内长生成的流量数据。
56.在本说明书一个或多个可选的实施例中,在确定待预测流量的对象,也即目标对象的基础上,可以基于当前时间段和预设历史时长,先确定各指定时间段,然后直接获取目标对象在各指定时间段的历史流量数据。例如,当前时间段为1月8日的第3个时间段,历史时间段为1月1日至1月7日,则指定时间段为1月1日至1月7日这七天中的第1个时间段、第2个时间段和第3个时间段,然后获取目标对象在1月1日至1月7日七天中第1个时间段的历史流量值、第2个时间段的历史流量值和第3个时间段的历史流量值。
57.在本说明书一个或多个可选的实施例中,在确定待预测流量的对象,也即目标对象的基础上,可以先获取预设历史时长中各时间段的历史流量数据,然后在基于当前时间段和预设历史时长确定各指定时间段,然后从各时间段的历史流量数据提取出目标对象在各指定时间段的。沿用上例,先获取目标对象在1月1日至1月7日这七天中各时间段的历史流量值,然后基于当前时间段和历史时间段确定指定时间段为1月1日至1月7日这七天中的第1个时间段、第2个时间段和第3个时间段,再从1月1日至1月7日这七天中各时间段的历史流量值中,提取目标对象在1月1日至1月7日七天中第1个时间段的历史流量值、第2个时间
段的历史流量值和第3个时间段的历史流量值。
58.需要说明的是,由于指定时间段是基于当前时间段从预设历史时长内确定,即指定时间段为预设历史时长中与当前时间段关联的时间段;而预设历史时长内的任意一个时间段均可以认为与当前时间段关联。因此,指定时间段还可以是预设历史时长内的任意一个时间段,则各指定时间段可以组成预设历史时长,即获取目标对象在各指定时间段的历史流量值还可以为:获取目标对象在预设历史时长中各时间段的历史流量值。
59.步骤104:根据所述历史流量值,确定目标流量特征,并确定所述当前时间段的目标时间特征。
60.在获取目标对象在各指定时间段的历史流量值的基础上,进一步地,根据各指定时间段的历史流量值,确定目标流量特征,并确定当前时间段的目标时间特征。
61.具体的,目标流量特征是指基于历史流量值确定的流量特征;目标时间特征是指基于各指定时间段与当前时间段的关系确定的特征。
62.实际应用中,在获取了目标对象在各指定时间段的历史流量值之后,可以基于预设的流量特征提取方法对各指定时间段的历史流量值进行处理,得到目标时间特征,同时基于预设的时间特征提取方法,确定将各指定时间段分别与当前时间段进行对比,从而确定当前时间段的目标时间特征。
63.在本说明书一个或多个可选的实施例中,目标流量特征可以只包含一个流量特征,此时,只需要对基于预设的流量特征提取方法,对各指定时间段的历史流量值进行处理,得到一个流量特征,将该流量特征作为目标流量特征即可。
64.在本说明书一个或多个可选的实施例中,目标流量特征还可以包含多个子流量特征。在目标流量特征包含第一流量特征和第二流量特征的情况下,需要从各指定时间段的历史流量值中,分别提取出第一时间段的第一历史流量值和第二时间段的第二历史流量值,然后第一历史流量值确定第一流量特征、第二历史流量值确定第二流量特征。也即在目标流量特征包含第一流量特征和第二流量特征的情况下,所述根据所述历史流量值,确定目标流量特征,具体实现过程可以如下:
65.从所述各指定时间段的历史流量值中,提取第一时间段的第一历史流量值,根据所述第一历史流量值,确定所述第一流量特征,其中,所述第一时间段为所述各指定时间段中与所述当前时间段具有相同时间范围的时间段;
66.从所述各指定时间段的历史流量值中,提取第二时间段的第二历史流量值,根据所述第二历史流量值,确定所述第二流量特征,其中,所述第二时间段为所述各指定时间段中与所述当前时间段相邻的时间段。
67.具体的,第一时间段是指预设历史时长中,也即各指定时间段中与当前时间段时间范围相同的时间段,例如当前时间段为1月20日的第2个时间段,则第一时间段为各指定时间段中的代表第2个时间段的任意一个时间段,如各指定时间段包含1月18日至1月19日的第1个至第3个时间段,则1月18日的第2个时间段和1月19日的第2个时间段均为第一时间段;第一历史流量值为第一时间段的历史流量值;第一流量特征是目标流量特征的一个子流量特征;第二时间段是指预设历史时长中,也即各指定时间段中与当前时间段时间范围相邻的时间段,例如当前时间段为1月20日的第2个时间段,则第二时间段为各指定时间段中的代表第1个时间段或第2个时间段的任意一个时间段,如各指定时间段包含1月18日至1
月19日的第1个至第3个时间段,则第二时间段可以为1月18日和1月19日中第1个时间段和/或第2个时间段中的任意一个时间段;第二历史流量值为第二时间段的历史流量值;第二流量特征是目标流量特征的另一个子流量特征。
68.实际应用中,在目标流量特征包含第一流量特征和第二流量特征的情况下,可以先确定各指定时间段中与当前时间段具有相同时间范围的第一时间段,其中,第一时间段可以有一个,也可以有多个;然后基于各第一时间段从各指定时间段的历史流量值中,提取出第一历史流量值;接着基于预设的第一流量特征提取方法,对第一历史流量值进行处理,得到第一流量特征。同时,确定各指定时间段中与当前时间段具有相邻时间范围的第二时间段,第二时间段可以是当前时间段对应的上一时间段,也可以是当前时间段对应的下一时间段,且第二时间段可以有一个,也可以有多个;然后基于各第二时间段从各指定时间段的历史流量值中,提取出第二历史流量值,接着基于预设的第二流量特征提取方法,对第二历史流量值进行处理,得到第二流量特征。如此,对目标流量特征进行细分,基于第一历史流量值确定第一流量特征,基于第二历史流量值确定第二流量特征,可以提高目标流量特征的准确度,进而提高基于目标流量特征确定的目标流量值的准确度。
69.在本说明书一个或多个可选的实施例中,可以将各第一时间段的第一历史流量值进行加权求和处理,也即为每个第一历史流量值预先配置一定的权重,计算各第一历史流量值的加权和,得到第一流量特征,如式1所示;还可以将各第一时间段的第一历史流量值进行连乘处理,然后除以第一历史流量值的数量,得到第一流量特征,如式2所述。
[0070][0071]
式1中,lastdayreqs表示第一流量特征;k表示第一历史流量值的数量;bi表示第i个第一历史流量值;ai表示第i个第一历史流量值对应的权重。
[0072][0073]
式2中,lastdayreqs表示第一流量特征;k表示第一历史流量值的数量;bi表示第i个第一历史流量值。
[0074]
在本说明书一个或多个可选的实施例中,可以将各第二时间段的第二历史流量值按照第一历史流量值的处理方法进行处理,如将各第二历史流量值进行加权求和处理得到第二流量特征,又如将第二历史流量值进行连乘处理后再除以第二历史流量值的数量,得到第二流量特征。
[0075]
在本说明书一个或多个可选的实施例中,还可以基于各第二时间段的第二历史流量值计算第二历史流量值的平滑度,进而基于平滑度来确定第二流量值,也即所述根据所述第二历史流量值,确定所述第二流量特征,具体实现过程可以如下:
[0076]
计算所述第二历史流量值的平滑度;
[0077]
根据所述平滑度,确定所述第二流量特征。
[0078]
具体的,平滑度是指衡量各第二历史流量值之间平滑程度的一个系数。
[0079]
实际应用中,在获得了各第二时间段的第二历史流量值之后,可以将各第二历史流量值输入至预设的平滑函数中,进而得到第二历史流量值的平滑度。然后,可以基于平滑度的数值,选择对应的流量特征作为第二流量特征;还可以将平滑度输入至预设的转换函
数中,得到第二流量特征。如此,基于平滑度确定第二流量特征,有利于提高第二流量特征的可信度和精准度,进而提高流量预测的精确度和效率。
[0080]
在本说明书一个或多个可选的实施例中,在确定平滑度之后,查看平滑度是否符合预设平滑条件,基于平滑度是否符合预设平滑条件,从而选择对应的流量特征作为第二流量特征。也即,所述根据所述平滑度,确定所述第二流量特征,包括:
[0081]
根据所述平滑度,判断所述第二历史流量值是否符合预设平滑条件;
[0082]
根据判断结果,确定所述第二流量特征。
[0083]
具体的,预设平滑条件是指用于衡量平滑度是否正常,也即衡量第二历史流量值是否平滑而设置的条件。
[0084]
实际应用中,在确定了平滑度之后,将平滑度与预设的平滑阈值及逆行比较,其中,平滑阈值可以基于人为经验进行设置。若平滑度大于平滑阈值,则确定第二历史流量值不符合预设平滑条件,将预设流量特征确定为第二流量特征;若平滑度小于或等于平滑阈值,则确定第二历史流量值符合预设平滑条件,将任意一个第二历史流量值确定为第二流量特征。如
[0085]
式3所示。
[0086][0087]
式3中,lastslotreqs为第二流量特征;originallastreqs为任意一个第二历史流量值;m为平滑度,n为平滑阈值;defaultlastreqs为预设流量特征。
[0088]
优选地,在平滑度小于或等于平滑阈值的情况下,也即第二历史流量值符合预设平滑条件的情况下,将与当前时间段对应的星期一样的第二历史流量值确定为第二流量特征,例如当前时间段为星期五的第6个时间段,则将各第二历史流量值中为属于星期五的第二历史流量值确定为第二流量特征。此外,预设流量特征为将各第二历史流量值进行连乘的积,如式4所示。
[0089][0090]
式4中,lastslotreqs表示第二流量特征;p表示第一历史流量值的数量;ci表示第i个第二历史流量值。
[0091]
在本说明书一个或多个可选的实施例中,可以在计算第二历史流量值的平滑度时,可以先计算第二历史流值的加权和以及方差,在基于计算结果确定平滑度。也即计算所述第二历史流量值的平滑度,具体实现过程可以如下:
[0092]
计算所述第二历史流量值的加权和与方差;
[0093]
根据所述加权和与方差,确定所述第二历史流量值的平滑度。
[0094]
实际应用中,可以将各第二时间段的第二历史流量值进行加权求和处理,也即为每个第二历史流量值预先配置一定的权重,计算各第二历史流量值的加权和,如式5所示,优选地,所述加权和为第二历史流量值的均值,参见式6;同时计算各第二时间段的第二历史流量值的方差,如式7所示,然后按照式8所式的公式计算第二历史流量值的平滑度。
[0095][0096]
式5中,weightedsum表示第二历史流量值的加权和;q表示第二历史流量值的数量;ci表示第i个第二历史流量值;di表示第i个第二历史流量值对应的权重。
[0097][0098]
式6中,avg表示第二历史流量值的均值;q表示第二历史流量值的数量;ci表示第i个第二历史流量值。
[0099][0100]
式7中,std2表示第二历史流量值的方差;avg表示第二历史流量值的均值;q表示第二历史流量值的数量;ci表示第i个第二历史流量值。
[0101]
在本说明书一个或多个可选的实施例中,在确定所述当前时间段的目标时间特征时,可以将各指定时间段与所述当前时间段进行对比,根据对比结果确定所述当前时间段的目标时间特征。对比结果中包括至少一个子对比结果,也即每个指定时间段与当前时间段的对比得到一个子对比结果:也即针对指定时间段中的任意一个指定时间段,若该指定时间段与当前时间段具有相同时间范围,则该子对比结果为第一数值;若该指定时间段与当前时间段不具有相同时间范围,则该子对比结果为第二数值;优选地,第一数值为1,第二数值为0,参见式8。遍历各指定时间段,确定各子对比结果,将各子对比结果进行组合,得到当前时间段的目标时间特征。
[0102][0103]
式8中,slotnum表示某指定时间段与当前时间段的子对比结果;h表示当前时间段对应的时间范围;j表示该指定时间段对应的时间范围。
[0104]
需要说明的是,在获取目标对象在预设历史时长中各时间段的历史流量值的情况下,目标时间特征可以为长度为t的一个二进制的一维数组,其中t为一天中划分的时间段的总数。例如,将一天分为24个时间段,则每天的每个时间段为一个小时,若当前时间段为第6个时间段,则目标时间特征为[0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]。
[0105]
步骤106:将所述目标流量特征和所述目标时间特征输入预训练的流量预测模型,得到所述目标对象在所述当前时间段的目标流量值,所述流量预测模型基于携带有标签流量值的样本特征对训练得到,所述样本特征对包含样本流量特征和样本时间特征。
[0106]
具体的,流量预测模型是指预先训练好的一种回归模型,该回归模型可以预测的目标流量值。
[0107]
实际应用中,在确定了目标流量特征和目标时间特征之后,将目标流量特征和目标时间特征输入至预训练的流量预测模型,也即将目标流量特征和目标时间特征代入至如式9所示的公式中,得到目标对象在当前时间段的目标流量值。
[0108]
f(d,o)=w
t
x(d,o) b
ꢀꢀꢀ
(式9)
[0109]
式9中,(d,o)表示当前时间段;f(d,o)表示当前时间段的目标流量值;x(d,o)表示目标特征对,也即目标流量特征和目标时间特征;w和b为流量预测模型的两个参数。
[0110]
此外,在目标流量特征包含第一流量特征和第二流量特征的情况下,x(d,o)表示第一流量特征、第二流量特征和目标时间特征,如x(d,o)[lastdayreqs,lastslotreqs,slotnum],其中lastdayreqs为第二流量特征,lastslotreqs为第一流量特征,slotnum为目标时间特征。
[0111]
需要说明的是,在使用流量预测模型之前,还需要对流量预测模型进行训练,也即对预先拟合的回归模型进行训练。因此,所述将所述目标流量特征和所述目标时间特征输入预训练的流量预测模型之前,还包括:
[0112]
获取携带有标签流量值的样本特征对;
[0113]
将所述样本特征对中的所述样本流量特征和所述样本时间特征输入至预先拟合的回归模型中,得到所述样本特征对的预测流量值;
[0114]
根据所述预测流量值与所述标签流量值,计算损失值;
[0115]
若所述损失值大于预设阈值,则调整所述回归模型的参数,并返回执行所述获取携带有标签流量值的样本特征对的步骤,直至达到训练停止条件,停止训练,确定完成训练的回归模型为流量预测模型。
[0116]
具体的,样本特征对是指任意一个历史时间段,也即样本时间段对应的样本流量特征和样本时间特征;标签流量值是指该样本时间段的实际的流量值,也即实际值;回归(r,regression)模型对统计关系进行定量描述的一种数学模型,优选地,回归模型为逻辑回归(lr,logistic regression)模型;预测流量值是指回归模型对样本流量特征和样本时间特征进行预测,得到的样本时间段的流量值;损失值是指基于预测流量值与标签流量值的差异性确定的数值;预设阈值是指预先设置的一个数值,用于衡量回归模型是否达标;训练停止条件可以是损失值小于或等于预设阈值,还可以是迭代训练次数达到预设迭代值。
[0117]
实际应用中,可以从预设的样本库中获取一个携带有标签流量值的样本特征对,然后将样本特征对中的样本流量特征和样本时间特征代入至预先拟合的回归模型中,进行计算,得到回归模型的输出结果,也即预测流量值。然后将预测流量值与标签流量值进行对比,也即将预测流量值与标签流量值输入至预设的损失函数中进行计算,得到损失值,其中,损失函数如式10所示;进而比较损失值与预设阈值的大小,在损失值大于预设阈值,调整回归模型的参数,然后再次从预设的样本库中获取一个携带有标签流量值的样本特征对,进行下一轮训练。当损失值小于或等于预设阈值,或者迭代训练次数达到预设迭代值时,停止训练,将训练好的回归模型确定为流量预测模型。为了调整回归模型的参数,结合式9和式10,对于损失函数求取偏导数如式11所示,将损失值最小化的问题转变为损失函数的极值点为偏导数为0的点。求解式11的方程组可以得到如式12所示的结果。
[0118][0119]
[0120][0121]
式10、式11和式12中,j(w,b)表示损失值;w和b为回归模型的两个参数;d表示预设历史时长的天数;o表示一天中划分的时间段的总数;(d,o)表示样本时间段;f(d,o)表示样本时间段的预测流量值;y(d,o)表示样本时间段的实际流量值,也即标签流量值;x(d,o)表示样本特征对,也即样本流量特征和样本时间特征。
[0122]
本说明书提供的流量预测方法,主要通过基于时间序进行流量预测,分为两部分特征提取以及流量预测模型的训练。流量特征提取主要是对历史的流量数据进行分析,即主要是对历史流量值进行分析来选择与当前时间段关联性强的特征。流量特征提取主要是生成满足流量变化的预测模型。
[0123]
以广告为例进行说明:在实际的广告系统中,广告流量高度依赖用户的行为,与此同时,用户的行为模式具有一定的规律性:工作日和休息日、白天和晚上所带来的流量均有迹可循。因此,通过分析用户的行为来预测广告位的流量趋势具有一定的可操作性,由于不同的时间段流量差异较大,设计将一天的时间分为o个时间段,如果o=24,则每天的每个时间段为一个小时,因此,对流量问题的分析模型可以量化为对以下公式的求极值的问题。
[0124]
arg
θ
min∑loss(h(x
d,o
;θ),y
d,o
),1≤d≤d,1≤o≤o
ꢀꢀꢀ
(式13)
[0125]
式13中,x
d,o
表示流量特征和时间特征,y
d,o
表示时间流量值。
[0126]
具体可以分为以下步骤:
[0127]
s1:从历史流量值出发,选择最近7天(d=7)的历史流量值进行预估,将一天分为t=48个时间段,则每天的每个时间段为30分钟,获取的各历史流量值计为reqs(d,t),其中d为前d天,t为时间段对应的值。
[0128]
s2:特征选取。选择三个特征如下:
[0129]
1)lastdayreqs:最近d天中与当前时间段相同的时间段的流量值,也即第一流量特征;
[0130]
2)lastslotreqs:当前时间段的上一个时间段的流量值,也即第二流量特征;
[0131]
3)slotnum:当前时间段的向量,其中slotnum是长度为48的一个二进制的一维数组。
[0132]
s3-1:计算lastslotreqs。
[0133]
首先,获取到最近7天的上一个时间段的流量值,从中取前7天上一个时间段的流量值,计为originallastreqs;然后,计算近7天上一个时间段的算术平均值和几何平均值,也即均值和方差;然后基于originallastreqs、算术平均值和几何平均值计算平滑度,判断上一个时间段的流量值是否是异常流量,如果是正常流量,则不进行平滑,否则进行平滑操作得到最终的上一个时间段的流量值,也即若平滑度大于平滑阈值,则确定lastslotreqs为各上一个时间段的流量值进行连乘的积,若平滑度小于或等于平滑阈值,则确定lastslotreqs为originallastreqs。
[0134]
s3-2:计算lastdayreqs。
[0135]
由于lastdayreqs代表着对于流量值的一种长期的效应,如果流量值呈现一种上升或者下降的趋势,该特征需要能反应出这种趋势,取得这些值连乘积的均值即可:将最近d天当前时间段对应的流量值进行连乘处理,然后除以最近d天当前时间段的数量,得到lastdayreqs。
[0136]
s3-3:计算slotnum。
[0137]
s4:线性回归模型的建立,也即流量预测模型的建立。针对给出的数据,拟合出一个能够较为准确预测出输出结果的线性模型。
[0138]
s5:将lastdayreqs、lastslotreqs和slotnum代入到流量预测模型即可计算出目标流量值。
[0139]
参见图2,图2示出了本说明书一个实施例提供的另一种流量预测方法的流程图:先利用样本特征对训练得到流量预测模型;然后从当前时间段开始执行,获取近d天的历史流量值;接着更新上一个时间段的流量值,基于近d天的历史流量值,获取目标流量特征和目标时间特征,在获取目标流量特征的同时进行平滑检测。进一步地,将目标流量特征和目标时间特征输入至流量预测模型,预测得到目标流量值。
[0140]
此外,还可以利用前d天的历史流量值训练得到流量预测模型:首先取出前d天对应的样本特征对,也即历史特征对训练出当天需要用到的流量预测模型,当需要进行预测的时间点,也即当前时间段来到时,通过流量预测模型来得到当前时间段对应的目标流量值。
[0141]
本说明书一个或多个实施例提供的流量预测方法,获取目标对象在各指定时间段的历史流量值,其中,所述指定时间段基于当前时间段从预设历史时长内确定;根据所述历史流量值,确定目标流量特征,并确定所述当前时间段的目标时间特征;将所述目标流量特征和所述目标时间特征输入预训练的流量预测模型,得到所述目标对象在所述当前时间段的目标流量值,所述流量预测模型基于携带有标签流量值的样本特征对训练得到,所述样本特征对包含样本流量特征和样本时间特征。通过各指定时间段的历史流量值,确定目标流量特征和目标时间特征,来预测目标对象的流量走势,也即流量值,提取特征少,计算量大大降低,能满足实时计算的需求。也即通过时间段以及历史天级别的历史流量值的特征作为输入,通过时间段窗口流量来减少窗口粒度异常流量对预估的影响,同时天级别流量特征来模拟流量的变化趋势,针对流量的异常激增以及流量的大趋势变化均能保证预测误差精度。
[0142]
下述结合附图3,以本说明书提供的流量预测方法在广告场景的应用为例,对所述流量预测方法进行进一步说明。其中,图3示出了本说明书一个实施例提供的一种流量预测方法的处理过程流程图,具体包括以下步骤。
[0143]
步骤302:获取目标广告位在各指定时间段的历史流量值,其中,指定时间段基于当前时间段从预设历史时长内确定。
[0144]
步骤304:从各指定时间段的历史流量值中,提取第一时间段的第一历史流量值。
[0145]
步骤306:根据第一历史流量值,确定第一流量特征。
[0146]
其中,第一时间段为各指定时间段中与当前时间段具有相同时间范围的时间段。
[0147]
步骤308:从各指定时间段的历史流量值中,提取第二时间段的第二历史流量值。
[0148]
步骤310:计算第二历史流量值的加权和与方差。
[0149]
步骤312:根据加权和与方差,确定第二历史流量值的平滑度。
[0150]
步骤314:根据平滑度,判断第二历史流量值是否符合预设平滑条件。
[0151]
步骤316:根据判断结果,确定第二流量特征。
[0152]
其中,第二时间段为各指定时间段中与当前时间段相邻的时间段。
[0153]
步骤318:将第一流量特征、第二流量特征和目标时间特征输入预训练的流量预测模型,得到目标广告位在当前时间段的目标流量值。
[0154]
可选地,将第一流量特征、第二流量特征和目标时间特征输入预训练的流量预测模型之前,还包括:
[0155]
获取携带有标签流量值的样本特征对;
[0156]
将样本特征对中的第一样本流量特征、第二样本流量特征和样本时间特征输入至预先拟合的回归模型中,得到样本特征对的预测流量值;
[0157]
根据预测流量值与标签流量值,计算损失值;
[0158]
若损失值大于预设阈值,则调整回归模型的参数,并返回执行获取携带有标签流量值的样本特征对的步骤,直至达到训练停止条件,停止训练,确定完成训练的回归模型为流量预测模型。
[0159]
本说明书一个或多个实施例提供的流量预测方法,通过各指定时间段的历史流量值,确定目标流量特征和目标时间特征,来预测目标对象的流量走势,也即流量值,提取特征少,计算量大大降低,能满足实时计算的需求。
[0160]
与上述方法实施例相对应,本说明书还提供了流量预测装置实施例,图4示出了本说明书一个实施例提供的一种流量预测装置的结构示意图。如图4所示,该装置包括:
[0161]
获取模块402,被配置为获取目标对象在各指定时间段的历史流量值,其中,所述指定时间段基于当前时间段从预设历史时长内确定;
[0162]
确定模块404,被配置为根据所述历史流量值,确定目标流量特征,并确定所述当前时间段的目标时间特征;
[0163]
预测模块406,被配置为将所述目标流量特征和所述目标时间特征输入预训练的流量预测模型,得到所述目标对象在所述当前时间段的目标流量值,所述流量预测模型基于携带有标签流量值的样本特征对训练得到,所述样本特征对包含样本流量特征和样本时间特征。
[0164]
可选地,所述目标流量特征包括第一流量特征和第二流量特征;
[0165]
所述确定模块404,还被配置为:
[0166]
从所述各指定时间段的历史流量值中,提取第一时间段的第一历史流量值,根据所述第一历史流量值,确定所述第一流量特征,其中,所述第一时间段为所述各指定时间段中与所述当前时间段具有相同时间范围的时间段;
[0167]
从所述各指定时间段的历史流量值中,提取第二时间段的第二历史流量值,根据所述第二历史流量值,确定所述第二流量特征,其中,所述第二时间段为所述各指定时间段中与所述当前时间段相邻的时间段。
[0168]
可选地,所述确定模块404,还被配置为:
[0169]
计算所述第二历史流量值的平滑度;
[0170]
根据所述平滑度,确定所述第二流量特征。
[0171]
可选地,所述确定模块404,还被配置为::
[0172]
根据所述平滑度,判断所述第二历史流量值是否符合预设平滑条件;
[0173]
根据判断结果,确定所述第二流量特征。
[0174]
可选地,所述确定模块404,还被配置为:
[0175]
计算所述第二历史流量值的加权和与方差;
[0176]
根据所述加权和与方差,确定所述第二历史流量值的平滑度。
[0177]
可选地,所述确定模块404,还被配置为::
[0178]
将各指定时间段与所述当前时间段进行对比,根据对比结果确定所述当前时间段的目标时间特征。
[0179]
可选地,所述装置还包括训练模块,被配置为:
[0180]
获取携带有标签流量值的样本特征对;
[0181]
将所述样本特征对中的所述样本流量特征和所述样本时间特征输入至预先拟合的回归模型中,得到所述样本特征对的预测流量值;
[0182]
根据所述预测流量值与所述标签流量值,计算损失值;
[0183]
若所述损失值大于预设阈值,则调整所述回归模型的参数,并返回执行所述获取携带有标签流量值的样本特征对的步骤,直至达到训练停止条件,停止训练,确定完成训练的回归模型为流量预测模型。
[0184]
本说明书一个或多个实施例提供的流量预测装置,获取目标对象在各指定时间段的历史流量值,其中,所述指定时间段基于当前时间段从预设历史时长内确定;根据所述历史流量值,确定目标流量特征,并确定所述当前时间段的目标时间特征;将所述目标流量特征和所述目标时间特征输入预训练的流量预测模型,得到所述目标对象在所述当前时间段的目标流量值,所述流量预测模型基于携带有标签流量值的样本特征对训练得到,所述样本特征对包含样本流量特征和样本时间特征。通过各指定时间段的历史流量值,确定目标流量特征和目标时间特征,来预测目标对象的流量走势,也即流量值,提取特征少,计算量大大降低,能满足实时计算的需求。
[0185]
上述为本实施例的一种流量预测装置的示意性方案。需要说明的是,该流量预测装置的技术方案与上述的流量预测方法的技术方案属于同一构思,流量预测装置的技术方案未详细描述的细节内容,均可以参见上述流量预测方法的技术方案的描述。
[0186]
图5示出了根据本说明书一个实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接,数据库550用于保存数据。
[0187]
计算设备500还包括接入设备540,接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(pstn,public switched telephone network)、局域网(lan,local area network)、广域网(wan,wide area network)、个域网(pan,personal area network)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic,network interface controller))中的一个或多个,诸如ieee802.11无线局域网(wlan,wireless local area network)无线接口、全球微波互联接入(wi-max,worldwide interoperability for microwave access)接口、以太网接口、通用串行总线(usb,
universal serial bus)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc,near field communication)接口,等等。
[0188]
在本说明书的一个实施例中,计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图5所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0189]
计算设备500可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备500还可以是移动式或静止式的服务器。
[0190]
其中,处理器520用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述流量预测方法的步骤。
[0191]
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的流量预测方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述流量预测方法的技术方案的描述。
[0192]
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述流量预测方法的步骤。
[0193]
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的流量预测方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述流量预测方法的技术方案的描述。
[0194]
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述流量预测方法的步骤。
[0195]
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的流量预测方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述流量预测方法的技术方案的描述。
[0196]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0197]
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。
[0198]
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域
技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
[0199]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0200]
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献