话务量预测模型构建方法、装置及计算机可读存储介质与流程

2023-02-19 01:31:33 来源：中国专利 TAG：

1.本技术涉及信息处理技术领域，具体涉及一种话务量预测模型构建方法、装置及计算机可读存储介质。

背景技术：

2.随着信息技术的快速发展，在各行各业均会存在相应的售后服务，而目前最常见的售后服务是直接通过电话进行售后服务。而目前，人们生活、工作中的很多事务都可以通过互联网来处理和展现，如转账、支付、购物等等。而随着互联网的广泛应用，随之而来的则是对客服的需求越来越多。因此，客服的话务量也是越来越多。
3.然而，由于话务业务范围会随着营运策略的变更而发生变更(如人工话务可能会因为智能语音的引入而减少或人工话务量出现转移的情况)，导致历史话务数据分布与未来话务数据分布存在不一致，不满足传统预测方法数据一致性的假设。如果不针对该问题进行优化，预测模型会给出与实际话务存在较大出入的预测结果，模型预测精度低。
4.因此，如何有效提高话务量预测模型的预测精度，是当前信息处理技术领域亟需解决的技术问题。

技术实现要素：

5.本技术提供一种话务量预测模型构建方法、装置及计算机可读存储介质，旨在解决如何有效提高话务量预测模型的预测精度。
6.一方面，本技术提供一种话务量预测模型构建方法，所述方法包括：
7.获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量；
8.获取第一时间段内所述第一呼叫中心的转移占比值，所述转移占比值为所述目标话务量与所述第一呼叫中心转移前的总话务量的比值；
9.根据所述第一呼叫中心转移前的总话务量和所述转移占比值，确定所述第一时间段内从所述第一呼叫中心转移目标话务量至所述第二呼叫中心的话务转移信息；
10.将所述第二呼叫中心转移前的总话务量和所述话务转移信息进行加和，以重构所述第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；
11.基于所述目标历史话务数据，构建目标话务量预测模型。
12.在本技术一种可能的实现方式中，所述第一时间段包括第二时间段和第三时间段，所述第二时间段为所述第一时间段内可统计话务转移信息的时间范围长度，所述第三时间段为所述第一时间段内不可统计话务转移信息的时间范围长度；
13.所述获取第一时间段内所述第一呼叫中心的转移占比值，包括：
14.获取所述第二时间段内第一呼叫中心的第一转移占比值；
15.通过所述第一转移占比值，计算第三时间段内所述第一呼叫中心的转移占比估计值；
16.基于所述第一转移占比值和所述转移占比估计值，确定第一时间段内所述第一呼
叫中心的转移占比值。
17.在本技术一种可能的实现方式中，所述基于所述目标历史话务数据，构建目标话务量预测模型，包括：
18.从所述目标历史话务数据中确定训练样本数据；
19.基于所述训练样本数据，建立初级话务量预测模型。
20.调整所述初级话务量预测模型中的参数，得到目标话务量预测模型。
21.在本技术一种可能的实现方式中，所述调整所述初级话务量预测模型中的参数，得到目标话务量预测模型，包括：
22.获取第四时间段内的第二历史话务信息；
23.对所述第二历史话务信息进行预处理，生成第三历史话务信息；
24.获取预先生成的模型候选参数；
25.基于所述第三历史话务信息和所述模型候选参数，调整述初级话务量预测模型中的参数，得到目标话务量预测模型。
26.在本技术一种可能的实现方式中，所述基于所述第三历史话务信息和所述模型候选参数，调整述初级话务量预测模型中的参数，得到目标话务量预测模型，包括：
27.基于所述第三历史话务信息和所述模型候选参数，确定模型最优参数；
28.基于所述最优参数，调整所述初级话务量预测模型中的参数，得到目标话务量预测模型。
29.在本技术一种可能的实现方式中，所述基于所述第三历史话务信息和所述模型候选参数，确定模型最优参数，包括：
30.基于所述第三历史话务信息，建立中级话务量预测模型；
31.通过所述中级话务量预测模型对第五时间段内话务量进行预测，得到第一话务量预测数据；
32.基于所述第一话务量预测数据，计算所述第四时间段内的滚动预测误差数据；
33.基于所述滚动预测误差数据和所述模型候选参数，确定模型最优参数。
34.另一方面，本技术提供一种话务量预测方法，所述方法包括：
35.获取第六时间段内的历史话务数据；
36.将所述历史话务数据输入目标话务量预测模型中，对第七时间段内的话务量进行预测，其中，所述第七时间段在所述第六时间段之后，所述目标话务量预测模型上述实现方式所述的目标话务量预测模型。
37.另一方面，本技术提供一种话务量预测模型构建装置，所述装置包括：
38.第一获取单元，用于获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量；
39.第二获取单元，用于获取第一时间段内所述第一呼叫中心的转移占比值，所述转移占比值为所述目标话务量与所述第一呼叫中心转移前的总话务量的比值；
40.第一确定单元，用于根据所述第一呼叫中心转移前的总话务量和所述转移占比值，确定所述第一时间段内从所述第一呼叫中心转移目标话务量至所述第二呼叫中心的话务转移信息；
41.第一重构单元，用于将所述第二呼叫中心转移前的总话务量和所述话务转移信息
进行加和，以重构所述第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；
42.第一构建单元，用于基于所述目标历史话务数据，构建目标话务量预测模型。
43.在本技术一种可能的实现方式中，所述第一时间段包括第二时间段和第三时间段，所述第二时间段为所述第一时间段内可统计话务转移信息的时间范围长度，所述第三时间段为所述第一时间段内不可统计话务转移信息的时间范围长度；
44.所述第二获取单元，具体用于：
45.获取所述第二时间段内第一呼叫中心的第一转移占比值；
46.通过所述第一转移占比值，计算第三时间段内所述第一呼叫中心的转移占比估计值；
47.基于所述第一转移占比值和所述转移占比估计值，确定第一时间段内所述第一呼叫中心的转移占比值。
48.在本技术一种可能的实现方式中，所述第一构建单元，具体包括：
49.第二确定单元，用于从所述目标历史话务数据中确定训练样本数据；
50.第一建立单元，用于基于所述训练样本数据，建立初级话务量预测模型。
51.第一调整单元，用于调整所述初级话务量预测模型中的参数，得到目标话务量预测模型。
52.在本技术一种可能的实现方式中，所述第一调整单元具体包括：
53.第三获取单元，用于获取第四时间段内的第二历史话务信息；
54.第一预处理单元，用于对所述第二历史话务信息进行预处理，生成第三历史话务信息；
55.第四获取单元，用于获取预先生成的模型候选参数；
56.第二调整单元，用于基于所述第三历史话务信息和所述模型候选参数，调整述初级话务量预测模型中的参数，得到目标话务量预测模型。
57.在本技术一种可能的实现方式中，所述第二调整单元，具体包括：
58.第三确定单元，用于基于所述第三历史话务信息和所述模型候选参数，确定模型最优参数；
59.第三调整单元，用于基于所述最优参数，调整所述初级话务量预测模型中的参数，得到目标话务量预测模型。
60.在本技术一种可能的实现方式中，所述第三确定单元，具体用于：
61.基于所述第三历史话务信息，建立中级话务量预测模型；
62.通过所述中级话务量预测模型对第五时间段内话务量进行预测，得到第一话务量预测数据；
63.基于所述第一话务量预测数据，计算所述第四时间段内的滚动预测误差数据；
64.基于所述滚动预测误差数据和所述模型候选参数，确定模型最优参数。
65.另一方面，本技术还提供一种计算机设备，所述计算机设备包括：
66.一个或多个处理器；
67.存储器；以及
68.一个或多个应用程序，其中所述一个或多个应用程序被存储于所述存储器中，并
配置为由所述处理器执行以实现所述的话务量预测模型构建方法。
69.另一方面，本技术还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器进行加载，以执行所述的话务量预测模型构建方法中的步骤。
70.本技术由于通过先获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量；并获取第一时间段内第一呼叫中心的转移占比值，转移占比值为目标话务量与第一呼叫中心转移前的总话务量的比值；然后根据第一呼叫中心转移前的总话务量和转移占比值，确定第一时间段内从第一呼叫中心转移目标话务量至第二呼叫中心的话务转移信息；再将第二呼叫中心转移前的总话务量和话务转移信息进行加和，以重构第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；最后基于目标历史话务数据，构建目标话务量预测模型。因此，能够根据业务变更修复历史话务数据，并自动快速适应最新的数据分布，不需要额外的人工调整过程，从而解决业务变更导致的话务量预测模型的预测精度下降的问题，使得重构后的话务量预测模型的预测精度更高。
附图说明
71.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
72.图1是本技术实施例提供的话务量预测模型构建系统的场景示意图；
73.图2是本技术实施例中提供的话务量预测模型构建方法的一个实施例流程示意图；
74.图3是本技术实施例中提供的步骤202的一个实施例流程示意图；
75.图4是本技术实施例中提供的步骤205的一个实施例流程示意图；
76.图5是本技术实施例中提供的步骤403的一个实施例流程示意图；
77.图6是本技术实施例中提供的步骤504的一个实施例流程示意图；
78.图7是本技术实施例中提供的步骤601的一个实施例流程示意图；
79.图8是本技术实施例中提供的话务量预测方法的一个实施例流程示意图；
80.图9是本技术实施例中提供的话务量预测模型构建装置的一个实施例结构示意图；
81.图10是本技术实施例中提供的计算机设备的一个实施例结构示意图。
具体实施方式
82.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
83.在本技术的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本技术和简化描
述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本技术的限制。此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本技术的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。
84.在本技术中，“示例性”一词用来表示“用作例子、例证或说明”。本技术中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任何技术人员能够实现和使用本技术，给出了以下描述。在以下描述中，为了解释的目的而列出了细节。应当明白的是，本领域普通技术人员可以认识到，在不使用这些特定细节的情况下也可以实现本技术。在其它实例中，不会对公知的结构和过程进行详细阐述，以避免不必要的细节使本技术的描述变得晦涩。因此，本技术并非旨在限于所示的实施例，而是与符合本技术所公开的原理和特征的最广范围相一致。
85.本技术实施例提供一种话务量预测模型构建方法、装置及计算机可读存储介质，以下分别进行详细说明。
86.如图1所示，图1是本技术实施例提供的话务量预测模型构建系统的场景示意图，该话务量预测模型构建系统可以包括多个终端100和服务器200，终端100和服务器200网络连接，服务器200中集成有话务量预测模型构建装置，如图1中的服务器，终端100可以访问服务器200。
87.本技术实施例中服务器200主要用于获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量；获取第一时间段内第一呼叫中心的转移占比值，转移占比值为目标话务量与第一呼叫中心转移前的总话务量的比值；根据第一呼叫中心转移前的总话务量和转移占比值，确定第一时间段内从第一呼叫中心转移目标话务量至第二呼叫中心的话务转移信息；将第二呼叫中心转移前的总话务量和话务转移信息进行加和，以重构第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；基于目标历史话务数据，构建目标话务量预测模型。
88.本技术实施例中，该服务器200可以是独立的服务器，也可以是服务器组成的服务器网络或服务器集群，例如本技术实施例中所描述的服务器200，其包括但不限于计算机、网络终端、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。其中，云服务器由基于云计算(cloud computing)的大量计算机或网络服务器构成。本技术的实施例中，服务器与终端之间可通过任何通信方式实现通信，包括但不限于，基于第三代合作伙伴计划(3rd generation partnership project，3gpp)、长期演进(long term evolution，lte)、全球互通微波访问(worldwide interoperability for microwave access，wimax)的移动通信，或基于tcp/ip协议族(tcp/ip protocol suite，tcp/ip)、用户数据报协议(user datagram protocol，udp)的计算机网络通信等。
89.可以理解的是，本技术实施例中所使用的终端100可以是既包括接收和发射硬件的设备，既具有能够在双向通信链路上，执行双向通信的接收和发射硬件的设备。这种终端可以包括：蜂窝或其他通信设备，其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备。具体的终端100具体可以是台式终端或移动终端，终端100具体还可以是手机、平板电脑、笔记本电脑等中的一种。
90.本领域技术人员可以理解，图1中示出的应用环境，仅仅是与本技术方案的一种应用场景，并不构成对本技术方案应用场景的限定，其他的应用环境还可以包括比图1中所示更多或更少的终端，或者服务器网络连接关系，例如图1中仅示出1个服务器和2个终端。可以理解的，该话务量预测模型构建系统还可以包括一个或多个其他服务器，或/且一个或多个与服务器网络连接的终端，具体此处不作限定。
91.另外，如图1所示，该话务量预测模型构建系统还可以包括存储器300，用于存储数据，如存储用户话务量预测数据和话务量预测模型构建数据，例如话务量预测模型构建系统运行时的话务量预测模型构建数据。
92.需要说明的是，图1所示的话务量预测模型构建系统的场景示意图仅仅是一个示例，本技术实施例描述的话务量预测模型构建系统以及场景是为了更加清楚的说明本技术实施例的技术方案，并不构成对于本技术实施例提供的技术方案的限定，本领域普通技术人员可知，随着话务量预测模型构建系统的演变和新业务场景的出现，本技术实施例提供的技术方案对于类似的技术问题，同样适用。
93.接下来，介绍本技术实施例提供的话务量预测模型构建方法。
94.本申实施例话务量预测模型构建方法的实施例中以话务量预测模型构建装置作为执行主体，为了简化与便于描述，后续方法实施例中将省略该执行主体，该话务量预测模型构建装置应用于计算机设备，该方法包括：获取第一时间段内从第一呼叫中心转移目标话务量至第二呼叫中心的话务转移信息；基于话务转移信息，重构第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；基于目标历史话务数据，构建目标话务量预测模型。
95.请参阅图2至图10，图2为本技术实施例中提供的话务量预测模型构建方法的一个实施例流程示意图，该话务量预测模型构建方法包括步骤201至步骤205：
96.201、获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量。
97.呼叫中心就是在一个相对集中的场所，由一批服务人员组成的服务机构.通常利用计算机通信技术，处理来自企业、顾客的电话垂询，尤其具备同时处理大量来话的能力，还具备主叫号码显示，可将来电自动分配给具备相应技能的人员处理，并能记录和储存所有来话信息。呼叫中心，又称客户服务中心，起源于20世纪30年代，最初是把用户的呼叫转移到应答台或者专家处。此后，随着要转移的呼叫和应答增多，开始建立起交互式语音应答系统，这种系统能把客户部分常见问题的应答实现由机器“自动话务员”来应答和处理。传统意义上的呼叫中心，是指以电话接入为主的呼叫响应中心，为客户提供各种电话响应服务。
98.对于一些大型企业，由于该企业的服务范围可能辐射到全国各地，单个的呼叫中心已经无法满足实际需求，并且由于全国各个地区之间的风俗习惯存在一定差异，其服务也会需要相应的适配与调整，因此，会在全国各地按照一定的区域划分，设定相应的呼叫中心，从而即使是一个企业，也会存在多个呼叫中心的情况，例如a呼叫中心负责华中和华南区域的非投诉话务，b呼叫中心负责华中和华南区域的投诉话务，c呼叫中心负责华北和华东区域的非投诉话务，d呼叫中心负责华北和华东区域的投诉话务。而由于企业运营策略的变更，因此，会出现呼叫中心之间的话务转移的情况，例如将呼叫中心负责的华中区域的非投诉话务转移至c呼叫中心。
99.其中，每个呼叫中心都会保存预设时间段内的话务量信息，这些话务量信息可以保存在相应的数据库中，因此，可以该数据库中获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量。
100.202、获取第一时间段内第一呼叫中心的转移占比值。
101.其中，转移占比值为目标话务量与第一呼叫中心转移前的总话务量的比值。
102.203、根据第一呼叫中心转移前的总话务量和转移占比值，确定第一时间段内从第一呼叫中心转移目标话务量至第二呼叫中心的话务转移信息。
103.204、将第二呼叫中心转移前的总话务量和话务转移信息进行加和，以重构第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据。
104.其中，重构后的目标历史话务数据包括在第一时间段内第二呼叫中心的原本历史话务数据和第一时间段内从第一呼叫中心转移目标话务量至第二呼叫中心的话务转移信息。
105.由于采用的机器学习算法(如lightgbm)要求所使用的历史数据(即预测样本或即目标历史话务数据)和待预测数据(未来的话务数据)独立同分布，当历史数据和待预测数据不同分布时，建立的模型会存在预测误差。造成数据不同分布的原因如上述所述，包括由于话务从属呼叫中心映射关系变化(即话务中心之间出现话务转移的情况)导致的话务转移，需要通过历史数据重构解决。
106.为了便于理解，将第一呼叫中心简称为a呼叫中心，第二呼叫中心简称为b呼叫中心，那么当a呼叫中心的部分话务总量即将转移至b呼叫中心的时候，最直接的解决方法是将a话务历史数据中即将转移至b的那一部分加和至b的历史话务数据中。
107.对于新映射关系(即发生了话务转移)下的b呼叫中心目标历史话务数据满足：
[0108][0109]
其中，为旧映射关系(即未发生话务转移之前呼叫中心与其话务数据的映射关系)下b呼叫中心的话务数据，为旧映射关系下a呼叫中心的话务数据，σ
t
为t时刻待变更话务数据在话务总数据中的转移占比值。即话务转移信息中的目标话务量为
[0110]
205、基于目标历史话务数据，构建目标话务量预测模型。
[0111]
本技术由于通过先获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量；并获取第一时间段内第一呼叫中心的转移占比值，转移占比值为目标话务量与第一呼叫中心转移前的总话务量的比值；然后根据第一呼叫中心转移前的总话务量和转移占比值，确定第一时间段内从第一呼叫中心转移目标话务量至第二呼叫中心的话务转移信息；再将第二呼叫中心转移前的总话务量和话务转移信息进行加和，以重构第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；最后基于目标历史话务数据，构建目标话务量预测模型。因此，能够根据业务变更修复历史话务数据，并自动快速适应最新的数据分布，不需要额外的人工调整过程，从而解决业务变更导致的话务量预测模型的预测精度下降的问题，使得重构后的话务量预测模型的预测精度更高。
[0112]
本技术实施例中，如图3所示，第一时间段包括第二时间段和第三时间段，第二时
间段为第一时间段内可统计话务转移信息的时间范围长度，第三时间段为第一时间段内不可统计话务转移信息的时间范围长度；步骤202、获取第一时间段内第一呼叫中心的转移占比值，具体包括步骤301至步骤303：
[0113]
301、获取第二时间段内第一呼叫中心的第一转移占比值。
[0114]
302、通过第一转移占比值，计算第三时间段内第一呼叫中心的转移占比估计值。
[0115]
303、基于第一转移占比值和转移占比估计值，确定第一时间段内第一呼叫中心的转移占比值。
[0116]
在实际情况下，历史映射关系变更的记录往往不会被保存下来，只能在较小时间范围内对待变更的话务数据进行统计。记t为可获得的全部历史话务数据的时间范围长度，ts为可统计变更话务数据的时间范围，则当t∈(-t,-ts]时，σ
t
未知；而t∈(-ts,0]时，σ
t
已知。即第一时间段对应t，而第二时间段对应t∈(-ts,0]，第三时间段对应t∈(-t,-ts]。
[0117]
步骤301中的第一转移占比值已知，可直接根据在第二时间段内的转移话务量与第一呼叫中心转移前的总话务量计算得到。进一步的，为了得到准确的需要对t∈(-t,-ts]内的σ
t
进行准确估计。为此，需要求得σ
t
的估计使得t∈(-t,-ts]时的变更话务数据估计量与t∈(-ts,0]的变更话务数据的估计量分布一致。对此，本技术采用对抗验证的方法判别其分布一致。具体步骤如下：
[0118]
1、任取占比的估计值计算该占比下的历史话务数据
[0119]
2、构造长度为k的历史话务样本将其标记为混淆类，其中
[0120]
3、构造长度为k的实际话务样本将其标记为真实类，其中
[0121]
4、乱序排列步骤2和步骤3中的样本，在保证混淆类占比不变的前提下，采用n折交叉验证的方式抽取特征向量作为训练样本和验证样本，构造分类器c，训练分类模型，用于判别混淆类与真实类；
[0122]
5、遍历所有估计值的取值，求得一个满足：
[0123][0124]
其中，κ1、κ2分别代表优化目标中对于占比近似程度和混淆程度的权重。考虑在尽可能达到最大混淆程度的情况下，占比近似程度越高，因此κ1《κ2。
[0125]
判别误差通过下式计算：
[0126][0127]
其中，n代表交叉验证的总次数，s代表第j次交叉验证中，验证集的样本个数。
[0128]
步骤5的优化目标表明，最佳的占比估计所生成的历史数据，应当使得分类器c无法正确判别该数据是属于新构造的历史数据(混淆类)，还是近期的实际历史数据(真实类)。即当分类器判别误差接近0.5时，表明分类器在判别数据归属类别时产生了混淆，此时历史数据与实际数据的分布一致。
[0129]
本技术实施例中，根据重构后的历史数据，构建预测模型，能够在未来数据分布不发生均值漂移的情况下稳定预测。然而实际运行过程中，数据分布变化频率较高，话务均值不断发生漂移，因此需要对初级话务量预测模型进一步改进，如图4所示，步骤205、基于目标历史话务数据，构建目标话务量预测模型，包括：
[0130]
401、从目标历史话务数据中确定训练样本数据。
[0131]
402、基于训练样本数据，建立初级话务量预测模型。
[0132]
训练样本数据应当是对目标日期具有强相关性的特征样本，本技术采用的输入特征如下：
[0133]
1、[t-k,t-1]的历史话务特征，其中k表示历史数据范围，具体的，k可以取7的倍数；
[0134]
2、[t-k,t-1]件量特征与预测件量特征，件量变化与话务量变化具有强相关性；
[0135]
3、营运指标特征，如中转落货率等，对话务量变化也具有强相关性；
[0136]
4、特殊日期的增长量预估特征，如除夕的话务预估下降量，通过fbprophet模型分解得出；
[0137]
5、上述特征的差分特征，包括历史n天的一阶差分(n＝{1,3,7,14,30})、历史n天的二阶差分；
[0138]
6、上述特征的滚动特征，基于不同的时间窗w＝{3,5,7,14,30}，统计时间窗范围内的最大值、最小值、平均值、带衰减的平均值、方差；
[0139]
7、日期特征，包括星期、季节、季度、年份、日期、是否为节假日；
[0140]
考虑日期特征的周期性，需要对日期特征进行预处理，构造两个辅助特征，如下式：
[0141][0142]
其中，t为特征的周期，对于星期特征，t＝7；t为具体的星期，如星期六，t＝6。
[0143]
预测模型采用lightgbm作为求解算法，计算输入与预测话务量的映射函数。具体而言，将历史数据样本按照一定比例(如0.8:0.2)以及先后的时间顺序划分成训练集与验证集，通过训练样本训练lightgbm模型，在验证集上校验模型误差，通过调整模型参数，训练出一个最优模型，模型的输入分布和模型的参数很大程度上决定了预测模型的准确度。本技术的预测准确度通过相对误差百分比mape定义，如下式：
[0144][0145]
其中，yi代表第i个样本的真实值，代表第i个样本的预测值，n为样本总数。
[0146]
403、调整初级话务量预测模型中的参数，得到目标话务量预测模型。
[0147]
本技术实施例中，如图5所示，步骤403、调整初级话务量预测模型中的参数，得到
目标话务量预测模型，包括：
[0148]
501、获取第四时间段内的第二历史话务信息。
[0149]
第四时间段可以是第一时间段，也可以在第一时间段之后，因此，第二历史话务信息中的历史话务数据可以为上述经过重构得到的目标历史话务数据。
[0150]
502、对第二历史话务信息进行预处理，生成第三历史话务信息。
[0151]
其中，预处理可以包括时序对齐、滑动平均填充等。需要说明的是，构造模型的输入向量，与传统预测过程不同的是，预处理过程中如果涉及预测性的特征(如未来的件量、节假日特征等)，需要滚动生成，模拟逐天预测的过程，避免对未来的信息产生泄露。
[0152]
503、获取预先生成的模型候选参数。
[0153]
贝叶斯优化算法假设参数空间与模型误差之间存在某种映射关系。通过不断生成参数建立预测模型后，可以根据参数和预测误差拟合这种映射关系，并且拟合准确度随着迭代次数不断提升。通过拟合的映射关系，以及随机采样概率，可以不断生成新的参数，以实现映射关系与生成参数的联合优化，最终收敛于最优的参数空间。
[0154]
504、基于第三历史话务信息和模型候选参数，调整述初级话务量预测模型中的参数，得到目标话务量预测模型。
[0155]
在步骤501至步骤504中，针对话务均值漂移问题，提出基于贝叶斯优化的动态调参算法，能够避免人工手动调参的工作，使得模型自动适应新的数据分布。
[0156]
本技术实施例中，如图6所示，步骤504、基于第三历史话务信息和模型候选参数，调整述初级话务量预测模型中的参数，得到目标话务量预测模型，包括：
[0157]
601、基于第三历史话务信息和模型候选参数，确定模型最优参数。
[0158]
602、基于最优参数，调整初级话务量预测模型中的参数，得到目标话务量预测模型。
[0159]
本技术实施例中，如图7所示，步骤601、基于第三历史话务信息和模型候选参数，确定模型最优参数，包括：
[0160]
701、基于第三历史话务信息，建立中级话务量预测模型。
[0161]
702、通过中级话务量预测模型对第五时间段内话务量进行预测，得到第一话务量预测数据。
[0162]
703、基于第一话务量预测数据，计算第四时间段内的滚动预测误差数据。
[0163]
704、基于滚动预测误差数据和模型候选参数，确定模型最优参数。
[0164]
在步骤701和步骤704中，通过第三历史话务信息中的历史话务数据作为输入数据，采用模型候选参数，以第五时间段内的话务量作为输出，建立中级话务量预测模型(如lightgbm)，并模拟该预设周期范围内的预测过程，例如该第五时间段长度为15天。
[0165]
然后计算第四时间段内的滚动预测误差，并通过某种规则加权(如离目标日越近，权重越大)，以拟合近期的特征，使得预测模型能够适应最新的数据分布。然后取该预设周期范围内的滚动预测误差的平均值作为该套参数的评分。
[0166]
选择所有参数中，对于最近的数据分布具有最佳的拟合效果以及评分最高的参数，其中，误差越小评分最高。
[0167]
为了更好实施本技术实施例中话务量预测模型构建方法，在话务量预测模型构建方法基础之上，本技术实施例中还提供一种话务量预测方法，如图8所示，该话务量预测方
法具体包括步骤801和步骤802：
[0168]
801、获取第六时间段内的历史话务数据。
[0169]
802、将历史话务数据输入目标话务量预测模型中，对第七时间段内的话务量进行预测。
[0170]
其中，第七时间段在所述第六时间段之后，且该目标话务量预测模型如上述实施例所述的目标话务量预测模型。
[0171]
本技术由于通过采用上述实施例重构的话务量预测模型进行话务量预测，其预测结果更加精准。
[0172]
为了更好实施本技术实施例中话务量预测模型构建方法，在话务量预测模型构建方法基础之上，本技术实施例中还提供一种话务量预测模型构建装置，如图9所示，该话务量预测模型构建装置900包括第一获取单元901、第二获取单元902、第一确定单元903、第一重构单元904以及第一构建单元905：
[0173]
第一获取单元901，用于获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量；
[0174]
第二获取单元902，用于获取第一时间段内所述第一呼叫中心的转移占比值，所述转移占比值为所述目标话务量与所述第一呼叫中心转移前的总话务量的比值；
[0175]
第一确定单元903，用于根据所述第一呼叫中心转移前的总话务量和所述转移占比值，确定所述第一时间段内从所述第一呼叫中心转移目标话务量至所述第二呼叫中心的话务转移信息；
[0176]
第一重构单元904，用于将所述第二呼叫中心转移前的总话务量和所述话务转移信息进行加和，以重构所述第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；
[0177]
第一构建单元905，用于基于所述目标历史话务数据，构建目标话务量预测模型。
[0178]
本技术实施例中，第一时间段包括第二时间段和第三时间段，第二时间段为第一时间段内可统计话务转移信息的时间范围长度，第三时间段为第一时间段内不可统计话务转移信息的时间范围长度。
[0179]
第二获取单元902，具体用于：
[0180]
获取第二时间段内第一呼叫中心的第一转移占比值。
[0181]
通过第一转移占比值，计算第三时间段内第一呼叫中心的转移占比估计值。
[0182]
基于第一转移占比值和转移占比估计值，确定第一时间段内第一呼叫中心的转移占比值。
[0183]
本技术实施例中，第一构建单元905，具体包括：
[0184]
第二确定单元，用于从目标历史话务数据中确定训练样本数据。
[0185]
第一建立单元，用于基于训练样本数据，建立初级话务量预测模型。
[0186]
第一调整单元，用于调整初级话务量预测模型中的参数，得到目标话务量预测模型。
[0187]
本技术实施例中，第一调整单元具体包括：
[0188]
第三获取单元，用于获取第四时间段内的第二历史话务信息。
[0189]
第一预处理单元，用于对第二历史话务信息进行预处理，生成第三历史话务信息。
[0190]
第四获取单元，用于获取预先生成的模型候选参数。
[0191]
第二调整单元，用于基于第三历史话务信息和模型候选参数，调整述初级话务量预测模型中的参数，得到目标话务量预测模型。
[0192]
本技术实施例中，第二调整单元，具体包括：
[0193]
第三确定单元，用于基于第三历史话务信息和模型候选参数，确定模型最优参数。
[0194]
第三调整单元，用于基于最优参数，调整初级话务量预测模型中的参数，得到目标话务量预测模型。
[0195]
本技术实施例中，第三确定单元，具体用于：
[0196]
基于第三历史话务信息，建立中级话务量预测模型。
[0197]
通过中级话务量预测模型对第五时间段内话务量进行预测，得到第一话务量预测数据。
[0198]
基于第一话务量预测数据，计算第四时间段内的滚动预测误差数据。
[0199]
基于滚动预测误差数据和模型候选参数，确定模型最优参数。
[0200]
本技术由于通过第一获取单元901先获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量；第二获取单元902获取第一时间段内第一呼叫中心的转移占比值，转移占比值为目标话务量与第一呼叫中心转移前的总话务量的比值；然后第一确定单元903根据第一呼叫中心转移前的总话务量和转移占比值，确定第一时间段内从第一呼叫中心转移目标话务量至第二呼叫中心的话务转移信息；再第一重构单元904将第二呼叫中心转移前的总话务量和话务转移信息进行加和，以重构第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；最后第一重构单元905基于目标历史话务数据，构建目标话务量预测模型。因此，能够根据业务变更修复历史话务数据，并自动快速适应最新的数据分布，不需要额外的人工调整过程，从而解决业务变更导致的话务量预测模型的预测精度下降的问题，使得重构后的话务量预测模型的预测精度更高。
[0201]
除了上述介绍用于话务量预测模型构建方法与装置之外，本技术实施例还提供一种计算机设备，其集成了本技术实施例所提供的任一种话务量预测模型构建装置，所述计算机设备包括：
[0202]
一个或多个处理器；
[0203]
存储器；以及
[0204]
一个或多个应用程序，其中所述一个或多个应用程序被存储于所述存储器中，并配置为由所述处理器执行上述话务量预测模型构建方法实施例中任一实施例中所述的任一方法的操作。
[0205]
本技术实施例还提供一种计算机设备，其集成了本技术实施例所提供的任一种话务量预测模型构建装置。参阅图10，图10是本技术实施例提供的计算机设备一个实施例结构示意图。
[0206]
如图10所示，其示出了本技术实施例所设计的话务量预测模型构建装置的结构示意图，具体来讲：
[0207]
该话务量预测模型构建装置可以包括一个或者一个以上处理核心的处理器101、一个或一个以上计算机可读存储介质的存储单元102、电源103和输入单元104等部件。本领域技术人员可以理解，图10中示出的话务量预测模型构建装置结构并不构成对话务量预测
模型构建装置的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：
[0208]
处理器101是该话务量预测模型构建装置的控制中心，利用各种接口和线路连接整个话务量预测模型构建装置的各个部分，通过运行或执行存储在存储单元102内的软件程序和/或模块，以及调用存储在存储单元102的数据，执行话务量预测模型构建装置的各种功能和处理数据，从而对话务量预测模型构建装置进行整体监控。可选的，处理器101可包括一个或多个处理核心；优选的，处理器101可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器101中。
[0209]
存储单元102可用于存储软件程序以及模块，处理器101通过运行存储在存储单元102的软件程序以及模块，从而执行各种功能应用以及数据处理。存储单元102可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据话务量预测模型构建装置的使用所创建的数据等。此外，存储单元102可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储单元102还可以包括存储器控制器，以提供处理器101对存储单元102的访问。
[0210]
话务量预测模型构建装置还包括给各个部件供电的电源103，优选的，电源103可以通过电源管理系统与处理器101逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源103还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0211]
该话务量预测模型构建装置还可包括输入单元104，该输入单元104可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0212]
尽管未示出，话务量预测模型构建装置还可以包括显示单元等，在此不再赘述。具体在本技术实施例中，话务量预测模型构建装置中的处理器101会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储单元102中，并由处理器101来运行存储在存储单元102中的应用程序，从而实现各种功能，如下：
[0213]
获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量；获取第一时间段内第一呼叫中心的转移占比值，转移占比值为目标话务量与第一呼叫中心转移前的总话务量的比值；根据第一呼叫中心转移前的总话务量和转移占比值，确定第一时间段内从第一呼叫中心转移目标话务量至第二呼叫中心的话务转移信息；将第二呼叫中心转移前的总话务量和话务转移信息进行加和，以重构第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；基于目标历史话务数据，构建目标话务量预测模型。
[0214]
本技术由于通过先获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量；并获取第一时间段内第一呼叫中心的转移占比值，转移占比值为目标话务量与第一呼叫中心转移前的总话务量的比值；然后根据第一呼叫中心转移前的总话务量和转移占比值，确定第一时间段内从第一呼叫中心转移目标话务量至第二呼叫中心的话务转移信息；再将第二呼叫中心转移前的总话务量和话务转移信息进行加和，以重构第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；最后基于目标历史话务数据，构
建目标话务量预测模型。因此，能够根据业务变更修复历史话务数据，并自动快速适应最新的数据分布，不需要额外的人工调整过程，从而解决业务变更导致的话务量预测模型的预测精度下降的问题，使得重构后的话务量预测模型的预测精度更高。
[0215]
为此，本技术实施例提供一种计算机可读存储介质，该计算机可读存储介质可以包括：只读存储器(rom，read only memory)、随机存取记忆体(ram，random access memory)、磁盘或光盘等。该计算机可读存储介质中存储有多条指令，该指令能够被处理器进行加载，以执行本技术实施例所提供的任一种话务量预测模型构建方法中的步骤。例如，该指令可以执行如下步骤：
[0216]
获取第一呼叫中心转移前的总话务量和第二呼叫中心转移前的总话务量；获取第一时间段内第一呼叫中心的转移占比值，转移占比值为目标话务量与第一呼叫中心转移前的总话务量的比值；根据第一呼叫中心转移前的总话务量和转移占比值，确定第一时间段内从第一呼叫中心转移目标话务量至第二呼叫中心的话务转移信息；将第二呼叫中心转移前的总话务量和话务转移信息进行加和，以重构第二呼叫中心的第一历史话务信息，得到重构后的目标历史话务数据；基于目标历史话务数据，构建目标话务量预测模型。
[0217]
在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。
[0218]
以上对本技术实施例所提供的一种话务量预测模型构建方法、装置及计算机可读存储介质进行了详细介绍，本文中应用了具体个例对本技术的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本技术的方法及其核心思想；同时，对于本领域的技术人员，依据本技术的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本技术的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：包裹运输风险预测方法、装置、设备和计算机存储介质与流程

话务量预测模型构建方法、装置及计算机可读存储介质与流程

相关文献

最热文献