预测模型训练方法及装置、用户类别预测方法及装置与流程

2022-03-23 10:11:15 来源：中国专利 TAG：

1.本公开涉及数据分析技术领域。更具体地，本公开涉及一种预测模型训练方法及装置、一种用户类别预测方法及装置。

背景技术：

2.在相关技术中，在主播运营策略时，通常是对已知某一方面或者某几个方面表现符合预设条件(例如，打赏收入高、直播观看用户多等)的主播提供一些扶持和运营策略帮助主播在平台更好的成长，一方面这种刻画多为人工根据几个指标进行规则判断，没有一个综合的衡量指标；另一方面对于一些未来有潜力成为符合预设条件的主播没有很好的识别方法，这部分主播如果提前识别并给予相应的产品和运营策略，不仅有利于主播的成长，同时可以促进平台的健康发展，实现主播和平台的双赢。

技术实现要素：

3.本公开的示例性实施例在于提供一种预测模型训练方法及装置、用户类别预测方法及装置，以至少解决相关技术中的问题，也可不解决任何上述问题。
4.根据本公开的示例性实施例，提供一种预测模型训练方法，包括：获取原始用户集合，其中，所述原始用户集合中的用户是在第一历史时间处于第一类别的用户；将所述原始用户集合划分为第一用户集合和剩余用户；将第一用户集合中的用户的评价指标作为训练数据对初始预测模型进行训练，得到第一模型；使用第一模型对剩余用户进行预测，基于预测结果从剩余用户中获取第二用户集合；将第二用户集合中的用户的评价指标作为训练数据对第一模型进行训练，得到第二模型；将第一模型和第二模型的组合作为初始预测模型训练后的预测模型。
5.可选地，在获取原始用户集合之前，所述预测模型训练方法还可包括：确定预设多个用户在历史时间的类别，其中，获取原始用户集合，可包括：从所述预设多个用户中选择在第一历史时间处于第一类别的预设数量个用户组成所述原始用户集合。
6.可选地，计算预设多个用户在历史时间的类别，可包括：基于所述预设多个用户中的每个用户在所述历史时间的多个评价指标确定所述多个评价指标中的每个评价指标的重要性；针对所述预设多个用户中的每个用户，基于所述每个评价指标的重要性对所述每个用户的所述多个评价指标进行综合处理，得到所述每个用户的评价结果；针对所述预设多个用户中的每个用户，基于所述每个用户的评价结果来确定所述每个用户在所述历史时间的类别。
7.可选地，基于所述预设多个用户中的每个用户在所述历史时间的多个评价指标确定所述多个评价指标中的每个评价指标的重要性，可包括：基于所述预设多个用户的多个评价指标确定所述多个评价指标中的每个评价指标的权重。
8.可选地，基于所述每个评价指标的重要性对所述每个用户的所述多个评价指标进行综合处理，可包括：基于所述多个评价指标中的每个评价指标的权重，对所述每个用户的
所述多个评价指标进行加权求和。
9.可选地，基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的权重，可包括：基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的变异系数；基于所述多个评价指标中的每个评价指标的变异系数，确定所述多个评价指标中的每个评价指标的权重。
10.可选地，基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的变异系数，可包括：针对所述多个评价指标中的每个评价指标，确定所述预设多个用户的所述评价指标的均值和标准差，基于所述均值和所述标准差确定所述评价指标的变异系数。
11.可选地，基于所述均值和所述标准差确定所述评价指标的变异系数，可包括：确定所述标准差与所述均值的比值，将所述比值确定为所述评价指标的变异系数。
12.可选地，基于所述多个评价指标中的每个评价指标的变异系数，确定所述多个评价指标中的每个评价指标的权重，可包括：对所述多个评价指标的变异系数进行归一化，得到所述多个评价指标中的每个评价指标的权重。
13.可选地，基于所述每个用户的评价结果来确定所述每个用户的类别，可包括：当所述每个用户的评价结果小于阈值，确定所述用户处于第一类别；当所述每个用户的评价结果大于所述阈值，确定所述用户处于第二类别。
14.可选地，所述阈值与所述预设多个用户参与的业务相关。
15.可选地，将原始用户集合划分为第一用户集合和剩余用户，可包括：基于所述原始用户集合中的用户在第二历史时间的类别，从所述原始用户集合中采样具有预设类别比的用户；将采样出的用户组成第一用户集合，其中，第二历史时间在第一历史时间之后。
16.可选地，从所述原始用户集合中采样具有预设类别比的用户，可包括：按照所述预设类别比的从所述原始用户集合中采样在第二历史时间处于第一类别和第二类别的用户。
17.可选地，基于预测结果从剩余用户中获取第二用户集合，可包括：将剩余用户中预测结果为第二类别的用户组成第二用户集合。
18.根据本公开的示例性实施例，提供一种用户类别预测方法，包括：获取待预测用户的评价指标；通过将所述评价指标输入到预测模型中来得到待预测用户在预设时间的类别，其中，所述预测模型是通过本公开中的任一种训练方法训练得到的，所述预测模型包括第一模型和第二模型。
19.可选地，通过将所述评价指标输入到预测模型中来得到待预测用户在预设时间的类别，可包括：将所述评价指标分别输入到第一模型和第二模型，得到第一概率和第二概率；将第一概率和第二概率中的最小值确定为待预测用户在预设时间处于预设类别的概率；通过将所述概率与预设阈值进行比较来确定待预测用户在预设时间的类别。
20.可选地，通过将所述概率与预设概率进行比较来确定待预测用户在预设时间的类别，可包括：当所述概率小于所述预设概率时，确定待预测用户在所述预设时间处于第一类别；当所述概率大于所述预设概率时，确定待预测用户在所述预设时间处于第二类别。
21.根据本公开的示例性实施例，提供一种预测模型训练装置，包括：用户集合获取单元，被配置为获取原始用户集合，其中，所述原始用户集合中的用户是在第一历史时间处于第一类别的用户；用户划分单元，被配置为将原始用户集合划分为第一用户集合和剩余用
户；第一训练单元，被配置为将第一用户集合中的用户的评价指标作为训练数据对初始预测模型进行训练，得到第一模型；用户获取单元，被配置为使用第一模型对剩余用户进行预测，基于预测结果从剩余用户中获取第二用户集合；第二训练单元，被配置为将第二用户集合中的用户的评价指标作为训练数据对第一模型进行训练，得到第二模型；和预测模型确定单元，被配置为将第一模型和第二模型的组合作为初始预测模型训练后的预测模型。
22.可选地，所述预测模型训练装置还可包括：历史类别确定单元，被配置为确定预设多个用户在历史时间的类别，其中，用户集合获取单元被配置为：从所述预设多个用户中选择在第一历史时间处于第一类别的预设数量个用户组成所述原始用户集合。
23.可选地，历史类别确定单元可被配置为：基于所述预设多个用户中的每个用户在所述历史时间的多个评价指标确定所述多个评价指标中的每个评价指标的重要性；针对所述预设多个用户中的每个用户，基于所述每个评价指标的重要性对所述每个用户的所述多个评价指标进行综合处理，得到所述每个用户的评价结果；针对所述预设多个用户中的每个用户，基于所述每个用户的评价结果来确定所述每个用户在所述历史时间的类别。
24.可选地，历史类别确定单元可被配置为：基于所述预设多个用户的多个评价指标确定所述多个评价指标中的每个评价指标的权重。
25.可选地，历史类别确定单元可被配置为：基于所述多个评价指标中的每个评价指标的权重，对所述每个用户的所述多个评价指标进行加权求和。
26.可选地，历史类别确定单元可被配置为：基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的变异系数；基于所述多个评价指标中的每个评价指标的变异系数，确定所述多个评价指标中的每个评价指标的权重。
27.可选地，历史类别确定单元可被配置为：针对所述多个评价指标中的每个评价指标，确定所述预设多个用户的所述评价指标的均值和标准差，基于所述均值和所述标准差确定所述评价指标的变异系数。
28.可选地，历史类别确定单元可被配置为：确定所述标准差与所述均值的比值，将所述比值确定为所述评价指标的变异系数。
29.可选地，历史类别确定单元可被配置为：对所述多个评价指标的变异系数进行归一化，得到所述多个评价指标中的每个评价指标的权重。
30.可选地，历史类别确定单元可被配置为：当所述每个用户的评价结果小于阈值，确定所述用户处于第一类别；当所述每个用户的评价结果大于所述阈值，确定所述用户处于第二类别。
31.可选地，所述阈值与所述预设多个用户参与的业务相关。
32.可选地，用户划分单元可被配置为：基于所述原始用户集合中的用户在第二历史时间的类别，从所述原始用户集合中采样具有预设类别比的用户；将采样出的用户组成第一用户集合，其中，第二历史时间在第一历史时间之后。
33.可选地，用户划分单元可被配置为：按照所述预设类别比的从所述原始用户集合中采样在第二历史时间处于第一类别和第二类别的用户。
34.可选地，用户获取单元可被配置为：将剩余用户中预测结果为第二类别的用户组成第二用户集合。
35.根据本公开的示例性实施例，提供一种用户类别预测装置，包括：数据获取单元，
被配置为获取待预测用户的评价指标；和类别预测单元，被配置为通过将所述评价指标输入到预测模型中来得到待预测用户在预设时间的类别，其中，所述预测模型是通过本公开中的任一种训练方法训练得到的，所述预测模型包括第一模型和第二模型。
36.可选地，类别预测单元可被配置为：将所述评价指标分别输入到第一模型和第二模型，得到第一概率和第二概率；将第一概率和第二概率中的最小值确定为待预测用户在预设时间处于预设类别的概率；通过将所述概率与预设阈值进行比较来确定待预测用户在预设时间的类别。
37.可选地，类别预测单元可被配置为：当所述概率小于所述预设概率时，确定待预测用户在所述预设时间处于第一类别；当所述概率大于所述预设概率时，确定待预测用户在所述预设时间处于第二类别。
38.根据本公开的示例性实施例，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现根据本公开的示例性实施例的方法。
39.根据本公开的示例性实施例，提供一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序被电子设备的处理器执行时，使得电子设备执行根据本公开的示例性实施例的方法。
40.根据本公开的示例性实施例，提供一种计算机程序产品，包括计算机程序/指令，当所述计算机程序/指令被处理器执行时，实现根据本公开的示例性实施例的方法。
41.本公开的实施例提供的技术方案至少带来以下有益效果：
42.通过使用本公开中训练得到的预测模型，可提高预测符合预设条件的主播的准确性。
43.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
44.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。
45.图1示出本公开的示例性实施例可以应用于其中的示例性系统架构。
46.图2示出根据本公开的示例性实施例的预测模型训练方法的流程图。
47.图3示出根据本公开的示例性实施例的用户类别预测方法的流程图。
48.图4示出根据本公开的示例性实施例的预测模型训练装置的框图。
49.图5示出根据本公开的示例性实施例用户类别预测装置的框图。
50.图6是根据本公开的示例性实施例的电子设备600的框图。
具体实施方式
51.为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。
52.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
53.在此需要说明的是，在本公开中出现的“若干项之中的至少一项”均表示包含“该若干项中的任意一项”、“该若干项中的任意多项的组合”、“该若干项的全体”这三类并列的情况。例如“包括a和b之中的至少一个”即包括如下三种并列的情况：(1)包括a；(2)包括b；(3)包括a和b。又例如“执行步骤一和步骤二之中的至少一个”，即表示如下三种并列的情况：(1)执行步骤一；(2)执行步骤二；(3)执行步骤一和步骤二。
54.相关技术主要着重于对潜在用户的识别，如对于电商领域的潜在用户识别，主要是通过用户的历史特征学习以及已有的转化主播训练分类模型，从而预测出当前没有购买商品但是未来会购买商品的用户，为用户提供运营手段促进用户转化。
55.潜在用户的识别方法并不能解决当前场景下的问题，主要在于：
56.1、潜在用户的识别，是有明确目标的，用户是否转化(即是否购买、是否登录应用等等)，但是符合预设条件主播的特征很多样(例如，直播时观看直播的观众数、直播时观看时长、直播时收到的打赏金额等)，因此对于符合预设条件的主播的没有一个直观、明确的定义；
57.2、潜在用户识别由于目标比较明确，分类时模型的转化与不转化的样本数量差别不大，因此使用传统的采样技术和分类技术训练一步模型就可以有效的获取识别出潜在的用户。但是对于符合预设条件的主播，由于符合预设条件的要求较高，因此样本比例很悬殊，使用传统的采样技术无法有效的识别出潜在的符合预设条件的主播。
58.因此，本公开为了高效地识别出潜在符合预设条件的主播，首先提供了一种综合评价符合预设条件的主播的方法，计算每个主播的评价分数，根据业务的判断选择分数阈值将主播划分为符合预设条件的主播和不符合预设条件的主播；其次根据主播的历史特征训练两步的分类模型识别出主播主播。
59.下面，将参照图1至图6具体描述根据本公开的示例性实施例的预测模型训练方法及装置、用户类别预测方法及装置。
60.图1示出本公开的示例性实施例可以应用于其中的示例性系统架构100。
61.如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类别，例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息(例如，预测模型训练请求、用户类别预测请求)等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如音视频通话软件、音视频录制软件、即使通信软件、会议软件、邮箱客户端、社交平台软件等。终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是具有显示屏并且能够进行音视频播放、录制、编辑等的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述所列举的电子设备中，其可以实现成多个软件或软件模块(例如，用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。
62.终端设备101、102、103可以安装有图像采集装置(例如，摄像头)，以采集视频数据。实践中，组成视频的最小视觉单位是帧(frame)。每一帧是一幅静态的图像。将时间上连续的帧序列合成到一起便形成动态视频。此外，终端设备101、102、103也可以安装有用于将电信号转换为声音的组件(例如，扬声器)以播放声音，并且还可以安装有用于将模拟音频信号转换为数字音频信号的装置(例如，麦克风)以采集声音。
63.需要说明的是，服务器可以是硬件，也可以是软件。当服务器为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块(例如，用来提供分布式服务)，也可以实现成单个软件或软件模块。在此不做具体限定。
64.需要说明的是，本公开实施例所提供的预测模型训练方法、用户类别预测方法通常由终端设备执行，但是也可由服务器执行，或者也可以由终端设备和服务器协作执行。相应地，预测模型训练装置、用户类别预测装置可设置在终端设备中、服务器中或者设置在终端设备和服务器两者中。
65.应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器，本公开对此并无限制。
66.图2示出根据本公开的示例性实施例的预测模型训练方法的流程图。例如，图2所示的方法可用于确定符合预设条件的主播。
67.参照图2，在步骤s201，获取原始用户集合。这里，所述原始用户集合中的用户是在第一历史时间处于第一类别的用户。例如，所述原始用户集合例如可以由包括历史上某天的不符合预设条件的主播n个组成。根据未来t天内是否成为过符合预设条件的主播可以将所述原始用户集合中的n个主播划分为两类。
68.在本公开的示例性实施例中，在获取原始用户集合之前，可确定预设多个用户在历史时间的类别。
69.在本公开的示例性实施例中，在获取原始用户集合时，可从所述预设多个用户中选择在第一历史时间处于第一类别的预设数量个用户组成所述原始用户集合。
70.在本公开的示例性实施例中，在计算预设多个用户在所述历史时间的类别时，可首先基于所述预设多个用户中的每个用户在所述历史时间的多个评价指标确定所述多个评价指标中的每个评价指标的重要性，然后针对所述预设多个用户中的每个用户，基于所述每个评价指标的重要性对所述每个用户的所述多个评价指标进行综合处理，得到所述每个用户的评价结果，并且针对所述预设多个用户中的每个用户，基于所述每个用户的评价结果来确定所述每个用户在所述历史时间的类别。
71.在本公开的示例性实施例中，在基于所述预设多个用户中的每个用户在所述历史时间的多个评价指标确定所述多个评价指标中的每个评价指标的重要性时，可基于所述预设多个用户的多个评价指标确定所述多个评价指标中的每个评价指标的权重。
72.在本公开的示例性实施例中，在基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的权重时，可首先基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的变异系数，然后基于所述多个评价指标中的每个评价指标的变异系数，确定所述多个评价指标中的每个评价指标的权重。根据业务侧的输入，筛选出一些符合预设条件的主播的特征：主播的打赏收入、直播观看人数、
点赞、评论、分享、关注等。在这种情况下，评价指标可以是点赞效率、评论效率、营收效率、播放效率中的至少一个。
73.点赞效率可以是近x天点赞次数/推流时长(分钟)，评论效率可以是近x天评论次数/推流时长(分钟)，营收效率可以是近x天营收流水/推流时长(分钟)，播放效率可以是近x天总播放时长(分钟)/推流时长(分钟)。
74.在本公开的示例性实施例中，在基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的变异系数时，可针对所述多个评价指标中的每个评价指标，确定所述预设多个用户的所述评价指标的均值和标准差，基于所述均值和所述标准差确定所述评价指标的变异系数。
75.在本公开的示例性实施例中，在基于所述均值和所述标准差确定所述评价指标的变异系数时，可首先确定所述标准差与所述均值的比值，然后将所述比值确定为所述评价指标的变异系数。
76.例如，以点赞效率为例，分别计算所有主播点赞效率的均值u和标准差s，通过公式c_点赞＝s/u来计算点赞效率的变异系数。行为，评论效率、营收效率、播放效率的变异系数分别为c_评论、c_营收、c_播放。
77.在本公开的示例性实施例中，在基于所述多个评价指标中的每个评价指标的变异系数，确定所述多个评价指标中的每个评价指标的权重时，可对所述多个评价指标的变异系数进行归一化，得到所述多个评价指标中的每个评价指标的权重。
78.例如，w_点赞＝c_点赞/(c_点赞 c_评论 c_营收 c_播放)，
79.w_评论＝c_评论/(c_点赞 c_评论 c_营收 c_播放)，
80.w_营收＝c_营收/(c_点赞 c_评论 c_营收 c_播放)，
81.w_播放＝c_播放/(c_点赞 c_评论 c_营收 c_播放)。
82.在本公开的示例性实施例中，在基于所述每个评价指标的重要性对所述每个用户的所述多个评价指标进行综合处理时，可基于所述多个评价指标中的每个评价指标的权重，对所述每个用户的所述多个评价指标进行加权求和。
83.例如，加权求和结果可以是w_点赞
×
点赞效率 w_评论
×
评论效率 w_营收
×
营收效率 w_播放
×
播放效率。
84.在本公开的示例性实施例中，在基于所述每个用户的评价结果来确定所述每个用户的类别时，可当所述每个用户的评价结果小于阈值，确定所述用户处于第一类别，当所述每个用户的评价结果大于所述阈值，确定所述用户处于第二类别。这里，所述阈值与所述预设多个用户参与的业务相关。
85.例如，预先确定了一个符合预设条件的主播分数的阈值x，如果主播的评价结果大于x，则主播为符合预设条件的主播；如果主播的评价结果小于x，则主播为不符合预设条件的主播。
86.在步骤s202，将原始用户集合划分为第一用户集合和剩余用户。
87.在本公开的示例性实施例中，在将原始用户集合划分为第一用户集合和剩余用户时，可首先基于所述原始用户集合中的用户在第二历史时间的类别，从所述原始用户集合中采样具有预设类别比的用户，然后将采样出的用户组成第一用户集合。这里，第二历史时间在第一历史时间之后。例如，预设类别比可以是，但不限于，符合预设条件的主播和不符
合预设条件的主播的比例1:1。
88.在本公开的示例性实施例中，在从所述原始用户集合中采样具有预设类别比的用户时，可按照所述预设类别比的从所述原始用户集合中采样在第二历史时间处于第一类别和第二类别的用户。
89.在步骤s203，将第一用户集合中的用户的评价指标作为训练数据对初始预测模型进行训练，得到第一模型。
90.在步骤s204，使用第一模型对剩余用户进行预测，基于预测结果从剩余用户中获取第二用户集合。
91.在本公开的示例性实施例中，在基于预测结果从剩余用户中获取第二用户集合时，可将剩余用户中预测结果为第二类别的用户组成第二用户集合。
92.在步骤s205，将第二用户集合中的用户的评价指标作为训练数据对第一模型进行训练，得到第二模型。
93.由于采样后的用户类别分布和原始的用户类别分布差别很大，因此第一模型会将a2个不符合预设条件的主播预测为符合预设条件的主播，也就是说第一模型难以识别a2个主播，因此需要进一步对被第一模型预测为符合预设条件的主播的主播进行分析，找到被第一模型预测为符合预设条件的主播的主播中的实际符合预设条件的主播和实际不符合预设条件的主播的区别，因此需要进一步训练模型用于区分被第一模型预测为符合预设条件的主播的主播中的实际符合预设条件的主播和实际不符合预设条件的主播。
94.在步骤s206，将第一模型和第二模型的组合作为初始预测模型的训练后的预测模型。在使用训练后的预测模型进行用户类别的预测时，可将第一模型和第二模型都识别为符合预设条件的主播的主播确定为符合预设条件的主播。
95.图3示出根据本公开的示例性实施例的用户类别预测方法的流程图。
96.参照图3，在步骤s301，获取待预测用户的评价指标。
97.在步骤s302，通过将所述评价指标输入到预测模型中来得到待预测用户在预设时间的类别。这里，所述预测模型是通过本公开中所述的预测模型训练方法训练得到的，所述预测模型包括第一模型和第二模型。
98.在本公开的示例性实施例中，在通过将所述评价指标输入到预测模型中来得到待预测用户在预设时间的类别时，可首先将所述评价指标分别输入到第一模型和第二模型，得到第一概率和第二概率，将第一概率和第二概率中的最小值确定为待预测用户在预设时间处于预设类别的概率，然后通过将所述概率与预设阈值进行比较来确定待预测用户在预设时间的类别。
99.在本公开的示例性实施例中，在通过将所述概率与预设概率进行比较来确定待预测用户在预设时间的类别时，可当所述概率小于所述预设概率时，确定待预测用户在所述预设时间处于第一类别；当所述概率大于所述预设概率时，确定待预测用户在所述预设时间处于第二类别。
100.以上已经结合图1至图3对根据本公开的示例性实施例的预测模型训练方法、用户类别预测方法进行了描述。在下文中，将参照图4和图5对根据本公开的示例性实施例的预测模型训练装置及其单元、用户类别预测装置及其单元进行描述。
101.图4示出根据本公开的示例性实施例的预测模型训练装置的框图。
102.参照图4，预测模型训练装置包括用户集合获取单元41、用户划分单元42、第一训练单元43、用户获取单元44、第二训练单元45和预测模型确定单元46。
103.用户集合获取单元41被配置为获取原始用户集合。这里，所述原始用户集合中的用户是在第一历史时间处于第一类别的用户。
104.在本公开的示例性实施例中，预测模型训练装置还可包括历史类别确定单元(未示出)，被配置为确定预设多个用户在历史时间的类别。
105.在本公开的示例性实施例中，用户集合获取单元41可被配置为：从所述预设多个用户中选择在第一历史时间处于第一类别的预设数量个用户组成所述原始用户集合。
106.在本公开的示例性实施例中，历史类别确定单元可被配置为：基于所述预设多个用户中的每个用户在所述历史时间的多个评价指标确定所述多个评价指标中的每个评价指标的重要性；针对所述预设多个用户中的每个用户，基于所述每个评价指标的重要性对所述每个用户的所述多个评价指标进行综合处理，得到所述每个用户的评价结果；针对所述预设多个用户中的每个用户，基于所述每个用户的评价结果来确定所述每个用户在所述历史时间的类别。
107.在本公开的示例性实施例中，历史类别确定单元可被配置为：基于所述预设多个用户的多个评价指标确定所述多个评价指标中的每个评价指标的权重。
108.在本公开的示例性实施例中，历史类别确定单元可被配置为：基于所述预设多个用户的所述多个评价指标确定所述多个评价指标中的每个评价指标的变异系数；基于所述多个评价指标中的每个评价指标的变异系数，确定所述多个评价指标中的每个评价指标的权重。
109.在本公开的示例性实施例中，历史类别确定单元可被配置为：针对所述多个评价指标中的每个评价指标，确定所述预设多个用户的所述评价指标的均值和标准差，基于所述均值和所述标准差确定所述评价指标的变异系数。
110.在本公开的示例性实施例中，历史类别确定单元可被配置为：确定所述标准差与所述均值的比值，将所述比值确定为所述评价指标的变异系数。
111.在本公开的示例性实施例中，历史类别确定单元可被配置为：对所述多个评价指标的变异系数进行归一化，得到所述多个评价指标中的每个评价指标的权重。
112.在本公开的示例性实施例中，历史类别确定单元可被配置为：基于所述多个评价指标中的每个评价指标的权重，对所述每个用户的所述多个评价指标进行加权求和。
113.在本公开的示例性实施例中，历史类别确定单元可被配置为：当所述每个用户的评价结果小于阈值，确定所述用户处于第一类别；当所述每个用户的评价结果大于所述阈值，确定所述用户处于第二类别。
114.在本公开的示例性实施例中，所述阈值可与所述预设多个用户参与的业务相关。
115.用户划分单元42被配置为将原始用户集合划分为第一用户集合和剩余用户。
116.在本公开的示例性实施例中，用户划分单元42可被配置为：基于所述原始用户集合中的用户在第二历史时间的类别，从所述原始用户集合中采样具有预设类别比的用户；将采样出的用户组成第一用户集合，其中，第二历史时间在第一历史时间之后。
117.在本公开的示例性实施例中，用户划分单元42可被配置为：按照所述预设类别比的从所述原始用户集合中采样在第二历史时间处于第一类别和第二类别的用户。
118.第一训练单元43被配置为将第一用户集合中的用户的评价指标作为训练数据对初始预测模型进行训练，得到第一模型。
119.用户获取单元44被配置为使用第一模型对剩余用户进行预测，基于预测结果从剩余用户中获取第二用户集合。
120.在本公开的示例性实施例中，用户获取单元44可被配置为：将剩余用户中预测结果为第二类别的用户组成第二用户集合。
121.第二训练单元45被配置为将第二用户集合中的用户的评价指标作为训练数据对第一模型进行训练，得到第二模型。
122.预测模型确定单元46被配置为将第一模型和第二模型的组合作为初始预测模型训练后的预测模型。
123.图5示出根据本公开的示例性实施例用户类别预测装置的框图。
124.参照图5，用户类别预测装置包括数据获取单元51和类别预测单元52。
125.数据获取单元51被配置为获取待预测用户的评价指标。
126.类别预测单元52被配置为通过将所述评价指标输入到预测模型中来得到待预测用户在预设时间的类别，其中，所述预测模型是通过本公开中所述的预测模型训练方法训练得到的，所述预测模型包括第一模型和第二模型。
127.在本公开的示例性实施例中，类别预测单元52可被配置为：将所述评价指标分别输入到第一模型和第二模型，得到第一概率和第二概率；将第一概率和第二概率中的最小值确定为待预测用户在预设时间处于预设类别的概率；通过将所述概率与预设阈值进行比较来确定待预测用户在预设时间的类别。
128.在本公开的示例性实施例中，类别预测单元52可被配置为：当所述概率小于所述预设概率时，确定待预测用户在所述预设时间处于第一类别；当所述概率大于所述预设概率时，确定待预测用户在所述预设时间处于第二类别。
129.关于上述实施例中的装置，其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
130.以上已经结合图4和图5对根据本公开的示例性实施例的预测模型训练装置、用户类别预测装置进行了描述。接下来，结合图6对根据本公开的示例性实施例的电子设备进行描述。
131.图6是根据本公开的示例性实施例的电子设备600的框图。
132.参照图6，电子设备600包括至少一个存储器601和至少一个处理器602，所述至少一个存储器601中存储有计算机可执行指令集合，当计算机可执行指令集合被至少一个处理器602执行时，执行根据本公开的示例性实施例的预测模型训练方法、用户类别预测方法。
133.在本公开的示例性实施例中，电子设备600可以是pc计算机、平板装置、个人数字助理、智能手机、或其他能够执行上述指令集合的装置。这里，电子设备600并非必须是单个的电子设备，还可以是任何能够单独或联合执行上述指令(或指令集)的装置或电路的集合体。电子设备600还可以是集成控制系统或系统管理器的一部分，或者可被配置为与本地或远程(例如，经由无线传输)以接口互联的便携式电子设备。
134.在电子设备600中，处理器602可包括中央处理器(cpu)、图形处理器(gpu)、可编程
逻辑装置、专用处理器系统、微控制器或微处理器。作为示例而非限制，处理器还可包括模拟处理器、数字处理器、微处理器、多核处理器、处理器阵列、网络处理器等。
135.处理器602可运行存储在存储器601中的指令或代码，其中，存储器601还可以存储数据。指令和数据还可经由网络接口装置而通过网络被发送和接收，其中，网络接口装置可采用任何已知的传输协议。
136.存储器601可与处理器602集成为一体，例如，将ram或闪存布置在集成电路微处理器等之内。此外，存储器601可包括独立的装置，诸如，外部盘驱动、存储阵列或任何数据库系统可使用的其他存储装置。存储器601和处理器602可在操作上进行耦合，或者可例如通过i/o端口、网络连接等互相通信，使得处理器602能够读取存储在存储器中的文件。
137.此外，电子设备600还可包括视频显示器(诸如，液晶显示器)和用户交互接口(诸如，键盘、鼠标、触摸输入装置等)。电子设备600的所有组件可经由总线和/或网络而彼此连接。
138.根据本公开的示例性实施例，还提供一种包括指令的计算机可读存储介质，例如包括指令的存储器601，上述指令可由装置600的处理器602执行以完成上述方法。可选地，计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
139.根据本公开的示例性实施例，还可提供一种计算机程序产品，该计算机程序产品包括计算机程序/指令，当所述计算机程序/指令被处理器执行时，实现根据本公开的示例性实施例的预测模型训练方法、用户类别预测方法。
140.以上已参照图1至图6描述了根据本公开的示例性实施例的预测模型训练方法及装置、用户类别预测方法及装置。然而，应该理解的是：图4和图5中所示的预测模型训练装置及其单元、用户类别预测装置及其单元可分别被配置为执行特定功能的软件、硬件、固件或上述项的任意组合，图6中所示的电子设备并不限于包括以上示出的组件，而是可根据需要增加或删除一些组件，并且以上组件也可被组合。
141.此外，根据本公开的预测模型训练方法及装置，通过获取原始用户集合，将原始用户集合划分为第一用户集合和剩余用户，将第一用户集合中的用户的评价指标作为训练数据对初始预测模型进行训练，得到第一模型，使用第一模型对剩余用户进行预测，基于预测结果从剩余用户中获取第二用户集合，将第二用户集合中的用户的评价指标作为训练数据对第一模型进行训练，得到第二模型，将第一模型和第二模型的组合作为初始预测模型训练后的预测模型，从而提高训练出的预测模型进行用户类别预测的效果。
142.此外，根据本公开的用户类别预测方法及装置，通过获取待预测用户的评价指标，通过将所述评价指标输入到预测模型中来得到待预测用户在预设时间的类别，其中，所述预测模型是通过本公开中的任一种训练方法训练得到的，所述预测模型包括第一模型和第二模型，从而提高用户类别预测的准确性。
143.本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
144.应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：用于参数有效的语义图像分割的反馈解码器的制作方法

预测模型训练方法及装置、用户类别预测方法及装置与流程

相关文献

最热文献