用户购买行为预测模型的构建方法、装置及计算机设备与流程

2022-07-16 11:32:09 来源：中国专利 TAG：

1.本发明涉及人工智能领域，尤其是涉及一种用户购买行为预测模型的构建方法、装置及计算机设备。

背景技术：

2.用户购买行为的预测一直是各电商品台研究的重要课题，大型电商平台一般都沉淀了千万乃至数亿的用户，积累了海量的用户历史数据，并倾向于从用户历史数据中找出规律，去预测用户未来的购买行为。
3.目前，通常通过收集用户在旧场景中的大量历史数据，来构建旧场景下的预测模型，以便基于该预测模型对用户未来的购买行为进行预测。然而，由于在旧场景下已经积累了海量的真实数据，基于这些数据训练的模型可以对用户的购买行为进行有效预测，而对于一些新场景，其仅存在少量与用户购买行为相关的表现数据，利用少量数据构建的预测模型无法实现新场景下对用户购买行为的精准预测。

技术实现要素：

4.本发明提供了一种用户购买行为预测模型的构建方法、装置及计算机设备，主要在于能够提高新场景下用户购买行为的预测精度。
5.根据本发明的第一个方面，提供一种用户购买行为预测模型的构建方法，包括：
6.获取与用户购买行为相关联的训练样本集和测试样本集，其中，所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集；
7.确定所述训练样本集中各个用户的属性特征向量对应的初始权重，并基于所述初始权重和所述训练样本集，构建初始用户购买行为预测模型；
8.计算所述初始用户购买行为预测模型在所述测试样本集上的错误率，其中，所述目标域训练样本集与所述测试样本集属于同一分布，所述源域训练样本集与所述测试样本集属于不同分布；
9.若所述错误率不满足预设要求，则通过更新所述初始权重，不断对所述初始用户行为购买模型进行迭代训练，直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求，将其作为所述目标场景下的用户购买行为预测模型输出。
10.根据本发明的第二个方面，提供一种用户购买行为预测模型的构建装置，包括：
11.获取单元，用于获取与用户购买行为相关联的训练样本集和测试样本集，其中，所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集；
12.构建单元，用于确定所述训练样本集中各个用户的属性特征向量对应的初始权重，并基于所述初始权重和所述训练样本集，构建初始用户购买行为预测模型；
13.计算单元，用于计算所述初始用户购买行为预测模型在所述测试样本集上的错误率，其中，所述目标域训练样本集与所述测试样本集属于同一分布，所述源域训练样本集与所述测试样本集属于不同分布；
14.训练单元，用于若所述错误率不满足预设要求，则通过更新所述初始权重，不断对所述初始用户行为购买模型进行迭代训练，直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求，将其作为所述目标场景下的用户购买行为预测模型输出。
15.根据本发明的第三个方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现以下步骤：
16.获取与用户购买行为相关联的训练样本集和测试样本集，其中，所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集；
17.确定所述训练样本集中各个用户的属性特征向量对应的初始权重，并基于所述初始权重和所述训练样本集，构建初始用户购买行为预测模型；
18.计算所述初始用户购买行为预测模型在所述测试样本集上的错误率，其中，所述目标域训练样本集与所述测试样本集属于同一分布，所述源域训练样本集与所述测试样本集属于不同分布；
19.若所述错误率不满足预设要求，则通过更新所述初始权重，不断对所述初始用户行为购买模型进行迭代训练，直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求，将其作为所述目标场景下的用户购买行为预测模型输出。
20.根据本发明的第四个方面，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现以下步骤：
21.获取与用户购买行为相关联的训练样本集和测试样本集，其中，所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集；
22.确定所述训练样本集中各个用户的属性特征向量对应的初始权重，并基于所述初始权重和所述训练样本集，构建初始用户购买行为预测模型；
23.计算所述初始用户购买行为预测模型在所述测试样本集上的错误率，其中，所述目标域训练样本集与所述测试样本集属于同一分布，所述源域训练样本集与所述测试样本集属于不同分布；
24.若所述错误率不满足预设要求，则通过更新所述初始权重，不断对所述初始用户行为购买模型进行迭代训练，直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求，将其作为所述目标场景下的用户购买行为预测模型输出。
25.本发明提供的一种用户购买行为预测模型的构建方法、装置及计算机设备，与目前直接利用少量样本数据构建新场景下的预测模型的方式相比，本发明能够获取与用户购买行为相关联的训练样本集和测试样本集，其中，所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集；同时确定所述训练样本集中各个用户的属性特征向量对应的初始权重，并基于所述初始权重和所述训练样本集，构建初始用户购买行为预测模型；此外，计算所述初始用户购买行为预测模型在所述测试样本集上的错误率，其中，所述目标域训练样本集与所述测试样本集属于同一分布，所述源域训练样本集与所述测试样本集属于不同分布；若所述错误率不满足预设要求，则通过更新所述初始权重，不断对所述初始用户行为购买模型进行迭代训练，直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求，将其作为所述目标场景下的用户购买行为预测模型输出。在本发明中，通过计算初始用户购买行为预测模型的错误率，能够不断对训练样本集中各个属性特征向量对应的权重进行更新，从而能够从历史场景中筛选出目标场景可用的样本数
据，并将其与目标场景下的少量样本数据结合，保证目标场景具有足够多的训练样本，进而能够提高目标场景下用户购买行为预测模型的预测精度。
附图说明
26.此处所说明的附图用来提供对本发明的进一步理解，构成本技术的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：
27.图1示出了本发明实施例提供的一种用户购买行为预测模型的构建方法流程图；
28.图2示出了本发明实施例提供的另一种用户购买行为预测模型的构建方法流程图；
29.图3示出了本发明实施例提供的一种用户购买行为预测模型的构建装置的结构示意图；
30.图4示出了本发明实施例提供的另一种用户购买行为预测模型的构建装置的结构示意图；
31.图5示出了本发明实施例提供的一种计算机设备的实体结构示意图。
具体实施方式
32.下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本技术中的实施例及实施例中的特征可以相互组合。
33.目前，对于一些新场景，其仅存在少量与用户购买行为相关的表现数据，利用少量数据构建的预测模型无法实现新场景下对用户购买行为的精准预测。
34.为了解决上述问题，本发明实施例提供了一种用户购买行为预测模型的构建方法，如图1所示，所述方法包括：
35.101、获取与用户购买行为相关联的训练样本集和测试样本集。
36.其中，所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集。历史场景为当前已经发展成熟的任意一个业务场景，该历史场景积累了大量用户数据，目标场景为当前还未发展成熟的新兴业务场景，该目标场景仅具有少量用户数据，例如，历史场景为当前已经发展成熟的母婴业务场景，目标业务场景为新兴的舞蹈服饰业务场景。
37.本发明实施例主要适用于构建新兴业务场景下的用户购买行为预测模型的场景。本发明实施例的执行主体为能够构建新兴业务场景下的用户购买行为预测模型的装置或者设备，具体可以设置在服务器一侧。
38.对于本发明实施例，为了构建目标场景下的用户购买行为预测模型，需要预先收集历史场景下的用户数据和目标场景下的用户数据，历史场景和目标场景下的用户数据具体包括用户的基础信息、行为信息、关联信息、消费信息等，其中，基础信息具体包括用户的年龄、性别、工作和地域等个人信息，行为信息具体包括用户在一定时间段内浏览相应场景的次数、用户在一定时间段内浏览相应场景商品的价格分布等，关联信息具体可以为与用户具有关联的其他用户的信息，如与用户具有代付款关联的其他用户的基础信息、行为信息等，消费信息具体为用户在相应场景中的历史消费数据。
39.与此同时，还要收集历史场景下和目标场景下每组用户数据对应的用户实际购买
行为，该实际购买行为包括用户在相应场景下购买商品，或者没有购买商品。进一步地，分别对目标场景下和历史场景下用户的基础信息、行为信息、关联信息、消费信息进行特征加工，得到目标场景和历史场景分别对应的各个属性特征向量，其中，该特征加工具体是指对基础信息、行为信息、关联信息、消费信息等进行标准化处理、归一化处理、离散化处理和时序处理等，收集的用户数据经过上述处理后，转换为属性特征向量，该属性特征向量任一维度的数值为0或者1，该属性特征向量对应的维数与收集的信息维度相关。
40.进一步地，根据目标场景下用户的实际购买行为，对目标场景下用户的属性特征向量进行标注，得到目标场景下标注后的属性特征向量，并将目标场景下标注后的属性特征向量作为目标域训练样本集，同理根据历史场景下用户的实际购买行为，对历史场景下用户的属性特征向量进行标注，得到历史场景下标注后的属性特征向量，并将历史场景下标注后的属性特征向量作为源域训练样本集，例如，当用户的实际购买行为为购买相应场景下的商品时，确定相应属性特征向量对应的标签为1；当用户的实际购买行为未购买相应场景下的商品时，确定相应属性特征向量对应的标签为0。需要说明的是目标域训练样本集中包含少量的样本特征，源域训练样本集中包含大量的样本特征。
41.进一步地，将目标域训练样本集和源域训练样本集进行合并，作为用于训练新场景下用户购买行为预测模型的训练样本集。与此同时，从目标场景下用户的属性特征向量中抽取部分未进行标注的属性特征向量，将其作为测试样本集。由此能够保证目标域训练样本集与测试样本集具有相同的分布，而源域训练样本集与测试样本集具有不同的分布。
42.102、确定所述训练样本集中各个用户的属性特征向量对应的初始权重，并基于所述初始权重和所述训练样本集，构建初始用户购买行为预测模型。
43.对于本发明实施例，由于目标场景下仅具有少量的样本数据(属性特征向量)，为了保证目标场景下的预测模型能够具有良好的精度，需要从历史场景中筛选出目标场景可用的样本数据，并将其与目标场景的少量样本数据进行结合，以保证目标场景具有足够的训练样本。
44.为了实现上述目的，本发明实施例采用预设迁移算法，从历史场景下的样本数据中筛选目标场景可用的样本数据。具体地，首先设定训练样本集中每个属性特征向量对应的初始权重，每个属性特征向量对应的初始权重可以相同，如设定每个属性特征向量对应的初始权重均是1。进一步地，基于训练样本集中的各个属性特征向量及其对应的初始权重，构建初始用户购买行为预测模型，该初始用户购买行为预测模型具体可以为初始决策树分类模型或者初始多层感知器。
45.103、计算所述初始用户购买行为预测模型在所述测试样本集上的错误率。
46.其中，所述目标域训练样本集与所述测试样本集属于同一分布，所述源域训练样本集与所述测试样本集属于不同分布。
47.对于本发明实施例，将测试样本集中的每个属性特征向量依次输入至初始用户购买行为预测模型中进行购买行为预测，得到测试样本集中每个属性特征向量对应的预测购买行为。进一步地，基于测试样本集中每个属性特征向量对应的预测购买行为和实际购买行为，计算初始用户购买行为预测模型对应的错误率。
48.104、若所述错误率不满足预设要求，则通过更新所述初始权重，不断对所述初始用户行为购买模型进行迭代训练，直至任一迭代层级对应的用户购买行为预测模型的错误
率满足预设要求，将其作为所述目标场景下的用户购买行为预测模型输出。
49.对于本发明实施例，如果初始用户购买行为预测模型对应的错误率大于预设错误率，则对训练样本集中每个属性特征向量对应的初始权重进行更新，具体对初始权重进行更新时，如果训练样本集中某个被分类错误的属性特征向量属于目标域训练样本集，说明该属性特征向量分类较为困难，需要提高该属性特征向量对应的权重；如果训练样本集中某个被分类错误的属性特征向量属于源域训练样本集，说明该属性特征向量与目标域训练样本集的关联度不大，需要降低该属性特征向量对应的权重，从而能够得到训练样本集中各个属性特征向量对应的更新后的权重。
50.进一步地，基于更新后的权重和训练样本集，对初始用户购买行为预测模型进行更新迭代，之后继续计算本轮迭代的用户购买行为预测模型对应的错误率，如果该错误率大于预设错误率，重复上述迭代过程，直至某一迭代层级的预测模型的错误率小于预设错误率，停止迭代，并将最终迭代的预测模型确定为目标场景下的用户购买行为预测模型。其中，该预设错误率可以根据实际业务需求进行设定，如设定预设错误率为0.5。
51.本发明实施例提供的一种用户购买行为预测模型的构建方法，通过计算初始用户购买行为预测模型的错误率，能够不断对训练样本集中各个属性特征向量对应的权重进行更新，从而能够从历史场景中筛选出目标场景可用的样本数据，并将其与目标场景下的少量样本数据结合，保证目标场景具有足够多的训练样本，进而能够提高目标场景下用户购买行为预测模型的预测精度。
52.进一步的，为了更好的说明上述构建新场景下用户购买行为预测模型的过程，作为对上述实施例的细化和扩展，本发明实施例提供了另一种用户购买行为预测模型的构建方法，如图2所示，所述方法包括：
53.201、获取与用户购买行为相关联的训练样本集和测试样本集。
54.其中，所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集。
55.对于本发明实施例，为了获取训练样本集，步骤201具体包括：分别收集所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息，以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息；根据所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息，以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息，确定所述历史场景和所述目标场景分别对应的各个属性特征向量；根据所述历史场景下各个用户的实际购买行为和所述目标场景下各个用户的实际购买行为，确定所述历史场景和所述目标场景分别对应的各个属性特征向量的标签；根据所述历史场景下的各个属性特征向量及其对应的标签，以及所述目标场景下的各个属性特征向量及其对应的标签，分别确定所述源域训练样本集和所述目标域训练样本集，其中，所述源域训练样本集中属性特征向量的数量大于所述目标域训练样本集中属性特征向量的数量。
56.具体地，通过对基础信息、行为信息、关联信息和消费信息进行标准化处理、归一化处理、离散化处理和时序处理，得到目标场景和历史场景分别对应的各个属性特征向量。进一步地，根据历史场景下的各个属性特征向量及其对应的标签，定义源域训练样本集同时根据目标场景下的各个属性特征向量及其对应的标签，定义目标
域训练样本集域训练样本集由此能够得到训练样本集中的所有样本数据，如下：
[0057][0058]
其中，有n个数据来自源域训练样本集，有m个数据来自目标域训练样本集，n远大于m。
[0059]
在具体应用场景中，除了获取目标场景和历史场景下用户的基础信息、行为信息、关联信息和消费信息，还可以根据上述信息，生成衍生信息，以便增加信息维度，基于此，所述方法包括：根据所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息，确定所述历史场景下各个用户的衍生信息；对所述历史场景下各个用户的基础信息、行为信息、关联信息、消费信息和衍生信息进行特征加工，得到所述历史场景对应的各个属性特征向量；根据所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息，确定所述目标场景下各个用户的衍生信息；对所述目标场景下各个用户的基础信息、行为信息、关联信息、消费信息和衍生信息进行特征加工，得到所述目标场景对应的各个属性特征向量。
[0060]
例如，基础信息为用户的地域，消费信息为用户在一定时间段内购买的商品品类，根据上述两种信息，可以衍生出用户在该地域一定时间段内购买的商品品类。
[0061]
在具体应用场景中，由于目标场景可能是针对特定人群，因此可以从收集的用户信息维度中筛选出符合特定人群的目标信息维度，从而能够减少模型训练过程中的计算量，基于此，所述方法包括：基于所述目标场景所针对的人群特征，分别对所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息，以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息进行信息维度筛选；基于所述历史场景下各个用户筛选后的信息，以及所述目标场景下各个用户筛选后的信息，确定所述历史场景和所述目标场景分别对应的各个属性特征向量。
[0062]
例如，针对目标场景和历史场景收集的信息维度包括用户的基础信息、行为信息、关联信息和消费信息，由于关联信息与适用目标场景的特定人群关联不大，因此可以将关联信息剔除，仅根据基础信息、行为信息和消费信息，确定目标场景和历史场景下的各个属性特征向量。
[0063]
进一步地，针对获取与用户购买行为相关联的测试样本集的具体过程，所述方法包括：从所述目标场景对应的各个属性特征向量中抽取未进行标注的预设数量的属性特征向量；根据所述未进行标注的预设数量的属性特征向量，确定所述测试样本集。其中，预设数量可以根据实际业务需求进行设定，例如，目标域训练样本集中共存在200个属性特征向量，抽取其中100个未进行标注的属性特征向量作为测试样本集
[0064]
202、确定所述训练样本集中各个用户的属性特征向量对应的初始权重，并基于所述初始权重和所述训练样本集，构建初始用户购买行为预测模型。
[0065]
例如，源域训练样本集为t
old
，目标域训练样本集为t
new
，将两者合并成训练样本集为t＝t
old
∪t
new
，并设定迭代次数n，之后为目标域训练样本集中的每个属性特征向量和源域训练样本集中的每个属性特征向量设定一个初始权重，从而能够得到初始权重向量为：
[0066][0067][0068]
其中，n为源域训练样本集中的样本数量，m为目标域训练样本集中的样本数量，n m为训练样本集中的样本数量，w
i1
为训练样本集中任意一个属性特征向量对应的初始权重。
[0069]
进一步地，根据训练样本集中各个属性特征向量对应的初始权重，确定初始权重分布，该初始权重分布具体为：
[0070][0071]
进一步地，根据该初始权重分布和训练样本集进行迭代训练，构建初始分类器，即初始用户购买行为预测模型，该初始用户购买行为模型能够基于用户的属性特征向量与用户购买行为之间的映射关系对用户的购买行为进行预测。
[0072]
203、计算所述初始用户购买行为预测模型在所述测试样本集上的错误率。
[0073]
其中，所述目标域训练样本集与所述测试样本集属于同一分布，所述源域训练样本集与所述测试样本集属于不同分布。
[0074]
对于本发明实施例，为了对初始用户购买行为预测模型不断进行更新迭代，需要计算预测模型在所述测试样本集上的错误率，针对计算该错误率的具体过程，所述方法包括：将所述测试样本集中各个属性特征向量依次输入至所述初始用户购买行为预测模型中进行购买行为预测，得到所述测试样本集中各个属性特征向量对应的预测购买行为；对所述测试样本集中各个属性特征向量对应的初始权重进行归一化处理，得到归一化处理后的初始权重；根据所述归一化处理后的初始权重，以及所述测试样本集中各个属性特征向量对应的预测购买行为和实际购买行为，计算所述初始用户购买行为预测模型的错误率。
[0075]
204、若所述错误率不满足预设要求，则通过更新所述初始权重，不断对所述初始用户行为购买模型进行迭代训练，直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求，将其作为所述目标场景下的用户购买行为预测模型输出。
[0076]
对于本发明实施例，如果构建的初始用户购买行为预测模型的错误率大于或者等于预设错误率，则对训练样本集中各个属性特征向量对应的初始权重进行更新，通过对初始权重进行更新，能够从历史场景的源域训练样本集中筛选出目标场景可用的样本数据，从而能够保证目标场景具有足够的训练样本，针对更新初始权重的具体过程，所述方法包括：在训练所述初始用户购买行为预测模型的过程中，确定所述训练样本集中被分类错误的属性特征向量；计算所述目标域训练样本集中任意一个属性特征向量对应的第一权重调整速率，以及所述源域训练样本集中任意一个属性特征向量对应的第二权重调整速率；若被分类错误的属性特征向量属于所述源域训练样本集，则基于所述第二权重调整速率，降低所述被分类错误的属性特征向量对应的初始权重；若被分类错误的属性特征向量属于所述目标域训练样本集，则基于所述第一权重调整速率，提高所述被分类错误的属性特征向量对应的初始权重。
[0077]
具体地，源域训练样本集中被分类错误的属性特征向量的初始权重被降低后，其在下一轮模型迭代训练中所占的比重会较小，而目标域训练样本集中被分类错误的属性特征向量的初始权重被提高后，其在下一轮模型迭代训练中所占的比重会较大，由此通过调整初始权重，能够从源域训练样本集中筛选出目标场景可用的样本数据，将其与目标场景的少量样本数据结合。
[0078]
进一步地，在更新训练样本集中每个属性特征向量对应的初始权重之后，基于更新后的初始权重的分布和训练样本集，对初始用户购买行为预测模型进行迭代，得到本轮迭代后的用户购买行为预测模型。
[0079]
在本发明实施例中，针对第t轮迭代的权重分布，具体可以表示为：
[0080][0081]
其中，p
t
为第t轮迭代的权重分布，w
it
为第t轮迭代训练样本集中第i个属性特征向量对应的权重。
[0082]
进一步地，根据第t轮迭代的权重分布和训练样本集，对预测模型进行第t轮迭代训练，得到第t轮迭代对应的用户购买行为预测模型，之后计算第t轮迭代的用户购买行为预测模型在测试样本集上的错误率，该错误率的具体计算公式如下：
[0083][0084]
其中，xi属于测试样本集中的任意一个属性特征向量，f
t
(x)为第t轮迭代的预测模型，c(xi)为属性特征向量对应的实际购买行为。由此通过上述公式能够计算出第t轮迭代的预测模型对应的错误率。
[0085]
进一步地，如果第t轮迭代的预测模型对应的错误率大于或者等于预设错误率，则对其权重进行更新，具体公式如下：
[0086][0087]
其中，β为源域训练样本集中任意一个属性特征向量对应的第二权重调整速率，β
t
为目标域训练样本集中任意一个属性特征向量对应的第一权重调整速率，w
t 1
为第t 1轮迭代过程中属性特征向量对应的权重。
[0088]
进一步地，重复更新权重和对预测模型迭代训练的过程，直至某一迭代层级对应的预测模型的错误率小于预设错误率，或者已经达到预设迭代次数n，停止迭代，最终输出目标场景下的用户购买行为预测模型，该模型具体为：
[0089][0090]
205、获取待预测用户在目标场景下的基础信息、行为信息、关联信息和消费信息，并基于所述待预测用户对应的基础信息、行为信息、关联信息和消费信息，确定所述待预测用户对应的目标属性特征。
[0091]
对于本发明实施例，在构建完成目标场景下的用户购买行为预测模型之后，如果想要对某个用户在目标场景下的购买行为进行预测，需要先收集该用户在目标场景下的基础信息、行为信息、关联信息和消费信息等，之后对上述信息进行标准化处理、归一化处理和离散化处理等，得到该用户对应的目标属性特征向量。
[0092]
206、将所述目标属性特征输入至所述目标场景下的用户购买行为预测模型中进行购买行为预测，得到所述待预测用户对应的预测购买行为。
[0093]
对于本发明实施例，将用户的目标属性特征向量输入至目标场景下的用户购买行为预测模型进行行为预测，如果输出结果为1，则表示该用户未来会在目标场景下进行购买；如果输出结果为0，则表示该用户未来可能不会在该目标场景下进行购买。根据该预测结果，能够提高营销推荐的准确率。
[0094]
本发明实施例提供的另一种用户购买行为预测模型的构建方法，通过计算初始用户购买行为预测模型的错误率，能够不断对训练样本集中各个属性特征向量对应的权重进行更新，从而能够从历史场景中筛选出目标场景可用的样本数据，并将其与目标场景下的少量样本数据结合，保证目标场景具有足够多的训练样本，进而能够提高目标场景下用户购买行为预测模型的预测精度。
[0095]
进一步地，作为图1的具体实现，本发明实施例提供了一种用户购买行为预测模型的构建装置，如图3所示，所述装置包括：获取单元31、构建单元32、计算单元33和训练单元34。
[0096]
所述获取单元31，可以用于获取与用户购买行为相关联的训练样本集和测试样本集，其中，所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集。
[0097]
所述构建单元32，可以用于确定所述训练样本集中各个用户的属性特征向量对应的初始权重，并基于所述初始权重和所述训练样本集，构建初始用户购买行为预测模型。
[0098]
所述计算单元33，可以用于计算所述初始用户购买行为预测模型在所述测试样本集上的错误率，其中，所述目标域训练样本集与所述测试样本集属于同一分布，所述源域训练样本集与所述测试样本集属于不同分布。
[0099]
所述训练单元34，可以用于若所述错误率不满足预设要求，则通过更新所述初始权重，不断对所述初始用户行为购买模型进行迭代训练，直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求，将其作为所述目标场景下的用户购买行为预测模型输出。
[0100]
在具体应用场景中，所述获取单元31，如图4所示，包括：收集模块311和第一确定模块312。
[0101]
所述收集模块311，可以用于分别收集所述历史场景下各个用户的基础信息、行为
信息、关联信息和消费信息，以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息。
[0102]
所述第一确定模块312，可以用于根据所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息，以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息，确定所述历史场景和所述目标场景分别对应的各个属性特征向量。
[0103]
所述第一确定模块312，还可以用于根据所述历史场景下各个用户的实际购买行为和所述目标场景下各个用户的实际购买行为，确定所述历史场景和所述目标场景分别对应的各个属性特征向量的标签。
[0104]
所述第一确定模块312，还可以用于根据所述历史场景下的各个属性特征向量及其对应的标签，以及所述目标场景下的各个属性特征向量及其对应的标签，分别确定所述源域训练样本集和所述目标域训练样本集，其中，所述源域训练样本集中属性特征向量的数量大于所述目标域训练样本集中属性特征向量的数量。
[0105]
在具体应用场景中，所述第一确定模块312，具体可以用于基于所述目标场景所针对的人群特征，分别对所述历史场景下各个用户的基础信息、行为信息、关联信息和消费信息，以及所述目标场景下各个用户的基础信息、行为信息、关联信息和消费信息进行信息维度筛选；基于所述历史场景下各个用户筛选后的信息，以及所述目标场景下各个用户筛选后的信息，确定所述历史场景和所述目标场景分别对应的各个属性特征向量。
[0106]
在具体应用场景中，所述获取单元31，还包括：抽取模块313。
[0107]
所述抽取模块313，可以用于从所述目标场景对应的各个属性特征向量中抽取未进行标注的预设数量的属性特征向量。
[0108]
所述第一确定模块312，还可以用于根据所述未进行标注的预设数量的属性特征向量，确定所述测试样本集。
[0109]
在具体应用场景中，所述计算单元33，包括：预测模块331、处理模块332和第一计算模块333。
[0110]
所述预测模块331，可以用于将所述测试样本集中各个属性特征向量依次输入至所述初始用户购买行为预测模型中进行购买行为预测，得到所述测试样本集中各个属性特征向量对应的预测购买行为。
[0111]
所述处理模块332，可以用于对所述测试样本集中各个属性特征向量对应的初始权重进行归一化处理，得到归一化处理后的初始权重。
[0112]
所述第一计算模块333，可以用于根据所述归一化处理后的初始权重，以及所述测试样本集中各个属性特征向量对应的预测购买行为和实际购买行为，计算所述初始用户购买行为预测模型的错误率。
[0113]
在具体应用场景中，所述训练单元34，包括：第二确定模块341、第二计算模块342、降低模块343和提高模块344。
[0114]
所述第二确定模块341，可以用于在训练所述初始用户购买行为预测模型的过程中，确定所述训练样本集中被分类错误的属性特征向量。
[0115]
所述第二计算模块342，可以用于计算所述目标域训练样本集中任意一个属性特征向量对应的第一权重调整速率，以及所述源域训练样本集中任意一个属性特征向量对应的第二权重调整速率。
[0116]
所述降低模块343，可以用于若被分类错误的属性特征向量属于所述源域训练样本集，则基于所述第二权重调整速率，降低所述被分类错误的属性特征向量对应的初始权重。
[0117]
所述提高模块344，可以用于若被分类错误的属性特征向量属于所述目标域训练样本集，则基于所述第一权重调整速率，提高所述被分类错误的属性特征向量对应的初始权重。
[0118]
在具体应用场景中，所述装置还包括：确定单元35和预测单元36。
[0119]
所述获取单元31，还可以用于获取待预测用户在目标场景下的基础信息、行为信息、关联信息和消费信息。
[0120]
所述确定单元35，可以用于基于所述待预测用户对应的基础信息、行为信息、关联信息和消费信息，确定所述待预测用户对应的目标属性特征。
[0121]
所述预测单元36，可以用于将所述目标属性特征输入至所述目标场景下的用户购买行为预测模型中进行购买行为预测，得到所述待预测用户对应的预测购买行为。
[0122]
需要说明的是，本发明实施例提供的一种用户购买行为预测模型的构建装置所涉及各功能模块的其他相应描述，可以参考图1所示方法的对应描述，在此不再赘述。
[0123]
基于上述如图1所示方法，相应的，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现以下步骤：获取与用户购买行为相关联的训练样本集和测试样本集，其中，所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集；确定所述训练样本集中各个用户的属性特征向量对应的初始权重，并基于所述初始权重和所述训练样本集，构建初始用户购买行为预测模型；计算所述初始用户购买行为预测模型在所述测试样本集上的错误率，其中，所述目标域训练样本集与所述测试样本集属于同一分布，所述源域训练样本集与所述测试样本集属于不同分布；若所述错误率不满足预设要求，则通过更新所述初始权重，不断对所述初始用户行为购买模型进行迭代训练，直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求，将其作为所述目标场景下的用户购买行为预测模型输出。
[0124]
基于上述如图1所示方法和如图3所示装置的实施例，本发明实施例还提供了一种计算机设备的实体结构图，如图5所示，该计算机设备包括：处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机程序，其中存储器42和处理器41均设置在总线43上所述处理器41执行所述程序时实现以下步骤：获取与用户购买行为相关联的训练样本集和测试样本集，其中，所述训练样本集包括目标场景的目标域训练样本集和历史场景的源域训练样本集；确定所述训练样本集中各个用户的属性特征向量对应的初始权重，并基于所述初始权重和所述训练样本集，构建初始用户购买行为预测模型；计算所述初始用户购买行为预测模型在所述测试样本集上的错误率，其中，所述目标域训练样本集与所述测试样本集属于同一分布，所述源域训练样本集与所述测试样本集属于不同分布；若所述错误率不满足预设要求，则通过更新所述初始权重，不断对所述初始用户行为购买模型进行迭代训练，直至任一迭代层级对应的用户购买行为预测模型的错误率满足预设要求，将其作为所述目标场景下的用户购买行为预测模型输出。
[0125]
本发明通过计算初始用户购买行为预测模型的错误率，能够不断对训练样本集中各个属性特征向量对应的权重进行更新，从而能够从历史场景中筛选出目标场景可用的样
本数据，并将其与目标场景下的少量样本数据结合，保证目标场景具有足够多的训练样本，进而能够提高目标场景下用户购买行为预测模型的预测精度。
[0126]
显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。
[0127]
以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包括在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种城镇排水系统微塑料排放量计算与污染程度评估方法

用户购买行为预测模型的构建方法、装置及计算机设备与流程

相关文献

最热文献