对象圈选模型的训练方法、装置、设备及存储介质与流程

2022-09-03 13:53:22 来源：中国专利 TAG：

1.本技术实施例涉及人工智能技术领域，特别涉及一种对象圈选模型的训练方法、装置、设备及存储介质。

背景技术：

2.通过对象圈选的方法，可以实现从样本对象中圈选出符合特征的目标对象，从而对目标对象进行合适的推荐。
3.相关技术中，采用标签规则圈选方法，通过对样本对象进行标签的方式，从中圈选出符合特征的目标对象；或者采用树模型对象圈选方法，根据已有的目标对象和对象特征拟合出相应的函数，根据拟合函数从样本对象中确定出符合特征的目标对象。
4.但标签规则圈选方法仅限于已经被标签的样本对象，树模型对象圈选方法采用的是单模型技术，在样本对象数量较多的情况下，无法满足对象圈选的精确性要求。

技术实现要素：

5.本技术实施例提供了一种对象圈选模型的训练方法、装置、设备及存储介质。所述技术方案如下：
6.一方面，本技术实施例提供了一种对象圈选模型的训练方法，所述方法包括：
7.确定样本对象，所述样本对象设置有目标标签和n个关联标签，所述目标标签对应的目标圈选任务与所述关联标签对应的关联圈选任务之间存在关联性，n为正整数；
8.将所述样本对象的样本对象信息输入多任务学习(multi-gate mixture-of-experts，mmoe)模型，得到所述mmoe模型输出的第一预测结果和n个第二预测结果，所述第一预测结果为所述目标圈选任务对应的预测结果，所述第二预测结果为所述关联圈选任务对应的预测结果，且所述mmoe模型中的专家网络包括共享专家网络、第一专家网络和第二专家网络，所述第一专家网络是所述目标圈选任务特有的专家网络，所述第二专家网络是所述关联圈选任务特有的专家网络，所述共享专家网络是所述目标圈选任务和所述关联圈选任务共享的专家网络；
9.基于所述目标标签、n个所述关联标签、所述第一预测结果以及n个所述第二预测结果，训练所述mmoe模型；
10.基于训练得到的所述mmoe模型生成所述目标圈选任务对应的目标对象圈选模型。
11.另一方面，本技术实施例提供了一种对象圈选模型的训练装置，所述装置包括：
12.样本确定模块，用于确定样本对象，所述样本对象设置有目标标签和n个关联标签，所述目标标签对应的目标圈选任务与所述关联标签对应的关联圈选任务之间存在关联性，n为正整数；
13.结果预测模块，用于将所述样本对象的样本对象信息输入mmoe模型，得到所述mmoe模型输出的第一预测结果和n个第二预测结果，所述第一预测结果为所述目标圈选任务对应的预测结果，所述第二预测结果为所述关联圈选任务对应的预测结果，且所述mmoe
模型中的专家网络包括共享专家网络、第一专家网络和第二专家网络，所述第一专家网络是所述目标圈选任务特有的专家网络，所述第二专家网络是所述关联圈选任务特有的专家网络，所述共享专家网络是所述目标圈选任务和所述关联圈选任务共享的专家网络；
14.模型训练模块，用于基于所述目标标签、n个所述关联标签、所述第一预测结果以及n个所述第二预测结果，训练所述mmoe模型；
15.模型生成模块，用于基于训练得到的所述mmoe模型生成所述目标圈选任务对应的目标对象圈选模型。
16.另一方面，本技术实施例提供了一种计算机设备，所述计算机设备包括处理器和存储器；所述存储器存储有至少一条指令，所述至少一条指令用于被所述处理器执行以实现如上述方面所述的对象圈选模型的训练方法。
17.另一方面，本技术实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条程序代码，所述程序代码由处理器加载并执行以实现如上述方面所述的对象圈选模型的训练方法。
18.另一方面，本技术实施例提供了一种计算机程序产品，该计算机程序产品包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方面的各种可选实现方式中提供的对象圈选模型的训练方法。
19.本技术实施例中，计算机设备为确定的样本对象设置有目标标签和n个关联标签，并基于mmoe模型，同时对目标圈选任务和n个关联圈选任务进行预测，进而以目标标签、n个关联标签、第一预测结果和n个第二预测结果对mmoe模型进行训练，从而生成目标圈选任务对应的目标对象圈选模型。采用本技术实施例提供的方案，计算机设备能够根据目标圈选任务添加与其具有关联性的关联圈选任务，并在设置有共享专家网络的mmoe模型基础上，为不同的圈选任务设置特有的专家网络，通过共享专家网络和各个特有的专家网络对不同的圈选任务进行预测，从而对mmoe模型进行训练，生成目标圈选任务对应的目标对象圈选模型，提高了目标对象圈选模型的质量，进而提高了目标圈选任务的准确性。
附图说明
20.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
21.图1示出了本技术一个示例性实施例提供的对象圈选模型的训练方法的流程图；
22.图2是本技术一个示例性实施例示出的不同专家网络进行结果预测的实施示意图；
23.图3示出了本技术另一个示例性实施例提供的对象圈选模型的训练方法的流程图；
24.图4是本技术另一个示例性实施例示出的mmoe模型训练过程的实施示意图；
25.图5是本技术另一个示例性实施例示出的目标对象圈选模型的实施示意图；
26.图6示出了本技术另一个示例性实施例提供的对象圈选模型的训练方法的流程
图；
27.图7是本技术一个示例性实施例提供的对象圈选模型的训练装置的结构框图；
28.图8示出了本技术一个示例性实施例提供的计算机设备的结构方框图。
具体实施方式
29.为使本技术的目的、技术方案和优点更加清楚，下面将结合附图对本技术实施方式作进一步地详细描述。
30.在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
31.相关技术中，采用标签规则圈选方法，计算机设备首先对样本对象进行特征标签标记，并基于目标标签，从样本对象中圈选出对应的目标对象，由于该方法仅能够从有限的具有标签标记的样本对象中圈选出符合目标标签的目标对象，对于没有标签标记的样本对象，计算机设备无法判断是否符合目标标签，因此标签规则圈选方法仅适用于从有限的样本对象中圈选出目标对象。
32.采用树模型对象圈选方法，计算机设备基于确定的目标对象和目标标签之间的映射关系，拟合出相应的函数，并根据该函数，从样本对象中确定出符合目标标签的目标对象，但是该方法是一种单模型技术，已有的确定的目标对象和目标标签之间的映射关系不具有广泛性和准确性，在样本对象较多的情况下，仅根据拟合出的函数得到的目标对象，不具有准确性。
33.本技术实施例中，计算机设备通过设置与目标圈选任务具有关联性的n个关联圈选任务，利用目标标签、n个关联标签、目标圈选任务对应的第一预测结果和n个关联圈选任务对应的n个第二预测结果对mmoe模型进行训练，从而根据训练得到的mmoe模型生成目标圈选任务对应的目标对象圈选模型，提高了目标圈选任务的准确性。
34.请参考图1，其示出了本技术一个示例性实施例提供的对象圈选模型的训练方法的流程图。该方法可以包括如下步骤：
35.步骤101，确定样本对象，样本对象设置有目标标签和n个关联标签，目标标签对应的目标圈选任务与关联标签对应的关联圈选任务之间存在关联性，n为正整数。
36.首先，计算机设备根据目标圈选任务，确定样本对象。为了判断样本对象是否符合圈选目标，计算机设备为样本对象设置有目标标签，该目标标签与目标圈选任务对应。
37.同时，为了提高目标圈选任务的准确性，计算机设备设置与目标圈选任务存在关联性的n个关联圈选任务，并为样本对象对应设置n个关联标签，其中，n为正整数。
38.在一种可能的实施方式中，计算机设备根据目标圈选任务，设置有一个存在关联性的关联圈选任务，同时，为确定的样本对象设置目标标签和一个关联标签。
39.在一个示意性的例子中，目标圈选任务为商品潜在购买对象圈选任务，计算机设备设置关联圈选任务为商品广告潜在点击对象圈选任务，同时，计算机设备将商品潜在购买人群确定为样本对象，并为商品潜在购买人群设置商品潜在购买标签和商品广告潜在点击标签。
40.步骤102，将样本对象的样本对象信息输入mmoe模型，得到mmoe模型输出的第一预
测结果和n个第二预测结果，第一预测结果为目标圈选任务对应的预测结果，第二预测结果为关联圈选任务对应的预测结果，且mmoe模型中的专家网络包括共享专家网络、第一专家网络和第二专家网络，第一专家网络是目标圈选任务特有的专家网络，第二专家网络是关联圈选任务特有的专家网络，共享专家网络是目标圈选任务和关联圈选任务共享的专家网络。
41.在一种可能的实施方式中，计算机设备将样本对象的样本对象信息输入mmoe模型，从而mmoe模型基于目标圈选任务输出第一预测结果，基于n个关联圈选任务输出n个对应的第二预测结果。
42.可选的，样本对象信息可以以目标圈选任务和关联圈选任务为依据进行采集，可以包括样本画像信息、应用使用记录、搜索词记录，以及其他能够体现样本对象特征的样本对象信息，本技术实施例对此并不作限定。
43.在一种可能的实施方式中，mmoe模型中的专家网络包括共享专家网络、第一专家网络和第二专家网络，其中，第一专家网络是目标圈选任务特有的专家网络，用于对目标圈选任务进行学习；第二专家网络是关联圈选任务特有的专家网络，用于对关联圈选任务进行学习；共享专家网络是目标圈选任务和关联圈选任务共享的专家网络，用于学习目标圈选任务和关联圈选任务中共有的部分任务，并且，共享专家网络包含至少两个专家网络，用于对共有任务中不同的子任务进行学习，从而，mmoe模型输出的第一预测结果基于第一专家网络和共享专家网络学习所得，第二预测结果基于第二专家网络和共享专家网络学习所得。
44.示意性的，如图2所示，在设置有一个关联圈选任务的情况下，计算机设备将样本对象信息201输入至mmoe模型，由共享专家网络202和第一专家网络203对目标圈选任务进行学习，得到第一预测结果205，由共享专家网络202和第二专家网络204对关联圈选任务进行学习，得到第二预测结果206。
45.步骤103，基于目标标签、n个关联标签、第一预测结果以及n个第二预测结果，训练mmoe模型。
46.为了减小目标圈选任务的圈选误差，计算机设备基于目标标签、n个关联标签、第一预测结果以及n个第二预测结果，对mmoe模型进行训练。
47.在一种可能的实施方式中，在对mmoe模型进行训练的过程中，计算机设备设置有损失函数，以该损失函数为依据，对mmoe模型进行反复训练，以此来提高mmoe模型输出的准确性。
48.步骤104，基于训练得到的mmoe模型生成目标圈选任务对应的目标对象圈选模型。
49.进一步的，计算机设备基于训练得到的mmoe模型生成目标圈选任务对应的目标对象圈选模型。
50.在一种可能的实施方式中，计算机设备通过mmoe模型输出目标圈选任务和n个关联圈选任务对应的圈选结果，为了进一步实现对目标对象的圈选，计算机设备基于mmoe模型中目标圈选任务对应的部分网络，生成对应的目标对象圈选模型。
51.综上所述，本技术实施例中，计算机设备为确定的样本对象设置有目标标签和n个关联标签，并基于mmoe模型，同时对目标圈选任务和n个关联圈选任务进行预测，进而以目标标签、n个关联标签、第一预测结果和n个第二预测结果对mmoe模型进行训练，从而生成目
标圈选任务对应的目标对象圈选模型。采用本技术实施例提供的方案，计算机设备能够根据目标圈选任务添加与其具有关联性的关联圈选任务，并在设置有共享专家网络的mmoe模型基础上，为不同的圈选任务设置特有的专家网络，通过共享专家网络和各个特有的专家网络对不同的圈选任务进行预测，从而对mmoe模型进行训练，生成目标圈选任务对应的目标对象圈选模型，提高了目标对象圈选模型的质量，进而提高了目标圈选任务的准确性。
52.为了提高目标对象圈选模型的圈选准确性，计算机设备需要通过mmoe模型对样本对象的样本对象信息进行特征提取，并生成预测结果，进而对mmoe模型进行反复训练，下面通过具体的实施例对获取样本对象信息以及利用样本对象信息对mmoe模型进行训练的过程进行详细说明。
53.请参考图3，其示出了本技术另一个示例性实施例提供的对象圈选模型的训练方法的流程图。该方法可以包括如下步骤：
54.步骤301，确定样本对象，样本对象设置有目标标签和n个关联标签，目标标签对应的目标圈选任务与关联标签对应的关联圈选任务之间存在关联性，n为正整数。
55.本步骤的实施方式可以参考上述步骤101，本实施例在此不作赘述。
56.步骤302，获取样本对象的原始对象信息。
57.计算机设备获取样本对象的原始对象信息，该原始对象信息是对样本对象特征的直接表现。
58.可选的，原始对象信息可以是样本对象的画像信息、应用使用记录、网页浏览记录等，本技术实施例对此并不作限定。
59.步骤303，对原始对象信息进行预处理，得到样本对象信息，其中，预处理包括信息聚合处理以及信息增益处理中的至少一种。
60.由于样本对象数量较多，单个样本对象之间的样本对象特征也是多样的，获取的原始对象信息也各不相同，因此为了能够对样本对象进行不同程度的分类，计算机设备需要对原始对象信息进行预处理，得到样本对象信息，从而计算机设备能够根据样本对象信息对样本对象进行不同的特征分类，其中，预处理包括信息聚合处理以及信息增益处理中的至少一种。
61.在一种可能的实施方式中，原始对象信息包括应用使用记录，该应用使用记录包括应用包名。
62.由于通过不同途径下载的应用所具有的应用包名可能存在差异，如果直接以应用包名作为样本对象的分类标准对样本对象进行划分，那么使用同一应用的样本对象将会因为应用包名的差异而被划分到不同类别，并且以应用包名作为分类标准对样本对象进行划分，所得到的划分类别过于详细，且区分不明显，因此计算机设备通过信息聚合处理的方式对应用包名进行处理，从而以应用名称作为样本对象信息对样本对象进行划分。
63.在一种可能的实施方式中，对应用包名进行信息聚合处理可以包括以下步骤：
64.1、获取原始对象信息中包含的应用包名。
65.首先，计算机设备获取原始对象信息中包含的应用包名，该应用包名是样本对象实际使用应用对应的应用包名。
66.2、基于应用包名之间的包名相似度，对应用包名进行聚类，得到应用类簇。
67.对于存在差异的应用包名，计算机设备基于应用包名之间的包名相似度，对应用
包名进行聚类，得到应用类簇。
68.可选的，由于以包名相似度对应用包名进行聚类需要以包名表示同一应用为前提，因此计算机设备只对包名相似度较高的应用包名进行聚类。
69.3、将原始对象信息中的应用包名替换为应用包名所属应用类簇对应的应用名称。
70.进一步的，计算机设备将原始对象信息中的应用包名替换为应用包名所属应用类簇对应的应用名称，从而该应用名称作为样本对象信息表现样本对象特征。
71.在一种可能的实施方式中，原始对象信息包括画像信息，该画像信息中包含待映射数据，待映射数据用于被映射至数据区间。
72.可选的，画像信息中的待映射数据可以包括身高、体重、年龄等，本技术实施例对此并不作限定。
73.相关技术中，计算机设备以固定的数据区间对待映射数据进行映射，增加了数据区间中特征选择的不确定性，本技术实施例中，通过对待映射数据进行信息增益处理，确定出符合待映射数据特征的数据区间，能够将特征相近的待映射数据划分在同一数据区间，提高了数据区间划分的合理性。
74.在一种可能的实施方式中，对待映射数据进行信息增益处理可以包括以下步骤：
75.1、获取原始对象信息中包含的待映射数据。
76.首先，计算机设备获取原始对象信息中包含的待映射数据，该待映射数据直接表现样本对象的画像特征。
77.2、确定待映射数据以及待映射数据所属样本对象的样本标签，样本标签包括目标标签和关联标签。
78.计算机设备对待映射数据进行确认，并获取待映射数据所属样本对象的样本标签，该样本标签包括目标标签和关联标签。
79.示意性的，以待映射数据为年龄，目标标签为购买商品为例，计算机设备确定样本对象的年龄数据以及购买商品的情况，得到样本数据有(25,0)，(27,1)，(30,0),(39,1),(42,1)，其中，0表示未购买商品，1表示购买商品。
80.3、基于待映射数据和样本标签确定原始信息熵。
81.为了在区间划分过程中，确定出最佳区间划分点，计算机设备根据待映射数据和样本标签确定原始信息熵，以原始信息熵为参考依据，进行信息增益计算。
82.示意性的，以待映射数据为年龄，样本标签为购买商品为例，原始信息熵可以表示为：
[0083][0084]
4、基于候选区间划分方式，将待映射数据映射至候选数据区间。
[0085]
为了能够找到最佳区间划分点，计算机设备以每一个待映射数据为一次候选区间划分点，对待映射数据进行划分，从而计算机设备基于候选区间划分方式，将待映射数据映射至候选数据区间。
[0086]
5、基于候选数据区间和样本标签确定候选信息熵。
[0087]
进一步的，计算机设备基于当前候选数据区间和样本标签确定当前候选信息标签。
[0088]
示意性的，以年龄30为区间划分点，对待映射数据进行区间划分，得到候选信息熵为：info(x≤30)＝p1entropy(x≤30) p2entropy(x》30)
[0089][0090][0091]
info(x≤30)＝0.551
[0092]
6、基于原始信息熵和候选信息熵，确定候选区间划分方式对应的信息增益值。
[0093]
根据计算得到的原始信息熵和候选信息熵，计算机设备确定当前候选区间划分方式对应的信息增益值，其中，信息增益值为原始信息熵和候选信息熵之差。
[0094]
示意性的，以年龄30为区间划分点，得到的信息增益值可以表示为：
[0095]
entropy(y)-info(x≤30)＝0.97-0.551＝0.419
[0096]
7、基于信息增益值确定目标区间划分方式。
[0097]
通过以每一个待映射数据为一次候选区间划分点，计算信息增益值的方式，根据信息增益值越大，候选区间划分状态越稳定的规律，计算机设备确定出目标区间划分方式。
[0098]
步骤304，通过mmoe模型的嵌入网络对样本对象的样本对象信息进行嵌入处理，得到嵌入式特征。
[0099]
由于样本对象信息是以文本数据的形式呈现，而mmoe模型只能对数值向量进行处理，因此在将样本对象信息输入mmoe模型时，计算机设备通过mmoe模型的嵌入网络对样本对象的样本对象信息进行嵌入处理，将样本对象信息进行文本向量化处理，从而得到样本对象信息对应的嵌入式特征。
[0100]
示意性的，如图4所示，计算机设备将样本对象信息输入至mmoe模型，通过嵌入网络401对样本对象信息进行嵌入处理，从而得到样本对象信息对应的嵌入式特征，以便mmoe模型进行相应的特征提取。
[0101]
步骤305，通过共享专家网络、第一专家网络以及第一门网络对嵌入式特征进行特征提取，得到第一中间特征。
[0102]
进一步的，为了得到目标圈选任务与样本对象信息之间的对应关系，计算机设备通过共享专家网络、第一专家网络以及第一门网络对嵌入式特征进行特征提取，从而得到第一中间特征。
[0103]
在一种可能的实施方式中，该步骤可以包括以下子步骤：
[0104]
步骤305a，将嵌入式特征输入共享专家网络，得到各个共享专家网络输出的共享特征。
[0105]
在一种可能的实施方式中，计算机设备将嵌入式特征输入共享专家网络，由共享专家网络对嵌入式特征进行特征提取，并对该嵌入式特征进行学习，进而各个共享专家网络输出提取的共享特征。
[0106]
示意性的，如图4所示，计算机设备通过共享专家网络中的第一共享专家网络4021、第二共享专家网络4022和第三共享专家网络4023对嵌入式特征进行特征提取，其中，各个共享专家网络对嵌入式特征的不同方面进行特征提取，从而得到共享特征。
[0107]
步骤305b，将嵌入式特征输入第一门网络，得到第一门网络输出的第一权重集合，
第一权重集合中包含各个共享特征的权重。
[0108]
由于各个共享专家网络负责从嵌入式特征的不同方面进行特征提取，对于不同圈选任务而言，其所对应的各个共享特征所占权重也不同，因此计算机设备需要通过不同圈选任务对应的门网络得到各个共享特征所占权重。
[0109]
在一种可能的实施方式中，计算机设备将嵌入式特征输入目标圈选任务对应的第一门网络，由第一门网络对嵌入式特征进行特征提取，得到第一门网络输出的第一权重集合，其中，该第一权重集合中包含各个共享特征的权重。
[0110]
示意性的，如图4所示，计算机设备将嵌入式特征输入第一门网络405，由第一门网络405对嵌入式特征进行特征提取，从而得到第一权重集合。
[0111]
步骤305c，将嵌入式特征输入第一专家网络，得到第一专家网络输出的第一特有特征。
[0112]
为了得到目标圈选任务特有的特征，计算机设备将嵌入式特征输入目标圈选任务对应的第一专家网络，由第一专家网络对嵌入式特征进行特征提取，并对该嵌入式特征进行学习，进而得到第一专家网络输出的第一特有特征。
[0113]
示意性的，如图4所示，计算机设备将嵌入式特征输入目标圈选任务对应的第一专家网络403，由第一专家网络403对嵌入式特征进行特征提取，并对该嵌入式特征进行学习，进而得到第一专家网络403输出的第一特有特征。
[0114]
步骤305d，基于第一权重集合对共享特征进行特征融合，得到第一融合特征。
[0115]
由于不同圈选任务中，各个共享特征所占权重不同，因此计算机设备基于第一权重集合对共享专家网络输出的共享特征进行特征融合，得到目标圈选任务对应的第一融合特征。
[0116]
示意性的，如图4所示，计算机设备基于第一门网络405输出的第一权重集合对第一共享专家网络4021、第二共享专家网络4022和第三共享专家网络4023输出的共享特征进行特征融合，从而得到第一融合特征。
[0117]
步骤305e，基于第一融合特征和第一特有特征生成第一中间特征。
[0118]
进而，计算机设备基于第一融合特征和第一特有特征生成目标圈选任务对应的第一中间特征。
[0119]
步骤306，将第一中间特征输入第一塔式网络，得到第一塔式网络输出的第一预测结果。
[0120]
为了使对应不同圈选任务的门网络学习不同的共享专家网络组合模式，得到不同圈选任务和共享专家网络之间的关系，计算机设备将第一中间特征输入第一塔式网络，第一塔式网络对应目标圈选任务，从而得到第一塔式网络输出的第一预测结果。
[0121]
示意性的，如图4所示，计算机设备将第一中间特征输入目标圈选任务对应的第一塔式网络407，从而得到第一塔式网络407输出的第一预测结果409。
[0122]
步骤307，通过共享专家网络、n个第二专家网络以及n个第二门网络对嵌入式特征进行特征提取，得到n个第二中间特征。
[0123]
同时，为了得到各个关联圈选任务与样本对象信息之间的对应关系，计算机设备通过共享专家网络、n个第二专家网络以及n个第二门网络对嵌入式特征进行特征提取，从而得到n个第二中间特征。
[0124]
在一种可能的实施方式中，对于各个关联圈选任务，该步骤可以包括以下子步骤：
[0125]
步骤307a，将嵌入式特征输入共享专家网络，得到各个共享专家网络输出的共享特征。
[0126]
在一种可能的实施方式中，计算机设备将嵌入式特征输入共享专家网络，由共享专家网络对嵌入式特征进行特征提取，并对该嵌入式特征进行学习，进而各个共享专家网络输出提取的共享特征。
[0127]
示意性的，如图4所示，计算机设备通过共享专家网络中的第一共享专家网络4021、第二共享专家网络4022和第三共享专家网络4023对嵌入式特征进行特征提取，其中，各个共享专家网络对嵌入式特征的不同方面进行特征提取，从而得到共享特征。
[0128]
步骤307b，将嵌入式特征输入第二门网络，得到第二门网络输出的第二权重集合，第二权重集合中包含各个共享特征的权重。
[0129]
为了得到各个关联圈选任务对应的各个共享特征的权重，计算机设备将嵌入式特征输入第二门网络，由第二门网络对嵌入式特征进行特征提取，得到第二门网络输出的关联圈选任务对应的第二权重集合。
[0130]
示意性的，如图4所示，计算机设备将嵌入式特征输入第二门网络406，由第二门网络406对嵌入式特征进行特征提取，从而得到第二权重集合。
[0131]
步骤307c，将嵌入式特征输入第二专家网络，得到第二专家网络输出的第二特有特征。
[0132]
为了得到关联圈选任务特有的特征，计算机设备将嵌入式特征输入第二专家网络，由第二专家网络对嵌入式特征进行特征提取，并对该嵌入式特征进行学习，进而得到第二专家网络输出的关联圈选任务对应的第二特有特征。
[0133]
示意性的，如图4所示，计算机设备将嵌入式特征输入关联圈选任务对应的第二专家网络404，由第二专家网络404对嵌入式特征进行特征提取，并对该嵌入式特征进行学习，进而得到第二专家网络404输出的第二特有特征。
[0134]
步骤307d，基于第二权重集合对共享特征进行特征融合，得到第二融合特征。
[0135]
由于不同圈选任务中，各个共享特征所占权重不同，因此计算机设备基于第二权重集合对共享专家网络输出的共享特征进行特征融合，得到关联圈选任务对应的第二融合特征。
[0136]
示意性的，如图4所示，计算机设备基于第二门网络406输出的第二权重集合对第一共享专家网络4021、第二共享专家网络4022和第三共享专家网络4023输出的共享特征进行特征融合，从而得到第二融合特征。
[0137]
步骤307e，基于第二融合特征和第二特有特征生成第二中间特征。
[0138]
进而，计算机设备基于第二融合特征和第二特有特征生成关联圈选任务对应的第二中间特征。
[0139]
步骤308，将n个第二中间特征输入n个第二塔式网络，得到n个第二塔式网络输出的n个第二预测结果。
[0140]
同样的，计算机设备将n个第二中间特征输入对应的n个第二塔式网络，第二塔式网络对应n个关联圈选任务，从而得到n个第二塔式网络输出的n个第二预测结果。
[0141]
示意性的，如图4所示，计算机设备将第二中间特征输入关联圈选任务对应的第二
塔式网络408，从而得到第二塔式网络408输出的第二预测结果410。
[0142]
步骤309，基于目标标签、n个关联标签、第一预测结果以及n个第二预测结果，训练mmoe模型。
[0143]
本步骤的实施方式可以参考上述步骤103，本实施例在此不作赘述。
[0144]
步骤310，基于训练得到的mmoe模型中的共享专家网络、第一专家网络、第一门网络以及第一塔式网络，生成目标对象圈选模型。
[0145]
进一步的，计算机设备基于训练得到的mmoe模型中的共享专家网络、第一专家网络、第一门网络以及第一塔式网络，生成目标对象圈选模型。
[0146]
示意性的，如图5所示，计算机设备基于嵌入网络501、第一共享专家网络5021、第二共享专家网络5022、第三共享专家网络5023、第一专家网络503、第一门网络504以及第一塔式网络505，生成目标圈选任务对应的目标对象圈选模型。
[0147]
上述实施例中，计算机设备通过对原始对象信息进行预处理得到样本对象信息，能够得到样本对象更加统一和规律性的特征，使得样本对象与样本对象信息之间的特征映射更加标准化。同时，计算机设备基于mmoe模型中共享专家网络、第一专家网络和第二专家网络对不同圈选任务进行特征提取和学习，并利用不同圈选任务对应门网络输出的权重集合对共享专家网络输出的共享特征进行权重融合，得到不同圈选任务的融合特征，从而提高了mmoe模型对不同圈选任务的预测结果的准确性。
[0148]
在一种可能的实施方式中，计算机设备基于生成的目标对象圈选模型对目标对象进行圈选。该过程可以包括以下步骤：
[0149]
1、获取目标对象的目标对象信息。
[0150]
在一种可能的实施方式中，计算机设备获取目标对象的目标对象信息，该目标对象信息可以包括目标对象画像信息、应用使用记录、搜索浏览记录等，本技术实施例对此并不作限定。
[0151]
2、将目标对象信息输入目标对象圈选模型，得到目标对象圈选模型输出的圈选结果。
[0152]
进一步的，计算机设备将目标对象信息输入目标对象圈选模型，通过目标对象圈选模型输出各个目标对象对应的圈选结果，从而计算机设备基于该圈选结果，以设定的目标圈选结果为依据，从目标对象中圈选出符合目标圈选结果的圈选对象。
[0153]
结合上述实施例，以目标圈选任务为商品潜在购买对象圈选任务，关联圈选任务至少包括商品广告潜在点击对象圈选任务为例进行说明。
[0154]
步骤601，确定样本对象，样本对象设置有商品购买标签和商品广告点击标签。
[0155]
首先，计算机设备确定样本对象，并基于商品潜在购买对象圈选任务和商品广告潜在点击对象圈选任务，为样本对象设置商品购买标签和商品广告点击标签。
[0156]
在一种可能的实施方式中，样本对象可以确定为最近一个月已经购买过商品的对象、最近一个月点击商品广告但未购买商品的对象，以及最近一个月没有购买过商品且没有点击过商品广告的对象，从而计算机设备为样本对象设置有商品购买标签和商品广告点击标签，最近一个月已经购买过商品的对象对应的商品购买标签为1，最近一个月没有购买过商品的对象对应的商品购买标签为0，最近一个月点击过商品广告的对象对应的商品广告点击标签为1，最近一个月没有点击过商品广告的对象对应的商品广告点击标签为0。
[0157]
步骤602，获取样本对象的原始对象信息，原始对象信息包括原始应用使用信息、原始历史搜索信息和原始画像信息中的至少一种。
[0158]
计算机设备获取样本对象的原始对象信息，该原始对象信息包括原始应用使用信息、原始历史搜索信息和原始画像信息中的至少一种，其中，原始画像信息可以包括年龄、性别等，原始应用使用信息可以包括应用包名、应用使用时长等，原始历史搜索信息可以包括搜索词信息、搜索网页浏览时长等。
[0159]
步骤603，对原始对象信息进行预处理，得到样本对象信息。
[0160]
计算机设备对原始对象信息进行预处理，得到样本对象信息，其中，样本对象信息包括应用使用信息、历史搜索信息以及画像信息中的至少一种。
[0161]
在一个示意性的例子中，计算机设备首先获取样本对象的原始应用使用信息，并根据应用安装量将安装量少于1000的应用过滤，在对应用包名进行信息聚合处理之后，得到应用名称作为样本对象信息，进而计算机设备根据应用名称建立一份索引，对应用名称依次标号，该索引大小为99999，进而对样本对象最近一个月的应用使用记录进行统计，并按照距离信息获取时刻时间间隔由近到远的关系，对样本对象使用应用的顺序进行排序，截取样本对象应用使用记录的前100个使用记录，对于不足100的部分，以索引值100000作为补充。
[0162]
在一个示意性的例子中，计算机设备获取样本对象的原始历史搜索信息，并根据搜索词建立一份索引，对搜索词依次标号，该索引大小为99999，进而对样本对象最近一个月的搜索词记录进行统计，按照搜索词出现次数大小进行排序，并截取样本对象搜索词记录的前200个搜索词，对于不足200的部分，以索引值200000作为补充。
[0163]
在一个示意性的例子中，计算机设备获取样本对象的原始画像信息，包括样本对象的性别和年龄，其中将性别男标号为200010，性别女标号为200011，空值用200012作为补充，进而对年龄进行信息增益处理，得到年龄最佳划分区间为0～17，18～22，23～28，29～32，33～40，41～45，46～59，60及以上，从而计算机设备对八个年龄段进行标号，分别为200001～200008，空值用200009作为补充。
[0164]
步骤604，将样本对象的样本对象信息输入mmoe模型，得到mmoe模型输出的第一预测结果和第二预测结果。
[0165]
计算机设备将处理得到的样本对象信息输入mmoe模型，通过mmoe模型得到商品潜在购买对象圈选任务对应的第一预测结果，以及商品广告潜在点击对象圈选任务对应的第二预测结果。
[0166]
步骤605，基于商品购买标签、商品广告点击标签、第一预测结果以及第二预测结果，训练mmoe模型。
[0167]
在一种可能的实施方式中，计算机设备基于商品购买标签、商品广告点击标签、商品潜在购买对象圈选任务对应的第一预测结果、商品广告潜在点击对象圈选任务对应的第二预测结果，对mmoe模型进行训练。
[0168]
步骤606，基于训练得到的mmoe模型中的共享专家网络、第一专家网络、第一门网络以及第一塔式网络，生成商品潜在购买对象圈选模型。
[0169]
进一步的，计算机设备基于训练得到的mmoe模型中的共享专家网络、第一专家网络、第一门网络以及第一塔式网络，生成商品潜在购买对象圈选模型。
[0170]
步骤607，获取目标对象的目标对象信息。
[0171]
在一种可能的实施方式中，计算机设备获取目标对象的目标对象信息，该目标对象信息包括应用使用信息、历史搜索信息和画像信息中的至少一种。
[0172]
步骤608，将目标对象信息输入商品潜在购买对象圈选模型，得到商品潜在购买对象圈选模型输出的圈选结果。
[0173]
进一步的，计算机设备将目标对象信息输入商品潜在购买对象圈选模型，通过该模型输出目标对象购买商品的圈选结果，从而计算机设备对达到目标圈选结果的目标对象进行圈选，圈选所得的目标对象即为商品潜在购买对象。
[0174]
在一个示意性的例子中，计算机设备设定目标圈选结果为0.75，当商品潜在购买对象圈选模型输出的目标对象圈选结果为0.8时，计算机设备对该目标对象进行圈选。
[0175]
上述实施例中，在目标圈选任务为商品潜在购买对象圈选任务，关联圈选任务为商品广告潜在点击对象圈选任务的情况下，计算机设备对不同原始对象信息分别进行处理，提高了样本对象与样本对象信息之间的对应关系。
[0176]
需要说明的是，本技术所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本技术中涉及到的画像信息、应用使用信息、历史搜索信息等都是在充分授权的情况下获取的。
[0177]
请参考图7，其示出了本技术一个示例性实施例提供的对象圈选模型的训练装置的结构框图，该装置可以包括如下结构：
[0178]
样本确定模块701，用于确定样本对象，所述样本对象设置有目标标签和n个关联标签，所述目标标签对应的目标圈选任务与所述关联标签对应的关联圈选任务之间存在关联性，n为正整数；
[0179]
结果预测模块702，用于将所述样本对象的样本对象信息输入mmoe模型，得到所述mmoe模型输出的第一预测结果和n个第二预测结果，所述第一预测结果为所述目标圈选任务对应的预测结果，所述第二预测结果为所述关联圈选任务对应的预测结果，且所述mmoe模型中的专家网络包括共享专家网络、第一专家网络和第二专家网络，所述第一专家网络是所述目标圈选任务特有的专家网络，所述第二专家网络是所述关联圈选任务特有的专家网络，所述共享专家网络是所述目标圈选任务和所述关联圈选任务共享的专家网络；
[0180]
模型训练模块703，用于基于所述目标标签、n个所述关联标签、所述第一预测结果以及n个所述第二预测结果，训练所述mmoe模型；
[0181]
模型生成模块704，用于基于训练得到的所述mmoe模型生成所述目标圈选任务对应的目标对象圈选模型。
[0182]
可选的，所述mmoe模型还包括所述目标圈选任务对应的第一门网络和第一塔式网络，以及各个所述关联圈选任务各自对应的第二门网络和第二塔式网络；
[0183]
所述结果预测模块702，包括：
[0184]
嵌入处理单元，用于通过所述mmoe模型的嵌入网络对所述样本对象的所述样本对象信息进行嵌入处理，得到嵌入式特征；
[0185]
第一特征提取单元，用于通过所述共享专家网络、所述第一专家网络以及所述第
一门网络对所述嵌入式特征进行特征提取，得到第一中间特征；
[0186]
第一结果预测单元，用于将所述第一中间特征输入所述第一塔式网络，得到所述第一塔式网络输出的所述第一预测结果；
[0187]
第二特征提取单元，用于通过所述共享专家网络、n个所述第二专家网络以及n个所述第二门网络对所述嵌入式特征进行特征提取，得到n个第二中间特征；
[0188]
第二结果预测单元，用于将n个所述第二中间特征输入n个所述第二塔式网络，得到n个所述第二塔式网络输出的n个所述第二预测结果。
[0189]
可选的，所述第一特征提取单元，用于：
[0190]
将所述嵌入式特征输入所述共享专家网络，得到各个所述共享专家网络输出的共享特征；
[0191]
将所述嵌入式特征输入所述第一门网络，得到所述第一门网络输出的第一权重集合，所述第一权重集合中包含各个所述共享特征的权重；
[0192]
将所述嵌入式特征输入所述第一专家网络，得到所述第一专家网络输出的第一特有特征；
[0193]
基于所述第一权重集合对所述共享特征进行特征融合，得到第一融合特征；
[0194]
基于所述第一融合特征和所述第一特有特征生成所述第一中间特征。
[0195]
可选的，对于各个所述关联圈选任务，所述第二特征提取单元，用于：
[0196]
将所述嵌入式特征输入所述共享专家网络，得到各个所述共享专家网络输出的共享特征；
[0197]
将所述嵌入式特征输入所述第二门网络，得到所述第二门网络输出的第二权重集合，所述第二权重集合中包含各个所述共享特征的权重；
[0198]
将所述嵌入式特征输入所述第二专家网络，得到所述第二专家网络输出的第二特有特征；
[0199]
基于所述第二权重集合对所述共享特征进行特征融合，得到第二融合特征；
[0200]
基于所述第二融合特征和所述第二特有特征生成所述第二中间特征。
[0201]
可选的，所述模型生成模块704，用于：
[0202]
基于训练得到的所述mmoe模型中的所述共享专家网络、所述第一专家网络、所述第一门网络以及所述第一塔式网络，生成所述目标对象圈选模型。
[0203]
可选的，所述装置还包括：
[0204]
信息获取模块，用于获取所述样本对象的原始对象信息；
[0205]
信息处理模块，用于对所述原始对象信息进行预处理，得到所述样本对象信息，其中，所述预处理包括信息聚合处理以及信息增益处理中的至少一种。
[0206]
可选的，所述原始对象信息包括应用使用记录，所述应用使用记录包括应用包名；
[0207]
所述信息处理模块，用于：
[0208]
获取所述原始对象信息中包含的所述应用包名；
[0209]
基于所述应用包名之间的包名相似度，对所述应用包名进行聚类，得到应用类簇；
[0210]
将所述原始对象信息中的所述应用包名替换为所述应用包名所属应用类簇对应的应用名称。
[0211]
可选的，所述原始对象信息包括画像信息，所述画像信息中包含待映射数据，所述
待映射数据用于被映射至数据区间；
[0212]
所述信息处理模块，用于：
[0213]
获取所述原始对象信息中包含的所述待映射数据；
[0214]
确定所述待映射数据以及所述待映射数据所属样本对象的样本标签，所述样本标签包括所述目标标签和所述关联标签；
[0215]
基于所述待映射数据和所述样本标签确定原始信息熵；
[0216]
基于候选区间划分方式，将所述待映射数据映射至候选数据区间；
[0217]
基于所述候选数据区间和所述样本标签确定候选信息熵；
[0218]
基于所述原始信息熵和所述候选信息熵，确定所述候选区间划分方式对应的信息增益值；
[0219]
基于所述信息增益值确定目标区间划分方式。
[0220]
可选的，所述装置还包括：
[0221]
信息获取模块，用于获取目标对象的目标对象信息；
[0222]
结果输出模块，用于将所述目标对象信息输入所述目标对象圈选模型，得到所述目标对象圈选模型输出的圈选结果。
[0223]
可选的，所述目标圈选任务为商品潜在购买对象圈选任务，所述关联圈选任务至少包括商品广告潜在点击对象圈选任务；
[0224]
所述样本对象信息包括应用使用信息、历史搜索信息以及画像信息中的至少一种。
[0225]
综上所述，本技术实施例中，计算机设备为确定的样本对象设置有目标标签和n个关联标签，并基于mmoe模型，同时对目标圈选任务和n个关联圈选任务进行预测，进而以目标标签、n个关联标签、第一预测结果和n个第二预测结果对mmoe模型进行训练，从而生成目标圈选任务对应的目标对象圈选模型。采用本技术实施例提供的方案，计算机设备能够根据目标圈选任务添加与其具有关联性的关联圈选任务，并在设置有共享专家网络的mmoe模型基础上，为不同的圈选任务设置特有的专家网络，通过共享专家网络和各个特有的专家网络对不同的圈选任务进行预测，从而对mmoe模型进行训练，生成目标圈选任务对应的目标对象圈选模型，提高了目标对象圈选模型的质量，进而提高了目标圈选任务的准确性。
[0226]
需要说明的是：上述实施例提供的装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其实现过程详见方法实施例，这里不再赘述。
[0227]
请参考图8，其示出了本技术一个示例性实施例提供的计算机设备的结构方框图。计算机设备1200可以包括一个或多个如下部件：处理器1210和存储器1220。
[0228]
处理器1210可以包括一个或者多个处理核心。处理器1210利用各种接口和线路连接整个计算机设备1200内的各个部分，通过运行或执行存储在存储器1220内的指令、程序、代码集或指令集，以及调用存储在存储器1220内的数据，执行计算机设备1200的各种功能和处理数据。可选地，处理器1210可以采用数字信号处理(digital signal processing，dsp)、现场可编程门阵列(field－programmable gate array，fpga)、可编程逻辑阵列(programmable logic array，pla)中的至少一种硬件形式来实现。处理器1210可集成中央
处理器(central processing unit，cpu)、图像处理器(graphics processing unit，gpu)、神经网络处理器(neural-network processing unit，npu)和调制解调器等中的一种或几种的组合。其中，cpu主要处理操作系统、用户界面和应用程序等；gpu用于负责触摸显示屏所需要显示的内容的渲染和绘制；npu用于实现人工智能(artificial intelligence，ai)功能；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器1210中，单独通过一块芯片进行实现。
[0229]
存储器1220可以包括随机存储器(random access memory，ram)，也可以包括只读存储器(read-only memory，rom)。可选地，该存储器1220包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器1220可用于存储指令、程序、代码、代码集或指令集。存储器1220可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等；存储数据区可存储根据计算机设备1200的使用所创建的数据(比如音频数据、电话本)等。
[0230]
除此之外，本领域技术人员可以理解，上述附图所示出的计算机设备1200的结构并不构成对计算机设备的限定，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。比如，计算机设备1200中还包括显示屏、摄像头、麦克风、扬声器、射频电路、输入单元、传感器(比如加速度传感器、角速度传感器、光线传感器等等)、音频电路、wifi模块、电源、蓝牙模块等部件，在此不再赘述。
[0231]
本技术实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有至少一条程序代码，所述程序代码由处理器加载并执行以实现如上各个实施例所述的对象圈选模型的训练方法。
[0232]
本技术实施例提供了一种计算机程序产品，该计算机程序产品包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方面的各种可选实现方式中提供的对象圈选模型的训练方法。
[0233]
应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外，本文中描述的步骤编号，仅示例性示出了步骤间的一种可能的执行先后顺序，在一些其它实施例中，上述步骤也可以不按照编号顺序来执行，如两个不同编号的步骤同时执行，或者两个不同编号的步骤按照与图示相反的顺序执行，本技术实施例对此不作限定。
[0234]
以上所述仅为本技术的可选实施例，并不用以限制本技术，凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：虚拟数字人动态嘴型的生成方法及相关设备与流程

对象圈选模型的训练方法、装置、设备及存储介质与流程

相关文献

最热文献