模型训练方法、目标对象选取方法、装置及电子设备与流程

2022-09-04 04:41:41 来源：中国专利 TAG：

1.本技术属于计算机技术领域，具体涉及一种模型训练方法、目标对象选取方法、装置、电子设备及存储介质。

背景技术：

2.随着互联网的高速发展和大数据时代的到来，人们被海量的信息包围，为了给每个用户精准地推送信息，推荐系统开始成为研究热点。但在相关的目标对象选取方法中，推荐准确度还有待提高。

技术实现要素：

3.鉴于上述问题，本技术提出了一种模型训练方法、目标对象选取方法、装置、电子设备以及存储介质，以实现改善上述问题。
4.第一方面，本技术实施例提供了一种模型训练方法，所述方法包括：获取训练数据，所述训练数据包括第一训练数据和第二训练数据，所述第一训练数据包括用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征，所述第二训练数据包括用户的关键用户特征，所述用户特征包括所述关键用户特征；基于所述训练数据对待训练模型进行训练，直至满足训练结束条件，得到参数预测模型。
5.第二方面，本技术实施例提供了一种目标对象选取方法，所述方法包括：获取目标用户特征和候选目标对象特征；将所述目标用户特征和候选目标对象特征输入参数预测模型，获取所述参数预测模型输出的所述候选目标对象对应的推荐分数，所述参数预测模型基于权利要求1-5任一所述方法的得到；基于所述推荐分数确定所述目标用户对应的目标对象。
6.第三方面，本技术实施例提供了一种模型训练装置，所述装置包括：数据获取单元，用于获取训练数据，所述训练数据包括第一训练数据和第二训练数据，所述第一训练数据包括用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征，所述第二训练数据用户的关键用户特征，所述用户特征包括所述关键用户特征；训练单元，用于基于所述训练数据对待训练模型进行训练，直至满足训练结束条件，得到参数预测模型。
7.第四方面，本技术实施例提供了一种目标对象选取装置，所述装置包括：特征获取单元，用于获取目标用户特征和候选目标对象特征；分数确定单元，用于将所述目标用户特征和候选目标对象特征输入参数预测模型，获取所述参数预测模型输出的所述候选目标对象对应的推荐分数，所述参数预测模型基于权利要求1-5任一所述方法的得到；目标对象确定单元，用于基于所述推荐分数确定所述目标用户对应的目标对象。
8.第五方面，本技术实施例提供了一种电子设备，包括一个或多个处理器以及存储器；一个或多个程序，其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行上述的方法。
9.第六方面，本技术实施例提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码运行时执行上述的方法。
10.本技术实施例提供了一种模型训练方法、目标对象选取方法、装置、电子设备及存储介质。在获取到包括第一训练数据和第二训练数据的训练数据后，通过获取到的训练数据对待训练模型进行训练，得到参数预测模型，其中，所述第一训练数据包括每个用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征，所述第二训练数据每个用户的关键用户特征。通过上述方法，在通过第一训练数据和第二训练数据对待训练模型进行训练时，关注了在新用户上覆盖度比较高的关键用户特征，使得这部分在新用户上覆盖度高的特征在模型中的权重更大，从而加强了这批特征对模型的影响程度，进而提高了参数预测模型预测的参数的准确性，使得可以更精确的向用户推荐目标对象。
附图说明
11.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
12.图1示出了本技术一实施例提出的一种模型训练方法、目标对象选取方法的应用场景示意图；
13.图2示出了本技术一实施例提出的一种模型训练方法、目标对象选取方法的应用场景示意图；
14.图3示出了本技术一实施例提出的一种模型训练方法的流程图；
15.图4示出了本技术另一实施例提出的一种模型训练方法的流程图；
16.图5示出了本技术另一实施例中的senet的工作示意图；
17.图6示出了本技术另一实施例中步骤s220的流程图；
18.图7示出了本技术另一实施例中步骤s230的流程图；
19.图8示出了本技术另一实施例中步骤s240的流程图；
20.图9示出了本技术另一实施例中的参数预测模型的网络结构示意图；
21.图10示出了本技术又一实施例提出的目标对象选取的流程图；
22.图11示出了本技术实施例提出的一种模型训练装置的结构框图；
23.图12示出了本技术实施例提出的一种推荐装置的结构框图；
24.图13示出了本技术实时中的用于执行根据本技术实施例的模型训练方法、目标对象选取方法的电子设备或服务器的结构框图；
25.图14示出了本技术实时中的用于保存或者携带实现根据本技术实施例的模型训练方法、目标对象选取方法的程序代码的存储单元。
具体实施方式
26.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于
本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
27.随着大数据时代的到来，人们被海量的信息包围，因此，如何为每个用户精准地推送信息显得尤为重要，于是推荐系统开始成为研究热点，例如，越来越多的互联网公司开始引入推荐系统，解决了给用户展现相同内容的问题，使信息推送可以达到千人千面的目的。
28.但是，发明人在对相关的目标对象选取方法的研究中发现，一般的推荐行为是基于用户对于目标对象的点击率而设定的，例如，基于listing-embedding算法，分析设备会对用户的点击行为进行统计、分析，然后建立相关模型，基于建模为用户提供推荐服务。但是，单一的基于点击率生成的用户画像比较片面，在复杂的场景中无法准确的为用户提供推荐服务，影响用户体验。
29.因此，发明人提出了本技术中的模型训练方法、目标对象选取方法、装置、电子设备及存储介质。在获取到包括第一训练数据和第二训练数据的训练数据后，通过获取到的训练数据对待训练模型进行训练，得到参数预测模型，其中，所述第一训练数据包括每个用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征，所述第二训练数据每个用户的关键用户特征。通过上述方法，在通过第一训练数据和第二训练数据对待训练模型进行训练时，关注了在新用户上覆盖度比较高的关键用户特征，使得这部分在新用户上覆盖度高的特征在模型中的权重更大，从而加强了这批特征对模型的影响程度，进而提高了参数预测模型预测的参数的准确性，使得可以更精确的向用户推荐目标对象。
30.在本技术实施例中，所提供的模型训练方法和目标对象选取方法可以由电子设备执行。在由电子设备执行的这种方式中，本技术实施例提供的模型训练方法和目标对象选取方法中所有步骤可以均由电子设备执行。例如，如图1所示，通过电子设备100的处理器执行模型训练方法中的获取训练数据；基于所述训练数据对待训练模型进行训练，直至满足训练结束条件，得到参数预测模型。以及，通过电子设备100的处理器执行获取目标用户特征和候选目标对象特征；将所述目标用户特征和候选目标对象特征输入参数预测模型，获取所述候选目标对象对应的推荐分数；基于所述推荐分数确定所述目标用户对应的目标对象。
31.再者，本技术实施例提供的模型训练方法和目标对象选取方法也可以由服务器(云端)进行执行。对应的，在由服务器执行的这种方式中，在执行模型训练方法时，可以由服务器实时的获取训练数据，所述训练数据包括第一训练数据和第二训练数据，所述第一训练数据包括用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征，所述第二训练数据包括用户的关键用户特征，所述用户特征包括所述关键用户特征；基于所述训练数据对待训练模型进行训练，直至满足训练结束条件，得到参数预测模型。以及，在执行目标对象选取方法时，可以由服务器实时的获取目标用户特征和候选目标对象特征；将所述目标用户特征和候选目标对象特征输入参数预测模型，获取所述参数预测模型输出的所述候选目标对象对应的推荐分数；基于所述推荐分数确定所述目标用户对应的目标对象。
32.另外，还可以由电子设备和服务器协同执行。在由电子设备和服务器协同执行的这种方式中，本技术实施例提供的模型训练方法和目标对象选取方法中的部分步骤由电子
设备执行，而另外部分的步骤则由服务器来执行。
33.示例性的，如图2所示，电子设备100可以执行目标对象选取方法包括的：获取目标用户特征和候选目标对象特征，然后由服务器200来执行将所述目标用户特征和候选目标对象特征输入参数预测模型，获取所述参数预测模型输出的所述候选目标对象对应的推荐分数；基于所述推荐分数确定所述目标用户对应的目标对象。
34.需要说明的是，在由电子设备和服务器协同执行的这种方式中，电子设备和服务器分别执行的步骤不限于上述示例中所介绍的方式，在实际应用中，可以根据实际情况动态的调整电子设备和服务器分别执行的步骤。
35.需要说明的是，该电子设备100除了可以为图1和图2中所示的智能手机外，还可以为车机设备、可穿戴设备、平板电脑、笔记本电脑、智能音箱等。服务器120可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统。
36.下面将结合附图具体描述本技术的各实施例。
37.请参阅图3，本技术实施例提供的一种模型训练方法，应用于如图1或图2所示的电子设备或服务器，所述方法包括：
38.步骤s110：获取训练数据，所述训练数据包括第一训练数据和第二训练数据，所述第一训练数据包括用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征，所述第二训练数据包括用户的关键用户特征，所述用户特征包括所述关键用户特征。
39.在本技术实施例中，用户的用户特征为表征用户的属性的特征。可选的，用户的用户特征可以包括用户id(identity document，身份标识号)、用户的性别、用户的年龄、用户的点击历史、用户的购买历史、爱好等。其中，用户的点击历史可以为用户对目标对象的历史点击数据；用户的购买历史可以为用户购买目标对象的历史购买数据；爱好可以为用户感兴趣的信息等。示例性的，以商品购物类的推荐系统为例，用户id可以为用户登录推荐系统时的账号；用户的性别、年龄等都可以为用户在注册用户id时填写的信息；用户的点击历史可以为用户点击某个商品的历史点击次数；用户的购买历史可以为用户购买商品的历史数据；爱好可以为用户喜欢的商品类型(大类、小类)等，其中，商品类型可以分为几种大类(如食品、药品、服装等)，每种大类可以分为多种小类(如服装可以分为衬衣、裙子、毛衣等)。
40.目标对象特征为表征目标对象的属性的特征。可选的，目标对象的类别不同，那么目标对象特征就不同，其中，目标对象可以理解为指定推荐场景中向用户推送的推荐物。例如，在信息推荐系统中，目标对象可以为各种信息，目标对象特征可以为信息的来源、信息的种类、信息的时间等；在商品购物类的推荐系统中，目标对象可以为各种商品，目标对象特征可以为商品的价格、商品id、商品的名称、库存量单位编码(stock keeping unit identity document，sku id)、标准化产品单元编码(standard product unit identity document，spu id)、商品所属大类、商品所属小类，商品点击通过率(click through rate，ctr)等。
41.场景特征为表征目标对象所在推荐场景的特征。场景特征可以包括每个推荐场景的时间信息、天气信息等。比如，在商品推荐系统中，场景特征可以为推荐目标商品时的时间信息和天气信息等。
42.用户的关键用户特征为用户特征中在新用户上覆盖率比较高的特征，比如，关键用户特征可以包括用户的年龄、用户的性别等用户注册用户id时提供的一些用户信息，关键用户特征也可以包括每个推荐场景的时间信息和天气信息等。
43.作为一种方式，训练数据可以为预先存储在指定存储区域或云服务器中，当需要获取训练数据时，可以从指定存储区域或云服务器中获取到训练数据。其中，训练数据中与用户特征对应的目标对象特征可以包括多个，也就是说，一个用户可以对应有多个目标对象，并且每个目标对象都对应有目标对象特征以及场景特征。
44.步骤s120：基于所述训练数据对待训练模型进行训练，直至满足训练结束条件，得到参数预测模型。
45.在本技术实施例中，训练结束条件可以为预设损失函数的损失值满足预设损失值，或者训练迭代次数达到预设迭代次数，或者模型的网络参数更新为预设网络参数等，在此不做具体限定。
46.作为一种方式，在获取到训练数据后，获取预设损失函数，进而可以基于预设损失函数和训练数据对待训练模型进行训练，当检测到预设损失函数的损失值满足预设损失值，或者训练迭代次数达到预设迭代次数，或者模型的网络参数更新为预设网络参数时，确定满足训练结束条件，得到参数预测模型。
47.可选的，参数预测模型用于对目标对象的推荐分数进行预测。
48.本技术提供的一种目标对象选取方法，在获取到包括第一训练数据和第二训练数据的训练数据后，通过获取到的训练数据对待训练模型进行训练，得到参数预测模型，其中，所述第一训练数据包括每个用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征，所述第二训练数据每个用户的关键用户特征。通过上述方法，在通过第一训练数据和第二训练数据对待训练模型进行训练时，关注了在新用户上覆盖度比较高的关键用户特征，使得这部分在新用户上覆盖度高的特征在模型中的权重更大，从而加强了这批特征对模型的影响程度，进而提高了参数预测模型预测的参数的准确性，使得可以更精确的向用户推荐目标对象。
49.请参阅图4，本技术实施例提供的一种模型训练方法，应用于如图1或图2所示的电子设备或服务器，所述方法包括：
50.步骤s210：获取训练数据，所述训练数据包括第一训练数据和第二训练数据，所述第一训练数据包括用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征，所述第二训练数据包括用户的关键用户特征，所述用户特征包括所述关键用户特征。
51.在本技术实施例中，第一训练数据中的用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征组成一个特征向量，第二训练数据中的用户关键特征组成一个特征向量。
52.步骤s220：将所述训练数据输入到所述特征融合模块中，获取所述特征融合模块输出的第一融合特征。
53.在本技术实施例中，所述训练数据还包括与所述目标对象对应的标签，所述待训练模型包括特征融合模块、点击率预测模块以及转化率预测模块。其中，特征融合模块用于对训练数据中包含的特征进行融合，得到第一融合特征；点击率预测模型用于预测目标对
象被点击的概率；转化率预测模块用于预测用户在点击目标对象后进一步的行为转换概率。可选的，特征融合模块分别与点击率预测模块、转换率预测模型连接。
54.与目标对象对应的标签可以包括点击分数、转化分数以及推荐分数，点击分数表征目标对象被点击的概率，转化分数表征用户在点击目标对象后进一步的行为转换概率，推荐分数表征目标对象对应的被推荐程度。
55.作为一种方式，所述特征融合模块包括第一注意力网络、第二注意力网络、第一专家网络、第二专家网络、第三专家网络以及门控网络。
56.其中，第一注意力网络和第二注意力网络为senet(squeeze-and-excitation networks，压缩和激励网络)。senet是一种可以显式地建模特征通道之间的相互依赖关系的网络，senet可以对特征进行重标定，特征重标定指的是可以通过学习的方式来自动获取到每个特征通道的重要程度，然后依照这个重要程度去提升有用的特征并抑制对当前任务用处不大的特征。如图5所示，senet的输入为一个维度为h*w*c的向量，其中h是高度(height)，w是宽度(width)，c是通道数(channel)。首先，senet通过对维度为h*w*c的向量进行池化操作，得到一个维度为1*1*c的向量，再经过fc全连接层(fully connected)，对每个通道的重要性进行预测，得到不同通道的重要性大小后再作用(激励)到之前的维度为h*w*c的向量的对应的通道上，实现给每个特征赋予不同权重的作用，从而达到增强有用特征，抑制无效特征的目的，充分发挥各个特征的作用。
57.第一专家网络、第二专家网络和第三专家网络为对输入的特征向量进行不同方式的变换处理的网络层。每个专家网络可以对不同任务带来不同的影响。
58.门控网络用于控制每个专家网络权重的变量，对于每一个任务，不同专家网络的权重可能是不一样的，因此使用门控网络来控制每个专家网络的权重，再通过门控网络将多个专家网络的结果进行加权组合。
59.在本技术实施例中，第一注意力网络分别和第一专家网络、第二专家网络连接，第二注意力网络和第三专家网络连接，第一专家网络、第二专家网络以及第三专家网络和门控网络进行连接。
60.如图6所示，步骤s220具体可以包括：
61.步骤s221：将所述第一训练数据输入到所述第一注意力网络中，获取所述第一注意力网络输出的第一注意力特征。
62.在本技术实施例中，将第一训练数据输入到第一注意力网络中，通过第一注意力网络为第一训练数据中所包括的特征赋予不同的权重，得到包括不同权重的特征。
63.作为一种方式，在将第一训练数据输入到第一注意力网络中时，一个用户对应一组第一训练数据。也就是说，每次输入模型的训练数据是一个用户对应的用户特征、一个用户对应的一个目标对象的特征以及一个目标对象对应的场景特征。同样的，第二训练数据和第一训练数据相对应，在输入第一训练数据和第二训练数据时，输入的是同一个用户对应的特征。
64.步骤s222：将所述第二训练数据输入到所述第二注意力网络中，获取所述第二注意力网络输出的第二注意力特征。
65.在本技术实施例中，第二训练数据为在新用户上覆盖率比较高的一些特征。将第二训练数据输入到第二注意力网络中，通过第二注意力网络为第二训练数据中所包括的特
征赋予不同的权重，使得这部分特征在模型中的权重更大，从而加强这部分特征对模型的影响程度。
66.步骤s223：将所述第一注意力特征分别输入到所述第一专家网络和所述第二专家网络中，分别获取所述第一专家网络输出的第一参考注意力特征和所述第二专家网络输出的第二参考注意力特征。
67.在本技术实施例中，每一个专家网络都会有一个擅长的数据区域，在这组区域上该专家网络就是“权威”，要比其他专家网络表现得好。
68.可以通过第一专家网络和第二专家网络对第一注意力特征中的不同特征区域进行不同方式的变换处理，得到各自对应的参考注意力特征。
69.步骤s224：将所述第二注意力特征输入到所述第三专家网络中，获取所述第三专家网络输出的第三参考注意力特征。
70.在本技术实施例中，在对待训练模型进行训练时，考虑到新用户与推荐系统交互较少，存在一部分特征为空的问题，且新用户数据量较少，如果不对新用户进行特殊处理，那么待训练模型将偏向于老用户，对老用户学习得比较充分，对新用户不太友好，如果待训练模型能够服务好新用户，不但在短期时间内能够提升待训练模型效果，在长期时间内也能够提升用户体验，增加用户留存。
71.从特征缺失的角度，可以将一些在新用户上覆盖率比较高的一些特征，输入到第三专家网络中对待训练模型进行训练，强化待训练模型对新用户的建模能力。
72.作为一种方式，可以将第二注意力特征输入到第三专家网络中，通过第三专家网络对第二注意力特征进行变换处理，得到第三参考注意力特征。
73.步骤s225：将所述第一参考注意力特征、所述第二参考注意力特征以及所述第三参考注意力特征输入到所述门控网络中，获取所述门控网络输出的第一融合特征。
74.在本技术实施例中，可以通过门控网络控制第一专家网络、第二专家网络、第三专家网络的权重，然后将第一专家网络、第二专家网络以及第三专家网络的输出进行加权融合，得到第一融合特征。
75.步骤s230：将所述第一融合特征输入到所述点击率预测模块中，获取所述点击率预测模块输出的点击分数，所述点击分数表征所述用户对目标对象的点击概率。
76.作为一种方式，所述训练数据还包括预设点击率向量和所述目标对象对应的场景信息；所述点击率预测模块包括多个专家网络、门控网络以及点击率塔网络。
77.在本技术实施例中，预设点击率向量为预先设置的点击率向量，目标对象对应的场景信息表征目标对象所处的推荐场景，比如首页推荐、尾页推荐等，不同的推荐场景对应的场景信息不同，在此不做具体限定。
78.其中，点击率预测模型中的多个专家网络与特征融合模块中的门控网络进行连接，点击率预测模块中的多个专家网络与点击率预测模块中的门控网络连接，点击率预测模块中的门控网络与点击率塔网络连接。
79.如图7所示，步骤s230具体可以包括：
80.步骤s231：将所述预设点击率向量和所述第一融合特征进行连接，得到第一连接特征。
81.在本技术实施例中，将预设点击率向量和第一融合特征进行连接指的是将预设点
击率向量和第一融合特征进行通道相加，得到第一连接特征。
82.作为一种方式，点击率预测模块还可以包括连接层，该连接层用于将预设点击率向量和第一融合特征进行连接。
83.步骤s232：将所述第一连接特征分别输入到所述多个专家网络中，获取所述多个专家网络输出的多个第一参考连接特征。
84.在本技术实施例中，多个专家网络同样是用于对第一连接特征中的不同特征区域进行不同方式的变换处理，得到每个专家网络输出的第一参考连接特征。
85.步骤s233：将所述场景信息和所述多个第一参考连接特征输入到所述门控网络中，获取所述门控网络输出的第二融合特征。
86.在本技术实施例中，场景信息表征与输入的目标对象特征对应的推荐场景。为了达到每个推荐场景抽取不同信息的目的，可以将场景信息作为门控网络的输入，从而使得对于不同场景从多个专家网络中抽取不同信息的作用，以此得到多场景建模的目的。
87.作为一种方式，门控网络用于控制多个专家网络的权重，然后将多个专家网络的输出以及场景信息进行加权融合，得到第二融合特征。
88.步骤s234：将所述第二融合特征输入到所述点击率塔网络中，获取所述点击率塔网络输出的点击分数。
89.在本技术实施例中，点击率塔网络用于进行用户点击目标对象的概率的预测。将第二融合特征输入到点击率塔网络中，点击率塔网络可以输出目标对象对应的点击分数。
90.步骤s240：将所述第一融合特征输入到所述转化率预测模块中，获取所述转化率预测模块输出的转化分数，所述转化分数表征所述用户在点击目标对象后进一步的行为转换概率。
91.作为一种方式，所述训练数据还包括预设转化率向量和所述目标对象对应的场景信息；所述转化率预测模块包括多个专家网络、门控网络以及转化率塔网络。
92.其中，点击率预测模型中的多个专家网络与特征融合模块中的门控网络进行连接，点击率预测模块中的多个专家网络与点击率预测模块中的门控网络连接，点击率预测模块中的门控网络与点击率塔网络连接。
93.如图8所示，步骤s240具体可以包括：
94.步骤s241：将所述预设转化率向量和所述第一融合特征进行连接，得到第二连接特征。
95.在本技术实施例中，将预设转化率向量和第一融合特征进行连接指的是将预设转化率向量和第一融合特征进行通道相加，得到第二连接特征。
96.作为一种方式，转化率预测模块还可以包括连接层，该连接层用于将预设点转化率向量和第一融合特征进行连接。
97.步骤s242：将所述第二连接特征分别输入到所述多个专家网络中，获取所述多个专家网络输出的多个第二参考连接特征。
98.在本技术实施例中，多个专家网络同样是用于对第二连接特征中的不同特征区域进行不同方式的变换处理，得到每个专家网络输出的第二参考连接特征。
99.步骤s243：将所述场景信息和所述多个第二参考连接特征输入到所述门控网络中，获取所述门控网络输出的第三融合特征。
100.在本技术实施例中，场景信息表征与输入的目标对象特征对应的推荐场景。为了达到每个推荐场景抽取不同信息的目的，可以将场景信息作为门控网络的输入，从而使得对于不同场景从多个专家网络中抽取不同信息的作用，以此得到多场景建模的目的。
101.作为一种方式，门控网络用于控制多个专家网络的权重，然后将多个专家网络的输出以及场景信息进行加权融合，得到第三融合特征。
102.可选的，点击率预测模块和转化率预测模块的训练时同时进行的，也就是说，点击率预测模块中的门控网络和转化率预测模块中的门控网络中输入的场景信息时相同的，并且可以是同时输入的。
103.步骤s244：将所述第三融合特征输入到所述转化率塔网络中，获取所述转化率塔网络输出的转化分数。
104.在本技术实施例中，转化率塔网络用于进行用户在点击目标对象后进一步的行为转换概率的预测。将第三融合特征输入到转化率塔网络中，转化率塔网络可以输出目标对象对应的转化分数。
105.步骤s250：基于所述点击分数和所述转化分数，得到推荐分数，所述推荐分数表征所述目标对象对应的被推荐程度。
106.在本技术实施例中，可以按照预设权重值，对目标对象对应的点击分数和转化分数进行加权计算，得到目标对象对应的推荐分数。
107.步骤s260：基于所述推荐分数和所述标签，对所述待训练模型进行训练，直至满足训练结束条件，得到所述参数预测模型。
108.在本技术实施例中，可以将目标对象对应的推荐分数分别与标签进行比较，基于比较结果对待训练模型进行训练，直至满足训练结束条件，以得到参数预测模型。
109.在本技术实施例中，参数预测模型的网络结构可以如图9所示。
110.本技术提供的一种模型训练方法，在获取到训练数据后，将训练数据输入到特征融合模块中，得到第一融合特征，然后将第一融合特征输入到点击率预测模块和转化率预测模块中，得到点击分数和转化分数，再基于点击分数和转化分数，得到推荐分数，最后基于推荐分数和标签，对待训练模型进行训练，直至满足训练结束条件，得到参数预测模型。通过上述方法，在通过第一训练数据和第二训练数据对待训练模型进行训练时，关注了在新用户上覆盖度比较高的关键用户特征，使得这部分在新用户上覆盖度高的特征在模型中的权重更大，从而加强了这批特征对模型的影响程度，进而提高了参数预测模型预测的参数的准确性，使得可以更精确的向用户推荐目标对象。
111.请参阅图10，本技术实施例提供的一种目标对象选取方法，应用于如图1或图2所示的电子设备或服务器，所述方法包括：
112.步骤s310：获取目标用户特征和候选目标对象特征。
113.在本技术实施例中，其中，目标用户特征可以指目标用户对应的用户特征，目标用户可以是登录推荐系统对应的展示界面的用户。候选目标对象特征可以是推荐系统中所包括的待推荐的目标对象的目标对象特征，其中，推荐系统中所包括的待推荐的目标对象可以指推荐系统对应的所有目标对象，还可以指经过对推荐系统进行召回处理后得到的目标对象。
114.作为一种方式，可以基于目标用户的用户id对推荐系统的数据库进行查询，以得
到目标用户特征。可以在确定目标用户后，从推荐系统的数据库中获取所有目标对象的目标对象特征，以将获取到的目标对象特征作为候选目标对象特征；还可以基于召回处理的结果，从推荐系统的数据库中实时获取对应的目标对象特征，以将获取到的目标对象特征作为候选目标对象特征。
115.步骤s320：将所述目标用户特征和候选目标对象特征输入参数预测模型，获取所述参数预测模型输出的所述候选目标对象对应的推荐分数。
116.在本技术实施例中，参数预测模型包括特征融合模块、点击率预测模块以及转化率预测模块。
117.作为一种方式，将目标用户对象特征和候选目标对象特征输入到参数预测模块的特征融合模块中，得到对应的融合特征；然后将融合特征分别输入到点击率预测模块和转化率预测模块中，得到对应的点击分数和转化分数；再基于点击分数和转化分数，得到候选目标对象对应的推荐分数。
118.其中，候选目标对象可以有多个，目标用户特征也可以有多个。在将目标用户特征和候选目标对象特征输入参数预测模型中时，是将一个目标用户特征和一个候选目标对象特征作为一组数据输入到参数预测模型中，得到每一组数据对应的推荐分数。
119.步骤s330：基于所述推荐分数确定所述目标用户对应的目标对象。
120.作为一种方式，可以将候选目标对象特征对应的推荐分数按照由高到低的顺序进行排序，将前n(n为正整数)个推荐分数对应的候选目标对象作为目标用户对应的目标对象。
121.可选的，n的取值可以基于推荐系统所包括的待推荐的目标对象的容量进行预先设置，容量越大，n的取值越大。
122.可选的，在得到目标用户对应的目标对象后，可以将目标对象直接通过推荐系统对应的展示界面展示给用户。
123.本技术提供的一种目标对象选取方法，首先获取目标用户特征和候选目标对象特征，然后将目标用户特征和候选目标对象特征输入参数预测模型，获取参数预测模型输出的候选目标对象对应的推荐分数，基于推荐分数确定目标用户对应的目标对象。通过上述方法，可以精确的向用户推荐目标对象。
124.请参阅图11，本技术实施例提供的一种模型训练装置400，所述装置400包括：
125.数据获取单元410，用于获取训练数据，所述训练数据包括第一训练数据和第二训练数据，所述第一训练数据包括用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征，所述第二训练数据用户的关键用户特征，所述用户特征包括所述关键用户特征。
126.训练单元420，用于基于所述训练数据对待训练模型进行训练，直至满足训练结束条件，得到参数预测模型。
127.作为一种方式，所述训练数据还包括与所述目标对象对应的标签，所述待训练模型包括特征融合模块、点击率预测模块以及转化率预测模块。可选的，训练单元420用于将所述训练数据输入到所述特征融合模块中，获取所述特征融合模块输出的第一融合特征；将所述第一融合特征输入到所述点击率预测模块中，获取所述点击率预测模块输出的点击分数，所述点击分数表征所述用户对目标对象的点击概率；将所述第一融合特征输入到所
述转化率预测模块中，获取所述转化率预测模块输出的转化分数，所述转化分数表征所述用户在点击目标对象后进一步的行为转换概率；基于所述点击分数和所述转化分数，得到推荐分数，所述推荐分数表征所述目标对象对应的被推荐程度；基于所述推荐分数和所述标签，对所述待训练模型进行训练，直至满足训练结束条件，得到所述参数预测模型。
128.其中，所述特征融合模块包括第一注意力网络、第二注意力网络、第一专家网络、第二专家网络、第三专家网络以及门控网络；训练单元420还具体用于将所述第一训练数据输入到所述第一注意力网络中，获取所述第一注意力网络输出的第一注意力特征；将所述第二训练数据输入到所述第二注意力网络中，获取所述第二注意力网络输出的第二注意力特征；将所述第一注意力特征分别输入到所述第一专家网络和所述第二专家网络中，分别获取所述第一专家网络输出的第一参考注意力特征和所述第二专家网络输出的第二参考注意力特征；将所述第二注意力特征输入到所述第三专家网络中，获取所述第三专家网络输出的第三参考注意力特征；将所述第一参考注意力特征、所述第二参考注意力特征以及所述第三参考注意力特征输入到所述门控网络中，获取所述门控网络输出的第一融合特征。
129.其中，所述训练数据还包括预设点击率向量和所述目标对象对应的场景信息；所述点击率预测模块包括多个专家网络、门控网络以及点击率塔网络；训练单元420还具体用于将所述预设点击率向量和所述第一融合特征进行连接，得到第一连接特征；将所述第一连接特征分别输入到所述多个专家网络中，获取所述多个专家网络输出的多个第一参考连接特征；将所述场景信息和所述多个第一参考连接特征输入到所述门控网络中，获取所述门控网络输出的第二融合特征；将所述第二融合特征输入到所述点击率塔网络中，获取所述点击率塔网络输出的点击分数。
130.其中，所述训练数据还包括预设转化率向量和所述目标对象对应的场景信息；所述转化率预测模块包括多个专家网络、门控网络以及转化率塔网络；训练单元420还具体用于将所述预设转化率向量和所述第一融合特征进行连接，得到第二连接特征；将所述第二连接特征分别输入到所述多个专家网络中，获取所述多个专家网络输出的多个第二参考连接特征；将所述场景信息和所述多个第二参考连接特征输入到所述门控网络中，获取所述门控网络输出的第三融合特征；将所述第三融合特征输入到所述转化率塔网络中，获取所述转化率塔网络输出的转化分数。
131.请参阅图12，本技术实施例提供的一种目标对象选取装置500，所述装置500包括：
132.特征获取单元510，用于获取目标用户特征和候选目标对象特征。
133.分数确定单元520，用于将所述目标用户特征和候选目标对象特征输入参数预测模型，获取所述参数预测模型输出的所述候选目标对象对应的推荐分数，所述参数预测模型基于权利要求1-5任一所述方法的得到。
134.目标对象确定单元530，用于基于所述推荐分数确定所述目标用户对应的目标对象。
135.需要说明的是，本技术中装置实施例与前述方法实施例是相互对应的，装置实施例中具体的原理可以参见前述方法实施例中的内容，此处不再赘述。
136.下面将结合图13对本技术提供的一种电子设备或服务器进行说明。
137.请参阅图13，基于上述的模型训练方法、目标对象选取方法、装置，本技术实施例
还提供的另一种可以执行前述模型训练方法、目标对象选取方法的电子设备或服务器800。电子设备或服务器800包括相互耦合的一个或多个(图中仅示出一个)处理器802、存储器804以及网络模块806。其中，该存储器804中存储有可以执行前述实施例中内容的程序，而处理器802可以执行该存储器804中存储的程序。
138.其中，处理器802可以包括一个或者多个处理核。处理器802利用各种接口和线路连接整个电子设备或服务器800内的各个部分，通过运行或执行存储在存储器804内的指令、程序、代码集或指令集，以及调用存储在存储器804内的数据，执行电子设备或服务器800的各种功能和处理数据。可选地，处理器802可以采用数字信号处理(digital signal processing，dsp)、现场可编程门阵列(field－programmable gate array，fpga)、可编程逻辑阵列(programmable logic array，pla)中的至少一种硬件形式来实现。处理器802可集成中央处理器(central processing unit，cpu)、图像处理器(graphics processing unit，gpu)和调制解调器等中的一种或几种的组合。其中，cpu主要处理操作系统、用户界面和应用程序等；gpu用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器802中，单独通过一块通信芯片进行实现。
139.存储器804可以包括随机存储器(random access memory，ram)，也可以包括只读存储器(read-only memory，rom)。存储器804可用于存储指令、程序、代码、代码集或指令集。存储器804可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备或服务器800在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
140.所述网络模块806用于接收以及发送电磁波，实现电磁波与电信号的相互转换，从而与通讯网络或者其他设备进行通讯，例如和音频播放设备进行通讯。所述网络模块806可包括各种现有的用于执行这些功能的电路元件，例如，天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(sim)卡、存储器等等。所述网络模块806可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。例如，网络模块806可以与基站进行信息交互。
141.请参考图14，其示出了本技术实施例提供的一种计算机可读存储介质的结构框图。该计算机可读存储介质900中存储有程序代码，所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。
142.计算机可读存储介质900可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。可选地，计算机可读存储介质900包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质900具有执行上述方法中的任何方法步骤的程序代码910的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码910可以例如以适当形式进行压缩。
143.本技术提供的一种模型训练方法、目标对象选取方法、装置、电子设备以及存储介质，在获取到包括第一训练数据和第二训练数据的训练数据后，通过获取到的训练数据对
待训练模型进行训练，得到参数预测模型，其中，所述第一训练数据包括每个用户的用户特征、与所述用户特征对应的目标对象特征以及与所述目标对象特征对应的场景特征，所述第二训练数据每个用户的关键用户特征。通过上述方法，在通过第一训练数据和第二训练数据对待训练模型进行训练时，关注了在新用户上覆盖度比较高的关键用户特征，使得这部分在新用户上覆盖度高的特征在模型中的权重更大，从而加强了这批特征对模型的影响程度，进而提高了参数预测模型预测的参数的准确性，使得可以更精确的向用户推荐目标对象。
144.上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于运动校正的图像成像方法、系统和存储介质与流程

模型训练方法、目标对象选取方法、装置及电子设备与流程

相关文献

最热文献