资源推荐模型训练方法、资源信息推荐方法和装置与流程

2022-05-26 22:57:52 来源：中国专利 TAG：

1.本公开涉及推荐技术领域，尤其涉及资源推荐模型训练方法、资源信息推荐方法和装置。

背景技术：

2.随着互联网的兴起，网络上的信息量也呈现爆炸式的增长。为了提供给用户更好的用户体验，需要在海量的信息中挖掘出少量信息并精准推送给不同的用户。相关技术中，在进行资源推荐时，需要对大量的特征信息进行处理，从而增大了资源推荐的计算量，并且存在无法对特征信息进行区分的问题，导致资源推荐的准确性降低。

技术实现要素：

3.本公开提供资源推荐模型训练方法、资源信息推荐方法和装置，以至少解决相关技术中资源推荐的计算量大且准确性低的问题。本公开的技术方案如下：
4.根据本公开实施例的第一方面，提供一种资源推荐模型训练方法，所述方法包括；
5.基于预设权重信息，对多个样本对象资源信息进行加权处理后，输入到第一待训练模型中进行推荐识别处理，确定第一推荐指标信息，所述样本对象资源信息为基于样本对象的对象信息和所述样本对象对应的样本多媒体资源的资源信息确定的；
6.基于所述第一推荐指标信息，对所述预设权重信息进行更新，得到多个所述样本对象资源信息各自对应的更新权重信息，所述更新权重信息用于表征多个所述样本对象资源信息分别对所述第一推荐指标信息的重要程度；
7.基于所述更新权重信息，从多个所述样本对象资源信息中确定目标对象资源信息；
8.基于所述目标对象资源信息，对第二待训练模型进行训练，得到资源推荐模型，所述第二待训练模型为对已训练的第一待训练模型中的网络结构进行调整得到的。
9.作为一个可选的实施例，所述基于所述第一推荐指标信息，对所述预设权重信息进行更新，得到多个所述样本对象资源信息各自对应的更新权重信息包括：
10.基于所述第一推荐指标信息和所述样本多媒体资源对应的预设推荐标注信息，确定第一损失信息；
11.基于所述第一损失信息，对所述预设权重信息进行更新，得到所述更新权重信息。
12.作为一个可选的实施例，所述基于所述第一损失信息，对所述预设权重信息进行更新，得到所述更新权重信息包括：
13.基于所述第一损失信息，对所述第一待训练模型中的模型参数进行更新，得到初始特征筛选模型；
14.基于所述初始特征筛选模型，对所述预设权重信息进行更新，得到所述更新权重信息。
15.作为一个可选的实施例，所述第一推荐指标信息包括多种推荐指标信息，所述基
于所述第一推荐指标信息和所述样本多媒体资源对应的预设推荐标注信息，确定第一损失信息包括：
16.确定每种所述推荐指标信息与所述预设推荐标注信息间的推荐损失信息；
17.基于每个所述推荐损失信息，得到所述第一损失信息。
18.作为一个可选的实施例，所述初始特征筛选模型包括多种推荐指标对应的指标识别层，所述基于所述第一损失信息，对所述第一待训练模型中的模型参数进行更新，得到初始特征筛选模型之后，所述方法还包括：
19.确定多种所述推荐指标中的目标推荐指标；
20.将所述指标识别层中，除目标指标识别层之外的其他指标识别层更新为特征融合层，所述目标指标识别层为所述目标推荐指标对应的指标识别层；
21.基于所述特征融合层和所述目标指标识别层，构建所述第二待训练模型。
22.作为一个可选的实施例，所述基于所述目标对象资源信息，对第二待训练模型进行训练，得到资源推荐模型包括：
23.将所述目标对象资源信息输入到所述第二待训练模型中进行推荐识别处理，确定第二推荐指标信息；
24.基于所述第二推荐指标信息和所述样本多媒体资源对应的预设推荐标注信息，得到第二损失信息；
25.基于所述第二损失信息，对所述第二待训练模型进行训练，得到所述资源推荐模型。
26.作为一个可选的实施例，所述第二待训练模型包括特征融合层和目标指标识别层，所述目标指标识别层包括特征感知层和推荐指标确定层，所述特征感知层包括多个按序连接的感知层，所述将所述目标对象资源信息输入到所述第二待训练模型中进行推荐识别处理，确定第二推荐指标信息包括：
27.将所述目标对象资源信息输入到所述特征融合层中进行特征融合，得到融合特征信息；
28.在当前感知层为第一个感知层的情况下，将所述目标对象资源信息输入到所述第一个感知层中进行特征感知处理，得到第一个感知层对应的感知处理结果；
29.在当前感知层为非第一个感知层的情况下，获取所述当前感知层的上一个感知层对应的上一感知处理结果；
30.将所述对象资源信息和所述上一感知处理结果输入到所述当前感知层中进行特征感知处理，得到所述当前感知层对应的感知处理结果；
31.将最后一个感知层输出的感知处理结果作为所述感知特征信息；
32.将所述融合特征信息和所述感知特征信息输入到所述推荐指标确定层中进行推荐指标确定，得到所述第二推荐指标信息。
33.作为一个可选的实施例，所述基于所述更新权重信息，从多个所述样本对象资源信息中确定目标对象资源信息包括：
34.对比每个所述样本对象资源信息对应的更新权重信息和预设权重阈值；
35.将更新权重信息大于等于所述预设权重阈值的样本对象资源信息作为所述目标对象资源信息。
36.根据本公开实施例的第二方面，提供一种资源信息推荐方法，所述方法包括：
37.从目标对象对应的对象资源信息中获取多个目标对象资源信息，多个所述目标对象资源信息为更新权重信息满足预设条件的对象资源信息，所述更新权重信息表征所述对象资源信息对推荐指标信息的重要程度，所述对象资源信息为基于所述目标对象的对象信息和待推荐多媒体资源的资源信息确定的；
38.将所述目标对象资源信息输入到如上述资源推荐模型训练方法得到的资源推荐模型中进行推荐识别处理，确定所述待推荐多媒体资源对应的推荐指标信息；
39.基于所述推荐指标信息，从所述待推荐多媒体资源中确定目标推荐资源；
40.向所述目标对象推荐所述目标推荐资源。
41.作为一个可选的实施例，所述资源推荐模型包括特征融合层和目标指标识别层，所述目标指标识别层包括特征感知层和推荐指标确定层，所述将所述目标对象资源信息输入到资源推荐模型中进行推荐识别处理，确定所述待推荐资源信息对应的推荐指标信息包括：
42.将所述目标对象资源信息输入到所述特征融合层中进行特征融合，得到融合特征信息；
43.将所述目标对象资源信息输入到所述特征感知层中进行特征感知处理，得到感知特征信息；
44.将所述融合特征信息和所述感知特征信息输入到所述推荐指标确定层中进行推荐指标确定，得到所述推荐指标信息。
45.作为一个可选的实施例，所述特征感知层包括多个按序连接的感知层，所述将所述目标对象资源信息输入到所述特征感知层中进行特征感知处理，得到感知特征信息包括：
46.在当前感知层为第一个感知层的情况下，将所述目标对象资源信息输入到所述第一个感知层中进行特征感知处理，得到第一个感知层对应的感知处理结果；
47.在当前感知层为非第一个感知层的情况下，获取所述当前感知层的上一个感知层对应的上一感知处理结果；
48.将所述目标对象资源信息和所述上一感知处理结果输入到所述当前感知层中进行特征感知处理，得到所述当前感知层对应的感知处理结果；
49.将最后一个感知层输出的感知处理结果作为所述感知特征信息。
50.根据本公开实施例的第三方面，提供一种资源推荐模型训练装置，所述装置包括：
51.第一推荐识别模块，被配置为执行基于预设权重信息，对多个样本对象资源信息进行加权处理后，输入到第一待训练模型中进行推荐识别处理，确定第一推荐指标信息，所述样本对象资源信息为基于样本对象的对象信息和所述样本对象对应的样本多媒体资源的资源信息确定的；
52.权重更新模块，被配置为执行基于所述第一推荐指标信息，对所述预设权重信息进行更新，得到多个所述样本对象资源信息各自对应的更新权重信息，所述更新权重信息用于表征多个所述样本对象资源信息分别对所述第一推荐指标信息的重要程度；
53.目标信息获取模块，被配置为执行基于所述更新权重信息，从多个所述样本对象资源信息中确定目标对象资源信息；
54.资源推荐模型训练模块，被配置为执行基于所述目标对象资源信息，对第二待训练模型进行训练，得到资源推荐模型，所述第二待训练模型为对已训练的第一待训练模型中的网络结构进行调整得到的。
55.作为一个可选的实施例，所述权重更新模块包括：
56.第一损失信息确定单元，被配置为执行基于所述第一推荐指标信息和所述样本多媒体资源对应的预设推荐标注信息，确定第一损失信息；
57.权重更新单元，被配置为执行基于所述第一损失信息，对所述预设权重信息进行更新，得到所述更新权重信息。
58.作为一个可选的实施例，所述权重更新单元包括：
59.模型参数更新单元，被配置为执行基于所述第一损失信息，对所述第一待训练模型中的模型参数进行更新，得到初始特征筛选模型；
60.更新权重信息获取单元，被配置为执行基于所述初始特征筛选模型，对所述预设权重信息进行更新，得到所述更新权重信息。
61.作为一个可选的实施例，所述第一推荐指标信息包括多种推荐指标信息，所述第一损失信息确定单元包括：
62.推荐损失信息确定单元，被配置为执行确定每种所述推荐指标信息与所述预设推荐标注信息间的推荐损失信息；
63.第一损失信息获取单元，被配置为执行基于每个所述推荐损失信息，得到所述第一损失信息。
64.作为一个可选的实施例，所述初始特征筛选模型包括多种推荐指标对应的指标识别层，所述装置还包括：
65.目标指标确定模块，被配置为执行确定多种所述推荐指标中的目标推荐指标；
66.模型更新模块，被配置为执行将所述指标识别层中，除目标指标识别层之外的其他指标识别层更新为特征融合层，所述目标指标识别层为所述目标推荐指标对应的指标识别层；
67.第二待训练模型构建模块，被配置为执行基于所述特征融合层和所述目标指标识别层，构建所述第二待训练模型。
68.作为一个可选的实施例，所述资源推荐模型训练模块包括：
69.第二推荐指标确定单元，被配置为执行将所述目标对象资源信息输入到所述第二待训练模型中进行推荐识别处理，确定第二推荐指标信息；
70.第二损失信息确定单元，被配置为执行基于所述第二推荐指标信息和所述样本多媒体资源对应的预设推荐标注信息，得到第二损失信息；
71.模型训练单元，被配置为执行基于所述第二损失信息，对所述第二待训练模型进行训练，得到所述资源推荐模型。
72.作为一个可选的实施例，所述第二待训练模型包括特征融合层和目标指标识别层，所述目标指标识别层包括特征感知层和推荐指标确定层，所述第二推荐指标确定单元包括：
73.特征融合单元，被配置为执行将所述目标对象资源信息输入到所述特征融合层中进行特征融合，得到融合特征信息；
74.第一特征感知单元，被配置为执行在当前感知层为第一个感知层的情况下，将所述目标对象资源信息输入到所述第一个感知层中进行特征感知处理，得到第一个感知层对应的感知处理结果；
75.上一感知处理结果获取单元，被配置为执行在当前感知层为非第一个感知层的情况下，获取所述当前感知层的上一个感知层对应的上一感知处理结果；
76.第二特征感知单元，被配置为执行将所述对象资源信息和所述上一感知处理结果输入到所述当前感知层中进行特征感知处理，得到所述当前感知层对应的感知处理结果；
77.感知特征信息获取单元，被配置为执行将最后一个感知层输出的感知处理结果作为所述感知特征信息；
78.第二推荐指标信息获取单元，被配置为执行将所述融合特征信息和所述感知特征信息输入到所述推荐指标确定层中进行推荐指标确定，得到所述第二推荐指标信息。
79.作为一个可选的实施例，所述目标信息获取模块包括：
80.对比单元，被配置为执行对比每个所述样本对象资源信息对应的更新权重信息和预设权重阈值；
81.目标信息确定单元，被配置为执行将更新权重信息大于等于所述预设权重阈值的样本对象资源信息作为所述目标对象资源信息。
82.根据本公开实施例的第四方面，提供一种资源信息推荐装置，所述装置包括：
83.对象资源获取模块，被配置为执行从目标对象对应的对象资源信息中获取多个目标对象资源信息，多个所述目标对象资源信息为更新权重信息满足预设条件的对象资源信息，所述更新权重信息表征所述对象资源信息对推荐指标信息的重要程度，所述对象资源信息为基于所述目标对象的对象信息和待推荐多媒体资源的资源信息确定的；
84.推荐识别模块，被配置为执行将所述目标对象资源信息输入到如上述资源推荐模型训练方法得到资源推荐模型中进行推荐识别处理，确定所述待推荐多媒体资源对应的推荐指标信息；
85.目标推荐资源确定模块，被配置为执行基于所述推荐指标信息，从所述待推荐多媒体资源中确定目标推荐资源；
86.推荐模块，被配置为执行向所述目标对象推荐所述目标推荐资源。
87.作为一个可选的实施例，所述资源推荐模型包括特征融合层和目标指标识别层，所述目标指标识别层包括特征感知层和推荐指标确定层，所述推荐识别模块包括：
88.特征融合单元，被配置为执行将所述目标对象资源信息输入到所述特征融合层中进行特征融合，得到融合特征信息；
89.特征感知单元，被配置为执行将所述目标对象资源信息输入到所述特征感知层中进行特征感知处理，得到感知特征信息；
90.推荐指标确定单元，被配置为执行将所述融合特征信息和所述感知特征信息输入到所述推荐指标确定层中进行推荐指标确定，得到所述推荐指标信息。
91.作为一个可选的实施例，所述特征感知层包括多个按序连接的感知层，所述特征感知单元包括：
92.第一感知处理单元，被配置为执行在当前感知层为第一个感知层的情况下，将所述目标对象资源信息输入到所述第一个感知层中进行特征感知处理，得到第一个感知层对
应的感知处理结果；
93.上一感知处理结果获取单元，被配置为执行在当前感知层为非第一个感知层的情况下，获取所述当前感知层的上一个感知层对应的上一感知处理结果；
94.第二感知处理单元，被配置为执行将所述目标对象资源信息和所述上一感知处理结果输入到所述当前感知层中进行特征感知处理，得到所述当前感知层对应的感知处理结果；
95.感知特征信息获取单元，被配置为执行将最后一个感知层输出的感知处理结果作为所述感知特征信息。
96.根据本公开实施例的第五方面，提供一种电子设备，包括：
97.处理器；
98.用于存储所述处理器可执行指令的存储器；
99.其中，所述处理器被配置为执行所述指令，以实现上述所述的资源推荐模型训练方法和上述所述的资源信息推荐方法。
100.根据本公开实施例的第六方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行上述所述的资源推荐模型训练方法和上述所述的资源信息推荐方法。
101.根据本公开实施例的第七方面，提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述所述的资源推荐模型训练方法和上述所述的资源信息推荐方法。
102.本公开的实施例提供的技术方案至少带来以下有益效果：
103.基于预设权重信息，对样本对象对应的多个样本对象资源信息进行加权处理，得到多个加权对象资源信息。将多个加权对象资源信息输入到第一待训练模型中进行推荐识别处理，确定第一推荐指标信息。基于第一推荐指标信息，对预设权重信息进行更新，得到多个样本对象资源信息各自对应的更新权重信息，并基于更新权重信息，从多个样本对象资源信息中确定目标对象资源信息。基于目标对象资源信息，对第二待训练模型进行训练，得到资源推荐模型。该方法可以筛选得到对推荐指标信息更重要的目标对象资源信息，从而减少特征处理的计算量，增强训练过程中模型对目标对象资源信息的学习，提高了资源推荐的准确性
104.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
105.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。
106.图1是根据一示例性实施例示出的一种资源推荐模型训练方法的应用场景示意图。
107.图2是根据一示例性实施例示出的一种资源推荐模型训练方法的流程图。
108.图3是根据一示例性实施例示出的一种资源推荐模型训练方法中第一待训练模型的示意图。
109.图4是根据一示例性实施例示出的一种资源推荐模型训练方法中得到更新权重信息的流程图。
110.图5是根据一示例性实施例示出的一种资源推荐模型训练方法中构建第二待训练模型的流程图。
111.图6是根据一示例性实施例示出的一种资源推荐模型训练方法中得到第二推荐指标信息的流程图
112.图7是根据一示例性实施例示出的一种资源信息推荐方法的流程图。
113.图8是根据一示例性实施例示出的一种资源信息推荐方法中确定推荐指标信息的流程图。
114.图9是根据一示例性实施例示出的一种资源信息推荐方法中资源推荐模型的示意图。
115.图10是根据一示例性实施例示出的一种资源信息推荐方法中特征交叉过程的示意图。
116.图11是根据一示例性实施例示出的一种资源信息推荐方法中得到感知特征信息的流程图。
117.图12是根据一示例性实施例示出的一种资源推荐模型训练装置的框图。
118.图13是根据一示例性实施例示出的一种资源信息推荐装置的框图。
119.图14是根据一示例性实施例示出的一种服务器侧电子设备的框图。
具体实施方式
120.为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。
121.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
122.需要说明的是，本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。
123.首先对本技术实施例中所涉及的相关术语做以下解释：
124.点击率(click-through-rate，ctr)：指多媒体资源的点击到达率，即该多媒体资源的实际点击次数除以该多媒体资源的展现量，严格的来说，实际点击次数可以是到达该多媒体资源对应的目标页面的数量。
125.转化率(conversion rate，cvr)：是一个衡量多媒体资源的推荐效果的指标，简言之就是用户点击多媒体资源到成为一个有效激活或者注册甚至付费用户的转化率。cvr＝(转化量/点击量)*100％。
126.sigmoid函数是一个在生物学中常见的s型函数，也称为s型生长曲线。在信息科学
中，由于其单增以及反函数单增等性质，sigmoid函数常被用作神经网络的激活函数，将变量映射到0,1之间。
127.图1是根据一示例性实施例示出的一种资源推荐模型训练方法的应用场景示意图，如图1所示，该应用场景包括客户端110和服务器120。客户端110向服务器120发送对象信息，服务器120基于对象信息和资源信息，得到样本对象对应的多个样本对象资源信息。服务器120基于预设权重信息，对样本对象资源信息进行加权处理，得到多个加权对象资源信息，并将多个加权对象资源信息输入到第一待训练模型中进行推荐识别处理，确定第一推荐指标信息。服务器120基于第一推荐指标信息，对预设权重信息进行更新，得到多个样本对象资源信息各自对应的更新权重信息，并基于更新权重信息，从多个样本对象资源信息中确定目标对象资源信息。服务器120基于目标对象资源信息，对第二待训练模型进行训练，得到资源推荐模型。客户端110向服务器120发送资源推荐请求，服务器120响应于资源推荐请求，基于资源推荐模型确定目标推荐资源，将目标推荐资源发送到客户端110中。
128.在本公开实施例中，客户端110包括智能手机、台式电脑、平板电脑、笔记本电脑、数字助理、智能可穿戴设备等类型的实体设备，也可以包括运行于实体设备中的软体，例如应用程序等。本技术实施例中实体设备上运行的操作系统可以包括但不限于安卓系统、ios系统、linux、unix、windows等。客户端110包括ui(user interface，用户界面)层，客户端110通过ui层对外提供对象信息的采集和目标推荐资源的显示，另外，基于api(application programming interface，应用程序接口)将对象信息发送给服务器120。
129.在本公开实施例中，服务器120可以包括一个独立运行的服务器，或者分布式服务器，或者由多个服务器组成的服务器集群。服务器120可以包括有网络通信单元、处理器和存储器等等。具体的，服务器120可以对第一待训练模型进行训练，确定目标对象资源信息，并对第二待训练模型进行训练，得到资源推荐模型，服务器120基于资源推荐模型向目标对象执行资源推荐步骤。
130.图2是根据一示例性实施例示出的一种资源推荐模型训练方法的流程图，如图2所示，该方法用于服务器中，包括以下步骤。
131.s210.基于预设权重信息，对多个样本对象资源信息进行加权处理后，输入到第一待训练模型中进行推荐识别处理，确定第一推荐指标信息，样本对象资源信息为基于样本对象的对象信息和样本对象对应的样本多媒体资源的资源信息确定的；
132.作为一个可选的实施例，样本对象资源信息可以包括样本对象对应的对象特征信息和样本多媒体资源对应的资源特征信息。样本对象的对象信息可以为对象属性信息，样本多媒体资源的资源信息可以为资源属性信息，对对象属性信息和资源属性信息进行特征提取，可以得到样本对象资源信息。在对对象属性信息和资源属性信息进行特征提取时，可以通过预设的特征提取网络进行特征提取，转换成为模型输入的数据，该预设的特征提取网络可以基于嵌入查询函数(embedding lookup)实现，基于嵌入查询函数对对象属性信息和资源属性信息进行特征处理，得到可以输入到第一待训练模型中的样本对象资源信息。例如对用户id、用户年龄、历史点击资源信息等对象属性信息进行特征提取，得到对象特征信息或者对资源类别、资源价格等资源属性信息进行特征提取，得到资源特征信息，并将对象特征信息和资源特征信息作为样本对象资源信息。其中，样本多媒体资源可以包括图像、视频、广告、商品等不同的多媒体资源。
133.作为一个可选的实施例，预设权重信息可以为激活处理后的权重信息，基于预设的激活函数，可以对预设权重信息进行激活处理，从而将预设权重信息映射在预设区间内，激活函数可以为sigmoid函数，sigmoid函数可以将预设权重信息映射在区间[0，1]内，该区间[0，1]即为预设区间。对每个样本对象资源信息可以先进行归一化处理，然后基于预设权重信息，对每个归一化处理后的样本对象资源信息进行加权处理，得到多个加权对象资源信息。归一化处理时可以通过批量归一化函数(batch normalization)，对样本对象资源信息进行归一化处理。
[0134]
作为一个可选的实施例，第一待训练模型为多任务教师模型，可以获取比目标任务更高层的任务的特征。将多个加权对象资源信息输入到第一待训练模型中进行推荐识别处理，可以确定第一推荐指标信息，该第一推荐指标信息可以为多种推荐指标对应的推荐指标信息。该多种推荐指标则对应着第一待训练模型中的多任务。例如第一待训练模型包括ctr预测和cvr预测两个任务，则第一推荐指标信息包括ctr预测任务对应的点击率指标信息，以及cvr预测任务对应的转化率指标信息。
[0135]
s220.基于第一推荐指标信息，对预设权重信息进行更新，得到多个样本对象资源信息各自对应的更新权重信息，更新权重信息表征多个样本对象资源信息分别对第一推荐指标信息的重要程度；
[0136]
作为一个可选的实施例，更新权重信息可以表征多个样本对象资源信息分别对第一推荐指标信息的重要程度，更新权重越大的样本对象资源信息，对第一推荐指标信息的重要程度越大，更新权重越小的样本对象资源信息，对第一推荐指标信息的重要程度越小。且基于重要程度大的样本对象资源信息，更容易确定出第一推荐指标信息。
[0137]
作为一个可选的实施例，基于第一推荐指标信息，对预设权重信息进行更新，得到多个样本对象资源信息各自对应的更新权重信息包括：
[0138]
基于第一推荐指标信息和样本多媒体资源对应的预设推荐标注信息，确定第一损失信息；
[0139]
基于第一损失信息，对预设权重信息进行更新，得到更新权重信息。
[0140]
作为一个可选的实施例，样本多媒体资源为样本对象执行过预设操作的多媒体资源和样本对象未执行过预设操作的多媒体资源，样本对象执行过预设操作的多媒体资源为正样本多媒体资源，样本对象未执行过预设操作的多媒体资源为负样本多媒体资源，预设操作可以是点击操作等。样本多媒体资源对应的预设推荐标注信息即为正样本标注信息和负样本标注信息，正样本标注信息则指示进行推荐，负样本标注信息则指示不进行推荐。第一推荐指标信息则包括指示满足推荐指标和指示不满足推荐指标两种情况，在满足推荐指标的情况下则进行推荐，在不满足推荐指标的情况下则不进行推荐。
[0141]
计算第一推荐指标信息和样本多媒体资源对应的预设推荐标注信息间的差值，可以得到第一损失信息，第一损失信息可以为交叉熵损失函数。基于第一损失信息，可以对预设权重信息进行更新，得到更新权重信息。预设权重信息的值可以设置为初始值0，基于更新权重信息，对预设权重信息进行更新后，得到的更新权重信息的值可以为[0，1]区间上的数值。在区间[0，1]中，更新权重信息越靠近0，则说明更新权重信息对应的样本对象资源信息对推荐指标信息的重要程度越小，更新权重信息越靠近1，则说明更新权重信息对应的样本对象资源信息对推荐指标信息的重要程度越大。
[0142]
将第一损失信息对预设权重信息进行训练，得到更新权重信息，更新权重信息表征多个样本对象资源信息分别对推荐指标信息的重要程度，从而可以基于更新权重信息进行特征筛选，得到目标对象资源信息，从而减少了特征信息的数量，减少了对特征信息的计算资源量，提高了特征信息计算的效率。
[0143]
作为一个可选的实施例，第一推荐指标信息包括多种推荐指标信息，基于第一推荐指标信息和样本多媒体资源对应的预设推荐标注信息，确定第一损失信息包括：
[0144]
确定每种推荐指标信息与预设推荐标注信息间的推荐损失信息；
[0145]
基于每个推荐损失信息，得到第一损失信息。
[0146]
作为一个可选的实施例，第一推荐指标信息可以包括多种推荐指标信息，在包括多种推荐指标信息的情况下，可以确定每种推荐指标信息与预设推荐表征信息间的推荐损失信息，对每个推荐损失信息相加求和，将得到的和值作为第一损失信息。例如，多种推荐指标信息包括点击率指标信息和转化率指标信息，点击率指标信息可以为ctr，转化率指标信息可以为cvr。计算点击率指标信息和预设推荐标注信息间的差值，得到点击率损失信息。计算转化率指标信息和预设推荐标注信息间的差值，得到转化率损失信息。计算点击率损失信息和转化率损失信息间的和值，可以得到第一损失信息。
[0147]
作为一个可选的实施例，在第一推荐指标信息包括点击率指标信息和转化率指标信息的情况下，请参见图3，如图3所示为多任务结构的第一待训练模型的示意图。第一待训练模型中可以包括多个推荐指标分别对应的待训练指标识别层，待训练指标识别层可以包括待训练点击率识别层和待训练转化率识别层，以及待训练点击率识别层和待训练转化率识别层共享的待训练特征感知层。该待训练特征感知层可以为单层的感知机结构，待训练点击率识别层和待训练转化率识别层均可以为多层感知机结构。样本对象资源信息在经过加权处理后，得到加权对象资源信息，将加权对象资源信息输入到第一待训练模型的待训练特征感知层中进行特征感知处理，即对加权对象资源信息再进行加权求和，得到训练感知特征信息，再将训练感知特征信息输入到待训练点击率识别层中进行点击率指标确定，得到点击率指标信息，将训练感知特征信息输入到待训练转化率识别层中进行转化率指标确定，得到转化率指标信息。计算点击率指标信息和预设推荐标注信息间的交叉熵损失函数，得到点击率损失信息。计算转化率指标信息和预设推荐标注信息间的交叉熵损失函数，得到转化率损失信息。计算点击率损失信息和cvr损失信息间的和值，可以得到第一损失信息。
[0148]
在第一待训练模型中设置多种推荐指标对应的待训练指标识别层，使得第一待训练模型为多任务模型，可以通过目标推荐指标以外的其他推荐指标进行特征学习和模型训练，因此，在基于第一待训练模型得到的目标对象资源信息中可以具有其他推荐指标对应的知识，从而在保证了部署在线上的资源推荐模型的计算量和推荐效率的前提下，提高了资源推荐的准确性。
[0149]
作为一个可选的实施例，请参见图4，基于第一损失信息，对预设权重信息进行更新，得到更新权重信息包括：
[0150]
s410.基于第一损失信息，对第一待训练模型中的模型参数进行更新，得到初始特征筛选模型；
[0151]
s420.基于初始特征筛选模型，确定预设权重信息对应的权重更新参数；
[0152]
s430.基于权重更新参数，对预设权重信息进行更新，得到更新权重信息。
[0153]
作为一个可选的实施例，第一待训练模型包括多层神经网络。基于第一损失信息，对第一待训练模型进行反向传播，更新第一待训练模型中的模型参数，得到模型参数更新后的第一待训练模型。基于预设权重信息，对多个样本对象资源信息进行加权处理后，输入到模型参数更新后的第一待训练模型中进行推荐识别处理，得到更新后的第一推荐指标信息，并基于更新后的第一推荐指标信息，更新第一损失信息，重复基于第一损失信息，更新第一待训练模型中的模型参数到基于更新后的第一推荐指标信息，更新第一损失信息的步骤，在模型参数满足预设的参数收敛条件的情况下，可以得到初始特征筛选模型。
[0154]
确定初始特征筛选模型对应的损失信息，基于初始特征筛选模型对应的损失信息进行反向传播，确定预设权重信息对应的权重更新参数。该权重更新参数可以为预设权重信息的梯度信息。基于该权重更新参数，对预设权重信息进行更新，可以得到更新权重信息。
[0155]
作为一个可选的实施例，第一待训练模型中包括待训练点击率识别层和待训练转化率识别层，以及待训练点击率识别层和待训练转化率识别层共享的特征感知层。该特征感知层可以为单层的感知机结构，待训练点击率识别层和待训练转化率识别层均可以为多层感知机结构。基于第一损失信息，对第一待训练模型进行反向传播，更新第一待训练模型中的待训练点击率识别层、待训练转化率识别层和特征感知层分别对应的模型参数，在模型参数收敛的情况下，可以得到初始特征筛选模型，再基于初始特征筛选模型，确定预设权重信息对应的权重更新参数。该权重更新参数可以为预设权重信息的梯度信息。基于该权重更新参数，对预设权重信息进行更新，可以得到更新权重信息。
[0156]
将第一损失信息输入到第一待训练模型中进行反向传播，可以对预设权重信息进行训练，从而得到更新权重信息，基于反向传播的方式可以减少对预设权重信息进行更新的干扰，从而可以提高更新权重信息的准确性，并在后续步骤中基于更新权重信息确定目标对象资源信息，提高了目标对象资源信息确定的有效性。
[0157]
作为一个可选的实施例，请参见图5，如图5所示，初始特征筛选模型包括多种推荐指标对应的指标识别层，基于第一损失信息，对第一待训练模型中的模型参数进行更新，得到初始特征筛选模型之后，该方法还包括：
[0158]
s510.确定多种推荐指标中的目标推荐指标；
[0159]
s520.将指标识别层中，除目标指标识别层之外的其他指标识别层更新为特征融合层，目标指标识别层为目标推荐指标对应的指标识别层；
[0160]
s530.基于特征融合层和目标指标识别层，构建第二待训练模型。
[0161]
作为一个可选的实施例，基于第一损失信息，对第一待训练模型进行训练，得到初始特征筛选模型，也就是将第一损失信息输入到第一待训练模型中进行反向传播，计算第一待训练模型中每一层神经网络的第一模型参数更新信息，该第一模型参数更新信息可以为第一待训练模型中每一层神经网络的模型参数对应的梯度信息。基于第一模型参数更新信息，对第一待训练模型中每一层神经网络的模型参数进行更新，可以得到初始特征筛选模型，初始特征筛选模型包括多种推荐指标对应的指标识别层，其中，该指标识别层中的模型参数是已经基于第一损失信息训练好的，且多种推荐指标可以为两种或两种以上的推荐指标。例如，在推荐指标包括ctr推荐指标和cvr推荐指标的情况下，指标识别层可以包括
ctr推荐指标对应的点击率识别层和cvr推荐指标对应的转化率识别层。
[0162]
目标推荐指标为在线上推荐多媒体资源时应用的推荐指标，在推荐指标包括ctr推荐指标和cvr推荐指标的情况下，可以将ctr推荐指标作为目标推荐指标，则ctr推荐指标对应的点击率识别层为目标指标识别层，cvr推荐指标对应的转化率识别层为其他指标识别层，将cvr推荐指标对应的转化率识别层可以更新为特征融合层。基于特征融合层和目标指标识别层，可以构建得到第二待训练模型。第二待训练模型中的目标指标识别层保留了初始特征筛选模型中已经训练好的模型参数。
[0163]
修改已经训练好的初始特征筛选模型中的部分网络结构，得到第二待训练模型，从而可以直接利用初始特征筛选模型中已经训练好的部分模型参数，减少第二待训练模型的训练轮次，从而提高第二待训练模型的训练效率。
[0164]
s230.基于更新权重信息，从多个样本对象资源信息中确定目标对象资源信息；
[0165]
作为一个可选的实施例，基于更新权重信息，从多个样本对象资源信息中确定目标对象资源信息包括：
[0166]
对比每个样本对象资源信息对应的更新权重信息和预设权重阈值；
[0167]
将更新权重信息大于等于预设权重阈值的样本对象资源信息作为目标对象资源信息。
[0168]
作为一个可选的实施例，基于更新权重信息，可以筛选出对确定推荐指标信息更为重要的优势特征信息，即目标对象资源信息。目标对象资源信息为更新权重信息满足预设条件的样本对象资源信息。若更新权重信息大于预设的权重阈值，则可以将更新权重信息大于预设的权重阈值的样本对象资源信息作为目标对象资源信息，若更新权重信息小于等于预设的权重阈值，则不选择该更新权重信息对应的样本对象资源信息作为目标对象资源信息。预设的权重阈值可以为0.5。目标对象资源信息的数目小于样本对象资源信息。
[0169]
更新权重信息大于预设的权重阈值即说明更新权重信息对应的样本对象资源信息为特征区分度满足预设条件的优势特征信息，该更新权重信息对应的样本对象资源信息，相比于其他样本对象资源信息，对于推荐指标信息而言比较重要，且更容易基于该更新权重信息对应的样本对象资源信息得到推荐指标信息。其他样本对象资源信息为样本对象资源信息中除了大于预设的权重阈值的更新权重信息对应的样本对象资源信息以外的样本对象资源信息。
[0170]
基于目标对象资源信息，能够更准确地计算得到推荐指标信息。例如根据用户在资源详情页的停留时长的特征，可以更为准确地确定用户的cvr推荐指标，则该特征就可以为目标对象资源信息。
[0171]
将更新权重信息大于预设权重阈值的样本对象资源信息确定为目标对象资源信息，可以筛选出特征区分度高且对推荐指标信息的重要程度大的特征信息，从而可以提高确定目标对象资源信息的准确性。
[0172]
s240.基于目标对象资源信息，对第二待训练模型进行训练，得到资源推荐模型，第二待训练模型为对已训练的第一待训练模型中的网络结构进行调整得到的。
[0173]
作为一个可选的实施例，第二待训练模型为单任务学生模型，基于目标对象资源信息，对第二待训练模型进行训练，第二待训练模型可以学习目标对象资源信息中目标任务之外的其他任务对应的特征。因此，对第二待训练模型进行训练后得到的资源推荐模型
虽然为单任务模型，但是可以采用与训练后的第一待训练模型相似的特征识别过程，从输入的对象资源信息中识别出目标对象资源信息。
[0174]
作为一个可选的实施例，基于目标对象资源信息，对第二待训练模型进行训练，得到资源推荐模型包括：
[0175]
将目标对象资源信息输入到第二待训练模型中进行推荐识别处理，确定第二推荐指标信息；
[0176]
基于第二推荐指标信息和样本多媒体资源对应的预设推荐标注信息，得到第二损失信息；
[0177]
基于第二损失信息，对第二待训练模型进行训练，得到资源推荐模型。
[0178]
作为一个可选的实施例，将目标对象资源信息输入到第二待训练模型中进行推荐识别处理，可以确定第二推荐指标信息。第二推荐指标信息为目标推荐指标对应的推荐指标信息。例如，在目标推荐指标为ctr推荐指标时，第二推荐指标信息就为ctr推荐指标对应的点击率指标信息。在将目标对象资源信息输入到第二待训练模型中时，由于目标对象资源信息为
[0179]
作为一个可选的实施例，计算第二推荐指标信息和样本多媒体资源对应的预设推荐标注信息间的差值，可以得到第二损失信息，第二损失信息可以为交叉熵损失函数。在目标推荐指标为ctr推荐指标时，该第二损失信息为ctr损失信息。将第二损失信息输入到第二待训练模型中进行反向传播，计算第二待训练模型中每一层神经网络的第二模型参数更新信息，该第二模型参数更新信息可以为第二待训练模型中每一层神经网络的模型参数对应的梯度信息。基于第二模型参数更新信息，对第二待训练模型中每一层神经网络的模型参数进行更新，可以得到资源推荐模型。
[0180]
基于目标对象资源信息，对第二待训练模型进行训练，可以基于对推荐指标信息更重要的特征，训练得到资源推荐模型，从而提高第二待训练模型的训练有效性。
[0181]
作为一个可选的实施例，请参见图6，第二待训练模型包括特征融合层和目标指标识别层，目标指标识别层包括特征感知层和推荐指标确定层，特征感知层包括多个按序连接的感知层，将目标对象资源信息输入到第二待训练模型中进行推荐识别处理，确定第二推荐指标信息包括：
[0182]
s610.将目标对象资源信息输入到特征融合层中进行特征融合，得到融合特征信息；
[0183]
s620.在当前感知层为第一个感知层的情况下，将目标对象资源信息输入到第一个感知层中进行特征感知处理，得到第一个感知层对应的感知处理结果；
[0184]
s630.在当前感知层为非第一个感知层的情况下，获取当前感知层的上一个感知层对应的上一感知处理结果；
[0185]
s640.将对象资源信息和上一感知处理结果输入到当前感知层中进行特征感知处理，得到当前感知层对应的感知处理结果；
[0186]
s650.将最后一个感知层输出的感知处理结果作为感知特征信息；
[0187]
s660.将融合特征信息和感知特征信息输入到推荐指标确定层中进行推荐指标确定，得到第二推荐指标信息。
[0188]
作为一个可选的实施例，在第二待训练模型的特征融合层中，可以先对目标对象
资源信息进行特征交叉处理，得到交叉特征信息。再对交叉特征信息进行求和，得到融合特征信息。特征交叉的处理方式可以包括内积、叉积、双线性变化等。交叉特征信息为目标对象资源信息的二阶特征信息。
[0189]
作为一个可选的实施例，第二待训练模型的特征感知层可以包括多个按序连接的感知层，在第二待训练模型的特征感知层中，可以将目标对象资源信息输入到第一个感知层中进行特征感知处理，得到第一个感知处理结果，即第一个感知层对应的感知处理结果。将第一个感知处理结果和目标对象资源信息输入到第二个感知层中进行特征感知处理，可以得到第二个感知处理结果，即第二个感知层对应的感知处理结果。将第二个感知处理结果和目标对象资源信息输入到第三个感知层中进行特征感知处理，可以得到第三个感知处理结果，即第三个感知层对应的感知处理结果。以此类推，在当前感知层非第一个感知层的情况下，将当前感知层的上一个感知层的输出和目标对象资源信息一起输入到当前感知层中进行特征感知处理，得到当前感知层对应的感知处理结果。当前感知层的上一个感知层的输出即为上一感知处理结果。直到在当前感知层为最后一个感知层的情况下，将倒数第二个感知层的输出和目标对象资源信息输入到最后一个感知层中进行特征感知处理，得到最后一个感知层输出的感知处理结果，可以将最后一个感知层输出的感知处理结果作为感知特征信息。
[0190]
作为一个可选的实施例，将融合特征信息和感知特征信息输入到第二待训练模型的推荐指标确定层中，对融合特征信息和感知特征信息进行求和，并将求和的结果进行特征归一化处理，可以得到第二推荐指标信息。
[0191]
将目标对象资源信息输入到第二待训练模型中进行推荐指标识别，基于特征融合层对目标对象资源信息进行特征融合处理，并基于多个感知层对目标对象资源信息进行特征感知处理，可以增强第二待训练模型对特征的学习，再基于融合特征信息和感知特征信息确定第二推荐指标信息，可以提高第二推荐指标信息的准确性。
[0192]
本公开实施例提供了一种资源信息推荐方法，请参见图7，该方法包括：
[0193]
s710.从目标对象对应的对象资源信息中获取多个目标对象资源信息，多个目标对象资源信息为更新权重信息满足预设条件的对象资源信息，更新权重信息表征对象资源信息对推荐指标信息的重要程度，对象资源信息为基于目标对象的对象信息和目标对象对应的待推荐多媒体资源的资源信息确定的；
[0194]
s720.将目标对象资源信息输入到对上述第二待训练模型进行训练得到的资源推荐模型中进行推荐识别处理，确定待推荐多媒体资源对应的推荐指标信息；
[0195]
s730.基于推荐指标信息，从待推荐多媒体资源中确定目标推荐资源；
[0196]
s740.向目标对象推荐目标推荐资源。
[0197]
作为一个可选的实施例，目标对象为需要推荐多媒体资源的用户，目标对象对应的对象资源信息为基于目标对象的对象属性信息和待推荐多媒体资源的资源属性信息确定的，对象属性信息可以包括用户id、用户年龄、历史点击资源信息等，资源属性信息可以包括资源类别、资源价格等。对象资源信息可以为基于特征提取网络提取到的特征信息，目标对象资源信息为更新权重信息满足预设条件的对象资源信息，是通过初始特征筛选模型筛选得到的特征信息。
[0198]
在离线进行模型训练的过程中，对第一待训练模型进行训练，得到初始特征筛选
模型时，基于第一损失信息，对第一待训练模型进行反向传播操作，可以得到预设权重信息对应的权重更新参数，基于该权重更新参数可以更新预设权重信息，得到每个样本对象资源信息对应的更新权重信息，在更新权重信息满足预设条件时，可以将满足预设条件的更新权重信息对应的样本对象资源信息确定为目标对象资源信息。基于训练过程中得到的目标对象资源信息，可以从对象资源信息中筛选出与目标对象资源信息匹配的对象资源信息，得到模型应用过程中的目标对象资源信息。该目标对象资源信息即为对确定推荐指标信息更为重要的优势特征信息。
[0199]
将目标对象资源信息输入到对上述第二待训练模型进行训练得到的资源推荐模型中进行推荐识别处理，可以确定待推荐多媒体资源对应的推荐指标信息。按照推荐指标信息的大小，对待推荐多媒体资源进行排序，得到待推荐资源序列。将待推荐资源序列中的前预设数目个待推荐多媒体资源作为目标推荐资源，或者将待推荐资源序列中推荐指标信息大于等于预设推荐阈值的待推荐多媒体资源作为目标推荐资源。
[0200]
响应于目标对象发送的资源推荐请求，向目标对象发送目标推荐资源或者基于预设的资源推荐信息，向目标对象发送目标推荐资源。
[0201]
将目标对象资源信息输入到资源推荐模型中进行推荐指标识别，并基于输出的推荐指标信息确定目标推荐资源，向目标对象推荐该目标推荐资源，可以使得资源推荐模型在进行目标推荐指标的识别时，基于目标对象资源信息获取初始特征筛选模型中的其他指标识别层的知识，从而减少资源消耗，提高资源推荐的效率。
[0202]
作为一个可选的实施例，请参见图8，资源推荐模型包括特征融合层和目标指标识别层，目标指标识别层包括特征感知层和推荐指标确定层，将目标对象资源信息输入到资源推荐模型中进行推荐识别处理，确定待推荐资源信息对应的推荐指标信息包括：
[0203]
s810.将目标对象资源信息输入到特征融合层中进行特征融合，得到融合特征信息；
[0204]
s820.将目标对象资源信息输入到特征感知层中进行特征感知处理，得到感知特征信息；
[0205]
s830.将融合特征信息和感知特征信息输入到推荐指标确定层中进行推荐指标确定，得到推荐指标信息。
[0206]
作为一个可选的实施例，请参见图9，如图9所示为单任务结构的资源推荐模型的示意图。资源推荐模型包括特征融合层和目标指标识别层，目标指标识别层包括特征感知层和推荐指标确定层。目标指标识别层为目标推荐指标对应的指标识别层，目标指标识别层可以为mlp结构。将目标对象资源信息输入到资源推荐模型的特征融合层中进行特征融合，可以得到融合特征信息。将目标对象资源信息输入到资源推荐模型的特征感知层中进行特征感知处理，可以得到感知特征信息，再将融合特征信息和感知特征信息输入到资源推荐模型的推荐指标确定层中进行推荐指标确定，可以得到推荐指标信息。
[0207]
在资源推荐模型的特征融合层中，可以先对目标对象资源信息进行特征交叉处理，得到交叉特征信息。再对交叉特征信息进行求和，得到融合特征信息。特征交叉的处理方式可以包括内积、叉积、双线性变化等。交叉特征信息为目标对象资源信息的二阶特征信息。
[0208]
请参见图10，如图10所示为在特征融合层中对特征进行内积的示意图。如图10所
示，目标对象资源信息为n个特征信息，包括e1、e2、e3、
……
、en。对目标对象资源信息进行两两之间的内积，内积计算得到的结果可以包括c(1,2)、c(1,3)、
……
、c(1,n)、c(2,3)、
……
、c(2,n)、
……
、c(n-1,n)。将内积计算得到的结果作为融合特征信息。在目标对象资源信息为n个特征信息的情况下，特征融合层对n个特征信息中的两两特征信息进行内积计算，可以得到n(n-1)/2个交叉特征信息。基于下述公式可以对交叉特征信息进行求和，得到融合特征信息。
[0209]
y1＝∑ci[0210]
其中，y1为特征融合层的输出，即融合特征信息，ci为交叉特征信息，i为1到n(n-1)/2间的数值。
[0211]
在资源推荐模型的特征感知层中对目标对象资源信息进行特征感知处理时，对输入的目标对象资源信息进行加权求和，可以得到感知特征信息。基于下述公式可以对目标对象资源信息进行求和，得到感知特征信息。
[0212]
y2＝w
mlpei
[0213]
其中，y2为特征感知层的输出，即感知特征信息，ei为目标对象资源信息，i为1到n间的数值。
[0214]
在推荐指标确定层中可以对感知特征信息和融合特征信息相加得到的和值执行特征映射步骤，得到感知特征信息和融合特征信息相加得到的和值在预设区间上对应的值，即得到推荐指标信息。执行特征映射步骤时可以采用预设的激活函数，该激活函数可以为sigmoid。基于下述公式可以计算得到推荐指标信息。
[0215]yout
＝σ(y1,y2)
[0216]
其中，yout为推荐指标确定层的输出，即推荐指标信息，σ()表示激活函数，y1为融合特征信息，y2为感知特征信息。
[0217]
通过特征交叉的方式进行特征融合，得到融合特征信息，可以增加特征的维度，同时通过多层感知机获取感知特征信息，可以增强资源推荐模型对特征的学习，再基于融合特征信息和感知特征信息确定推荐指标信息，可以提高推荐指标信息确定的有效性。
[0218]
作为一个可选的实施例，请参见图11，特征感知层包括多个按序连接的感知层，将目标对象资源信息输入到特征感知层中进行特征感知处理，得到感知特征信息包括：
[0219]
s1110.在当前感知层为第一个感知层的情况下，将目标对象资源信息输入到第一个感知层中进行特征感知处理，得到第一个感知层对应的感知处理结果；
[0220]
s1120.在当前感知层为非第一个感知层的情况下，获取当前感知层的上一个感知层对应的上一感知处理结果；
[0221]
s1130.将目标对象资源信息和上一感知处理结果输入到当前感知层中进行特征感知处理，得到当前感知层对应的感知处理结果；
[0222]
s1140.将最后一个感知层输出的感知处理结果作为感知特征信息。
[0223]
作为一个可选的实施例，资源推荐模型的特征感知层可以包括多个按序连接的感知层，将目标对象资源信息输入到第一个感知层中进行特征感知处理，得到第一个感知处理结果，即第一个感知层对应的感知处理结果。将第一个感知处理结果和目标对象资源信息输入到第二个感知层中进行特征感知处理，可以得到第二个感知处理结果，即第二个感知层对应的感知处理结果。将第二个感知处理结果和目标对象资源信息输入到第三个感知
层中进行特征感知处理，可以得到第三个感知处理结果，即第三个感知层对应的感知处理结果。以此类推，在当前感知层非第一个感知层的情况下，将当前感知层的上一个感知层的输出和目标对象资源信息一起输入到当前感知层中进行特征感知处理，得到当前感知层对应的感知处理结果。当前感知层的上一个感知层的输出即为上一感知处理结果。直到在当前感知层为最后一个感知层的情况下，将倒数第二个感知层的输出和目标对象资源信息输入到最后一个感知层中进行特征感知处理，得到最后一个感知层输出的感知处理结果，可以将最后一个感知层输出的感知处理结果作为感知特征信息。
[0224]
作为一个可选的实施例，请参见图9，如图9所示为单任务结构的资源推荐模型的示意图。在如图9所示的资源推荐模型中，基于concat操作，将目标对象资源信息连接到特征感知层中的每一层感知层上，使得目标对象资源信息可以输入到每一层感知层中。
[0225]
将目标对象资源信息连接到特征感知层中的每一层感知层上，可以增强资源推荐模型对目标对象资源信息的学习，目标对象资源信息是对推荐指标信息的重要程度满足预设条件的信息，因此可以提高资源推荐模型中生成推荐指标信息的有效性，从而提高资源推荐的准确性。
[0226]
作为一个可选的实施例，上述资源推荐模型训练方法和资源信息推荐方法可以应用在广告业务领域、视频业务领域等多种资源推荐场景中，目标对象即为用户。在一个具体的资源推荐场景中，在模型训练时，服务器获取样本对象对应的多个样本对象资源信息，并基于预设权重信息，对多个样本对象资源信息进行加权处理，得到多个加权对象资源信息。服务器构建多任务的第一待训练模型，将加权对象资源信息输入到第一待训练模型中进行推荐识别处理，得到第一推荐指标信息，第一推荐指标信息包括每个任务对应的推荐指标信息。服务器基于第一推荐指标信息，可以对预设权重信息进行更新，得到多个样本对象资源信息各自对应的更新权重信息，并基于更新权重信息，从样本对象资源信息中确定目标对象资源信息，目标对象资源信息为对推荐指标信息的重要程度满足预设条件的对象资源信息。
[0227]
服务器将第一待训练模型训练后得到的初始特征筛选模型中除目标指标识别层外的其他指标识别层替换为特征融合层，可以得到第二待训练模型。服务器基于目标对象资源信息，对第二待训练模型进行训练，可以得到资源推荐模型。
[0228]
在模型应用时，只对资源推荐模型进行线上部署，不对初始特征筛选模型进行线上部署。服务器在接收到用户发送的资源推荐请求，或者在获取到资源推荐信息的情况下，可以从用户对应的对象资源信息中确定出目标对象资源信息，将目标对象资源信息输入到上述模型训练方法得到的资源推荐模型中进行推荐识别处理，确定待推荐多媒体资源对应的推荐指标信息。服务器获取推荐指标信息满足预设条件的待推荐多媒体资源作为目标资源信息，并向用户推荐这些目标资源信息。
[0229]
本公开实施例提出了一种资源推荐模型训练方法，该方法包括：基于预设权重信息，对样本对象对应的多个样本对象资源信息进行加权处理，得到多个加权对象资源信息。将多个加权对象资源信息输入到第一待训练模型中进行推荐识别处理，确定第一推荐指标信息。基于第一推荐指标信息，对预设权重信息进行更新，得到多个样本对象资源信息各自对应的更新权重信息，并基于更新权重信息，从多个样本对象资源信息中确定目标对象资源信息。基于目标对象资源信息，对第二待训练模型进行训练，得到资源推荐模型。该方法
可以筛选得到对推荐指标信息更重要的目标对象资源信息，从而减少特征处理的计算量，增强训练过程中模型对目标对象资源信息的学习，提高了资源推荐的准确性
[0230]
图12是根据一示例性实施例示出的一种资源推荐模型训练装置框图。参照图12，该装置包括：
[0231]
第一推荐识别模块1210，被配置为执行基于预设权重信息，对多个样本对象资源信息进行加权处理后，输入到第一待训练模型中进行推荐识别处理，确定第一推荐指标信息，样本对象资源信息为基于样本对象的对象信息和样本对象对应的样本多媒体资源的资源信息确定的；
[0232]
权重更新模块1220，被配置为执行基于第一推荐指标信息，对预设权重信息进行更新，得到多个样本对象资源信息各自对应的更新权重信息，更新权重信息用于表征多个样本对象资源信息分别对第一推荐指标信息的重要程度；
[0233]
目标信息获取模块1230，被配置为执行基于更新权重信息，从多个样本对象资源信息中确定目标对象资源信息；
[0234]
资源推荐模型训练模块1240，被配置为执行基于目标对象资源信息，对第二待训练模型进行训练，得到资源推荐模型，第二待训练模型为对已训练的第一待训练模型中的网络结构进行调整得到的。
[0235]
作为一个可选的实施例，权重更新模块1220包括：
[0236]
第一损失信息确定单元，被配置为执行基于第一推荐指标信息和样本多媒体资源对应的预设推荐标注信息，确定第一损失信息；
[0237]
权重更新单元，被配置为执行基于第一损失信息，对预设权重信息进行更新，得到更新权重信息。
[0238]
作为一个可选的实施例，权重更新单元包括：
[0239]
模型参数更新单元，被配置为执行基于第一损失信息，对第一待训练模型中的模型参数进行更新，得到初始特征筛选模型；
[0240]
更新权重信息获取单元，被配置为执行基于初始特征筛选模型，对预设权重信息进行更新，得到更新权重信息。
[0241]
作为一个可选的实施例，第一推荐指标信息包括多种推荐指标信息，第一损失信息确定单元包括：
[0242]
推荐损失信息确定单元，被配置为执行确定每种推荐指标信息与预设推荐标注信息间的推荐损失信息；
[0243]
第一损失信息获取单元，被配置为执行基于每个推荐损失信息，得到第一损失信息。
[0244]
作为一个可选的实施例，初始特征筛选模型包括多种推荐指标对应的指标识别层，装置还包括：
[0245]
目标指标确定模块，被配置为执行确定多种推荐指标中的目标推荐指标；
[0246]
模型更新模块，被配置为执行将指标识别层中，除目标指标识别层之外的其他指标识别层更新为特征融合层，目标指标识别层为目标推荐指标对应的指标识别层；
[0247]
第二待训练模型构建模块，被配置为执行基于特征融合层和目标指标识别层，构建第二待训练模型。
[0248]
作为一个可选的实施例，资源推荐模型训练模块1240包括：
[0249]
第二推荐指标确定单元，被配置为执行将目标对象资源信息输入到第二待训练模型中进行推荐识别处理，确定第二推荐指标信息；
[0250]
第二损失信息确定单元，被配置为执行基于第二推荐指标信息和样本多媒体资源对应的预设推荐标注信息，得到第二损失信息；
[0251]
模型训练单元，被配置为执行基于第二损失信息，对第二待训练模型进行训练，得到资源推荐模型。
[0252]
作为一个可选的实施例，第二待训练模型包括特征融合层和目标指标识别层，目标指标识别层包括特征感知层和推荐指标确定层，第二推荐指标确定单元包括：
[0253]
特征融合单元，被配置为执行将目标对象资源信息输入到特征融合层中进行特征融合，得到融合特征信息；
[0254]
第一特征感知单元，被配置为执行在当前感知层为第一个感知层的情况下，将目标对象资源信息输入到第一个感知层中进行特征感知处理，得到第一个感知层对应的感知处理结果；
[0255]
上一感知处理结果获取单元，被配置为执行在当前感知层为非第一个感知层的情况下，获取当前感知层的上一个感知层对应的上一感知处理结果；
[0256]
第二特征感知单元，被配置为执行将对象资源信息和上一感知处理结果输入到当前感知层中进行特征感知处理，得到当前感知层对应的感知处理结果；
[0257]
感知特征信息获取单元，被配置为执行将最后一个感知层输出的感知处理结果作为感知特征信息；
[0258]
第二推荐指标信息获取单元，被配置为执行将融合特征信息和感知特征信息输入到推荐指标确定层中进行推荐指标确定，得到第二推荐指标信息。
[0259]
作为一个可选的实施例，目标信息获取模块1230包括：
[0260]
对比单元，被配置为执行对比每个样本对象资源信息对应的更新权重信息和预设权重阈值；
[0261]
目标信息确定单元，被配置为执行将更新权重信息大于等于预设权重阈值的样本对象资源信息作为目标对象资源信息。
[0262]
关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0263]
图13是根据一示例性实施例示出的一种资源信息推荐装置框图。参照图11，该装置包括:
[0264]
对象资源获取模块1310，被配置为执行从目标对象对应的对象资源信息中获取多个目标对象资源信息，多个目标对象资源信息为更新权重信息满足预设条件的对象资源信息，更新权重信息表征对象资源信息对推荐指标信息的重要程度，对象资源信息为基于目标对象的对象信息和目标对象对应的待推荐多媒体资源的资源信息确定的；
[0265]
推荐识别模块1320，被配置为执行将目标对象资源信息输入到上述第二待训练模型的训练过程中得到的资源推荐模型中进行推荐识别处理，确定待推荐多媒体资源对应的推荐指标信息；
[0266]
目标推荐资源确定模块1330，被配置为执行基于推荐指标信息，从待推荐多媒体
资源中确定目标推荐资源；
[0267]
推荐模块1340，被配置为执行向目标对象推荐目标推荐资源。
[0268]
作为一个可选的实施例，资源推荐模型包括特征融合层和目标指标识别层，目标指标识别层包括特征感知层和推荐指标确定层，推荐识别模块包括：
[0269]
特征融合单元，被配置为执行将目标对象资源信息输入到特征融合层中进行特征融合，得到融合特征信息；
[0270]
特征感知单元，被配置为执行将目标对象资源信息输入到特征感知层中进行特征感知处理，得到感知特征信息；
[0271]
推荐指标确定单元，被配置为执行将融合特征信息和感知特征信息输入到推荐指标确定层中进行推荐指标确定，得到推荐指标信息。
[0272]
作为一个可选的实施例，特征感知层包括多个按序连接的感知层，特征感知单元包括：
[0273]
第一感知处理单元，被配置为执行在当前感知层为第一个感知层的情况下，将目标对象资源信息输入到第一个感知层中进行特征感知处理，得到第一个感知层对应的感知处理结果；
[0274]
上一感知处理结果获取单元，被配置为执行在当前感知层为非第一个感知层的情况下，获取当前感知层的上一个感知层对应的上一感知处理结果；
[0275]
第二感知处理单元，被配置为执行将目标对象资源信息和上一感知处理结果输入到当前感知层中进行特征感知处理，得到当前感知层对应的感知处理结果；
[0276]
感知特征信息获取单元，被配置为执行将最后一个感知层输出的感知处理结果作为感知特征信息。
[0277]
关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0278]
图14是根据一示例性实施例示出的一种用于资源推荐模型训练或资源信息推荐的电子设备的框图，该电子设备可以是服务器，其内部结构图可以如图14所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种用于资源推荐模型训练或资源信息推荐方法。
[0279]
本领域技术人员可以理解，图14中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0280]
在示例性实施例中，还提供了一种包括指令的计算机可读存储介质，例如包括指令的存储器1404，上述指令可由电子设备1400的处理器1420执行以完成上述方法。可选地，计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0281]
在示例性实施例中，还提供一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时实现如上述所述的资源推荐模型训练方法和上述所述的资源信息推荐方法。
[0282]
本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
[0283]
应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：车牌识别方法、相关设备及可读存储介质与流程

资源推荐模型训练方法、资源信息推荐方法和装置与流程

相关文献

最热文献