信息推荐模型的训练方法、信息推荐方法、装置及服务器与流程

2022-08-10 14:48:20 来源：中国专利 TAG：

1.本公开涉及信息推荐技术领域，尤其涉及一种信息推荐模型的训练方法、信息推荐方法、装置、电子设备及存储介质。

背景技术：

2.随着信息推荐技术的发展，出现了一种利用信息推荐模型进行信息推荐的技术，通过对信息推荐模型进行训练，在进行信息推荐时，可以提取推荐信息库中包含的推荐信息的信息特征以及进行信息推荐的推荐用户的用户特征，并将信息特征与用户特征输入至推荐模型，即可由模型输出用户访问各推荐信息的概率，从而可以为用户提供高访问概率的推荐信息。
3.相关技术中，目前的信息推荐模型在训练过程中，采集样本后可以利用不同层次的网络分别提取样本的浅层特征以及深层特征，并且通过将浅层特征以及深层特征通过直接相加的方式进行融合，来实现信息推荐模型的训练，然而，这种直接相加进行融合的方式较为单一，因此训练出的信息推荐模型的推荐准确率较低。

技术实现要素：

4.本公开提供一种信息推荐模型的训练方法、信息推荐方法、装置、电子设备及存储介质，以至少解决相关技术中信息推荐模型的推荐准确率低的问题。本公开的技术方案如下：
5.根据本公开实施例的第一方面，提供一种信息推荐模型的训练方法，包括：
6.获取初始样本特征，以及样本账户针对于样本推荐信息的实际操作结果；所述初始样本特征根据所述样本账户的样本账户特征，以及所述样本推荐信息的样本信息特征得到；
7.将所述初始样本特征输入待训练的信息推荐模型，得到所述样本账户针对于所述样本推荐信息的预测操作结果；所述信息推荐模型包括门控结构和多个特征提取层，所述多个特征提取层用于输出针对于所述初始样本特征的多个目标样本特征，所述门控结构的输出值根据所述初始样本特征得到，用于表征各个目标样本特征的重要程度，所述预测操作结果根据所述多个目标样本特征，以及所述门控结构的输出值得到；
8.基于所述预测操作结果和所述实际操作结果之间的差异，对所述待训练的信息推荐模型进行训练，得到训练完成的信息推荐模型。
9.在一示例性实施例中，所述将所述初始样本特征输入待训练的信息推荐模型，得到所述样本账户针对于所述样本推荐信息的预测操作结果，包括：将所述初始样本特征输入所述待训练的信息推荐模型，通过所述信息推荐模型的多个特征提取层，分别得到针对于所述初始样本特征的多个目标样本特征；将所述初始样本特征输入所述门控结构，通过所述门控结构得到各个目标样本特征分别对应的门控结构的输出值；按照所述门控结构的输出值对所述各个目标样本特征进行加权处理，利用加权处理的结果得到所述预测操作结
果。
10.在一示例性实施例中，所述通过所述推荐模型的多个特征提取层，分别得到针对于所述初始样本特征的多个目标样本特征，包括：从所述多个特征提取层中，获取当前特征提取层，以及获取用于输入当前特征提取层的当前输入样本特征；将所述当前输入样本特征输入所述当前特征提取层，通过所述当前特征提取层对应的特征提取层参数，得到与所述当前特征提取层对应的目标样本特征。
11.在一示例性实施例中，所述获取用于输入当前特征提取层的当前输入样本特征，包括：在所述当前特征提取层为所述待训练的信息推荐模型的首个特征提取层的情况下，将所述初始样本特征作为所述当前输入样本特征；在所述当前特征提取层不是所述待训练的信息推荐模型的首个特征提取层的情况下，将上一特征提取层对应的目标样本特征，作为所述当前输入样本特征。
12.在一示例性实施例中，所述将所述初始样本特征输入所述门控结构，通过所述门控结构得到各个目标样本特征分别对应的门控结构的输出值，包括：从所述初始样本特征中，获取门控输入样本特征；将所述门控输入样本特征输入所述门控结构，通过所述门控结构得到所述门控结构的输出值。
13.在一示例性实施例中，所述初始样本特征由第一初始样本特征以及第二初始样本特征所组成；所述第一初始样本特征为用于标识所述样本账户，或者用于标识所述样本推荐信息的初始样本特征，所述第二初始样本特征为所述初始样本特征中，除所述第一初始样本特征以外的初始样本特征；所述从所述初始样本特征中，获取门控输入样本特征，包括：按照预设的门控输入筛选信息，从所述第二初始样本特征中，筛选出第二门控输入样本特征；将所述第一初始样本特征作为第一门控输入样本特征，并将所述第一门控输入样本特征与所述第二门控输入样本特征，作为所述门控输入样本特征。
14.根据本公开实施例的第二方面，提供一种信息推荐方法，包括：
15.获取信息推荐特征；其中，所述信息推荐特征根据目标账户的账户特征，以及候选推荐信息的信息特征得到；
16.将所述信息推荐特征输入至训练完成的信息推荐模型，得到所述目标账户针对所述候选推荐信息的预测操作结果；其中，所述信息推荐模型通过如第一方面中任一项实施例所述的信息推荐模型的训练方法得到；
17.根据所述预测操作结果，从所述候选推荐信息中筛选出针对所述目标账户的目标推荐信息，并将所述目标推荐信息推荐至所述目标账户。
18.根据本公开实施例的第三方面，提供一种信息推荐模型的训练装置，包括：
19.样本数据获取单元，被配置为执行获取初始样本特征，以及样本账户针对于样本推荐信息的实际操作结果；所述初始样本特征根据所述样本账户的样本账户特征，以及所述样本推荐信息的样本信息特征得到；
20.预测结果获取单元，被配置为执行将所述初始样本特征输入待训练的信息推荐模型，得到所述样本账户针对于所述样本推荐信息的预测操作结果；所述信息推荐模型包括门控结构和多个特征提取层，所述多个特征提取层用于输出针对于所述初始样本特征的多个目标样本特征，所述门控结构的输出值根据所述初始样本特征得到，用于表征各个目标样本特征的重要程度，所述预测操作结果根据所述多个目标样本特征，以及所述门控结构
的输出值得到；
21.推荐模型训练单元，被配置为执行基于所述预测操作结果和所述实际操作结果之间的差异，对所述待训练的信息推荐模型进行训练，得到训练完成的信息推荐模型。
22.在一示例性实施例中，所述预测结果获取单元，进一步被配置为执行将所述初始样本特征输入所述待训练的信息推荐模型，通过所述信息推荐模型的多个特征提取层，分别得到针对于所述初始样本特征的多个目标样本特征；将所述初始样本特征输入所述门控结构，通过所述门控结构得到各个目标样本特征分别对应的门控结构的输出值；按照所述门控结构的输出值对所述各个目标样本特征进行加权处理，利用加权处理的结果得到所述预测操作结果。
23.在一示例性实施例中，所述预测结果获取单元，进一步被配置为执行从所述多个特征提取层中，获取当前特征提取层，以及获取用于输入当前特征提取层的当前输入样本特征；将所述当前输入样本特征输入所述当前特征提取层，通过所述当前特征提取层对应的特征提取层参数，得到与所述当前特征提取层对应的目标样本特征。
24.在一示例性实施例中，所述预测结果获取单元，进一步被配置为在执行所述当前特征提取层为所述待训练的信息推荐模型的首个特征提取层的情况下，将所述初始样本特征作为所述当前输入样本特征；在所述当前特征提取层不是所述待训练的信息推荐模型的首个特征提取层的情况下，将上一特征提取层对应的目标样本特征，作为所述当前输入样本特征。
25.在一示例性实施例中，所述预测结果获取单元，进一步被配置为执行从所述初始样本特征中，获取门控输入样本特征；将所述门控输入样本特征输入所述门控结构，通过所述门控结构得到所述门控结构的输出值。
26.在一示例性实施例中，所述初始样本特征由第一初始样本特征以及第二初始样本特征所组成；所述第一初始样本特征为用于标识所述样本账户，或者用于标识所述样本推荐信息的初始样本特征，所述第二初始样本特征为所述初始样本特征中，除所述第一初始样本特征以外的初始样本特征；所述预测结果获取单元，进一步被配置为执行按照预设的门控输入筛选信息，从所述第二初始样本特征中，筛选出第二门控输入样本特征；将所述第一初始样本特征作为第一门控输入样本特征，并将所述第一门控输入样本特征与所述第二门控输入样本特征，作为所述门控输入样本特征。
27.根据本公开实施例的第四方面，提供一种信息推荐装置，包括：
28.推荐特征获取单元，被配置为执行获取信息推荐特征；其中，所述信息推荐特征根据目标账户的账户特征，以及候选推荐信息的信息特征得到；
29.模型预测获取单元，被配置为执行将所述信息推荐特征输入至训练完成的信息推荐模型，得到所述目标账户针对所述候选推荐信息的预测操作结果；其中，所述信息推荐模型通过如第一方面中任一项实施例所述的信息推荐模型的训练方法得到；
30.目标信息推荐单元，被配置为执行根据所述预测操作结果，从所述候选推荐信息中筛选出针对所述目标账户的目标推荐信息，并将所述目标推荐信息推荐至所述目标账户。
31.根据本公开实施例的第五方面，提供一种服务器，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如第一方面中
任一项实施例所述的信息推荐模型的训练方法，或者如第二方面中任一项实施例所述的信息推荐方法。
32.根据本公开实施例的第六方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由服务器的处理器执行时，使得所述服务器能够执行如第一方面中任一项实施例所述的信息推荐模型的训练方法，或者如第二方面中任一项实施例所述的信息推荐方法。
33.根据本公开实施例的第七方面，提供一种计算机程序产品，所述计算机程序产品中包括指令，所述指令被服务器的处理器执行时，使得所述服务器能够执行如第一方面中任一项实施例所述的信息推荐模型的训练方法，或者如第二方面中任一项实施例所述的信息推荐方法。
34.本公开的实施例提供的技术方案至少带来以下有益效果：
35.通过获取初始样本特征，以及样本账户针对于样本推荐信息的实际操作结果；初始样本特征根据样本账户的样本账户特征，以及样本推荐信息的样本信息特征得到；将初始样本特征输入待训练的信息推荐模型，得到样本账户针对于样本推荐信息的预测操作结果；信息推荐模型包括门控结构和多个特征提取层，多个特征提取层用于输出针对于初始样本特征的多个目标样本特征，门控结构的输出值根据初始样本特征得到，用于表征各个目标样本特征的重要程度，预测操作结果根据多个目标样本特征，以及门控结构的输出值得到；基于预测操作结果和实际操作结果之间的差异，对待训练的信息推荐模型进行训练，得到训练完成的信息推荐模型。本公开可以通过门控结构的输出值得到各个特征提取层输出的目标样本特征之间的重要程度，同时信息推荐模型输出的预测操作结果可以基于目标样本特征以及门控结构的输出值确定得到，从而实现信息推荐模型的训练，相比于传统技术中通过将各个特征提取层输出的特征通过直接相加的方式进行融合来实现信息推荐模型训练，本公开可以基于各个特征提取层输出的特征的重要程度来实现特征之间的融合，而上述重要程度则可以由输入至信息推荐模型的初始样本特征确定得到，实现了各个特征提取层输出的特征的自适应融合，从而可以提高训练出的信息推荐模型的推荐准确率。
36.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
37.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。
38.图1是根据一示例性实施例示出的一种信息推荐模型的训练方法的流程图。
39.图2是根据一示例性实施例示出的信息推荐模型的结构示意图。
40.图3是根据一示例性实施例示出的得到预测操作结果的流程图。
41.图4是根据一示例性实施例示出的得到门控结构的输出值的流程图。
42.图5是根据一示例性实施例示出的信息推荐方法的流程图。
43.图6是根据一示例性实施例示出的一种信息推荐模型的训练装置的框图。
44.图7是根据一示例性实施例示出的一种信息推荐装置的框图。
45.图8是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
46.为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。
47.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
48.还需要说明的是，本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。
49.图1是根据一示例性实施例示出的一种信息推荐模型的训练方法的流程图，如图1所示，信息推荐模型的训练方法用于服务器中，包括以下步骤。
50.在步骤s101中，获取初始样本特征，以及样本账户针对于样本推荐信息的实际操作结果；初始样本特征根据样本账户的样本账户特征，以及样本推荐信息的样本信息特征得到。
51.其中，信息推荐模型是用于为账户进行信息推荐的神经网络模型，例如可以是为账户进行视频推荐的网络模型，该模型可以通过将账户的账户特征以及需要推荐的推荐信息的信息特征，例如视频的视频特征输入至推荐模型中，推荐模型则可以根据账户特征以及信息特征确定出账户对该推荐信息执行操作的概率，例如可以是账户对推荐的视频进行访问或者首层的概率等等，进而可以通过账户的操作概率来为用户推荐与用户相关度更高的推荐信息。
52.样本数据则是用于对上述信息推荐模型进行模型训练的数据，该样本数据可以包括初始样本特征，以及用于训练推荐模型的样本账户针对样本推荐信息的实际操作结果，该实际操作结果可以用于表征样本账户是否对该样本推荐信息存在诸如点击、点赞以及分享等操作。其中初始样本特征可以由样本账户数据的特征，即样本账户特征，以及样本推荐信息数据的特征，即样本信息特征组成。
53.具体来说，当服务器对信息推荐模型进行训练时，可以预先采集训练样本的数据特征，例如样本账户的样本账户特征，和样本推荐信息的样本信息特征，以及上述样本账户针对于上述样本推荐信息的实际访问结果，即该样本账户是否访问上述样本推荐信息。之后，则可以基于采集得到的样本账户特征以及样本信息特征组合形成初始样本特征，并将初始样本特征以及上述实际操作结果作为用于训练信息推荐模型的初始样本特征。例如，样本账户特征以及样本信息特征可以通过向量的形式进行表示，在得到上述特征的向量形式后，可以通过串联的方式将上述特征进行融合，合并成初始样本特征。
54.在步骤s102中，将初始样本特征输入待训练的信息推荐模型，得到样本账户针对于样本推荐信息的预测操作结果；推荐模型包括门控结构和多个特征提取层，多个特征提取层用于输出针对于初始样本特征的多个目标样本特征，门控结构的输出值根据初始样本特征得到，用于表征各个目标样本特征的重要程度，预测操作结果根据多个目标样本特征，
以及门控结构的输出值得到。
55.门控结构的输出值指的是信息推荐模型中携带的门控结构的输出参数，该输出值可以根据输入至信息推荐模型的初始样本特征确定得到，用于表征各个目标样本特征的重要程度，并且该输出值的数量可以和目标样本特征所对应的层数相匹配。而目标样本特征则指的是利用信息推荐模型的不同特征提取层，对初始样本特征进行不同维度的特征处理后得到的样本特征。例如，信息推荐模型中用于对初始样本特征a进行处理的特征提取层的数量为4个，那么在将初始样本特征a输入信息推荐模型后，则可以通过上述4个特征提取层，分别输出针对初始样本特征a的4层不同层次的目标样本特征，分别可以为目标样本特征o1、目标样本特征o2、目标样本特征o3，以及目标样本特征o4。同时，门控结构的输出值的数量也可以是4个，分别与上述目标样本特征o1、目标样本特征o2、目标样本特征o3，以及目标样本特征o4相适应，用于表征上述目标样本特征o1、目标样本特征o2、目标样本特征o3，以及目标样本特征o4之间的重要程度。
56.而预测操作结果则指的是推荐模型输出的预测结果，可以是表征样本账户针对样本推荐信息的预测操作概率。服务器将初始样本特征输入至信息推荐模型后，则可以通过信息推荐模型中包含的多个特征提取层，分别输出针对于初始样本特征的多个目标样本特征，并且可以基于初始样本特征，以及信息推荐模型中携带的门控结构，来得到用于表征上述各个目标样本特征的重要程度的输出值，最后则可以根据上述多个目标样本特征，以及门控结构的输出值，从而确定出样本账户针对于样本推荐信息的预测操作结果。
57.如图2所示，图2可以是一个信息推荐模型的模型结构示意图，可见输入至信息推荐模型的初始样本特征可以是由向量1、向量2、
……
、向量n所组成。该信息推荐模型可以包含多个特征提取层，特征提取层1、特征提取层2、特征提取层3、
……
、特征提取层n，服务器将初始样本特征输入至信息推荐模型后，则可以通过信息推荐模型中包含的多个特征提取层，即特征提取层1、特征提取层2、特征提取层3、
……
、特征提取层n，分别得到针对初始样本特征的多个目标样本特征，即目标样本特征1、目标样本特征2、目标样本特征3、
……
、目标样本特征n。并且，还可以根据输入的初始样本特征，以及信息推荐模型中包括的门控结构，得到上述多个目标样本特征分别对应的门控结构输出值，从而信息推荐模型可以通过上述多个目标样本特征，以及用于表征各个目标样本特征的重要程度的门控结构输出值，来得到最终的输出结果，即预测操作结果。
58.在步骤s103中，基于预测操作结果和实际操作结果之间的差异，对待训练的信息推荐模型进行训练，得到训练完成的信息推荐模型。
59.在步骤s102服务器得到样本账户针对于样本推荐信息的预测操作结果之后，还可以计算该预测操作结果与样本账户针对于样本推荐信息的实际操作结果之间的差异，例如，可以是通过预先构造的损失函数，来得到预测操作结果和实际操作结果之间的损失值，将其作为预测操作结果和实际操作结果之间的差异，并利用上述损失值，对上述信息推荐模型进行训练，从而得到训练完成的信息推荐模型，例如可以是信息推荐模型的损失值小于一个损失值阈值，或者训练步数达到一定步数时，停止训练得到最终的信息推荐模型。
60.上述信息推荐模型的训练方法中，通过获取初始样本特征，以及样本账户针对于样本推荐信息的实际操作结果；初始样本特征根据样本账户的样本账户特征，以及样本推荐信息的样本信息特征得到；将初始样本特征输入待训练的信息推荐模型，得到样本账户
针对于样本推荐信息的预测操作结果；信息推荐模型包括门控结构和多个特征提取层，多个特征提取层用于输出针对于初始样本特征的多个目标样本特征，门控结构的输出值根据初始样本特征得到，用于表征各个目标样本特征的重要程度，预测操作结果根据多个目标样本特征，以及门控结构的输出值得到；基于预测操作结果和实际操作结果之间的差异，对待训练的信息推荐模型进行训练，得到训练完成的信息推荐模型。本公开可以通过门控结构的输出值得到各个特征提取层输出的目标样本特征之间的重要程度，同时信息推荐模型输出的预测操作结果可以基于目标样本特征以及门控结构的输出值确定得到，从而实现信息推荐模型的训练，相比于传统技术中通过将各个特征提取层输出的特征通过直接相加的方式进行融合来实现信息推荐模型训练，本公开可以基于各个特征提取层输出的特征的重要程度来实现特征之间的融合，而上述重要程度则可以由输入至信息推荐模型的初始样本特征确定得到，实现了各个特征提取层输出的特征的自适应融合，从而可以提高训练出的信息推荐模型的推荐准确率。
61.在一示例性实施例中，如图3所示，步骤s102可以进一步包括：
62.在步骤s301中，将初始样本特征输入待训练的信息推荐模型，通过信息推荐模型的多个特征提取层，分别得到针对于初始样本特征的多个目标样本特征。
63.本实施例中，多个目标样本特征可以是分别通过多个特征提取层输出得到，服务器可以通过将初始样本特征输入至包含多个特征提取层的信息推荐模型中，由信息推荐模型的各个特征提取层，分别输出针对于初始样本特征的多个目标样本特征。例如，多个特征提取层的数量可以是k个，分别是特征提取层1、特征提取层2、
……
、特征提取层k，服务器在将初始样本特征输入至信息推荐模型后，则可以通过信息推荐模型的各个特征提取层，分别得到对应的多个目标样本特征，分别得到目标样本特征o1、目标样本特征o2，
……
，目标样本特征ok。
64.在步骤s302中，将初始样本特征输入门控结构，通过门控结构得到各个目标样本特征分别对应的门控结构的输出值。
65.而门控结构的输出值，则可以是服务器通过将初始样本特征输入至信息推荐模型的门控结构，由该门控结构输出得到，给门控结构的输出值可以分别和各个特征提取层输出的目标样本特征相适应。具体来说，服务器在将初始样本特征输入信息推荐模型时，可以同时将初始样本特征输入至信息推荐模型的门控结构中，由门控结构分别输出相应的各个目标样本特征的输出值。
66.例如，对于包含k个特征提取层的信息推荐模型，各个特征提取层输出的目标样本特征可以分别是目标样本特征o1、目标样本特征o2、
……
、目标样本特征ok，那么通过门控结构得到的输出值的数量也可以是k个，分别为门控结构输出值g1、门控结构输出值g2、
……
、门控结构输出值gk，并且上述门控结构采用mlp神经网络结构，因此k个门控结构的输出值可以通过以下公式得到：
67.[g1,g2,
…
,gk]＝fg(a,wg)＝σ(a*wg)
[0068]
其中，a表示输入至门控结构的初始样本特征，而wg则表示用于门控结构的mlp神经网络结构所对应的结构参数，σ则表示sigmoid激活函数，即s形双弯曲函数。
[0069]
在步骤s303中，按照门控结构的输出值对各个目标样本特征进行加权处理，利用加权处理的结果得到预测操作结果。
[0070]
最后，在得到上述多个目标样本特征后，则可以利用各个目标样本特征对应的门控结构的输出值，来对各个目标样本特征进行加权处理，并利用加权处理后得到的结果，来最终得到信息推荐模型输出的预测操作结果。
[0071]
例如，多个目标样本特征可以分别是目标样本特征o1、目标样本特征o2、
……
、目标样本特征ok，各个门控结构的输出值则可以是门控结构输出值g1、门控结构输出值g2、
……
、门控结构输出值gk，服务器则可以通过以下公式进行加权处理：
[0072][0073]
其中，o
*
表示加权处理后得到的结果，ok表示第k个目标样本特征，而gk则表示第k个目标样本特征所对应的门控参数的输出值。
[0074]
之后，则可以进一步通过最终的mlp神经网络即可得到最终的预估值，即通过如下计算公式实现：
[0075]
pred＝f(o
*
*w
*
)＝σ(o
*
*w)
[0076]
其中σ是sigmoid激活函数，即s形双弯曲函数，pred则表示最终的预测操作结果。
[0077]
本实施例中，在将初始样本特征输入信息推荐模型后，则可以通过信息推荐模型的多个特征提取层，分别得到多个目标样本特征，还可以将初始样本特征输入信息推荐模型的门控结构，由门控结构输出相应的输出值，并通过加权的方式得到预测操作结果，本实施例可以通过权重的形式来表征各个目标样本特征的重要程度，因此可以进一步提高得到的预测操作结果的准确性。
[0078]
进一步地，步骤s301可以进一步包括：从多个特征提取层中，获取当前特征提取层，以及获取用于输入当前特征提取层的当前输入样本特征；将当前输入样本特征输入当前特征提取层，通过当前特征提取层对应的特征提取层参数，得到与当前特征提取层对应的目标样本特征。
[0079]
当前特征提取层则可以是指的是信息推荐模型中包含的多个特征提取层中的任意一个，而当前输入样本特征则指的是输入至当前特征提取层的样本特征，例如当前特征提取层为特征提取层1，那么输入至特征提取层1的样本特征则可以作为当前输入样本特征，而如果当前特征提取层为特征提取层2，那么则可以将输入至特征提取层2的样本特征则可以作为当前输入样本特征，本实施例中，服务器可以获取每一个当前特征提取层对应的当前输入样本特征，并且通过将当前输入样本特征输入至相应的当前特征提取层，从而可以通过当前特征提取层所对应的特征提取层参数，来输出得到每一个当前特征提取层所对应的目标样本特征。
[0080]
本实施例中，服务器还可以获取每一个特征提取层所对应的输入样本特征，并且利用每一个特征提取层的特征提取层参数，对每一个特征提取层的输入样本特征进行处理，从而输出每一个特征提取层的目标样本特征，通过上述方式，服务器可以得到每一个特征提取层的目标样本特征，从而提高各个特征提取层输出的目标样本特征的精度。
[0081]
并且，获取用于输入当前特征提取层的当前输入样本特征，可以进一步包括：在当前特征提取层为待训练的信息推荐模型的首个特征提取层的情况下，将初始样本特征作为当前输入样本特征；在当前特征提取层不是待训练的信息推荐模型的首个特征提取层的情况下，将上一特征提取层对应的目标样本特征，作为当前输入样本特征。
[0082]
本实施例中，特征提取层的数量为多个，而首个特征提取层则指的是初始样本特
征输入至信息推荐模型所对应的第一个特征提取层，例如多个特征提取层的顺序分别是特征提取层1、特征提取层2以及特征提取层3，那么特征提取层1则可以作为待训练的信息推荐模型中的首个特征提取层。具体来说，如果当前特征提取层为信息推荐模型的首个特征提取层，即特征提取层1，那么服务器则可以将初始样本特征作为当前输入样本特征，来输出相应的目标样本特征1，而如果当前特征提取层不是信息推荐模型的首个特征提取层，那么服务器则可以将当前特征提取层的上一个特征提取层，即上一特征提取层的目标样本特征，作为当前输入样本特征。例如当前特征提取层为特征提取层2，其并非信息推荐模型的首个特征提取层，那么服务器则可以将当前特征提取层的上一特征提取层所对应的目标样本特征，即特征提取层1对应的目标样本特征1，作为当前输入样本特征，从而通过特征提取层2得到相应的目标样本特征2，,而如果当前特征提取层为特征提取层3，那么服务器则可以将特征提取层2对应的目标样本特征2，作为当前输入样本特征。
[0083]
例如，每一个特征提取层对应的目标样本特征可以通过如下计算公式表征：
[0084]
o1＝f1(a*w1)
[0085]
ok＝fk(o
k-1
*wk)
[0086]
其中函数f表示神经网络的单层特征提取层，f(x,w)＝σ(x*w)，fk表示第k层神经网络的特征提取层，wk表示第k层特征提取层的特征提取层参数，σ表示relu激活函数，即线性整流函数，ok则表示第k层特征提取层输出的目标样本特征，可见对于第一层特征提取层，其输入为初始样本特征a，而对于其他特征提取层，其输入则可以是第k-1层特征提取层输出的目标样本特征，通过上述方式，则可以得到多种深度的目标样本特征，代表着模型在不同深度下提取出来的信息。
[0087]
本实施例中，如果当前特征提取层为首个特征提取层，则可以将初始样本特征作为当前输入样本特征，而如果当前特征提取层不是首个特征提取层，则可以将上一特征提取层的目标样本特征作为当前输入样本特征，通过上述方式，则可以得到每一个特征提取层的目标样本特征，从而可以得到不同深度的目标样本特征。
[0088]
另外，在一示例性实施例中，如图4所示，步骤s302可以进一步包括：
[0089]
在步骤s401中，从初始样本特征中，获取门控输入样本特征。
[0090]
门控输入样本特征指的是初始样本特征中，用于输入门控结构的初始样本特征。本实施例中，为了提高信息推荐模型的运算效率，在将初始样本特征输入至门控结构得到门控结构的输出值时，并非是将所有的初始样本特征都输入至门控结构，来得到上述门控结构的输出值，而是先从初始样本特征中，按照设定的特征选取规则，筛选出一部分作为输入至门控结构的样本特征，即门控输入样本特征。例如，初始样本特征可以由10个特征向量所构成，那么在将其输入至门控结构之前，则可以对上述10个特征向量进行初步的筛选，例如筛选出其中5个特征向量，作为用于输入至门控结构的门控输入样本特征。
[0091]
在步骤s402中，将门控输入样本特征输入门控结构，通过门控结构得到门控结构的输出值。
[0092]
在步骤s401得到门控输入样本特征后，则可以进一步地将门控输入样本特征输入至信息推荐模型的门控结构中，从而可以通过门控结构得到与该门控输入样本特征相适应的门控结构的输出值。
[0093]
本实施例中，在利用门控结构得到门控结构的输出值时，可以是先从初始样本特
征中，筛选出门控输入样本特征，并将门控输入样本特征输入至门控结构，来得到上述门控结构的输出值，相比于将所有的初始样本特征都输入至门控结构来得到上述输出值，本实施例可以减少门控结构得到输出值的运算量，从而进一步提高信息推荐模型的运算效率。
[0094]
进一步地，初始样本特征由第一初始样本特征以及第二初始样本特征所组成；第一初始样本特征为用于标识样本账户，或者用于标识样本推荐信息的初始样本特征，第二初始样本特征为初始样本特征中，除第一初始样本特征以外的初始样本特征；步骤s401可以进一步包括：按照预设的门控输入筛选信息，从第二初始样本特征中，筛选出第二门控输入样本特征；将第一初始样本特征作为第一门控输入样本特征，并将第一门控输入样本特征与第二门控输入样本特征，作为门控输入样本特征。
[0095]
其中，第一初始样本特征指的是初始样本特征中，用于标识样本账户，或者用于标识样本推荐信息的初始样本特征，例如可以是样本账户的账户id特征，即账户信息编号特征，或者样本推荐信息的推荐信息id特征，即推荐信息编号特征，而第二初始样本特征则指的是初始样本特征中，除第一初始样本特征以外的其他的初始样本特征，即可以是除样本账户的账户id特征以及样本推荐信息的推荐信息id特征的其他特征，如样本账户的性别特征以及样本推荐信息的上传时间特征等等。而第一门控输入样本特征，则指的是用于作为门控输入样本特征的第一初始样本特征，第二门控输入样本特征，则指的是用于作为门控输入样本特征的第二初始样本特征，门控输入筛选信息则指的是将第二初始样本特征筛选为第二门控输入样本特征的信息，例如可以是预先设定的第二门控输入样本特征筛选规则。
[0096]
本实施例中，初始样本特征可以是包括第一初始样本特征以及第二初始样本特征，在确定门控输入样本特征时，则可以将所有的第一初始样本特征都作为第一门控输入样本特征，而对于第二门控输入样本特征则可以按照门控输入筛选信息，来进行第二门控输入样本特征，从而将确定出的第一门控输入样本特征以及第二门控输入样本特征作为门控输入样本特征，由于第一初始样本特征可以用于表征标识样本账户，或者标识样本推荐信息，因此通过上述方式筛选的门控输入样本特征，可以在提高信息推荐模型的运算效率的前提下，实现门控结构的输出可以根据标识的样本账户或者样本推荐信息实现自适应的调整，从而可以提高门控结构输出的灵活性。
[0097]
上述实施例中，服务器可以将用于标识样本账户或者样本推荐信息的第一初始样本特征作为第一门控输入样本特征，而初始样本特征中除第一初始样本特征以外的第二初始样本特征则可以基于门控输入筛选信息来筛选得到第二门控输入样本特征，从而可以在提高信息推荐模型的运算效率的前提下，实现门控结构的输出可以根据标识的样本账户或者样本推荐信息实现自适应的调整，进而提高门控结构输出的灵活性。
[0098]
图5是根据一示例性实施例示出的一种信息推荐方法的流程图，如图5所示，信息推荐方法用于服务器中，包括以下步骤。
[0099]
在步骤s501中，获取信息推荐特征；其中，信息推荐特征根据目标账户的账户特征，以及候选推荐信息的信息特征得到。
[0100]
其中，目标账户则指的是待信息推荐的账户，候选推荐信息则指的是在推荐信息库中可以用于推荐给目标账户的推荐信息，例如可以是视频数据库中包含的视频。本实施例中，当服务器需要将推荐信息推荐至账户时，例如可以是用户通过其终端触发刷新页面
操作时，从而触发针对于服务器信息推荐请求，此时服务器则可以对该请求进行响应，从而得到该目标账户的账户特征，并且从推荐信息库中提取出各个候选推荐信息的信息特征，之后则可以根据得到的账户特征以及信息特征，形成用于输入至信息推荐模型的信息推荐特征。
[0101]
在步骤s502中，将信息推荐特征输入至训练完成的信息推荐模型，得到目标账户针对候选推荐信息的预测操作结果；其中，信息推荐模型通过如上任一项实施例所述的信息推荐模型的训练方法得到。
[0102]
预测操作结果指的是由信息推荐模型输出的，目标账户针对各个候选推荐信息的预测操作情况，例如可以是目标账户对各个候选推荐信息的预测操作概率，本实施例中，在信息推荐模型通过上述实施例提供的信息推荐模型的训练方法训练完成后，服务器则可以进一步将步骤s501中得到的信息推荐特征输入至训练完成的信息推荐模型中，之后则可以通过信息推荐模型输出得到目标账户针对各个候选推荐信息的预测操作结果。
[0103]
在步骤s503中，根据预测操作结果，从候选推荐信息中筛选出针对目标账户的目标推荐信息，并将目标推荐信息推荐至目标账户。
[0104]
目标推荐信息则指的是候选推荐信息中，最终推荐至目标账户的推荐信息。最后，服务器在得到目标账户针对每一个候选推荐信息的预测操作结果后，则可以进一步基于上述预测操作结果，从各个候选推荐信息中，筛选出用于推荐给目标账户的目标推荐信息，例如预测操作结果可以是目标账户针对各个候选推荐信息的预测操作概率，服务器则可以将预测操作概率最大的候选推荐信息，作为目标推荐信息推荐至目标账户。
[0105]
上述信息推荐方法中，通过获取信息推荐特征；其中，信息推荐特征根据目标账户的账户特征，以及候选推荐信息的信息特征得到；将信息推荐特征输入至训练完成的信息推荐模型，得到目标账户针对候选推荐信息的预测操作结果；其中，信息推荐模型通过如上任一项实施例所述的信息推荐模型的训练方法得到；根据预测操作结果，从候选推荐信息中筛选出针对目标账户的目标推荐信息，并将目标推荐信息推荐至目标账户。本公开提供的信息推荐方法中，训练的信息推荐模型可以通过门控结构的输出值得到各个特征提取层输出的目标样本特征之间的重要程度，同时信息推荐模型输出的预测操作结果可以基于目标样本特征以及门控结构的输出值确定得到，从而实现信息推荐模型的训练，相比于传统技术中通过将各个特征提取层输出的特征通过直接相加的方式进行融合来实现信息推荐模型训练，本公开可以基于各个特征提取层输出的特征的重要程度来实现特征之间的融合，而上述重要程度则可以由输入至信息推荐模型的初始样本特征确定得到，实现了各个特征提取层输出的特征的自适应融合，从而可以提高训练出的信息推荐模型的推荐准确率。
[0106]
在一示例性实施例中，还提供了一种基于多分支多深度网络门控结构的推荐方法，该方法用于推荐网络的场景，可以提高推荐系统的预估效果。该方法能让神经网络模型具备从浅到深的各类特征，并让每个样本/用户/物品通过门控机制可以自适应地按不同的重要程度来融合多深度分支特征，从而获得更为贴切准确的预估值。具体可以包括如下步骤：
[0107]
首先根据历史数据组织出训练样本，每个样本的构成是：用户id，即用户编号、目标物品id，即目标用品编号、用户侧的特征(如性别、浏览历史等)、目标物品侧特征(如上传
时间等)，以及一些用户-物品的上下文特征(如相遇的时间、位置等)。每个特征内的原始表示一般是数字或字符串。如城市这个特征，该特征具有很多个特征值key分别对应着不同城市，我们可以用一个有限的数字集合来表示不同的特征值key(比如该特征的key1对应城市1，key2对应城市2)。特征的每个key将获得对应的向量(同特征内，不同的key其对应向量的维度一样，数值不竟相同)。比如对于城市特征的key＝
‘
城市1’拥有其独有的向量，城市特征的key＝
‘
城市2’拥有和
‘
城市1’同维度但不同数值的向量。从而通过上述方式，将这种数字或字符串的key转为独有向量的方式，实现特征向量化。
[0108]
输入样本，现将这n个特征对应的key的向量取出来并串联在一起，得到输入input＝[e1,e2,
…en
]。将它输入神经网络模型中。最后得到预估值pred＝f(input,w)。函数f表示网络模型，w表示网络模型内的参数，pred是该用户为点击/观看该视频的预估值。本实施例主要作用于上述的网络模型，在于提供一种多分支多深度网络的门控结构，让神经网络的预估值更为准确，该网络模型的结构可如图2所示。
[0109]
具体来说，先将样本的n个特征取出对应的n个向量，合并成向量a＝[e1,e2,
…en
]。合并的方式有多种，如将全部向量直接串联在一起，或将局部特征向量进行其他操作(如乘积、神经网络再生成新特征向量)后再合并在一起，本实施例则采用直接串联的方式。
[0110]
根据合并后的向量a，依次用神经网络进行投影(增加神经网络的层数)，得到不同深度的o1,o2,
…
,ok共k个向量输出。即：
[0111]
o1＝f1(a*w1)
[0112]
ok＝fk(o
k-1
*wk)
[0113]
其中函数f表示神经网络的单层特征提取层，f(x,w)＝σ(x*w)，σ表示relu激活函数，即线性整流函数，w是神经网络中的参数，其中wk表示第k层特征提取层的特征提取层参数。这样就得到k种深度的向量输出，它们代表着模型在不同深度下提取出来的信息。
[0114]
以向量a作为门控的输入(只要该输入包含用户id特征的向量或物品id特征的向量即可，这样能达到用户级/物品级自适应分支门控)，通过门控机制得到o1,o2,
…
,ok每个分支的门控值[g1,g2,
…
,gk](k个值),这门控值表示对应分支输出的重要程度，或说融合系数。此门控机制采用mlp神经网络结构：[g1,g2,
…
,gk]＝fg(a,wg)＝σ(a*wg)，其中σ是sigmoid激活函数，即s形双弯曲函数，而wg则表示用于门控结构的mlp神经网络结构所对应的结构参数。
[0115]
将多分支的输出[o1,o2,
…
,ok]分别对应乘上门控值[g1,g2,
…
,gk]，相加方式融合成新的向量其中ok表示第k个目标样本特征，而gk则表示第k个目标样本特征所对应的门控参数的输出值。此向量正是样本个性化融合多分支多深度的新型特征。将该向量通过最终的mlp神经网络即可得到最终的预估值：
[0116]
pred＝f(o
*
*w
*
)＝σ(o
*
*w)
[0117]
其中σ是sigmoid激活函数，即s形双弯曲函数，而w表示最终的mlp神经网络的模型参数，得到的pred则是用户对于该视频的点击预估值。
[0118]
上述实施例中，可以满足推荐系统中对于深浅层特征的需求，并且门控机制可以让样本/用户/物品自适应地寻找到最佳特征融合方式，得到更为准确的预估值。从而可以有效提高推荐模型的效果，获得业务收益。并且模型的架构大幅度提高了整个模型的潜力，通过提供了简洁高效且解耦合的体系结构，有便于多种其他有效模型结构集成入本结构
中，来进一步提高模型效果。
[0119]
应该理解的是，虽然本公开的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0120]
可以理解的是，本说明书中上述方法的各个实施例之间相同/相似的部分可互相参见，每个实施例重点说明的是与其他实施例的不同之处，相关之处参见其他方法实施例的说明即可。
[0121]
图6是根据一示例性实施例示出的一种信息推荐模型的训练装置的框图。参照图6，该装置包括样本数据获取单元601，预测结果获取单元602和推荐模型训练单元603。
[0122]
样本数据获取单元601，被配置为执行获取初始样本特征，以及样本账户针对于样本推荐信息的实际操作结果；初始样本特征根据样本账户的样本账户特征，以及样本推荐信息的样本信息特征得到；
[0123]
预测结果获取单元602，被配置为执行将初始样本特征输入待训练的信息推荐模型，得到样本账户针对于样本推荐信息的预测操作结果；信息推荐模型包括门控结构和多个特征提取层，多个特征提取层用于输出针对于初始样本特征的多个目标样本特征，门控结构的输出值根据初始样本特征得到，用于表征各个目标样本特征的重要程度，预测操作结果根据多个目标样本特征，以及门控结构的输出值得到；
[0124]
推荐模型训练单元603，被配置为执行基于预测操作结果和实际操作结果之间的差异，对待训练的信息推荐模型进行训练，得到训练完成的信息推荐模型。
[0125]
在一示例性实施例中，预测结果获取单元602，进一步被配置为执行将初始样本特征输入待训练的信息推荐模型，通过信息推荐模型的多个特征提取层，分别得到针对于初始样本特征的多个目标样本特征；将初始样本特征输入门控结构，通过门控结构得到各个目标样本特征分别对应的门控结构的输出值；按照门控结构的输出值对各个目标样本特征进行加权处理，利用加权处理的结果得到预测操作结果。
[0126]
在一示例性实施例中，预测结果获取单元602，进一步被配置为执行从多个特征提取层中，获取当前特征提取层，以及获取用于输入当前特征提取层的当前输入样本特征；将当前输入样本特征输入当前特征提取层，通过当前特征提取层对应的特征提取层参数，得到与当前特征提取层对应的目标样本特征。
[0127]
在一示例性实施例中，预测结果获取单元602，进一步被配置为在执行当前特征提取层为待训练的信息推荐模型的首个特征提取层的情况下，将初始样本特征作为当前输入样本特征；在当前特征提取层不是待训练的信息推荐模型的首个特征提取层的情况下，将上一特征提取层对应的目标样本特征，作为当前输入样本特征。
[0128]
在一示例性实施例中，预测结果获取单元602，进一步被配置为执行从初始样本特征中，获取门控输入样本特征；将门控输入样本特征输入门控结构，通过门控结构得到门控结构的输出值。
[0129]
在一示例性实施例中，初始样本特征由第一初始样本特征以及第二初始样本特征
所组成；第一初始样本特征为用于标识样本账户，或者用于标识样本推荐信息的初始样本特征，第二初始样本特征为初始样本特征中，除第一初始样本特征以外的初始样本特征；预测结果获取单元602，进一步被配置为执行按照预设的门控输入筛选信息，从第二初始样本特征中，筛选出第二门控输入样本特征；将第一初始样本特征作为第一门控输入样本特征，并将第一门控输入样本特征与第二门控输入样本特征，作为门控输入样本特征。
[0130]
图7是根据一示例性实施例示出的一种信息推荐装置的框图。参照图7，该装置包括推荐特征获取单元701，模型预测获取单元702和目标信息推荐单元703。
[0131]
推荐特征获取单元701，被配置为执行获取信息推荐特征；其中，信息推荐特征根据目标账户的账户特征，以及候选推荐信息的信息特征得到；
[0132]
模型预测获取单元702，被配置为执行将信息推荐特征输入至训练完成的信息推荐模型，得到目标账户针对候选推荐信息的预测操作结果；其中，信息推荐模型通过如上任一项实施例所述的信息推荐模型的训练方法得到；
[0133]
目标信息推荐单元703，被配置为执行根据预测操作结果，从候选推荐信息中筛选出针对目标账户的目标推荐信息，并将目标推荐信息推荐至目标账户。
[0134]
关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0135]
图8是根据一示例性实施例示出的一种用于信息推荐模型的训练，或者用于信息推荐的电子设备800的框图。例如，电子设备800可以为服务器。参照图8，电子设备800包括处理组件820，其进一步包括一个或多个处理器，以及由存储器822所代表的存储器资源，用于存储可由处理组件820的执行的指令，例如应用程序。存储器822中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件820被配置为执行指令，以执行上述方法。
[0136]
电子设备800还可以包括：电源组件824被配置为执行电子设备800的电源管理，有线或无线网络接口826被配置为将电子设备800连接到网络，和输入输出(i/o)接口828。电子设备800可以操作基于存储在存储器822的操作系统，例如windows server，mac os x，unix，linux，freebsd或类似。
[0137]
在示例性实施例中，还提供了一种包括指令的计算机可读存储介质，例如包括指令的存储器822，上述指令可由电子设备800的处理器执行以完成上述方法。存储介质可以是计算机可读存储介质，例如，所述计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
[0138]
在示例性实施例中，还提供一种计算机程序产品，所述计算机程序产品中包括指令，上述指令可由电子设备800的处理器执行以完成上述方法。
[0139]
需要说明的，上述的装置、电子设备、计算机可读存储介质、计算机程序产品等根据方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照相关方法实施例的描述，在此不作一一赘述。
[0140]
本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要
求指出。
[0141]
应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种特征更新的人脸识别方法及系统与流程

信息推荐模型的训练方法、信息推荐方法、装置及服务器与流程

相关文献

最热文献