信息推荐方法、装置、服务器及存储介质与流程

2022-05-21 04:59:42 来源：中国专利 TAG：

1.本公开涉及互联网技术领域，特别涉及一种信息推荐方法、装置、服务器及存储介质。

背景技术：

2.推荐系统是互联网的核心组件，是连接用户过去发生过的行为和用户未来可能感兴趣的信息的重要纽带。推荐系统基于精排模型对用户和信息之间的相关性进行评分，进而根据评分结果将topn的信息推送给用户。
3.相关技术在对信息进行推荐时，主要采用如下方法：在离线状态下，每天基于前一天在内的预设时间段的历史数据全量预训练模型，得到多个用户隐式表征向量和多个内容隐式表征向量，然后计算每个用户隐式表征向量和每个内容隐式表征向量之间的内积，得到多个隐式表征内积，进而基于多个隐式表征内积，训练精排模型；在线状态下，基于离线状态所训练的精排模型，为用户推荐信息。
4.然而，相关技术需要每天全量预训练模型，以获取用于训练精排模型的多个用户隐式表征向量和多个内容隐式表征向量，这使得精排模型的训练过程耗时较长、占用离线资源较多，进一步导致信息推荐过程资源消耗量较大。

技术实现要素：

5.本公开实施例提供了一种信息推荐方法、装置、服务器及存储介质，能够降低用于训练精排模型的多个用户隐式表征向量和多个内容隐式表征向量的获取时长，减低离线资源的消耗，进而降低信息推荐过程消耗的资源量。所述技术方案如下：
6.第一方面，提供了一种信息推荐方法，所述方法包括：
7.获取用户的用户特征和用户隐式表征向量，并获取多条信息中每条信息的信息特征和内容隐式表征向量；
8.将所述用户特征和所述用户隐式表征向量及每条信息的信息特征和内容隐式表征向量输入到精排模型中，输出每条信息的精排分数，所述精排模型根据当前时间前第一预设时间段生成的多个用户隐式表征向量和多个内容隐式表征向量训练得到，所述多个用户隐式表征向量和所述多个内容隐式表征向量基于增量预训练模型生成，所述增量预训练模型基于第二预设时间段之后至当前时间前第一预设时间段新增的历史数据对所述全量预训练模型进行迭代训练得到，所述全量预训练模型基于所述第二预设时间段的历史数据训练得到，所述第一预设时间段的时长小于所述第二预设时间段的时长；
9.基于每条信息的精排分数，从所述多条信息中筛选出目标信息，并将所述目标信息推荐给所述用户。
10.在本公开的另一个实施例中，所述获取用户的用户隐式表征向量，包括：
11.基于所述用户的用户标识，从指定数据库中获取所述用户的用户隐式表征向量，所述指定数据库用于持久化存储所述多个用户的用户标识与用户隐式表征向量之间的对
应关系，且随着所述增量预训练模型的训练进行更新。
12.在本公开的另一个实施例中，所述获取多条信息中每条信息的内容隐式表征向量，包括：
13.基于每条信息的信息标识，从内存中获取每条信息的内容隐式表征向量，所述内存中存储有所述多条信息的信息标识与内容隐式表征向量之间的对应关系，且随着所述增量预训练模型的训练进行更新。
14.在本公开的另一个实施例中，所述将所述用户特征和所述用户隐式表征向量及每条信息的信息特征和内容隐式表征向量输入到精排模型中，输出每条信息的精排分数之前，还包括：
15.将所述用户特征和所述用户隐式表征向量分别与每条信息的信息特征和内容隐式表征向量进行拼接，得到每条信息对应的拼接向量；
16.所述将所述用户特征和所述用户隐式表征向量及每条信息的信息特征和内容隐式表征向量输入到精排模型中，输出每条信息的精排分数，包括：
17.将每条信息对应的拼接向量输入到所述精排模型中，输出每条信息的精排分数。
18.在本公开的另一个实施例中，所述精排模型的训练过程为：
19.获取所述多个用户隐式表征向量和所述多个内容隐式表征向量；
20.计算每个用户隐式表征向量与每个内容隐式表征向量之间的内积，得到多个隐式表征内积；
21.基于所述多个用户隐式表征向量、所述多个内容隐式表征向量、所述多个隐式表征内积及其他特征，对初始精排模型进行训练，得到所述精排模型，所述其他特征包括多个用户和多条信息的离散特征与连续特征。
22.第二方面，提供了一种信息推荐装置，所述装置包括：
23.第一获取模块，用于获取用户的用户特征和用户隐式表征向量，并获取多条信息中每条信息的信息特征和内容隐式表征向量；
24.输入输出模块，用于将所述用户特征和所述用户隐式表征向量及每条信息的信息特征和内容隐式表征向量输入到精排模型中，输出每条信息的精排分数，所述精排模型根据当前时间前第一预设时间段生成的多个用户隐式表征向量和多个内容隐式表征向量训练得到，所述多个用户隐式表征向量和所述多个内容隐式表征向量基于增量预训练模型生成，所述增量预训练模型基于第二预设时间段之后至当前时间前第一预设时间段新增的历史数据迭代训练得到，所述全量预训练模型基于所述第二预设时间段的历史数据训练得到，所述第一预设时间段的时长小于所述第二预设时间段的时长；
25.筛选模块，用于基于每条信息的精排分数，从所述多条信息中筛选出目标信息；
26.推荐模块，用于将所述目标信息推荐给所述用户。
27.在本公开的另一个实施例中，所述获取模块，用于基于所述用户的用户标识，从指定数据库中获取所述用户的用户隐式表征向量，所述指定数据库用于持久化存储所述多个用户的用户标识与用户隐式表征向量之间的对应关系，且随着所述增量预训练模型的训练进行更新。
28.在本公开的另一个实施例中，所述获取模块，用于基于每条信息的信息标识，从内存中获取每条信息的内容隐式表征向量，所述内存中存储有所述多条信息的信息标识与内
容隐式表征向量之间的对应关系，且随着所述增量预训练模型的训练进行更新。
29.在本公开的另一个实施例中，所述装置还包括：
30.拼接模块，用于将所述用户特征和所述用户隐式表征向量分别与每条信息的信息特征和内容隐式表征向量进行拼接，得到每条信息对应的拼接向量；
31.所述输入输出模块，用于将每条信息对应的拼接向量输入到所述精排模型中，输出每条信息的精排分数。
32.在本公开的另一个实施例中，用于训练所述精排模型的训练的装置包括：
33.第二获取模块，用于获取所述多个用户隐式表征向量和所述多个内容隐式表征向量；
34.计算模块，用于计算每个用户隐式表征向量与每个内容隐式表征向量之间的内积，得到多个隐式表征内积；
35.训练模块，用于基于所述多个用户隐式表征向量、所述多个内容隐式表征向量、所述多个隐式表征内积及其他特征，对初始精排模型进行训练，得到所述精排模型，所述其他特征包括多个用户和多条信息的离散特征与连续特征。
36.第三方面，提供了一种服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现第一方面所述的信息推荐方法。
37.第四方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如第一方面所述的信息推荐方法。
38.第五方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现第一方面所述的信息推荐方法。
39.本公开实施例提供的技术方案带来的有益效果是：
40.无需每天全量训练模型，在第二预设时间段的历史数据训练的全量预训练模型基础上，基于新增的历史数据训练增量预训练模型，从而获取用于训练精排模型的多个用户隐式表征向量和多个内容隐式表征向量，降低了精排模型训练过程消耗的时长及占用的离线资源，从而减小了信息推荐过程消耗的资源量。
附图说明
41.为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
42.图1是本公开实施例提供的一种信息推荐方法所涉及的实施环境的示意图；
43.图2是本公开实施例提供的一种信息推荐方法的整体框架的示意图；
44.图3是本公开实施例提供的一种预训练模型和主模型的关系示意图；
45.图4是本公开实施例提供的一种增量预训练模型迭代过程的示意图；
46.图5是本公开实施例提供的一种信息推荐方法的流程图；
47.图6是本公开实施例提供的另一种信息推荐方法的流程图；
48.图7是本公开实施例提供的一种信息推荐装置的结构示意图；
49.图8是根据一示例性实施例示出的一种用于信息推荐的服务器。
具体实施方式
50.为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。
51.可以理解，本公开实施例所使用的术语“每个”、“多个”及“任一”等，多个包括两个或两个以上，每个是指对应的多个中的每一个，任一是指对应的多个中的任意一个。举例来说，多个词语包括10个词语，而每个词语是指这10个词语中的每一个词语，任一词语是指10个词语中的任意一个词语。
52.需要说明的是，本技术中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应装置所有者给予授权的情况下进行的。
53.请参考图1，其示出了本公开实施例提供的信息推荐方法所涉及的实施环境，参见图1，该实施环境包括终端101和服务器102。
54.其中，终端101中安装有购物类应用、新闻类应用、搜索类应用等至少一种应用，基于所安装的应用，终端101能够向服务器102发起信息查询请求，也能够接收服务器推送的信息。终端101可以为智能手机、平板电脑、笔记本电脑、台式电脑等设备，本公开实施例不对终端101的产品类型作具体的限定。
55.服务器102为终端101内所安装的应用程序的后台服务器，该服务器102可以为独立的物理服务器，也可以为多个物理服务器构成的服务器集群或者分布式系统，本公开实施例不对服务器102的类型作具体的限定。该服务器102具有较强的计算能力，能够基于预设时间段的历史数据训练全量预训练模型，并基于第二预设时间段之后至当前时间前第一预设时间段新增的历史数据迭代训练增量预训练模型，基于全量预训练模型和增量预训练模型生成多个用户隐式表征向量和多个内容隐式表征向量，进而基于多个用户隐式表征向量、多个内容隐式表征向量及其他特征训练精排模型；服务器102还能够基于所训练的精排模型，从多条信息中获取目标信息，进而将目标信息推荐给用户。
56.上述终端101以及服务器102可以通过有线或无线通信方式进行直接或间接地连接，本公开实施例对此不做限制。
57.图2示出了本公开实施例提供的信息推荐方法的整体框架，参见图2，信息推荐过程包括离线训练过程和在线服务过程。
58.其中，离线训练过程用于训练全量预训练模型、增量预训练模型及精排模型。全量预训练模型的训练过程为：基于第二预设时间段内全量曝光的历史数据(该历史数据为基于用户点击行为生成的数据)，对初始全量预训练模型进行训练，得到全量预训练模型。该全量预训练模型只在模型训练之初训练一次，当全量预训练模型训练完成之后，后续直接应用该全量预训练模型，无需重复训练。
59.增量预训练模型的训练过程为：在全量预训练模型的基础上，基于第二预设时间段之后至当前时间前第一预设时间段新增的历史数据，对全量预训练模型进行迭代训练，得到增量预训练模型。
60.精排模型的训练过程为：获取当前时间前第一预设时间段增量预训练模型输出的多个用户隐式表征向量和多个内容隐式表征向量，基于多个用户隐式表征向量和多个内容隐式表征向量，对初始精排模型进行训练，得到精排模型。
61.在线服务获取全量预训练模型和增量预训练模型输出的多个用户隐式表征向量和多个内容隐式表征向量，并将多个用户隐式表征向量存储在指定数据库中，将多个内容隐式表征向量存储在内存中，该指定数据库可以为tair等。在线服务还获取离线训练过程所训练的精排模型，并在接收到对用户的信息推荐请求时，获取用户的实时特征和用户特征以及每条信息的信息特征，并从指定数据库中获取用户的用户隐式表征向量，从内存中获取每条信息的内容隐式表征向量，进而将用户的实时特征、用户特征和用户隐式表征向量以及每条信息的信息特征和内容隐式表征向量输入到精排模型中，输出每条信息的精排分数，基于每条信息的精排分数，从多条信息中筛选出目标信息，进而将目标信息推荐给用户。
62.图3示出了本公开实施例提供的预训练模型和主模型的关系示意图，该主模型为精排模型，参见图3，本公开实施例基于第二预设时间段(例如，过去两年半)的历史数据训练全量预训练模型，并基于过去两年半后至当前时间前第一预设时间段(例如，一天等)新增的历史数据，对所训练的全量预训练模型进行迭代训练，得到增量预训练模型，进而基于所训练的增量预训练模型获取多个用户隐式表征向量和多个内容隐式表征向量，并计算每个用户隐式表征向量和每个内容隐式表征向量之间的内积，得到多个隐式表征内积。同时基于每个历史数据，获取其他特征，该其他特征包括用户和信息的离散特征、序列特征及连续特征等，进而基于多个用户隐式表征向量、多个内容隐式表征向量、多个隐式表征内积及其他特征，训练精排模型。本公开实施例采用轻量级模型预训练的方法，使得离线预训练模型(包括全量预训练模型和增量预训练模型)和线上服务主模型(精排模型)隔离开，能够独立迭代，优化成本较低，且离线预训练的模型使用特征较少，模型结构简单，离线训练速度较快，不受线上响应时长限制，从而能通过扩数据量或增加训练轮数，从而充分学习用户和内容表征，提高线上服务主模型的准确性。
63.请参考图4，其示出了本公开实施例提供的增量预训练模型迭代过程的示意图，参见图4，基于过去两年用户行为产生的历史数据训练出全量预训练模型。在所训练的全量预训练模型的基础上，基于过去1天用户行为产生的历史数据对全量预训练模型进行迭代训练，得到增量预训练模型。基于所训练的增量预训练模型，获取到用户长期兴趣表达(用户隐式表征向量)和长期内容表达(内容隐式表征向量)。当接收到对用户的信息推荐请求，基于当前请求的用户和每条待推荐信息，获取用户的用户隐式表征向量和每条待推荐信息的内容隐式表征向量，并计算用户隐式表征向量和每条待推荐信息的内容隐式表征向量之间的内积，进而通过将用户的用户隐式表征向量、每条待推荐信息的内容隐式表征向量及内积输入到所训练的精排模型中，为用户推荐信息。本公开实施例采用增量训练的方式，一方面无需每天对所训练的增量预训练模型进行初始化，使得不同版本模型之间的隐式表征(embedding)差别不大，只是随着时间缓慢变化，由于embedding稳定使其能直接作为主模型(精排模型)的输入特征，增强对用户和内容的表征能力；另一方面按照天级增量训练，极大减少了预训练模型的训练时长及占用的存储空间，能够每天及时更新用户兴趣变化，提高对新信息的覆盖率。
64.本公开实施例提供了一种信息推荐方法，参见图5，本公开实施例提供的方法流程包括：
65.501.获取用户的用户特征和用户隐式表征向量，并获取多条信息中每条信息的信息特征和内容隐式表征向量。
66.502.将用户特征和用户隐式表征向量及每条信息的信息特征和内容隐式表征向量输入到精排模型中，输出每条信息的精排分数。
67.其中，精排模型根据当前时间前第一预设时间段生成的多个用户隐式表征向量和多个内容隐式表征向量训练得到，多个用户隐式表征向量和多个内容隐式表征向量基于增量预训练模型生成，增量预训练模型基于第二预设时间段之后至当前时间前第一预设时间段新增的历史数据对全量预训练模型进行迭代训练得到，全量预训练模型基于第二预设时间段的历史数据训练得到，第一预设时间段的时长小于第二预设时间段的时长。
68.503.基于每条信息的精排分数，从多条信息中筛选出目标信息，并将目标信息推荐给用户。
69.本公开实施例提供的方法，无需每天全量训练模型，在第二预设时间段的历史数据训练的全量预训练模型基础上，基于新增的历史数据训练增量预训练模型，从而获取用于训练精排模型的多个用户隐式表征向量和多个内容隐式表征向量，降低了精排模型训练过程消耗的时长及占用的离线资源，从而减小了信息推荐过程消耗的资源量。
70.在本公开的另一个实施例中，获取用户的用户隐式表征向量，包括：
71.基于用户的用户标识，从指定数据库中获取用户的用户隐式表征向量，指定数据库用于持久化存储多个用户的用户标识与用户隐式表征向量之间的对应关系，且随着增量预训练模型的训练进行更新。
72.在本公开的另一个实施例中，获取多条信息中每条信息的内容隐式表征向量，包括：
73.基于每条信息的信息标识，从内存中获取每条信息的内容隐式表征向量，内存中存储有多条信息的信息标识与内容隐式表征向量之间的对应关系，且随着增量预训练模型的训练进行更新。
74.在本公开的另一个实施例中，将用户特征和用户隐式表征向量及每条信息的信息特征和内容隐式表征向量输入到精排模型中，输出每条信息的精排分数之前，还包括：
75.将用户特征和用户隐式表征向量分别与每条信息的信息特征和内容隐式表征向量进行拼接，得到每条信息对应的拼接向量；
76.将用户特征和用户隐式表征向量及每条信息的信息特征和内容隐式表征向量输入到精排模型中，输出每条信息的精排分数，包括：
77.将每条信息对应的拼接向量输入到精排模型中，输出每条信息的精排分数。
78.在本公开的另一个实施例中，精排模型的训练过程为：
79.获取多个用户隐式表征向量和多个内容隐式表征向量；
80.计算每个用户隐式表征向量与每个内容隐式表征向量之间的内积，得到多个隐式表征内积；
81.基于多个用户隐式表征向量、多个内容隐式表征向量、多个隐式表征内积及其他特征，对初始精排模型进行训练，得到精排模型，其他特征包括多个用户和多条信息的离散
特征与连续特征。
82.上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。
83.本公开实施例提供了一种信息推荐方法，以图1中的服务器执行本公开实施例为例，参见图6，本公开实施例提供的方法流程包括：
84.601.服务器训练精排模型。
85.其中，精排模型用于对待推荐的多条信息进行排序，进而基于排序结果从多条信息中筛选出目标信息，然后推荐给用户。精排模型可根据当前时间前第一预设时间段生成的多个用户隐式表征向量和多个内容隐式表征向量训练得到。第一预设时间段的时长可以为1天、2天、7天等，本公开实施例不对第一预设时间段的时长作具体的限定。该精排模型的训练过程为：
86.6011.服务器获取多个用户隐式表征向量和多个内容隐式表征向量。
87.服务器获取多个用户隐式表征向量和多个内容隐式表征向量之前，需要先训练能够输出当前时间前第一预设时间段的多个用户隐式表征向量和多个内容隐式表征向量的增量预训练模型。该增量预训练模型的训练过程为：
88.60111.服务器获取全量预训练模型。
89.全量预训练模型可基于第二预设时间段的历史数据训练得到，该第二预设时间段的时长长于第一预设时间段的时长，该第二预设时间段的时长可以为半年、一年、两年等，该历史数据包括用户标识、信息标识、信息类型等。全量预训练模型的训练过程为：获取第二预设时间段的历史数据，基于第二预设时间段的历史数据和预先为初始全量预训练模型设置的初始模型参数，对初始全量预训练模型进行训练，得到全量预训练模型。
90.全量预训练模型为用于表征第二预设时间段内用户和内容隐式表征的模型，当全量预训练模型训练完成，即可输出第二预设时间段内的用户隐式表征向量和内容隐式表征向量。
91.60112.服务器基于第二预设时间段之后至当前时间前第一预设时间段新增的历史数据，对全量预训练模型进行迭代训练，得到增量预训练模型。
92.增量预训练模型的训练过程为：服务器获取第二预设时间段之后第一天新增的历史数据，并基于第一天新增的历史数据，对全量预训练模型进行训练，得到预设时间段之后第一天的增量预训练模型，进而后续至当前时间前第一预设时间段基于每一天新增的历史数据，对前一天训练得到的增量预训练模型进行更新，得到该增量预训练模型。
93.增量预训练模型为表征当前时间前第一预设时间段用户和内容隐式表征的模型，当增量预训练模型训练完成，即可输出多个第二用户隐式表征向量和多个第二内容隐式表征向量。
94.本步骤中得到的多个用户隐式表征向量和多个内容隐式表征向量有两方面用途，一方面多个用户隐式向量表征可持久化存储在指定数据库中、多个内容隐式表征向量可存储在内存中，另一方面多个用户隐式表征向量和多个内容隐式表征向量可用于训练精排模型。为便于后续查询使用，服务器在将多个用户隐式表征向量存储到指定数据库时，可按照每个用户的用户标识，存储多个用户的用户标识与用户隐式表征向量之间的对应关系；服务器在将多个内容隐式表征存储到内存时，可按照每条信息的信息标识，存储每条信息的
信息标识与内容隐式表征向量之间的对应关系。随着增量预训练模型的更新，指定数据库中存储的多个用户的用户标识与用户隐式表征向量之间的对应关系进行更新，当然，内存中存储的多条信息的信息标识与内容隐式表征向量之间的对应关系也将进行更新。
95.6012.服务器计算每个用户隐式表征向量与每个内容隐式表征向量之间的内积，得到多个隐式表征内积。
96.基于所获取的多个用户隐式表征向量和多个内容隐式表征向量，服务器将计算每个用户隐式表征向量与每个内容隐式表征向量之间的内积，得到多个隐式表征内积。
97.6013.服务器基于多个用户隐式表征向量、多个内容隐式表征向量、多个隐式表征内积及其他特征，对初始精排模型进行训练，得到精排模型。
98.其中，其他特征包括多个用户和多条信息的离散特征与连续特征等，该离散特征是指取值有限的特征，例如，信息标识、信息类型、信息所关联的商圈、信息的作者、用户标识、用户性别、用户年龄、用户所在地域等等，该连续特征是指取值范围连续的特征，例如，信息发布时长、用户阅读时长等等。服务器预先为初始精排模型设置初始模型参数，并基于多个用户隐式表征向量、多个内容隐式表征向量、多个隐式表征内积及其他特征，对初始精排模型进行训练，得到精排模型。
99.由于用户的长期行为往往代表用户更深层的兴趣，抓住用户的潜在兴趣点有助于提升用户对产品的依赖性，使推荐系统和用户之前形成良性循环。而长期兴趣的提取离不开用户大量长期数据的使用，在工业界过于复杂的模型会加重线上服务性能负担，增加离线模型的迭代时间成本。而本公开实施例使用轻量级模型预训练的方式，独立于精排模型使用超长用户行为作为预训练模型输入，建模用户长期兴趣，得到用户和内容的隐式表征(embedding)。拉长训练数据可以覆盖的用户更多行为，有效感知用户兴趣变化，通过用户和内容的协同作用也能更全面表征内容。模型训练和特征使用上，使用增量的方式更新预训练模型，得到的用户和内容隐式表征(embedding)和其他特征一起作为精排模型输入，进行后续多任务目标优化。增量预训练方式一方面使用相对平滑的隐式表征(embedding)代替内积分可以增加表征力度；另一方面，可以减少内存占用，降低训练时间成本。
100.602.服务器获取用户的用户特征和用户隐式表征向量，并获取多条信息中每条信息的信息特征和内容隐式表征向量。
101.当接收到对用户的信息推荐请求，服务器获取用户的用户特征和该用户的用户隐式表征向量。该用户特征包括实时特征(例如，发送信息推荐请求的时间等)和基础特征(例如，用户年龄、用户性别、用户标识等等)。服务器获取用户的用户隐式表征向量时，可基于用户的用户标识，从指定数据库中获取用户的用户隐式表征向量。
102.当接收到对用户的信息推荐请求，服务器还获取多条信息中每条信息的信息特征和内容隐式表征向量，该信息特征包括信息标识、信息类型等等。服务器获取多条信息中每条信息的内容隐式表征向量时，可基于每条信息的信息标识，从内存中获取每条信息的内容隐式表征向量。
103.603.服务器将用户特征和用户隐式表征向量及每条信息的信息特征和内容隐式表征向量输入到精排模型中，输出每条信息的精排分数。
104.当接收到对用户的信息推荐请求、在为用户推荐信息之前，服务器可将用户特征和用户隐式表征向量分别与每条信息的信息特征和内容隐式表征向量进行拼接，得到每条
信息对应的拼接向量，进而将每条信息对应的拼接向量输入到精排模型中，输出每条信息的精排分数。
105.604.服务器基于每条信息的精排分数，从多条信息中筛选出目标信息，并将目标信息推荐给用户。
106.服务器基于每条信息的精排分数，按照精排分数由高到低的顺序，对多条信息进行排序，基于排序结果，从多条信息中筛选出目标信息，进而将目标信息推荐给用户。
107.本公开实施例提供的方法，无需每天全量训练模型，在第二预设时间段的历史数据训练的全量模型基础上，基于新增的历史数据训练增量预训练模型，从而获取用于训练精排模型的多个用户隐式表征向量和多个内容隐式表征向量，降低了精排模型训练过程消耗的时长及占用的离线资源，从而减小了信息推荐过程消耗的资源量。另外，本公开实施例不仅基于多个用户的隐式表征向量和多个内容隐式表征向量进行内积计算得到多个隐式表征内积及其他特征训练精排模型，还基于多个用户隐式表征向量和多个内容隐式表征向量进行训练，由于多个用户隐式表征向量和多个内容隐式表征向量比多个隐式表征内积包含的信息量要丰富，因而采用该种训练方法能够将更多的特征传递给精排模型，使得所训练的精排模型更准确，进一步提高了所推荐信息的准确性。
108.参见图7，本公开实施例提供了一种信息推荐装置，该装置包括：
109.第一获取模块701，用于获取用户的用户特征和用户隐式表征向量，并获取多条信息中每条信息的信息特征和内容隐式表征向量；
110.输入输出模块702，用于将用户特征和用户隐式表征向量及每条信息的信息特征和内容隐式表征向量输入到精排模型中，输出每条信息的精排分数，该精排模型根据当前时间前第一预设时间段生成的多个用户隐式表征向量和多个内容隐式表征向量训练得到，该多个用户隐式表征向量和多个内容隐式表征向量基于增量预训练模型生成，该增量预训练模型基于第二预设时间段之后至当前时间前第一预设时间段新增的历史数据对全量预训练模型进行迭代训练得到，该全量预训练模型基于第二预设时间段的历史数据训练得到，该第一预设时间段的时长小于第二预设时间段的时长；
111.筛选模块703，用于基于每条信息的精排分数，从多条信息中筛选出目标信息；
112.推荐模块704，用于将目标信息推荐给用户。
113.在本公开的另一个实施例中，获取模块，用于基于用户的用户标识，从指定数据库中获取用户的用户隐式表征向量，指定数据库用于持久化存储多个用户的用户标识与用户隐式表征向量之间的对应关系，且随着增量预训练模型的训练进行更新。
114.在本公开的另一个实施例中，获取模块，用于基于每条信息的信息标识，从内存中获取每条信息的内容隐式表征向量，内存中存储有多条信息的信息标识与内容隐式表征向量之间的对应关系，且随着增量预训练模型的训练进行更新。
115.在本公开的另一个实施例中，该装置还包括：
116.拼接模块，用于将用户特征和用户隐式表征向量分别与每条信息的信息特征和内容隐式表征向量进行拼接，得到每条信息对应的拼接向量；
117.输入输出模块，用于将每条信息对应的拼接向量输入到精排模型中，输出每条信息的精排分数。
118.在本公开的另一个实施例中，用于训练精排模型的训练的装置包括：
119.第二获取模块，用于获取多个用户隐式表征向量和多个内容隐式表征向量；
120.计算模块，用于计算每个用户隐式表征向量与每个内容隐式表征向量之间的内积，得到多个隐式表征内积；
121.训练模块，用于基于多个用户隐式表征向量、多个内容隐式表征向量、多个隐式表征内积及其他特征，对初始精排模型进行训练，得到精排模型，其他特征包括多个用户和多条信息的离散特征与连续特征。
122.综上，本公开实施例提供的装置，无需每天全量训练模型，在第二预设时间段的历史数据训练的全量模型基础上，基于新增的历史数据训练增量预训练模型，从而获取用于训练精排模型的多个用户隐式表征向量和多个内容隐式表征向量，降低了精排模型训练过程消耗的时长及占用的离线资源，从而减小了信息推荐过程消耗的资源量。另外，本公开实施例不仅基于多个用户的隐式表征向量和多个内容隐式表征向量进行内积计算得到多个隐式表征内积及其他特征训练精排模型，还基于多个用户隐式表征向量和多个内容隐式表征向量进行训练，由于多个用户隐式表征向量和多个内容隐式表征向量比多个隐式表征内积包含的信息量要丰富，因而采用该种训练方法能够将更多的特征传递给精排模型，使得所训练的精排模型更准确，进一步提高了所推荐信息的准确性。
123.图8是根据一示例性实施例示出的一种用于信息推荐的服务器。参照图8，服务器800包括处理组件822，其进一步包括一个或多个处理器，以及由存储器832所代表的存储器资源，用于存储可由处理组件822的执行的指令，例如应用程序。存储器832中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件822被配置为执行指令，以执行上述信息推荐方法中服务器所执行的功能。
124.服务器800还可以包括一个电源组件826被配置为执行服务器800的电源管理，一个有线或无线网络接口850被配置为将服务器800连接到网络，和一个输入输出(i/o)接口858。服务器800可以操作基于存储在存储器832的操作系统，例如windows server
tm
，mac os x
tm
，unix
tm
,linux
tm
，freebsd
tm
或类似。
125.本公开实施例提供的服务器，无需每天全量训练模型，在第二预设时间段的历史数据训练的全量预训练模型基础上，基于新增的历史数据训练增量预训练模型，从而获取用于训练精排模型的多个用户隐式表征向量和多个内容隐式表征向量，降低了精排模型训练过程消耗的时长及占用的离线资源，从而减小了信息推荐过程消耗的资源量。另外，本公开实施例不仅基于多个用户的隐式表征向量和多个内容隐式表征向量进行内积计算得到多个隐式表征内积及其他特征训练精排模型，还基于多个用户隐式表征向量和多个内容隐式表征向量进行训练，由于多个用户隐式表征向量和多个内容隐式表征向量比多个隐式表征内积包含的信息量要丰富，因而采用该种训练方法能够将更多的特征传递给精排模型，使得所训练的精排模型更准确，进一步提高了所推荐信息的准确性。
126.本公开实施例提供了一种计算机可读存储介质，该存储介质中存储有至少一条程序代码，该至少一条程序代码由处理器加载并执行，以实现信息推荐方法。该计算机可读存储介质可以是非暂态的。例如，该计算机可读存储介质可以是只读存储器(read-only memory，rom)、随机存取存储器(random access memory，ram)、cd-rom、磁带、软盘和光数据存储设备等。
127.本公开实施例提供的计算机可读存储介质，无需每天全量训练模型，在第二预设
时间段的历史数据训练的全量预训练模型基础上，基于新增的历史数据训练增量预训练模型，从而获取用于训练精排模型的多个用户隐式表征向量和多个内容隐式表征向量，降低了精排模型训练过程消耗的时长及占用的离线资源，从而减小了信息推荐过程消耗的资源量。另外，本公开实施例不仅基于多个用户的隐式表征向量和多个内容隐式表征向量进行内积计算得到多个隐式表征内积及其他特征训练精排模型，还基于多个用户隐式表征向量和多个内容隐式表征向量进行训练，由于多个用户隐式表征向量和多个内容隐式表征向量比多个隐式表征内积包含的信息量要丰富，因而采用该种训练方法能够将更多的特征传递给精排模型，使得所训练的精排模型更准确，进一步提高了所推荐信息的准确性。
128.本公开实施例提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现信息推荐方法。
129.本公开实施例提供的计算机程序产品，无需每天全量训练模型，在第二预设时间段的历史数据训练的全量预训练模型基础上，基于新增的历史数据训练增量预训练模型，从而获取用于训练精排模型的多个用户隐式表征向量和多个内容隐式表征向量，降低了精排模型训练过程消耗的时长及占用的离线资源，从而减小了信息推荐过程消耗的资源量。另外，本公开实施例不仅基于多个用户的隐式表征向量和多个内容隐式表征向量进行内积计算得到多个隐式表征内积及其他特征训练精排模型，还基于多个用户隐式表征向量和多个内容隐式表征向量进行训练，由于多个用户隐式表征向量和多个内容隐式表征向量比多个隐式表征内积包含的信息量要丰富，因而采用该种训练方法能够将更多的特征传递给精排模型，使得所训练的精排模型更准确，进一步提高了所推荐信息的准确性。
130.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。
131.以上所述仅为本公开的可选实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于多模态融合的三维目标检测方法及系统

信息推荐方法、装置、服务器及存储介质与流程

相关文献

最热文献