资源推荐方法、装置、设备及存储介质与流程

2023-03-15 09:47:49 来源：中国专利 TAG：

1.本公开涉及人工智能中的大数据技术领域，尤其涉及一种资源推荐方法、装置、设备及存储介质。

背景技术：

2.随着物联网技术的发展，网络世界中的海量的数据对用户造成了很大的负担，因此个性化推荐技术也在各个领域中逐渐普及，例如：新闻推荐、商务推荐、娱乐推荐、学习推荐、生活推荐、决策支持等。
3.现有技术中，对用户进行资源推荐的方式主要是通过显示召回或者隐式召回的方式进行资源召回。显示召回强调基于内容，直接基于用户搜索的内容或者浏览的内容进行资源搜索召回。隐式召回更偏向特征工程，通过空间中的向量表示用户，即用户向量，进一步根据用户向量从网络中进行资源召回。
4.然而，目前的基于用户本身搜索的内容或者用户向量的召回方式，对于低活用户的渗透率提高效果较差。

技术实现要素：

5.本公开提供了一种资源推荐方法、装置、设备及存储介质。
6.根据本公开的第一方面，提供了一种资源推荐方法，包括：
7.根据全网用户对与目标类型不同的其他至少一个类型的资源的历史访问记录，确定多个召回词；
8.针对每个召回词，获取与所述召回词对应的用户集合，所述用户集合中的每个用户都是所述召回词下所述目标类型的资源的高活用户，且对所述其他至少一个类型资源的点击次数达到预设次数；
9.针对每个用户集合，确定每个用户集合中的代表性种子用户，所述代表性种子用户包括所述用户集合中用户向量与中心向量之间的相似度最大的预设数量个用户；
10.针对每个召回词对应的用户集合，获取所述用户集合中的代表性种子用户的访问所述召回词对应的目标类型的资源列表；
11.根据每个召回词对应的所述资源列表，向所述目标类型的资源的低活用户进行资源推荐。
12.根据本公开的第二方面，提供了一种资源推荐装置，包括：
13.第一处理单元，用于根据全网用户对与目标类型不同的其他至少一个类型的资源的历史访问记录，确定多个召回词；
14.第二处理单元，用于针对每个召回词，获取与所述召回词对应的用户集合，所述用户集合中的每个用户都是所述召回词下所述目标类型的资源的高活用户，且对所述其他至少一个类型资源的点击次数达到预设次数；
15.第三处理单元，用于针对每个用户集合，确定每个用户集合中的代表性种子用户，
所述代表性种子用户包括所述用户集合中用户向量与中心向量之间的相似度最大的预设数量个用户；
16.第四处理单元，用于针对每个召回词对应的用户集合，获取所述用户集合中的代表性种子用户的访问所述召回词对应的目标类型的资源列表；
17.推荐单元，用于根据每个召回词对应的所述资源列表，向所述目标类型的资源的低活用户进行资源推荐。
18.根据本公开的第三方面，提供了一种电子设备，包括：
19.至少一个处理器；以及
20.与所述至少一个处理器通信连接的存储器；其中，
21.所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面所述的方法。
22.根据本公开的第四方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行第一方面所述的方法。
23.根据本公开的第五方面，提供了一种计算机程序产品，所述计算机程序产品包括：计算机程序，所述计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序，所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
24.根据本公开的技术方案，在对目标类型的资源的低活用户进行资源推荐时，首先从全网用户对其他至少一个类型资源的历史访问记录中确定多个召回词；针对每个召回词，获取属于该目标类型资源的高活，且对其他至少一个类型资源的点击次数达到预设次数的用户集合；再根据每个用户集合中的代表性种子用户访问的该召回词对应的目标类型的资源列表，向该目标类型的资源的低活用户进行资源推荐。通过上述方案，在进行资源推荐时结合群体特征，并迁移了其他类型资源的信号，提高资源推荐的精准度，提升推荐效果，提高对低活用户的渗透率。
25.应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
26.附图用于更好地理解本方案，不构成对本公开的限定。其中：
27.图1为本公开第一实施例提供的一种资源推荐方法的流程示意图；
28.图2为本公开第二实施例提供的一种资源推荐方法的流程示意图；
29.图3为本公开第三实施例提供的一种资源推荐方法的流程示意图；
30.图4为本公开第四实施例提供的一种资源推荐方法的流程示意图；
31.图5为本公开第五实施例提供的一种资源推荐方法的流程示意图；
32.图6为本公开第六实施例提供的一种资源推荐方法的流程示意图；
33.图7是本公开实施例提供的资源推荐装置的结构示意图；
34.图8示出了用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
35.以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。
36.随着互联网和大数据技术的发展，海量的信息给用户带了巨大的负担，帮助用户进行资源的推荐变成了重要的研究课题，以应对信息爆炸和信息灾难的问题，是目前的信息流类推荐应用的核心。目前的技术方案中，在需要对用户进行资源推荐时，常用的方式大体可以分为显式召回或隐式召回，前者强调基于内容的推荐方式，解释性强；后者偏向于特征工程，通过空间向量表示用户，基于向量为用户召回资源。
37.这种基于单一的显式召回或隐式召回的资源推荐方式，在具体的应用场景中，综合推荐效果普通，尤其是对于低活用户的渗透率较低，目前缺少一种结合各类型资源信息，综合显式和隐式召回方式的有点的综合性资源召回方式。
38.针对上述技术问题，本公开的技术构思过程如下：发明人在研究资源推荐方案的过程中，发现对于低活用户来说，他们本身的历史行为数据能够提供的特征比较优先，但是对于同一个感兴趣的兴趣点来说，高活用户对于资源的点击和浏览历史能够提供更多的信息，并且用户不仅会对一种资源进行访问，也会对其他类型的资源进行点击和浏览，在对某一类型的资源进行召回的过程中，也可以结合对其他类型资源的访问特征，精准定位用户的需求，从而进行资源推荐。因此，发明人考虑可以将用户向量，历史行为以及用户的实时特征全部进行集合，对不同类型资源的信号进行迁移学习，结合显式和隐式的优点的综合性的资源推荐方案。
39.基于上述技术构思过程，本公开提供了一种资源推荐方法，应用于公资源推荐系统的后台服务器中，在对低活用户进行某种类型的资源推荐时，从全网用户对其他类型的资源的历史访问记录中确定进行资源召回的召回词，基于这些召回词，确定每个召回词对应的一个用户群体，也就是用户集合，基于这个用户群体中对于该类型资源的高活用户的特征和访问历史，对低活用户进行该类型资源的推荐，也就是说在进行资源推荐时结合群体特征，并且迁移学习其他类型资源的信号，以提高对低活用户进行资源推荐时候的准确度，从而提升推荐效果。
40.本公开实施例的整个资源推荐方案可以应用在服务器中，该服务器可以是某个娱乐软件的服务器，也可以是信息推荐系统的服务器，也可以是搜索系统的服务器，还可以是信息流系统的服务器等等，对此本方案不做限制。示例性的，如果涉及到与用户之间的交互，则还可以包括用户端的设备。
41.可以理解的是，本公开的资源推荐方案在实际应用中，该场景中还可以包括其他设备，例如，存储设备等，具体可以根据实际需求进行调整，本公开并不对其进行限定。本公开实施例也不对应用场景中包括的各种设备的实际形态进行限定，也不对设备之间的交互方式进行限定，在方案的具体应用中，可以根据实际需求设定。
42.应理解，在本公开中，低活用户指的是低活跃度的用户，也称为低活跃用户；高活用户指的是高活跃度的用户，也称为高活用户。
43.下述以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述
技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本公开的实施例进行描述。
44.下面对本公开提供的资源推荐方法的具体实现方案进行介绍。
45.图1为本公开第一实施例提供的一种资源推荐方法的流程示意图。如图1所示，该资源推荐方法具体包括以下步骤：
46.s101：根据全网用户对与目标类型不同的其他至少一个类型的资源的历史访问记录，确定多个召回词。
47.在本步骤中，在需要对低活用户进行目标类型的资源推荐时，首先则需要确定召回词，以基于这些召回词进行资源召回。在确定召回词时，可基于全网用户对与该目标类型不同的其他类型的资源的历史访问记录进行确定，例如，要推荐的资源为小视频类型，那么则可以基于全网用户对图文类型，和/或短视频类型的资源的历史访问记录确定召回词。该历史访问记录中至少包括了每个用户在一段时间内对该其他至少一个类型资源的点击次数，不同级别分类下的点击次数等。
48.示例性的，在一种具体实现方式中，首先，根据全网用户对所述其他至少一个类型的资源的历史访问记录，获取全网用户对所述其他至少一个类型的资源的多个兴趣点，以及全网用户点击所述至少一个其他类型的资源的一级分类和二级分类；然后根据所述多个兴趣点，所述一级分类和所述二级分类，确定进行资源召回的所述多个召回词。
49.在该方案中，服务器需要从其他资源的历史访问记录中确定召回词，首先需要获取对其他至少一个类型资源的兴趣点，由于用户比较多，每个用户的兴趣点也可能存在一个或者多个，因此基于全网用户获取到的兴趣点也是多个，这些兴趣点则作为召回词。还需要从历史访问记录中获取出用户点击次数较多的一级分类和二级分类，其中点击次数达到了一定数量的一级分类和二级分类也作为召回词。
50.示例性的，以目标类型为小视频，其他至少一个类型的资源包括图文类型的资源以及短视频类型的资源为例，在进行小视频类型的资源的推荐时，首先获取全网用户对于图文类型以及短视频类型的资源的兴趣点，然后获取用户点击的一级分类和二级分类。兴趣点，一级分类和二级分类这三类内容都可以作为召回词。但是在具体实现中，可以选择点击次数超过一定数量的兴趣点，一级分类和二级分类作为最终的召回词。例如，获取用户点击超过6次的兴趣点，点击超过10次的一级分类，以及点击超过8次的二级分类，作为最终进行资源召回的召回词。
51.s102：针对每个召回词，获取与召回词对应的用户集合，用户集合中的每个用户都是召回词下目标类型的资源的高活用户，且对其他至少一个类型资源的点击次数达到预设次数。
52.在本步骤中，在确定了召回词以后，针对每个召回词确定对应的用户群体，也称为用户crowd或者用户集合，本公开中以用户集合进行方案描述。
53.应理解，本步骤的实现中，一个召回词对应一个用户群体，也就是一个召回词对应一个用户集合，最终一个用户集合会得到一个目标类型的资源列表。
54.在该步骤的具体实现中，针对每个召回词，获取全网用户中所有在该召回词下的用户，并从这些用户中获取所有属于目标类型的资源的高活用户，然后基于这些用户对其他类型的资源的点击情况，确定最终的用户集合。在具体实现中，可以设置对其他至少一个
类型的资源的点击次数的阈值，对其他类型的资源的点击次数达到了设置的阈值的入选该集合，达不到的则不能入选该集合。
55.应理解，对于每个召回词对应的用户集合来说，该用户集合中的用户是能够代表对目标类型资源高活的用户在其他类型资源中的特征的用户。
56.s103：针对每个用户集合，确定每个用户集合中的代表性种子用户，代表性种子用户包括用户集合中用户向量与中心向量之间的相似度最大的预设数量个用户。
57.在本步骤中，针对每个召回词得到对应的用户集合之后，如果存在用户数量过少的集合，则可以直接去除这个集合，对于过于小众的兴趣领域，并不能代表大多数用户的兴趣和特征，可以去除。例如：可以设置召回词对应的用户集合中的用户数量至少需要达到一百人，那么对于没有达到一百人的用户集合则可以直接去除，不再进行分析处理。
58.对于保留下来的用户集合，每个用户集合中都包括大量的用户，考虑到数据处理的效率，可以从这些用户中选择能够代表整个用户群体特征的预设数量个用户，作为代表性种子用户。由于要选取这些代表性种子用户能够表征整个用户群体的特征，因此在确定代表性种子用户的过程中，需要计算用户向量与整个用户集合的中心向量之间的相似度，将相似度最大的这些用户作为代表性种子用户。代表性种子用户的数量可以根据具体的实现方式进行设置，本方案不做限制。
59.s105：针对每个召回词对应的用户集合，获取用户集合中的代表性种子用户的访问召回词对应的目标类型的资源列表。
60.在本步骤中，前述的每个召回词对应的用户集合中的代表性种子用户确定以后，则需要获取这些代表性种子用户访问的目标类型的资源列表，以便后续向目标类型的资源的低活用户进行资源推荐。
61.需要说明的是，在该方案的具体实现中，首先基于每个代表性种子用户的访问历史，从中获取出该代表性种子用户在一段时间内访问的该集合对应的召回词的所有资源的列表，然后从中筛选出目标类型的资源，组成该代表性种子用户对应的资源列表。再将一个用户集合中的所有代表性种子用户的资源列表进行汇总，从而得到整个用户集合对应的该目标类型的资源列表，也就是与该召回词对应的目标类型的资源列表。
62.s106：根据每个召回词对应的资源列表，向目标类型的资源的低活用户进行资源推荐。
63.在本步骤中，得到了每个召回词对应的资源列表之后，则基于这个资源列表，向该召回词下的低活用户进行目标类型的资源的推荐。推荐给该召回词下的低活用户的资源，来自于按照前述方式得到的该召回词对应的用户群体确定出的资源列表。
64.本实施例提供的资源推荐方法，在对目标类型的资源的低活用户进行资源推荐时，首先从全网用户对其他至少一个类型资源的历史访问记录中确定多个召回词；针对每个召回词，获取属于该目标类型资源的高活，且对其他至少一个类型资源的点击次数达到预设次数的用户集合；再根据每个用户集合中的代表性种子用户访问的该召回词对应的目标类型的资源列表，向该目标类型的资源的低活用户进行资源推荐。通过上述方案，在进行资源推荐时结合群体特征，并迁移了其他类型资源的信号，提高资源推荐的精准度，提升推荐效果，提高对低活用户的渗透率。
65.图2为本公开第二实施例提供的一种资源推荐方法的流程示意图。如图2所示，在
上述实施例的基础上，第一实施例中的步骤s102包括以下步骤：
66.s1021：针对每个召回词，获取全网用户中属于召回词下对目标类型的资源高活的用户，组成初始集合。
67.在本步骤中，在确定了召回词之后，需要针对每个召回词获取用户群体。具体实现中，首先针对每个召回词，获取全网用户中所有在该召回词下的用户，也就是所有访问过该召回词对应的资源的用户。进一步的，从这些用户中获取所有属于目标类型的资源的高活用户组成初始集合，具体的高活用户的标准可以根据实际情况设定，也可以基于现有的高活用户的判断方式确定。例如，对目标类型的资源的点击次数大于预设的阈值，或者对目标类型的资源的访问频率大于预设的阈值等，对方法对此不做限制。
68.s1022：将初始集合中的点击其他至少一个类型的资源的次数未达到预设次数的用户剔除，得到召回词对应的用户集合。
69.在本步骤中，在得到初始集合之后，再基于初始集合中的这些用户对至少一个其他类型的资源的点击情况，确定最终的用户集合。
70.在具体实现中，可以有多种实现方式，下面进行举例说明：
71.在一种可能的实现方式中，可以设置对至少一个其他类型的资源的点击次数的阈值，初始集合中的对其他类型的资源的点击次数达到了设置的阈值的用户入选该集合，达不到的用户则不能入选该集合。例如，以目标类型为小视频类型为例，要求入选召回词对应的用户集合的用户需要对所述召回词下的图文类型和/或短视频的点击次数大于六次，一级分类点击次数大于8次，二级分类点击次数大于10次，那么则该用户可以保留在用户集合中。
72.在另一种可能的实现方式中，同样的，也是设置对至少一个其他类型的资源的点击次数的阈值，对初始集合中的用户一一进行判断，将初始集合中对其他类型的资源的点击次数达到了设置的阈值的用户保留，达不到的用户则剔除掉，最终由初始集合中剩余的用户组成最后的用户集合。
73.本实施例提供的资源推荐方法，虽然最终要进行的是向目标类型的资源的低活用户进行目标类型资源的推荐，但是在确定了召回词后，针对每个召回词获取用户群体时，需要结合用户在至少一个其他类型的资源中的兴趣点以及信息流相关数据，跨资源类型来获取用户群体，能够更准确的定位用户的需求，从而提升最终的资源推荐的效果。
74.图3为本公开第三实施例提供的一种资源推荐方法的流程示意图。如图3所示，在上述任一实施例的基础上，第一实施例中的步骤s103可以通过以下步骤实现：
75.s1031：针对每个用户集合，根据用户集合中的每个用户的用户向量，计算用户集合的中心向量。
76.在本步骤中，在确定了召回词对应的用户集合之后，需要获取用户集合中的代表性种子用户，首先需要获取该用户集合的中心向量，一个用户集合的中心向量用于代表整个集合的用户的特征。
77.在该方案的具体实现中，首选需要获取每个用户的用户向量，具体可以采用孪生ucf网络模型或者图神经网络模型，生成网络中每个用户的用户向量。然后针对每个召回词对应的用户集合，计算该用户集合中的每个用户的用户向量的平均值，得到所述用户集合的所述中心向量。
78.可选的，若召回词对应的用户集合中即包括目标类型资源的高活用户，也包括目标类型资源的低活用户，则计算该用户集合中的高活用户的用户向量的平均值，作为该用户集合的中心向量。
79.s1032：计算用户集合中的每个用户的用户向量与用户集合的中心向量之间的相似度。
80.s1033：基于每个用户的用户向量与中心向量之间的相似度，确定相似度最大的预设数量个用户作为用户集合的代表性种子用户。
81.在上述步骤中，通过计算用户集合中每个用户的用户向量与中心向量之间的相似度，根据相似度的大小确定集合中的代表性种子用户。
82.在获取到每个用户向量与中心向量的相似度之后，可以将相似度最大的多个用户作为该用户集合的代表性种子用户，具体的获取方式中，可以按照相似度从大到小的顺序排序，将排序前预设数量个用户作为代表性种子选手。也可以设置相似度门限，将大于相似度门限的用户作为代表性种子选手，对此本方案不做限制。
83.可选的，针对每个用户集合，还可以通过用户向量计算一个用户集合的内聚度，该内聚度用于表示该用户集合对应的召回词的代表性，内聚度越大，证明该集合中的用户群体的代表性越好。具体的实现中，可以随机选取一个用户集合中的多个用户(例如，可以选择集合中500名用户)，两两计算这些用户的用户向量之间的相似度并求平均值，得到该用户集合的内聚度。即计算一个用户集合的内聚度的方式为：从所述用户集合中随机选择多个用户，计算所述多个用户中任意两个用户的用户向量之间的相似度，并对得到的所有相似度求平均值，得到所述用户集合的内聚度。
84.本实施例提供的资源推荐方法，在每个召回词对应的用户群体内部，通过用户向量与中心向量的相似度的大小，选择出更能代表整个群体的代表性种子用户，以便在后续根据这些代表性种子用户的访问历史对低活用户进行资源推荐，这些用户更能代表整个群体的特征，通过这种方式进行自愿推荐可以更精准的定位用户需求，利用群体信息向低活用户进行推荐，有效提升推荐效果。
85.图4为本公开第四实施例提供的一种资源推荐方法的流程示意图。如图4所示，在上述任一实施例的基础上，第一实施例中的步骤s105可以通过以下步骤实现：
86.s1051：针对每个召回词对应的资源列表，通过召回词对应的用户集合中的用户进行投票，将得票数量小于预设票数的资源删除，并对资源列表中的全局热门资源进行打压处理，得到目标资源列表。
87.在本步骤中，在通过前述实施例的技术方案获取到每个召回词对应的资源列表以后，需要在集合内对资源列表中的资源进行投票，选择最后进行推荐的资源。应理解，该资源列表中的资源均是目标类型的资源。
88.需要说明的是，在该方案中对资源列表中的资源进行投票的用户均是目标类型的资源的高活用户，具体的针对资源列表中的每个资源，一个高活用户点击过一次，累计一票，以此类推得到资源列表中的每个资源的得分，然后将资源列表中的得票数量小于预设票数的资源删除。该预设票数可以根据实际情况进行配置。
89.进一步的，由于很多内容属于当前时段，或者一段时间内的热门内容，很多用户都会被推荐点击到，并不能代表用户本身的兴趣，因此还需要对资源列表中的全局热门资源
进行打压处理，具体的处理方式如下：
90.第一种方式，将所述资源列表中属于全局热门资源的资源排列至列表的最后，以使在对低活用户进行资源推荐的时候最后才会推荐到全局热门。
91.第二种方式，将所述资源列表中属于全局热门资源的资源删除。由于热门资源有对应的推荐方式，所有用户都可能被推荐到，对于低活用户来说，直接将全局热门资源从资源列表中删除，避免重复向低活用户推荐热门资源。
92.通过上述的处理过程，得到了每个召回词对应的目标资源列表，目标资源列表中的资源是需要向对应召回词的低活用户进行推荐的资源，具体的推荐方式如下面的步骤所示。
93.s1052：根据多个召回词对应的多个目标资源列表，向目标类型的资源的低活用户进行资源推荐。
94.在本步骤中，在得到各个召回词对应的目标资源列表之后，可以直接将这些资源随机的或者按照一定的顺序向低活用户进行推荐。一种具体的推荐方式中，针对召回词，可以将该召回词对应的目标资源列表中的资源向该召回词下的低活用户进行推荐。然而，具体实现中一个低活用户可能会属于多个召回词对应的群体，因此对一个低活用户进行资源推荐的时候，可以将多个召回词对应的目标资源列表中的资源打散后进行推荐，避免连续推荐类似的内容给用户。例如：可以根据召回词的代表性增加随机扰动，将召回的资源进行排序，最后按照概率推荐给低活用户。
95.本公开实施例提供的资源推荐方法，在最终进行资源召回之后推荐之前，通过高活用户对资源进行投票，将其中大多数用户均不感兴趣的资源筛除，并对全局热门资源进行打压处理，避免向低活用户推荐热门资源，进一步提高推荐效果，提升对低活用户的渗透率。
96.应理解，在本公开的技术方案中，核心思想是结合跨资源类型的信号，以及基于群体的特征来改善资源推荐效果，通过对高活用户的相关特征的处理向低活用户进行资源推荐，因此在才在上述实施例中召回词对应的用户集合中保留了高活用户，但是这种实现方式只是其中一种，再具体实现中，用户群体中可以即包括目标类型资源的高活用户，也包括目标类型资源的低活用户，只是在获取最终的待推荐给低活用户的资源的处理过程中，只针对目标类型的高活用户的访问结果进行处理即可，即获取用户集合的中心向量时只根据对目标类型的资源高活的用户的向量进行计算，获取待推荐资源列表时，根据用户集合中的高活用户对代表性种子用户最近的访问历史中的目标类型资源列表投票得到最后的资源列表，向用户集合中的低活用户进行推荐。例如：在进行视频类型的资源推荐时，一个召回词对应的用户集合中包括对该召回词下的图文类型和或短视频类型资源的点击次数大于预设次数的所有用户，这其中就可能包括对小视频类型的资源高活的用户，也可能包括对小视频类型的资源低活的用户。在这种情况下，在获取到集合中的代表性种子用户的小视频资源列表后，通过用户集合中的高活用户进行投票，得到最后的小视频资源列表。
97.在上述任一个实施例的基础上，在得到目标资源列表，向低活用户进行资源推荐的具体实现中，还可以再次进行排序，然后再推荐给低活用户。可选的，可以按照下面的步骤进行资源推荐：
98.第一步，针对所述目标类型资源的每个低活用户，获取所述低活用户对应的目标
召回词。
99.对于低活用户来说，可能同时属于多个用户群体，感兴趣的内容也很多，因此针对每个低活用户来说，确定出其对应的目标召回词，该目标召回词包括一个或者一个以上的召回词。
100.第二步，从所述多个召回词对应的多个目标资源列表中，获取所述目标召回词对应的第一目标资源列表。将一个或者多个目标召回词对应的目标资源列表进行合并，得到所有可能推荐给该低活用户的资源列表，也就是第一目标资源列表。
101.第三步，根据所述目标召回词对应的用户集合的内聚度，通过xgboost模型对所述第一目标资源列表进行至少一次排序，得到第二目标资源列表。
102.在本方案中，根据每个召回词的代表性，也就是内聚度，在第一目标资源列表中加随机扰动。然后，结合实时特征、crowd特征等训练xgboost模型，在召回、粗排、精排阶段进行重排序，得到一个新的资源列表，也就是第二目标资源列表。应理解，每次重排列表中的资源数量都回进一步减少。
103.最后，将所述第二目标资源列表中的资源向所述低活用户进行推荐。在向低活用户进行资源推荐的时候，可以按照每个资源被该用户点击的概率进行推荐，也可以将最后得到的目标资源列表中的资源随机进行推荐，对此本方案不做限制。
104.结合上述各个实施例，应理解本公开主要是提供一种结合群体特征的跨资源推荐方法。其核心主要是利用不同种类资源(如图文、视频)间的信号，来进行迁移学习，实现特征的跨域应用，具体实现时可以采用crowd2vec算法，跨资源的crowd2vec算法。主要解决在向用户进行资源推荐场景下，低活跃用户的渗透问题，通过跨资源信号提升低活用户渗透率。下面以目标类型为小视频类型，至少一个其他类型包括图文类型和短视频类型为例，对本公开提供的资源推荐方法进行举例说明。
105.图5为本公开第五实施例提供的一种资源推荐方法的流程示意图；如图5所示，示出了资源推荐方法中获取用户群体的方案，具体包括以下步骤：
106.s201：小视频高活跃用户(近七天对小视频的点击次数大于100次)。
107.s202：历史图文、短视频兴趣点点击大于6次准入(一级分类10次，二级分类8次)。
108.s203：所有准入用户构成召回词对应的用户集合。
109.在本方案中，针对小视频的用户，通过孪生基于用户的协同过滤推荐算法(user-collaborative filtering，简称：ucf)网络模型训练获取用户侧的表示向量，也就是用户向量。由于后续的处理过程中主要用到高活用户的用户向量，因此以只获取高活用户的用户想。在具体实现中，可以采用孪生ucf模型，graphcf等图模型神经网络等等生成的用户侧向量，能够获得一个稳定表示用户特征的向量表达即可。在本方案中，对于高活用户的限定可以是近七天对小视频的点击次数大于100次的用户，满足该条件的用户均属于小视频高活跃用户，需要获取这些用户的用户向量。
110.然后，获取图文、短视频中的兴趣点和一二级分类等召回词下的小视频的高活跃用户以及这些高活跃用户的用户向量。然后根据用户向量计算该召回词(crowd)的中心向量，一般来说可以通过求平均值的方式得到。在该过程中，需要要从其他资源的召回词信号中，生成crowd。如一个小视频高活跃用户(最近7天点击小视频数大于100)，历史点击某图文兴趣点6次，二级分类8次，一级分类10次以上，则该用户属于这一crowd，也就是说满足所
有准入条件的用户确定为这个召回词对应的用户群体，即该将该用户加入该召回词对应的用户集合中。
111.图6为本公开第六实施例提供的一种资源推荐方法的流程示意图；如图6所示，示出了资源推荐方法中基于用户群体向低活用户进行，具体包括以下步骤：
112.s301：从每个用户集合中确定代表性种子用户。
113.s302：小视频高活用户对小视频点击列表进行投票。
114.s303：推荐给同一个用户集合内的小视频低活用户。
115.在上述步骤中，当采用前述方式确定了每个召回词对应的用户集合之后，通过高活用户的访问历史中对小视频的访问记录对低活用户进行小视频推荐。
116.具体实现中，计算用户集合中的每个用户的用户向量与中心向量之间的相似度，在同一个用户集合中将相似度最大的预设数量个用户确定为代表性种子用户，例如：利用与中心向量的相似度对用户排序，选取top用户作为代表性种子用户；选取100名代表性种子用户，对于规模过小、代表性用户数不足的crowd予以去除，也就是说如果用户集合中的数量不满100个则去除该集合，不进行后续处理。
117.然后，针对每个用户集合，获取这些代表性种子用户最近一段时间的访问历史，从每个代表性种子用户的访问历史中获取该集合的召回词对应的小视频点击列表，然后合并起来得到整个召回词对应的小视频资源列表。然后进一步的，相同用户集合内的高活用户对得到的小视频资源列表进行投票，将crowd信号从图文、短视频迁移到小视频，投票结果中票数小于一定数量的资源从列表中删除。该过程中需要注意打压全局热门资源，可以使结果更准确。例如：集合内的高活用户对100代表性种子用户的小视频资源列表中的每个小视频进行投屏，有如果100个人点击过同一个小视频，该小视频100票，有99个人点击过，99票，以此类推，得到列表中每个小视频资源的票数。
118.进一步的，根据召回词的代表性对资源列表中的资源增加随机扰动，并结合实时特征，群体特征等训练xgboost模型，在召回，粗排和精排阶段对小视频资源列表中的资源进行排序。具体实现中，线上读取用户模型，找到低活用户的召回词，对应这些召回词的用户集合选出小视频资源列表，例如100条进行推荐。将系统内所有用户对这100篇资源的历史后验点击展现，召回词对应的用户群体内(也就是召回词对应的用户集合内)用户的投票数，召回词对应的用户集合的内聚度特征落盘到离线，根据地实际点击展现样本以点展比为目标训练xgboost模型，得到召回xgboost模型，线上再次获取100小视频资源列表时，将点展特征，用户集合特征输入到xgboost模型，模型输出分数用于对小视频资源进行重排序，提升召回精度。粗排和精排过程类似，粗排重排过重中，在原有xgboost中加入粗排分特征训练，精排重排加入粗排，精排分特征训练。召回重排后截断到80个小视频进入粗排，粗排重排后截断到50个小视频进入精排，精排重排后限制排序分阈值大于0.1的小视频资源，然后将这些小视频资源向低活用户进行推荐。
119.本公开实施例提供的资源推荐方法，将用户向量、用户历史行为、用户实时特征结合起来，通过crowd2vec算法思想，对不同领域的信号进行迁移学习。巧妙的结合了基于内容(content-based)的推荐算法和协同过滤(collaborative filtering)的推荐算法，确定用户所处的具体crowd群体，从而精准定位用户需求，在提升推荐的效果的同时，提高用户的满意度。并且在特定的情境下，通过群体信息来对低活跃用户进行推荐，可以提升低活跃
用户的渗透率，改善推荐系统效果。
120.图7是本公开实施例提供的资源推荐装置的结构示意图。如图7所示，本实施例提供的资源推荐装置700包括：
121.第一处理单元701，用于根据全网用户对与目标类型不同的其他至少一个类型的资源的历史访问记录，确定多个召回词；
122.第二处理单元702，用于针对每个召回词，获取与所述召回词对应的用户集合，所述用户集合中的每个用户都是所述召回词下所述目标类型的资源的高活用户，且对所述其他至少一个类型资源的点击次数达到预设次数；
123.第三处理单元703，用于针对每个用户集合，确定每个用户集合中的代表性种子用户，所述代表性种子用户包括所述用户集合中用户向量与中心向量之间的相似度最大的预设数量个用户；
124.第四处理单元704，用于针对每个召回词对应的用户集合，获取所述用户集合中的代表性种子用户的访问所述召回词对应的目标类型的资源列表；
125.推荐单元705，用于根据每个召回词对应的所述资源列表，向所述目标类型的资源的低活用户进行资源推荐。
126.本实施例提供的资源推荐装置，可用于执行上述任意方法实施例的资源推荐方法，其实现原理和技术效果类似，此处不做作赘述。
127.在一种可能的实现方式中，所述第二处理单元702，包括：
128.第一获取模块，用于针对每个召回词，获取全网用户中属于所述召回词下对所述目标类型的资源高活的用户，组成初始集合；
129.第一处理模块，用于将所述初始集合中的点击所述其他至少一个类型的资源的次数未达到所述预设次数的用户剔除，得到所述召回词对应的用户集合。
130.在一种可能的实现方式中，所述第三处理单元703，包括；
131.第一计算模块，用于针对每个用户集合，根据所述用户集合中的每个用户的用户向量，计算所述用户集合的中心向量；
132.第二计算模块，用于计算所述用户集合中的每个用户的用户向量与所述用户集合的中心向量之间的相似度；
133.第一确定模块，用于基于每个用户的用户向量与中心向量之间的相似度，确定相似度最大的预设数量个用户作为所述用户集合的代表性种子用户。
134.在一种可能的实现方式中，所述第一处理单元701，包括：
135.第二处理模块，用于根据全网用户对所述其他至少一个类型的资源的历史访问记录，获取全网用户对所述其他至少一个类型的资源的多个兴趣点，以及全网用户点击所述至少一个其他类型的资源的一级分类和二级分类；
136.第三处理模块，用于根据所述多个兴趣点，所述一级分类和所述二级分类，确定进行资源召回的所述多个召回词。
137.在一种可能的实现方式中，所述推荐单元705，包括：
138.第四处理模块，用于针对每个召回词对应的资源列表，通过所述召回词对应的用户集合中的用户进行投票，将得票数量小于预设票数的资源删除，并对所述资源列表中的全局热门资源进行打压处理，得到目标资源列表；
139.推荐模块，用于根据所述多个召回词对应的多个目标资源列表，向所述目标类型的资源的低活用户进行资源推荐。
140.可选的，所述推荐模块，包括：
141.第一处理子模块，用于针对所述目标类型资源的每个低活用户，获取所述低活用户对应的目标召回词；
142.第二处理子模块，用于从所述多个召回词对应的多个目标资源列表中，获取所述目标召回词对应的第一目标资源列表；
143.第三处理子模块，用于根据所述目标召回词对应的用户集合的内聚度，通过xgboost模型对所述第一目标资源列表进行至少一次排序，得到第二目标资源列表；
144.推荐子模块，用于将所述第二目标资源列表中的资源向所述低活用户进行推荐。
145.可选的，所述第四处理模块具体用于：
146.将所述资源列表中属于全局热门资源的资源排列至列表的最后；
147.或者，
148.将所述资源列表中属于全局热门资源的资源删除。
149.在一种可能的实现方式中，所述装置700还包括：
150.第五处理单元706，用于针对每个召回词对应的用户集合，从所述用户集合中随机选择多个用户，计算所述多个用户中任意两个用户的用户向量之间的相似度，并对得到的所有相似度求平均值，得到所述用户集合的内聚度。
151.可选的，所述第一计算模块具体用于：
152.计算所述用户集合中的每个用户的用户向量的平均值，得到所述用户集合的所述中心向量。
153.在一种可能的实现方式中，所述装置700还包括：
154.第六处理单元707，用于采用孪生协同过滤算法ucf网络模型或者图神经网络模型，生成网络中每个用户的用户向量。
155.本实施例提供的资源推荐装置，可用于执行上述任意方法实施例的资源推荐方法，其实现原理和技术效果类似，此处不做作赘述。
156.本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。
157.根据本公开的实施例，本公开还提供了一种电子设备、一种存储有计算机指令的非瞬时计算机可读存储介质和一种计算机程序产品。
158.根据本公开的实施例，本公开还提供了一种计算机程序产品，计算机程序产品包括：计算机程序，计算机程序存储在可读存储介质中，电子设备的至少一个处理器可以从可读存储介质读取计算机程序，至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
159.图8示出了用来实施本公开的实施例的示例电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制
本文中描述的和/或者要求的本公开的实现。
160.如图8所示，电子设备800包括计算单元801，其可以根据存储在只读存储器(rom)802中的计算机程序或者从存储单元808加载到随机访问存储器(ram)803中的计算机程序，来执行各种适当的动作和处理。在ram 803中，还可存储设备800操作所需的各种程序和数据。计算单元801、rom 802以及ram 803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
161.设备800中的多个部件连接至i/o接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
162.计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如资源推荐方法。例如，在一些实施例中，资源推荐方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由rom 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到ram 803并由计算单元801执行时，可以执行上文描述的资源推荐方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为资源推荐方法。
163.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、复杂可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
164.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
165.在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom
或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
166.为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
167.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)和互联网。
168.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与vps服务("virtual private server"，或简称"vps")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。
169.应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。
170.上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：信息处理方法、装置、设备及存储介质与流程
下一篇：广告投放方法、装置、电子设备及存储介质与流程

资源推荐方法、装置、设备及存储介质与流程

相关文献

最热文献