一种内容推荐方法、通信设备及计算机可读存储介质与流程

2022-09-14 22:30:26 来源：中国专利 TAG：

1.本发明涉及推荐技术领域，尤其涉及一种内容推荐方法、通信设备及计算机可读存储介质。

背景技术：

2.随着互联网技术的发展，大量应用均可为用户提供个性化推荐服务，为用户提供符合其行为偏好的内容等，以增加用户的粘性和活跃度等。
3.目前，在内容推荐过程中，常用的方式是通过分析用户在终端上的行为或用户通过应用的某账号的行为，获取用户偏好，为用户提供推荐内容。然而，通过这种方式，在终端上的行为或通过应用的某账号的行为，都是算成同一个用户的行为，例如，一个家庭中多个用户共用一个终端，产生的行为是多用户行为，算成同一用户的行为，又例如，同一账号，可在不同的终端上登录，即不同用户可共用一个账号，产生的行为是多用户行为，算成同一用户的行为。这样，通过上述常用的方式进行内容推荐，容易导致内容推荐精确性较差。

技术实现要素：

4.本发明实施例提供一种内容推荐方法、通信设备及计算机可读存储介质，以解决内容推荐精确性较差的问题。
5.为了解决上述技术问题，本发明是这样实现的：
6.第一方面，本发明实施例提供了一种内容推荐方法，包括：
7.在终端启动应用和/或通过账号登录所述应用的情况下，获取用户行为识别结果，所述用户行为识别结果为预先通过目标识别模型识别用户行为数据得到的识别结果，所述用户行为识别结果包括多用户行为或单用户行为，所述用户行为数据关联所述终端和/或所述账号，所述目标识别模型通过训练样本行为特征集训练得到，所述训练样本行为特征集包括行为标记为多用户行为的s条样本行为特征以及行为标记为单用户行为的t条样本行为特征，s和t均为正整数；
8.基于所述用户行为识别结果进行内容推荐。
9.第二方面，本发明实施例还提供一种通信设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上所述的内容推荐方法中的步骤。
10.第三方面，本发明实施例还提供一种可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如上所述的内容推荐方法中的步骤。
11.在本实施例的内容推荐方法中，可通过目标识别模型识别终端和/或账号的用户行为数据，得到用户行为识别结果，即可确定是单用户行为还是多用户行为，且目标识别模型是通过多用户行为的s条样本行为特征和单用户行为的t条样本行为特征训练得到，可利用得到的用户行为识别结果进行内容推荐，即在推荐过程中，考虑了终端和/或账号的用户
行为识别结果，且用户行为识别结果是通过多用户行为的s条样本行为特征和单用户行为的t条样本行为特征训练得到的目标识别模型，对终端和/或账号的用户行为数据进行用户行为识别得到的，这样，可提高内容推荐精确性。
附图说明
12.为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
13.图1是本发明实施例提供的内容推荐方法的流程图之一；
14.图2是本发明实施例提供的内容推荐方法的流程图之二；
15.图3是本发明实施例提供实现内容推荐方法的内容推荐系统的模块图；
16.图4是本发明实施例提供的通信设备的结构图。
具体实施方式
17.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
18.参见图1，图1是本发明实施例提供的内容推荐方法的流程图，如图1所示，包括以下步骤：
19.步骤101：在终端启动应用和/或通过账号登录应用的情况下，获取用户行为识别结果。
20.用户行为识别结果为预先通过目标识别模型识别用户行为数据得到的识别结果，用户行为识别结果包括多用户行为或单用户行为，用户行为数据关联终端和/或账号，目标识别模型通过训练样本行为特征集训练得到，训练样本行为特征集包括行为标记为多用户行为的s条样本行为特征以及行为标记为单用户行为的t条样本行为特征，s和t均为正整数。
21.需要说明的是，在同一终端或同一账号下产生行为的用户可能是一个(单个)用户，即终端或账号被同一用户使用，在同一终端或同一账号下产生行为的用户也可能并不是同一个用户，可能存在多个用户，即多个用户共用一个终端或共用一个账号，在应用内对相关内容进行行为，例如，点击行为、收藏行为等，本实施例不作限定，生成行为数据，可以理解的是，本实施例的用户行为数据是与该应用相关的行为数据。上述终端关联的和/或上述账号关联的用户行为数据中可包括至少一个行为内容，即进行过相关行为(例如，点击行为等)的内容，例如，物品(可以包括商品等)、视频、书籍、新闻等。
22.本实施例中，可预先获取终端和/或账号关联的用户行为数据，基于目标识别模型对用户行为数据进行用户行为识别，得到用户行为识别结果，即可识别用户行为数据是单用户行为还是多用户行为，也可以理解为对终端和/或账号的用户行为类别进行识别，即识别该终端和/或账号是多用户行为的终端和/或账号还是单用户行为的终端和/或账号。
23.需要说明的是，目标识别模型是已训练的模型，是预先通过训练样本行为特征集训练得到的模型，训练样本行为特征集中包括两种不同行为类别的样本行为特征，即多用户行为的s条样本行为特征和单用户行为的t条样本行为特征，这样，可提高目标识别模型的用户行为识别性能，对用户行为数据进行行为识别，可提高得到的用户行为识别结果的准确性。在终端启动应用和/或通过账号登录上述应用的情况下，先获取通过目标识别模型识别得到的用户行为识别结果。
24.步骤102：基于用户行为识别结果进行内容推荐。
25.由于使用上述终端、账号的用户可能是单用户，也可能是多用户，在本实施例中，可获取该终端和/或账号关联的用户行为数据的用户行为识别结果，利用用户行为识别结果来进行内容推荐，即内容推荐过程中，考虑了用户行为识别结果，可以理解考虑了是单用户行为还是多用户行为，对于不同的用户行为识别结果，可实现不同内容推荐，可提高内容推荐的准确性。
26.在本实施例的内容推荐方法中，可通过目标识别模型识别终端和/或账号的用户行为数据，得到用户行为识别结果，即可确定是单用户行为还是多用户行为，且目标识别模型是通过多用户行为的s条样本行为特征和单用户行为的t条样本行为特征训练得到，可利用得到的用户行为识别结果进行内容推荐，即在推荐过程中，考虑了终端和/或账号的用户行为识别结果，且用户行为识别结果是通过多用户行为的s条样本行为特征和单用户行为的t条样本行为特征训练得到的目标识别模型，对终端和/或账号的用户行为数据进行用户行为识别得到的，这样，可提高内容推荐精确性。
27.在一个实施例中，基于用户行为识别结果进行内容推荐，包括：
28.在用户行为识别结果为多用户行为的情况下，根据预先获取的k个用户的行为画像，输出第一内容，其中，k个用户的行为画像为预先根据k类行为数据构建得到，k类行为数据为预先根据用户行为识别结果对用户行为数据进行聚类得到，k为大于1的整数；
29.在接收到对第一内容中目标内容的第一输入的情况下，根据目标内容以及k类行为数据，从k个用户中确定目标用户；
30.从k个用户的行为画像中，获取目标用户的行为画像；
31.基于目标用户的行为画像，推荐第二内容。
32.在用户行为识别结果为多用户行为的情况下，表示使用上述终端和/账号的用户是多个用户，由于用户之间的差异，不同用户的行为存在差异，从而，在多用户行为情况下的内容推荐过程中，可先根据k个用户的行为画像，输出第一内容，即呈现给当前使用终端和/或当前使用该账号登录应用的用户。需要说明的是，可预先对上述终端关联的和/或上述账号关联的用户行为数据进行聚类，确定终端和/或账号对应的k类行为数据，即可将用户行为数据分为k类，每一类分别对应一个用户，且k类行为数据对应的用户不同，这样，可对应k个用户，表示上述用户行为数据为在该终端和/或该账号下k个用户产生的行为数据，k个用户使用该终端和/或账号进行了相关行为，一类行为数据为同一用户在应用内产生的行为数据，k类行为数据与k个用户一一对应。另外，可利用k类行为数据构建k个用户的行画像。
33.作为一个实例，根据k个用户的行为画像，输出第一内容的过程中，可先根据k个用户的行为画像，选定对应的k个候选内容集，一个候选内容集对应k个用户中的一个用户，k
个候选内容集与k个用户一一对应，任一候选内容集中包括至少一个内容，作为一个示例，内容可以包括但不限于物品(可以包括商品等)、视频、书籍、新闻等。然后对k个候选内容集进行内容抽样，得到第一内容，输出第一内容。需要说明的是，第一内容中的内容数量可以为一个或多个，本实施例中不作限定。
34.第一输入可以理解是对目标内容的第一行为，例如，第一输入为第一点击输入，即可以理解为第一点击行为。也即是输出第一内容后，当前用户可查看输出的第一内容，可选择内容，在接收到对第一内容中目标内容的第一输入的情况下，表示对目标内容的选择，后续可根据目标内容以及k类行为数据，从k个用户中确定目标用户，即可判定当前使用该终端和/或该账号的目标用户。
35.由于目标用户为k个用户中的用户，k个用户的行为画像已预先根据k类行为数据构建，在确定目标用户之后，可从k个用户的行为画像中，获取目标用户的行为画像，即可获取目标用户的行为偏好。
36.利用目标用户的行为画像，推荐第二内容，即通过目标用户的行为偏好进行内容推荐，可提高内容推荐的精确性。
37.在本实施例中，在用户行为识别结果为多用户行为的情况下进行内容推荐，在内容推荐过程中，可先根据k个用户的行为画像，输出第一内容，然后根据第一内容中第一输入对应的目标内容以及对用户行为数据进行聚类得到的k类行为数据，从k个用户中确定目标用户，基于目标用户的行为画像，推荐第二内容。即在本实施例中，即使用户行为数据为k个用户产生的行为数据，可先根据k个用户的行为画像，输出第一内容，后续可接收对第一内容中目标内容的第一输入，根据目标内容以及k类行为数据，确定k个用户中当前使用该终端和/或该账号的目标用户，利用的是当前使用该终端和/或该账号的目标用户的行为画像，推荐第二内容，以提高内容推荐的精确性。
38.在一个实施例中，基于用户行为识别结果进行内容推荐，包括：
39.在用户行为识别结果为单用户行为的情况下，根据预先获取的k个用户的行为画像，推荐第三内容，k个用户的行为画像为预先根据k类行为数据构建得到，k类行为数据为预先根据用户行为识别结果对用户行为数据进行聚类得到，k为1。
40.在用户行为识别结果为单用户行为的情况下，表示使用上述终端和/账号的用户是单用户，预先对终端和/账号关联的用户行为数据进行聚类得到一类行为数据，利用得到这一类行为数据构建一个用户的行为画像，在内容推荐过程中，考虑的是这一个用户的行为画像，输出第三内容，实现单用户行为情况下的内容推荐，以提高单用户行为情况下内容推荐的精确性。可以理解的是，本发明实施例的内容推荐方法，可针对多用户行为和单用户行为，采用不同的方式实现内容推荐，即区别制定相应的推荐过程进行内容推荐，提高内容推荐的精确性。
41.在一个实施例中，基于用户行为识别结果进行内容推荐之前，还包括：
42.获取用户行为数据；
43.根据用户行为数据，生成用户行为特征；
44.将用户行为特征输入到目标识别模型进行用户行为识别，得到用户行为识别结果。
45.也即是，可通过目标识别模型进行用户行为识别，得到用户行为识别结果，在本实
施例中，先根据用户行为数据，生成用户行为特征，然后是通过目标识别模型对用户行为特征进行用户行为识别，得到用户行为识别结果，以提高用户行为识别的准确性。作为一个示例，目标识别模型可以为但不限于目标因子分解机(factorization machine，fm)等。作为一个示例，用户行为数据可以是预设历史时间内的行为数据，例如，预设历史时间可以是最近l天，l可以为正整数等。
46.一个示例中，用户行为特征可包括一阶用户行为特征向量以及二阶用户行为特征矩阵，根据用户行为数据，生成用户行为特征的过程中，可先得到全量行为内容集，按照全量行为内容集中行为内容的排列顺序，生成用户行为数据的一阶用户行为特征向量，其中，任一一阶用户行为特征向量的维度与全量行为内容集中行为内容的数量相同，且任一一阶用户行为特征向量中的参考位置的值为第一预设值，以及除参考位置之外的其他位置的值为第二预设值，参考位置与参考行为内容在全量行为内容集中的顺序位置匹配，参考行为内容为用户行为数据中的行为内容，全量行为内容集可以是对多条历史行为内容序列中的历史行为内容进行并集处理得到的内容集，一条历史行为内容序列包括一个用户的历史行为内容。然后根据全量行为内容集中行为内容的数量，生成用户行为数据的二阶用户行为特征矩阵，任一二阶用户行为特征矩阵的行数以及列数均与全量行为内容集中行为内容的数量相同，且在全量行为内容集中第i个行为内容以及第j个行为内容均在拼接行为内容序列中的情况下，将二阶用户行为特征矩阵中第i行第j列的值设为第一预设值；在全量行为内容集中第i个行为内容以及第j个行为内容中至少一项不在用户行为数据中的情况下，二阶用户行为特征矩阵中第i行第j列的值设为第二预设值；其中，1≤i≤n，1≤j≤n，n为全量行为内容集中行为内容的数量。
47.在一个实施例中，将用户行为特征输入到目标识别模型进行用户行为识别，得到用户行为识别结果之后，还包括：
48.在用户行为识别结果为单用户行为的情况下，设置k为1，或者，在用户行为识别结果为多用户行为的情况下，设置k为大于1的整数，k为聚类数；
49.根据k的取值，对用户行为数据进行聚类，得到k类行为数据。
50.用户行为识别结果的不同，采用的聚类数k的取值不同，从而进行聚类的结果不同，在本实施例中，若用户行为识别结果为单用户行为，设置k的值为1，可以理解，在k的取值为1的情况下，对用户行为数据进行聚类，得到k类行为数据，即可得到1类行为数据，用户行为数据中噪声数据(未在上述1类行为数据中)过滤。若在用户行为识别结果为多用户行为，设置k的值为大于1的整数，根据k的取值，对用户行为数据进行聚类，可得到多类行为数据。可以理解，在聚类过程中，根据用户行为识别结果的不同，为k设置不同的值，根据设置的k的值进行聚类，这样可提高聚类的准确性。
51.在一个实施例中，用户行为数据包括m个行为内容，m为正整数；
52.其中，根据k的取值，对用户行为数据进行聚类，得到k类行为数据，包括：
53.根据k的取值以及m个行为内容的第一特征向量进行聚类，得到k类行为数据，其中，m个行为内容的第一特征向量预先通过目标识别模型进行特征学习得到，用户行为特征根据用户行为数据生成。
54.m个行为内容中每个行为内容分别有对应的第一特征向量，m个行为内容的第一特征向量可以理解为m个第一特征向量。预先通过多条样本行为特征中二阶特征矩阵对初始
识别模型训练得到目标识别模型的过程中，可通过初始识别模型为全量行为内容集中每个行为内容学习对应的第一特征向量(例如，目标识别模型为目标fm的情况下，第一特征向量可以理解为隐向量)，即进行特征学习，二阶特征矩阵中包括全量行为内容集中每个行为内容的组合特征向量，全量行为内容集中任一行为内容的组合特征向量中每个元素即为该行为内容与全量行为内容集中的行为内容之间的组合特征值，若两个行为内容均在同一条样本行为特征对应的拼接行为内容序列中，这两个行为内容之间的组合特征值为第一预设值，否则为第二预设值。在训练完成的情况下，特征学习结束，得到目标识别模型，此时，可得到全量行为内容集中每个行为内容的第一特征向量，全量行为内容集包括上述m个行为内容，也即是，m个行为内容的第一特征向量可预先通过目标识别模型进行特征学习得到。
55.在本实施例中，预先通过目标识别模型进行特征学习得到了m个行为内容的第一特征向量，在聚类过程中，可利用m个行为内容的第一特征向量和k的取值对用户行为数据进行聚类，得到k类行为数据，从而提高聚类准确性。
56.在一个实施例中，目标识别模型通过以下训练方式得到：
57.获取多条历史行为内容序列，其中，一条历史行为内容序列包括一个用户的历史行为内容；
58.基于多条历史行为内容序列，构建目标行为样本集；
59.根据目标行为样本集以及多条历史行为内容序列中的历史行为内容，生成训练样本行为特征集；
60.基于训练样本行为特征集对初始识别模型进行训练，得到目标识别模型。
61.其中，任一条历史行为内容序列中可包括多个历史行为内容，作为一个示例，一条历史行为内容序列可以包括上述应用内一个终端和/或一个账号下预设历史时间内预设时间段的历史行为内容，多条历史行为内容序列即可包括多个终端和/或多个账号下预设历史时间内预设时间段的历史行为内容，预设时间段可以是第一预设时刻到第二预设时刻之间的时间段，例如，第一预设时刻可以为早上八点，第二预设时刻可以为晚上七点等，本实施例不作具体限定。
62.在本实施例中，通过多条历史行为内容序列，构建目标行为样本集，再利用目标行为样本集以及多条历史行为内容序列中的历史行为内容，生成训练样本行为特征集，是利用训练样本行为特征集对初始识别模型进行训练，得到目标识别模型，实现识别模型的训练，以提高训练得到的目标识别模型的性能。
63.在一个实施例中，基于多条历史行为内容序列，构建目标行为样本集，包括：
64.针对多条历史行为内容序列中的每条历史行为内容序列，对历史行为内容序列进行分段，得到历史行为内容序列的分段行为内容；
65.根据多条历史行为内容序列的分段行为内容进行拼接，得到目标行为样本集，目标行为样本集中包括多条拼接行为内容序列。
66.对于每条历史行为内容序列分别进行分段，每条历史行为内容序列的分段行为内容的段数至少为一，任一分段行为内容中包括至少一个行为内容，然后可根据多条历史行为内容序列的分段行为内容进行拼接，得到目标行为样本集。需要说明的是，可以对不同历史行为内容序列的分段行为内容进行拼接，以及相同历史行为内容序列中不同分段行为内容进行拼接。
67.在本实施例中，目标行为样本集通过多条历史行为内容序列的分段行为内容进行拼接得到，如此，可使得到的拼接行为内容序列更加多样性，利用得到的目标行为样本集生成训练样本行为特征集，依此对对初始识别模型进行训练，得到目标识别模型，从而提高训练得到的目标识别模型的性能。
68.在一个实施例中，目标行为样本集中包括第一行为样本集和第二行为样本集，第一行为样本集中包括s条拼接行为内容序列，第二行为样本集包括t条拼接行为内容序列；
69.其中，s条拼接行为内容序列中任一序列为不同用户的至少两个分段行为内容拼接而成，且s条拼接行为内容序列中任一序列的第一相似度小于第一预设阈值，一个拼接行为内容序列的第一相似度为拼接行为内容序列对应的不同用户的历史行为内容序列的第二特征向量之间的相似度，历史行为内容序列的第二特征向量通过历史行为内容序列中各行为内容的嵌入向量得到，一个行为内容的嵌入向量通过行为内容的身份标识进行向量映射得到；
70.t条拼接行为内容序列包括q条拼接内容序列以及h条拼接行为内容序列，q条拼接行为内容序列中任一序列为相同用户的至少两个分段行为内容拼接而成，h条拼接行为内容序列中任一序列为不同用户的至少两个分段行为内容拼接而成，h条拼接内容序列中任一序列的第二相似度大于第二预设阈值，一个拼接行为内容序列的第二相似度为拼接行为内容序列对应的不同用户的历史行为内容序列的第二特征向量之间的相似度。
71.可以理解，不同历史行为内容序列是不同用户的历史行为，第一行为样本集中的拼接行为内容序列是不同用户的至少两个分段行为内容拼接而成，即第一行为样本集中的拼接行为内容序列是通过不同历史行为内容序列的分段行为内容进行拼接得到，即第一行为样本集中同一拼接行为内容序列中的行为内容包括不同的多个用户的分段行为内容，即为多用户行为样本数据，也可以理解是负样本数据，第一行为样本集对应的标记为多用户行为，例如，标记可以为0。第二行为样本集中q条拼接行为内容序列的同一拼接行为内容序列是相同用户的至少两个分段行为内容拼接而成，可以理解是相同历史行为内容序列中不同分段行为内容进行拼接，第二行为样本集中的同一拼接行为内容序列中的行为内容包括同一用户的不同分段行为内容，即单用户行为样本数据，另外第二行为样本集中h条拼接行为内容序列的同一拼接行为内容序列虽然是不同用户的至少两个分段行为内容拼接而成，但对应的不同用户的历史行为内容序列的第二特征向量之间的相似度是大于第二预设阈值，也即是h条拼接行为内容序列的同一拼接行为内容序列是相似用户之间的分段行为内容的拼接，其行为相似，也可理解为单用户行为样本数据，也可以理解为正样本数据，第二行为样本集对应的标记为单用户行为，例如，标记可以为1。
72.另外，为了降低第一行为样本集中的拼接行为内容序列中不同用户的分段行为内容的相似性，确保第一行为样本集中的拼接行为内容序列中分段行为内容的差异性，本实施例中，需要确保第一行为样本集中的拼接行为内容序列关联的不同用户的历史行为内容之间的相似度较低，即第一行为样本集中任一拼接行为内容序列的第一相似度小于第一预设阈值。另外，为提高h条拼接行为内容中拼接行为内容序列中不同用户的分段行为内容之间的相似性，本实施例中，需要确保h条拼接行为内容中的拼接行为内容序列关联的不同用户的历史行为内容序列的第二特征向量之间的相似度较高，即h条拼接行为内容中任一拼接行为内容序列的第二相似度大于第二预设阈值，第二预设阈值是大于或等于第一预设阈
值。通过上述包括第一行为样本集和第二行为样本集的目标行为样本集，生成训练样本行为特征集，用以对初始识别模型进行训练，得到目标识别模型，可提高模型的性能。
73.一个示例中，分段行为内容的第二特征向量可以是该分段行为内容中各行为内容的嵌入向量的，一条历史行为内容序列的第二特征向量可以是该历史行为内容序列中各行为内容的嵌入向量的平均，一个行为内容的嵌入向量通过该行为内容的身份标识进行向量映射得到，例如，可将行为内容的身份标识输入到item2vec模型进行映射，得到行为内容的第二嵌入向量。
74.在一个实施例中，训练样本行为特征集中任一条样本行为特征包括一阶特征向量以及二阶特征矩阵；
75.根据目标行为样本集以及多条历史行为内容序列中的历史行为内容，生成训练样本行为特征集，包括：
76.对多条历史行为内容序列中的历史行为内容进行并集处理，得到全量行为内容集；
77.按照全量行为内容集中行为内容的排列顺序，生成目标行为样本集中每条拼接行为内容序列的一阶特征向量，其中，任一一阶特征向量的维度与全量行为内容集中行为内容的数量相同，且任一一阶特征向量中的目标位置的值为第一预设值，以及除目标位置之外的其他位置的值为第二预设值，目标位置与目标行为内容在全量行为内容集中的顺序位置匹配，目标行为内容为一阶特征向量对应的拼接行为内容序列的行为内容；
78.根据全量行为内容集中行为内容的数量，生成目标行为样本集中每条拼接行为内容序列的二阶特征矩阵，任一二阶特征矩阵的行数以及列数均与全量行为内容集中行为内容的数量相同；
79.其中，s条样本行为特征与s条拼接行为内容序列对应，t条样本行为特征与t条拼接行为内容序列对应。
80.例如，第一预设值为1，第二预设值为0，全量行为内容集为{item1，item2，
……
，item
n-1
,itemn}，一条拼接行为内容序列为{item1，item2}，则该条拼接行为内容序列的一阶特征向量中item
1-item2对应位置的值为1，item
3-itemn对应位置的值为0，即该条拼接行为内容序列的一阶特征向量为(1，1，0，
……
，0)，维度为n。另外，任一条拼接行为内容序列的二阶特征矩阵的大小为n行n列，一条拼接行为内容序列的二阶特征矩阵中第i行第j列的值即为itemi和itemj之间的组合特征值，为1或0。
81.在本实施例中，生成训练样本特征集的过程中，先多条历史行为内容序列中的历史行为内容，进行并集处理，得到全量行为内容集，然后按照全量行为内容集中行为内容的排列顺序，生成目标行为样本集中每条拼接行为内容序列的一阶特征向量，以及根据全量行为内容集中行为内容的数量，生成目标行为样本集中每条拼接行为内容序列的二阶特征矩阵，得到的训练样本行为特征集中每条样本行为特征包括一阶特征向量以及二阶特征矩阵，利用训练样本行为特征集进行模型训练，以提高模型的性能。
82.在一个实施例中，根据全量行为内容集中行为内容的数量，生成目标行为样本集中每条拼接行为内容序列的二阶特征矩阵，包括：
83.对于目标行为样本集中每条拼接行为内容序列，在全量行为内容集中第i个行为内容以及第j个行为内容均在拼接行为内容序列中的情况下，将拼接行为内容序列的二阶
特征矩阵中第i行第j列的值设为第一预设值；在全量行为内容集中第i个行为内容以及第j个行为内容中至少一项不在拼接行为内容序列中的情况下，将拼接行为内容序列的二阶特征矩阵中第i行第j列的值设为第二预设值；
84.其中，1≤i≤n，1≤j≤n，n为全量行为内容集中行为内容的数量。
85.例如，如上的全量行为内容集为{item1，item2，
……
，item
n-1
,itemn}以及拼接行为内容序列为{item1，item2}，得到的该拼接行为内容序列的二阶特征矩阵中第1行第1列的值表示的是item1与item1之间的组合特征值，由于是item1在该拼接行为内容序列中，组合特征值为1，第1行第2列的值表示的是item1与item2之间的组合特征值，由于是item1与item2均在该拼接行为内容序列中，组合特征值为1，第2行第1列的值表示的是item2与item1之间的组合特征值，由于是item1与item2均在该拼接行为内容序列中，组合特征值为1，第2行第2列的值表示的是item2与item2之间的组合特征值，由于是item2在该拼接行为内容序列中，组合特征值为1，该拼接行为内容序列的二阶特征矩阵中其余值均为0。
86.在本实施例中，通过判断全量行为内容集中第i个行为内容以及第j个行为内容是否均在拼接行为内容序列中，根据结果，设置拼接行为内容序列的二阶特征矩阵中第i行第j列的值，不同的结果设置不同的值，如此，对全量行为内容集中每两个行为内容通过类似判断，为二阶特征矩阵相应的位置设置对应的值，从而得到该拼接行为内容序列的二阶特征矩阵，将其与一阶特征矩阵一起作为一条样本行为特征，如此，构建训练样本行为特征集，用以模型训练，以提高模型的性能。
87.在一个实施例中，根据目标内容以及k类行为数据，从k个用户中确定目标用户，包括：
88.根据目标内容的第一特征向量以及k类行为数据中各类行为数据的聚类中心特征向量，从k类行为数据中确定目标类行为数据；
89.将目标类行为数据对应的用户确定为目标用户；
90.其中，参考类行为数据的聚类中心特征向量根据参考类行为数据中各行为内容的第一特征向量得到，参考类行为数据为k类行为数据中的任一类行为数据。
91.目标内容的第一特征向量预先通过目标识别模型进行特征学习得到，例如，上述全量行为内容集中包括目标内容，预先得到全量行为内容集中每个行为内容的第一特征向量，即可从全量行为内容集的第一特征向量中获取该目标内容的第一特征向量。一个示例中，参考类行为数据的聚类中心特征向量可以是参考类行为数据中各行为内容的第一特征向量平均。
92.在本实施例中，是通过目标内容的第一特征向量以及k类行为数据中各类行为数据的聚类中心特征向量，从k类行为数据中确定目标类行为数据，然后将目标类行为数据对应的用户确定为目标用户，如此，可提高确定的目标用户的精确性，利用目标用户的行为画像推荐第二内容，从而可提高内容推荐的精确性。
93.一个示例中，根据目标内容的第一特征向量以及k类行为数据中各类行为数据的聚类中心特征向量，从k类行为数据中确定目标类行为数据的过程中，可先计算目标内容的第一特征向量分别与k个聚类中心特征向量之间的相似度，即可得到k个相似度，将k个相似度中最大相似度对应的类行为数据确定为目标类行为数据，然后将目标类行为数据对应的用户确定为目标用户。可以理解是将最为相似的用户确定为目标用户，即确定为当前使用
上述终端和/或上述账号的用户。
94.下面以一个具体实施例对上述内容推荐方法的过程加以具体说明。
95.如图2所示，本实施例的内容推荐方法的过程如下：
96.首先，收集应用内多个用户点击或播放数字内容等行为数据，得到多条历史行为内容序列，并构建训练样本行为特征集，利用训练样本行为特征集进行模型训练得到目标fm模型，且得到全量行为内容集中每个行为内容的隐向量；
97.然后，获取某个终端或某个账号下的用户行为数据，可通过目标fm模型对用户行为数据进行用户行为识别，得到用户行为识别结果，利用用户行为识别结果，对用户行为数据进行聚类，得到k类行为数据，并利用k类行为数据构建k个用户的行为画像；
98.其次，在该终端启动应用或该账号登录应用的情况下，获取用户行为标识结果，基于用户行为识别结果进行内容推荐。
99.其中，基于用户行为识别结果进行内容推荐的过程如下：
100.若用户行为识别结果为多用户行为，系统可根据k个用户的行为画像选定对应的候选内容集，并对候选内容集进行抽样得到第一内容，输出第一内容，此时的k为大于1；
101.用户根据自身偏好点击第一内容中的目标内容；
102.系统根据用户点击的目标内容，从k个用户中确定目标用户；
103.系统从k个用户的行为画像中获取目标用户的行为画像，并根据目标用户的行为画像推送第二内容，从而实现了同一个终端或同一个账号下多个用户识别和个性化内容推荐。
104.需要说明的是，可通过内容推荐系统实现上述内容推荐方法，如图3所示，该内容推荐系统可包括用户行为收集模块、多用户分析识别模块、特定用户探索模块、特定用户切换模块以及用户个性化内容推荐模块。
105.用户行为收集模块：负责通过埋点的方式，在数字内容应用上收集用户行为数据并进行存储；
106.多用户分析识别模块：负责从海量用户行为数据中，分析挖掘同一账号或者同一终端下用户行为，构建多用户的行为识别模型(目标识别模型)，并根据用户的行为数据刻画用户画像数据，即得到用户的行为画像；
107.特定用户探索模块：根据用户在数字内容应用的交互行为，判定用户偏好，进一步确认当前用户在同一终端或者同一账号下的特定用户身份，可以理解是确定目标用户；
108.特定用户切换模块：负责人通知个性化推荐模块，将当前的行为画像切换到特定用户的行为画像；
109.用户个性化内容推荐模块：根据切换确认的行为画像和用户的实时行为，向当前用户推送相关数字内容。
110.对于模型训练得到目标识别模型的过程如下：
111.(1)单用户客户端行为抽样：从全量用户行为中，提取最近l天单用户客户端的用户行为，由于不知道哪些用户是单用户客户端，因此选择抽样发生在工作日上班时间(8点到19点之间的行为，有最大概率是同一个用户产生)的用户行为数据，标记为单用户产生的行为数据，对每个用户，对其最近l天行为中的内容(item)序列，按发生时间生成如下格式数据(即历史行为内容序列)：
112.sep
x
：{item1，item2，
……
，itemm,}；
113.其中，sep
x
为用户x(user
x
)的历史行为内容序列，m为user
x
最近l天的行为物品总数，一个示例中，可预先设定一个最小阈值size
min
，需抽样满足m》size
min
的用户，确保该用户具备一定的活跃度；
114.(2)抽样用户行为序列分段：将上述(1)中的每个用户的历史行为内容序列划分为k段(可采用均分划分方法或按行为发生的日期划分，本实施例不作限定)，以均分为例，生成如下格式的分段行为内容：
115.sep
x1
：{item1，item2，
……
，item
m/k
}；
116.sep
x2
：{item
m/k 1
，item
m/k 2
，
……
，item
m*2/k
}；
117.…
118.sep
xi
：{item
m(i-1)/k 1
，item
m(i-1)/k 2
，
……
，item
m*i/k
}；
119.…
120.sep
xk
：{item
m(k-1)/k 1
，item
m(k-1)/k 2
，
……
，itemm}；
121.其中，k为分段的数量，sep
xi
为用户x的历史行为内容序列对应的第i段分段行为内容，对m/k设定一个最小阈值c
min
，根据每个用户的m值来设定k的大小，需满足m/k》c
min
，即确保每个用户的分段行为内容的内容数量要大于c
min
；
122.(3)构造训练样本：通过(2)中的用户的历史行为内容序列的分段行为内容，生成判定多用户客户端的正负样本，假设一个客户端是单用户为正，是多用户为负，正负样本构建方法如下：
123.负样本构造(即第一行为样本集构造)：对两个不同用户user
x
和usery(用户y)分别随机抽取各自的历史行为内容序列中的若干段(从1到k)进行拼接，生成拼接行为内容序列，比如抽取sep
xi
和sep
yi
(为用户y的历史行为内容序列对应的第i段分段行为内容)则生成新的接行为内容序列为：sep
xiyi
:{sep
xi
，sep
yi
},由于sep
xiyi
是user
x
和usery的第i段分段行为内容拼接而成，来自多个用户，因此把sep
xiyi
作为负样本，其标记(label)为0。以此为例，多次重复以上随机抽取合并操作，可以生成若干负样本；需要注意的是，考虑到user
x
和usery可能是兴趣相同的相似用户，把相似用户的行为序列拼接作为负样本并不准确，因此在构造负样本时，需要确保user
x
和usery相似度不能太高。可使用(1)中的历史行为内容序列来训练一个item2vec模型(是word2vec模型(词向量模型)的演化，可将item当作词)来得到全量行为内容的嵌入(embedding)向量，然后对每个用户，使用该用户的历史行为序列中各行为内容的嵌入向量求和取平均，作为该用户的嵌入向量表示user
x
和usery的相似度通过其用户的嵌入向量的内积得到，设定一个第一预设阈值simi_score
false
，对选取构造负样本的user
x
和usery，需满足嵌入向量的内积《simi_score
false
；
124.正样本构造(即第二行为样本集构造)：对一个用户user
x
，随机抽取其分段行为内容sep
x1
～sep
xk
中的若干段(从1到k)进行拼接合并，生成新的拼接行为内容序列，比如抽取sep
xi
和sep
xj
，则生成的新的拼接行为内容序列为：sep
xixj
:{sep
xi
，sep
xj
}，由于sep
xixj
是user
x
不同分段的行为序列拼接而成，均为user
x
产生，因此把sep
xixj
作为正样本，其标记为1；另外可以参考负样本构造方法，选取相似度较高的两个用户user
x
和usery，分别随机抽取各自分段行为内容若干段(从1到k)进行拼接，作为正样本的补充，设定一个第二预设阈值simi_score
true
，对选取构造正样本的user
x
和usery，需满足嵌入向量的内积》simi_
score
true
。以此为例，多次重复以上随机抽取合并操作，可以生成若干正样本；
125.如此，生成包括第一行为样本集和第二行为样本集的目标行为样本集，然后根据目标行为样本集全量行为内容集，生成训练样本行为特征集。
126.(4)识别模型(分类模型)训练：将(3)中产生的训练样本行为特征集作为识别模型的输入，训练一个多用户客户端判别模型，即目标识别模型，核心思想是把全量行为内容的行为特征作为模型的特征进行学习，差异较大的两个内容出现在同一个行为序列中，会提高判定为多用户的概率，而差异较小的两个内容出现在同一个行为序列，会提高判定为单用户的概率，对所有特征进行二阶组合并充分学习组合特征对分类结果的影响，模型表达式如下：
[0127][0128]
在本实施例中，模型的一阶特征向量中的xi为目标行为样本集中出现的内容itemi的特征得分，假设全量行为内容集合为{item1，item2，
……
，item
n-1
,itemn}，如果一条拼接行为内容序列为{item1，item2，
……
，itemm}(m《n)，则输入到模型中的一阶特征向量中x1～xm对应位置的值等于1，x
m 1
～xn对应位置的值等于0；模型的二阶特征矩阵中第i行第j列的值xixj为目标行为样本集中内容itemi和itemj的组合特征值(组合特征得分)，对于拼接行为内容序列{item1，item2，
……
，itemm}(m《n)，item1到itemm之间的任意两个物品组合特征得分为1，其他组合特征得分为0；另外，如果是单用户样本，则模型y值为1，如果是多用户样本，则模型y值为0；通过大量样本进行训练，即可得到一个基于fm的多用户客户端判别模型。
[0129]
(5)训练后对全量用户进行判别，使用最近l天全量客户端的用户行为数据(和(1)的区别是此时包含非工作时间的用户行为数据)，生成每个客户端的用户行为数据，并作为模型输入，通过模型预测即可判定该客户端是单用户还是多用户；
[0130]
(6)可根据用户行为识别结果，对客户端的用户行为数据进行聚类，得到k类行为数据，构建k个用户的行为画像，后续该客户端启动应用的情况下，可根据构建的k个用户的行为画像，输出第一内容，然后根据用户对第一用户中目标内容的点击行为，从k个用户中确定目标用户，利用目标用户的行为画像推荐第二内容；
[0131]
需要说明的是，上述识别模型除了实现对多用户客户端的识别外，另外一个收获是获取了全量物品的隐向量，由于是将物品作为特征输入，可以直接得到每个物品的隐向量，假设全量物品数量为n，fm模型的一个优点是对二阶交叉特征权重构成的n*n维对称二阶特征矩阵进行因子分解后可以得到一个n*v维低纬矩阵，其中，低纬矩阵的第i行即为第i个物品的隐向量。出现在同一客户端的行为序列中的两个内容item
x
和itemy，其隐向量内积越大客户端是单用户的概率就越大，说明两个物品越相似，因此可以对每个客户端，将其行为序列中的物品，根据隐向量进行k-means聚类，聚类数k表示该客户端的用户数，对判定为单用户的客户端，用户数为1，即聚类数k＝1，将少数离聚类中心点的物品作为噪声进行过滤，使得对单用户偏好刻画更准确；对判定为多用户的客户端，指定k》1进行聚类,把客户端行为序列中的物品划分到k类，以实现对客户端多个用户的偏好刻画，实现对多用户客户端的个性化推荐策略。
[0132]
本技术提出了一种多用户识别和内容推荐方法，通过分析客户端或账号的用户观看或点播行为识别不同用户，根据不同用户分别选择推荐内容候选集，结合用户终端交互行为确定切换特定用户，根据特定用户推送符合其偏好的数字内容。
[0133]
参见图4，提供一种实施例的内容推荐装置400，包括：
[0134]
第一获取模块401，用于在终端启动应用和/或通过账号登录应用的情况下，获取用户行为识别结果，用户行为识别结果为预先通过目标识别模型识别用户行为数据得到的识别结果，用户行为识别结果包括多用户行为或单用户行为，用户行为数据关联终端和/或账号，目标识别模型通过训练样本行为特征集训练得到，训练样本行为特征集包括行为标记为多用户行为的s条样本行为特征以及行为标记为单用户行为的t条样本行为特征，s和t均为正整数；
[0135]
推荐模块402，用于基于用户行为识别结果进行内容推荐。
[0136]
在一个实施例中，推荐模块402包括：
[0137]
输出模块，用于在用户行为识别结果为多用户行为的情况下，根据预先获取的k个用户的行为画像，输出第一内容，其中，k个用户的行为画像为预先根据k类行为数据构建得到，k类行为数据为预先根据用户行为识别结果对用户行为数据进行聚类得到，k为大于1的整数；
[0138]
确定模块，用于在接收到对第一内容中目标内容的第一输入的情况下，根据目标内容以及k类行为数据，从k个用户中确定目标用户；
[0139]
第二获取模块，用于从k个用户的行为画像中，获取目标用户的行为画像；
[0140]
第一推荐子模块，用于基于目标用户的行为画像，推荐第二内容。
[0141]
在一个实施例中，推荐模块402还包括：
[0142]
第二推荐子模块，用于在用户行为识别结果为单用户行为的情况下，根据预先获取的k个用户的行为画像，推荐第三内容，k个用户的行为画像为预先根据k类行为数据构建得到，k类行为数据为预先根据用户行为识别结果对用户行为数据进行聚类得到，k为1。
[0143]
在一个实施例中，装置400还包括：
[0144]
第三获取模块，用于获取用户行为数据；
[0145]
第一特征生成模块，用于根据用户行为数据，生成用户行为特征；
[0146]
行为识别模块，用于将用户行为特征输入到目标识别模型进行用户行为识别，得到用户行为识别结果。
[0147]
在一个实施例中，装置400还包括：
[0148]
设置模块，用于在用户行为识别结果为单用户行为的情况下，设置k为1，或者，在用户行为识别结果为多用户行为的情况下，设置k为大于1的整数，k为聚类数；
[0149]
行为数据聚类模块，用于根据k的取值，对用户行为数据进行聚类，得到k类行为数据。
[0150]
在一个实施例中，用户行为数据包括m个行为内容，m为正整数；
[0151]
其中，行为数据聚类模块，具体用于根据k的取值以及m个行为内容的第一特征向量进行聚类，得到k类行为数据，其中，m个行为内容的第一特征向量预先通过目标识别模型进行特征学习得到，用户行为特征根据用户行为数据生成。
[0152]
在一个实施例中，目标识别模型通过以下训练方式得到：
[0153]
获取多条历史行为内容序列，其中，一条历史行为内容序列包括一个用户的历史行为内容；
[0154]
基于多条历史行为内容序列，构建目标行为样本集；
[0155]
根据目标行为样本集以及多条历史行为内容序列中的历史行为内容，生成训练样本行为特征集；
[0156]
基于训练样本行为特征集对初始识别模型进行训练，得到目标识别模型。
[0157]
在一个实施例中，基于多条历史行为内容序列，构建目标行为样本集，包括：
[0158]
针对多条历史行为内容序列中的每条历史行为内容序列，对历史行为内容序列进行分段，得到历史行为内容序列的分段行为内容；
[0159]
根据多条历史行为内容序列的分段行为内容进行拼接，得到目标行为样本集，目标行为样本集中包括多条拼接行为内容序列。
[0160]
在一个实施例中，目标行为样本集中包括第一行为样本集和第二行为样本集，第一行为样本集中包括s条拼接行为内容序列，第二行为样本集包括t条拼接行为内容序列；
[0161]
其中，s条拼接行为内容序列中任一序列为不同用户的至少两个分段行为内容拼接而成，且s条拼接行为内容序列中任一序列的第一相似度小于第一预设阈值，一个拼接行为内容序列的第一相似度为拼接行为内容序列对应的不同用户的历史行为内容序列的第二特征向量之间的相似度，历史行为内容序列的第二特征向量通过历史行为内容序列中各行为内容的嵌入向量得到，一个行为内容的嵌入向量通过行为内容的身份标识进行向量映射得到；
[0162]
t条拼接行为内容序列包括q条拼接内容序列以及h条拼接行为内容序列，q条拼接行为内容序列中任一序列为相同用户的至少两个分段行为内容拼接而成，h条拼接行为内容序列中任一序列为不同用户的至少两个分段行为内容拼接而成，h条拼接内容序列中任一序列的第二相似度大于第二预设阈值，一个拼接行为内容序列的第二相似度为拼接行为内容序列对应的不同用户的历史行为内容序列的第二特征向量之间的相似度。
[0163]
在一个实施例中，训练样本行为特征集中任一条样本行为特征包括一阶特征向量以及二阶特征矩阵；
[0164]
根据目标行为样本集以及多条历史行为内容序列中的历史行为内容，生成训练样本行为特征集，包括：
[0165]
对多条历史行为内容序列中的历史行为内容进行并集处理，得到全量行为内容集；
[0166]
按照全量行为内容集中行为内容的排列顺序，生成目标行为样本集中每条拼接行为内容序列的一阶特征向量，其中，任一一阶特征向量的维度与全量行为内容集中行为内容的数量相同，且任一一阶特征向量中的目标位置的值为第一预设值，以及除目标位置之外的其他位置的值为第二预设值，目标位置与目标行为内容在全量行为内容集中的顺序位置匹配，目标行为内容为一阶特征向量对应的拼接行为内容序列的行为内容；
[0167]
根据全量行为内容集中行为内容的数量，生成目标行为样本集中每条拼接行为内容序列的二阶特征矩阵，任一二阶特征矩阵的行数以及列数均与全量行为内容集中行为内容的数量相同；
[0168]
其中，s条样本行为特征与s条拼接行为内容序列对应，t条样本行为特征与t条拼
接行为内容序列对应。
[0169]
在一个实施例中，根据全量行为内容集中行为内容的数量，生成目标行为样本集中每条拼接行为内容序列的二阶特征矩阵，包括：
[0170]
对于目标行为样本集中每条拼接行为内容序列，在全量行为内容集中第i个行为内容以及第j个行为内容均在拼接行为内容序列中的情况下，将拼接行为内容序列的二阶特征矩阵中第i行第j列的值设为第一预设值；在全量行为内容集中第i个行为内容以及第j个行为内容中至少一项不在拼接行为内容序列中的情况下，将拼接行为内容序列的二阶特征矩阵中第i行第j列的值设为第二预设值；
[0171]
其中，1≤i≤n，1≤j≤n，n为全量行为内容集中行为内容的数量。
[0172]
在一个实施例中，确定模块，包括：
[0173]
目标类行为数据确定模块，用于根据目标内容的第一特征向量以及k类行为数据中各类行为数据的聚类中心特征向量，从k类行为数据中确定目标类行为数据；
[0174]
目标用户确定模块，用于将目标类行为数据对应的用户确定为目标用户；
[0175]
其中，参考类行为数据的聚类中心特征向量根据参考类行为数据中各行为内容的第一特征向量得到，参考类行为数据为k类行为数据中的任一类行为数据。
[0176]
上述内容推荐装置400的技术特征与上述内容推荐方法的中的技术特征对应，通过内容推荐装置400实现上述内容推荐方法的各个过程，并能得到相同的效果，为避免重复，在此不再赘述。
[0177]
本发明实施例还提供一种通信设备，包括处理器以及存储器，存储器上存储有可在处理器上运行的计算机程序，该计算机程序被处理器执行时实现上述内容推荐方法实施例中的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
[0178]
本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述内容推荐方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。
[0179]
其中，的计算机可读存储介质，如只读存储器(read-only memory，简称rom)、随机存取存储器(random access memory，简称ram)、磁碟或者光盘等。
[0180]
需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0181]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台通信设备(可以是手机，计算机，服务端，空调器，或者网络设备等)执行本发明各个实施例的方法。
[0182]
上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员
在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：振动编码处理方法、装置、计算机设备及存储介质与流程

一种内容推荐方法、通信设备及计算机可读存储介质与流程

相关文献

最热文献