一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

图网络模型训练方法、视频推荐方法、装置及电子设备与流程

2022-03-22 20:09:34 来源:中国专利 TAG:


1.本技术涉及视频推荐技术领域,特别是涉及图网络模型训练方法、视频推荐方法、装置及电子设备。


背景技术:

2.随着科技技术的不断发展,以手机为代表的终端得到越来越多用户的欢迎,越来越多的用户通过手机等终端来观看短视频。为了满足用户的视频观看需求,通常为用户推荐其自身可能感兴趣的视频。
3.相关技术中,通常通过分析用户的历史观看行为数据来个性化地为用户推荐视频。具体的,可以通过分析用户的历史观看行为数据得到用户画像,并为用户推荐与用户画像匹配的短视频。
4.但是,在实际应用中,用户的兴趣可能发生变化,这样,相关技术为用户推荐的视频较为单一,导致无法满足用户的视频观看需求。


技术实现要素:

5.为了解决相关技术中存在的为用户推荐的视频较为单一,导致无法满足用户的视频观看需求的技术问题,本公开提供了图网络模型训练方法、视频推荐方法、装置及电子设备,本公开的技术方案如下:
6.根据本公开实施例的第一方面,提供了一种图网络模型训练方法,包括:
7.获取用户观看视频的历史行为数据;
8.基于所述历史行为数据生成连通图,其中,所述连通图中的节点的节点标识为视频标识,所述连通图中的边用于连接所述历史行为数据中具有直接相关性的视频标识所对应的节点,所述连通图中每条边的边权重用于表征该条边连接的两个节点的视频标识对应的视频的相关性大小;
9.根据所述连通图中视频标识之间的相关性以及相关性大小,确定与各视频标识相关联的视频标识;
10.对于每一视频标识,将与该视频标识相关联的视频标识确定为正样本数据,将与该视频标识不相关联的视频标识确定为负样本数据;
11.利用所述正样本数据与所述负样本数据对所述图网络模型进行训练,得到训练后的图网络模型,以通过所述训练后的图网络模型提取视频标识对应的视频向量。
12.可选的,所述视频标识之间的相关性包括:视频标识之间的直接相关性以及间接相关性,视频标识之间的间接相关性用于表示视频标识通过所述连通图中的多条边间接相连接;
13.所述根据所述连通图中视频标识之间的相关性以及相关性大小,确定与各视频标识相关联的视频标识,包括:
14.对于所述连通图中的任一视频标识,根据该视频标识与其他视频标识之间的直接
相关性,直接相关性的相关性大小,间接相关性以及间接相关性的相关性大小,利用随机游走方式确定该视频标识对应的随机游走序列;
15.对于所述连通图中的任一视频标识,将该视频标识对应的随机游走序列中的各个视频标识,确定为与该视频标识相关联的视频标识。
16.可选的,所述连通图为有向连通图,所述连通图中的边为有向边,所述有向边的方向是根据历史行为数据中用户对视频的视频交互顺序确定的;
17.确定所述连通图中每条边的边权重,包括:
18.对于有向连通图中的任意一条有向边,按照如下公式确定该条有向边的边权重:
19.edge_weight=edge_number/math.log10(dst_node_popularity a);
20.其中,edge_weight为该条有向边的边权重,edge_number为该条有向边的起点对应的连接边数和终点对应的连接边数之和,所述dst_node_popularity为该条有向边的终点的视频标识对应的视频的热度,所述a为常数。
21.可选的,在所述图网络模型满足预设条件时,得到所述训练后的图网络模型,其中,所述预设条件用于表征所述图网络模型对所述正样本数据与所述负样本数据的识别准确度大于预设准确度;
22.所述预设条件包括以下条件中的至少一种:
23.所述图网络模型的损失函数的损失值小于预设损失值;所述图网络模型所确定的相关联视频标识对应的视频描述信息之间的语义相似度大于第一预设相似度;以及,将所述图网络模型所确定的相关联视频标识对应的视频向量降维后,降维后的视频向量的相似度大于第二预设相似度。
24.根据本公开实施例的第二方面,提供了一种视频推荐方法,包括:
25.将各个视频的视频标识输入第一方面所述的训练后的图网络模型,得到各个视频的视频标识对应的视频向量;
26.基于目标用户历史交互过的视频的视频标识对应的视频向量,确定所述目标用户对应的目标用户向量;
27.计算所述目标用户向量与各个视频的视频标识对应的视频向量之间的相似度;
28.为所述目标用户推荐相似度大于预定相似度的视频标识对应的视频。
29.可选的,所述基于目标用户历史交互过的视频的视频标识对应的视频向量,确定所述目标用户对应的目标用户向量,包括:
30.将目标用户历史交互过的视频的视频标识对应的视频向量进行加权求和,得到加权后的视频向量;
31.将所述加权后的视频向量确定为所述目标用户对应的目标用户向量。
32.可选的,所述计算所述目标用户向量与各个视频的视频标识对应的视频向量之间的相似度,包括:
33.通过近似最邻近方法计算计算所述目标用户向量与各个视频的视频标识对应的视频向量之间的相似度。
34.根据本公开实施例的第三方面,提供了一种图网络模型训练装置,包括:
35.历史行为数据获取模块,被配置为执行获取用户观看视频的历史行为数据;
36.连通图生成模块,被配置为执行基于所述历史行为数据生成连通图,其中,所述连
通图中的节点的节点标识为视频标识,所述连通图中的边用于连接所述历史行为数据中具有直接相关性的视频标识所对应的节点,所述连通图中每条边的边权重用于表征该条边连接的两个节点的视频标识对应的视频的相关性大小;
37.视频标识确定模块,被配置为执行根据所述连通图中视频标识之间的相关性以及相关性大小,确定与各视频标识相关联的视频标识;
38.样本数据确定模块,被配置为执行对于每一视频标识,将与该视频标识相关联的视频标识确定为正样本数据,将与该视频标识不相关联的视频标识确定为负样本数据;
39.图网络模型训练模块,被配置为执行利用所述正样本数据与所述负样本数据对所述图网络模型进行训练,得到训练后的图网络模型,以通过所述训练后的图网络模型提取视频标识对应的视频向量。
40.可选的,所述视频标识之间的相关性包括:视频标识之间的直接相关性以及间接相关性,视频标识之间的间接相关性用于表示视频标识通过所述连通图中的多条边间接相连接;
41.所述视频标识确定模块,具体被配置为执行:
42.对于所述连通图中的任一视频标识,根据该视频标识与其他视频标识之间直接相关性,直接相关性的相关性大小,间接相关性以及间接相关性的相关性大小,利用随机游走方式确定该视频标识对应的随机游走序列;
43.对于所述连通图中的任一视频标识,将该视频标识对应的随机游走序列中的各个视频标识,确定为与该视频标识相关联的视频标识。
44.可选的,所述连通图为有向连通图,所述连通图中的边为有向边,所述有向边的方向是根据历史行为数据中用户对视频的视频交互顺序确定的;
45.所述连通图生成模块,具体被配置为执行:
46.对于有向连通图中的任意一条有向边,按照如下公式确定该条有向边的边权重:
47.edge_weight=edge_number/math.log10(dst_node_popularity a);
48.其中,edge_weight为该条有向边的边权重,edge_number为该条有向边的起点对应的连接边数和终点对应的连接边数之和,所述dst_node_popularity为该条有向边的终点的视频标识对应的视频的热度,所述a为常数。
49.可选的,在所述图网络模型满足预设条件时,得到所述训练后的图网络模型,其中,所述预设条件用于表征所述图网络模型对所述正样本数据与所述负样本数据的识别准确度大于预设准确度;
50.所述预设条件包括以下条件中的至少一种:
51.所述图网络模型的损失函数的损失值小于预设损失值;所述图网络模型所确定的相关联视频标识对应的视频描述信息之间的语义相似度大于第一预设相似度;以及,将所述图网络模型所确定的相关联视频标识对应的视频向量降维后,降维后的视频向量的相似度大于第二预设相似度。
52.根据本公开实施例的第四方面,提供了一种视频推荐装置,包括:
53.视频向量获取模块,被配置为执行将各个视频的视频标识输入第三方面所述的训练后的图网络模型,得到各个视频的视频标识对应的视频向量;
54.用户向量确定模块,被配置为执行基于目标用户历史交互过的视频的视频标识对
应的视频向量,确定所述目标用户对应的目标用户向量;
55.相似度计算模块,被配置为执行计算所述目标用户向量与各个视频的视频标识对应的视频向量之间的相似度;
56.视频推荐模块,被配置为执行为所述目标用户推荐相似度大于预定相似度的视频标识对应的视频。
57.可选的,所述用户向量确定模块,具体被配置为执行:
58.将目标用户历史交互过的视频的视频标识对应的视频向量进行加权求和,得到加权后的视频向量;
59.将所述加权后的视频向量确定为所述目标用户对应的目标用户向量。
60.可选的,所述相似度计算模块,具体被配置为执行:
61.通过近似最邻近装置计算计算所述目标用户向量与各个视频的视频标识对应的视频向量之间的相似度。
62.根据本公开实施例的第五方面,提供了一种电子设备,包括:
63.处理器;
64.用于存储所述处理器可执行指令的存储器;
65.其中,所述处理器被配置为执行所述指令,以实现第一方面所述的图网络模型训练方法,或者,第二方面所述的视频推荐方法。
66.根据本公开实施例的第六方面,提供了一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面所述的图网络模型训练方法,或者,第二方面所述的视频推荐方法。
67.根据本公开实施例的第七方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机实现第一方面所述的图网络模型训练方法,或者,第二方面所述的视频推荐方法。
68.本公开实施例提供的技术方案,获取用户观看视频的历史行为数据;基于历史行为数据生成连通图;根据连通图中视频标识之间的相关性以及相关性大小,确定与各视频标识相关联的视频标识;对于每一视频标识,将与该视频标识相关联的视频标识确定为正样本数据,将与该视频标识不相关联的视频标识确定为负样本数据;利用正样本数据与负样本数据对图网络模型进行训练,得到训练后的图网络模型,以通过所述训练后的图网络模型提取视频标识对应的视频向量。
69.可见,通过本公开实施例提供的技术方案,可以基于用户观看视频的历史行为数据生成连通图,并根据所生成的连通图进行图网络模型训练,得到训练后的图网络模型,这样,有利于后续步骤中,通过图网络模型为用户推荐用户感兴趣的视频,进而为用户推荐的视频具有多样性,能够满足用户的视频观看需求。
附图说明
70.图1是根据一示例性实施例示出的一种图网络模型训练方法的流程图;
71.图2是根据一示例性实施例示出的一种视频推荐方法的流程图;
72.图3是根据一示例性实施例示出的一种图网络模型训练装置的框图;
73.图4是根据一示例性实施例示出的一种视频推荐装置的框图;
74.图5是根据一示例性实施例示出的一种电子设备的框图;
75.图6是根据一示例性实施例示出的一种用于训练图网络模型或推荐视频的装置的框图;
76.图7是根据一示例性实施例示出的另一种用于训练图网络模型或推荐视频的装置的框图。
具体实施方式
77.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
78.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
79.为了解决相关技术中存在的为用户推荐的视频较为单一,导致无法满足用户的视频观看需求的技术问题,本公开提供了图网络模型训练方法、视频推荐方法、装置及电子设备。
80.第一方面,将对本公开实施例提供的一种图网络模型训练方法进行详细介绍。
81.如图1所示,本公开实施例提供的一种图网络模型训练方法,可以包括如下步骤:
82.在步骤s11中,获取用户观看视频的历史行为数据。
83.具体的,可以获取大量用户观看视频的历史行为数据。其中,观看视频的历史行为数据可以包括:用户观看视频的视频id、用户观看视频的时刻,用户观看视频的时长,用户对视频的点击次数,用户对视频的观看次数,以及用户对视频的转发次数等等,本公开实施例对用户观看视频的历史行为数据不作具体限定
84.在步骤s12中,基于历史行为数据生成连通图。
85.其中,连通图中的节点的节点标识为视频标识,连通图中的边用于连接历史行为数据中具有直接相关性的视频标识所对应的节点,连通图中每条边的边权重用于表征该条边连接的两个节点的视频标识对应的视频的相关性大小。
86.具体的,在获取到用户观看视频的历史行为数据之后,可以将视频的视频标识作为连通图中节点的节点标识,并基于用户观看视频的历史行为数据中同一用户交互的视频的视频id,将连通图中的节点连接起来。例如,同一用户交互的视频的视频标识有视频1和视频2,那么,视频1与视频2具有直接相关性,因此,可以将视频1对应的节点和视频2对应的节点连起来作为连通图的一条边。再例如,同一用户在对视频标识为视频3的视频点赞的同时,还对视频标识为视频4的视频进行了点赞,那么,视频3与视频4具有直接相关性,可以将视频3对应的节点和视频4对应的节点连起来作为连通图的一条边。当然,本公开实施例对如何生成连通图的边不做具体限定。
87.并且,连通图中的每条边可以具有边权重,边权重用于表征该条边连接的两个节点的视频标识对应的视频的相关性大小。可以理解的是,一条边的边权重越大,说明该条边
连接的两个节点的视频标识对应的视频的相关性越大,否则,说明该条边连接的两个节点的视频标识对应的视频的相关性越小。
88.例如,观看视频标识为视频标识1的视频的用户,大多也观看了视频标识为视频标识2的视频,说明具有视频标识1的视频与具有视频标识2的视频的相关性较高,因此,可以为连接视频标识1的节点与视频标识2的节点的边赋予较高的边权重。当然,这里只是举例说明了确定边权重的一种实现方式,本公开实施例对确定边权重的具体实现方式不做具体限定。并且,为了方案描述清楚,将在下面实施例中对确定连通图中每条边的边权重的具体实现方式进行阐述。
89.在步骤s13中,根据连通图中视频标识之间的相关性以及相关性大小,确定与各视频标识相关联的视频标识。
90.具体的,视频标识之间的相关性可以包括:视频标识之间的直接相关性以及间接相关性,视频标识之间的间接相关性用于表示视频标识通过连通图中的多条边间接相连接。
91.具体的,如果连通图中的两个节点通过边直接相连,说明这两个节点对应的视频标识具有直接相关性;如果连通图中的两个节点通过边间接相连,说明这两个节点对应的视频标识具有间接相关性。
92.举例而言,视频标识1对应的节点与视频标识2对应的节点通过边直接相连,视频标识2对应的节点与视频标识3对应的节点也通过边直接相连。那么,视频标识1与视频标识2具有直接相关性,视频标识2与视频标识3也具有直接相关性,视频标识1与视频标识3具有间接相关性。视频标识2和视频标识3均是视频标识1相关联的视频标识。
93.在一种实施方式中,根据连通图中视频标识之间的相关性以及相关性大小,确定与各视频标识相关联的视频标识,可以包括如下步骤,分别为步骤a1和步骤a2:
94.步骤a1,对于连通图中的任一视频标识,根据该视频标识与其他视频标识之间的直接相关性,直接相关性的相关性大小,间接相关性以及间接相关性的相关性大小,利用随机游走方式确定该视频标识对应的随机游走序列。
95.具体的,在生成连通图之后,对于连通图中的任一视频标识,可以根据连通图中连接该视频标识对应的节点与其他视频标识对应的节点的边以及边权重,通过随机游走方式确定该视频标识对应的随机游走序列。
96.需要说明的是,本领域技术人员可以理解通过随机游走方式得到每个视频标识对应的随机游走序列的具体实现方式,在此不再赘述。
97.步骤a2,对于连通图中的任一视频标识,将该视频标识对应的随机游走序列中的各个视频标识,确定为与该视频标识相关联的视频标识。
98.具体的,在得到连通图中任一视频标识对应的随机游走序列之后,可以将随机游走序列中的各个视频标识确定为与该视频标识相关联的视频标识,并将不在随机游走序列中的视频标识确定为与该视频标识不相关联的视频标识。
99.在步骤s14中,对于每一视频标识,将与该视频标识相关联的视频标识确定为正样本数据,将与该视频标识不相关联的视频标识确定为负样本数据。
100.可以理解的是,训练图网络模型需要采集大量的样本数据,对于每一视频标识,可以将与视频标识相关联的视频标识确定为正样本数据,即可以为与视频标识相关联的视频
标识打上1的标签;并可以将与视频标识不相关联的视频标识确定为负样本数据,即可以为与视频标识不相关联的视频标识打上0的标签。
101.在步骤s15中,利用将正样本数据与负样本数据对图网络模型进行训练,得到训练后的图网络模型,以通过训练后的图网络模型提取视频标识对应的视频向量。
102.具体的,在收集了大量正样本数据与负样本数据之后,可以将正样本数据与负样本数据输入到图网络模型中,采用图神经网络gnn算法对图网络模型进行有监督训练。可以理解的是,在将正样本数据输入图网络模型后,从图网络模型输出的标签为1;在将负样本数据输入图网络模型后,从图网络模型输出的标签为0,说明得到了训练后的图网络模型,也就是说,在图网络模型对正样本数据与负样本数据的识别准确度大于预设准确度时,说明得到了训练后的图网络模型,以在为用户推荐视频时,通过训练后的图网络模型提取视频标识对应的视频向量。
103.并且,为了使得所得到的训练后的图网络模型更加准确,可以对图网络模型进行评估。并在图网络模型满足预设条件时,得到训练后的图网络模型。其中,预设条件用于表征图网络模型对正样本数据与负样本数据的识别准确度大于预设准确度。
104.在一种实现方式中,预设条件可以为图网络模型的损失函数的损失值小于预设损失值。也就是说,在图网络模型的损失函数的损失值小于预设损失值时,将图网络模型确定为训练后的图网络模型。
105.具体的,可以为图网络模型设置一个损失函数,如果图网络模型的损失函数的损失值小于预设损失值,说明图网络模型的损失函数的损失值较小,图网络模型的识别准确度较高,此时,可以将图网络模型确定为训练后的图网络模型。如果图网络模型的损失函数的损失值大于预设损失值,说明图网络模型的损失函数的损失值较大,图网络模型的识别准确度较低,此时,需要继续对图网络模型进行训练,即调整图网络模型的模型参数,直至图网络模型的损失函数的损失值小于预设损失值。
106.需要说明的是,本公开实施例对预设损失值的大小不做具体限定。
107.在另一种实现方式中,预设条件可以为图网络模型所确定的相关联视频标识对应的视频描述信息之间的语义相似度大于第一预设相似度。也就是说,在图网络模型所确定的相关联视频标识对应的视频描述信息之间的语义相似度大于第一预设相似度时,将图网络模型确定为训练后的图网络模型。
108.在该实施方式中,在图网络模型确定两个视频标识为相关联视频标识时,可以计算这两个视频标识对应的视频的视频描述信息之间的语义相似度是否大于第一预设相似度,如果语义相似度大于第一预设相似度,说明图网络模型所确定的相关联的视频标识的准确度较高,此时,可以将图网络模型确定为训练后的图网络模型。例如,如果两个视频均为美妆类视频,那么,这两个视频的视频描述信息之间的语义相似度较高,即大于第一预设相似度。如果语义相似度小于第一预设相似度,说明图网络模型所确定的相关联的视频标识的准确度较低,此时,需要继续对图网络模型进行训练,即调整图网络模型的模型参数,直至图网络模型所确定的相关联视频标识对应的视频描述信息之间的语义相似度大于第一预设相似度。
109.需要说明的是,本公开实施例对第一预设相似度的大小不做具体限定。在再一种实现方式中,预设条件可以为将图网络模型所确定的相关联视频标识对应的视频向量降维
后,降维后的视频向量的相似度大于第二预设相似度,也就是说,在将图网络模型所确定的相关联视频标识对应的视频向量降维后,降维后的视频向量的相似度大于第二预设相似度时,将图网络模型确定为训练后的图网络模型。
110.具体的,在将正样本数据与负样本数据输入图网络模型之后,图网络模型可以提取正样本数据与负样本数据对应的向量,即提取视频标识对应的视频向量。在实际应用中,所提取的视频标识对应的视频向量的维度可以为128,可以将128维的视频向量降维到二维的视频向量,如果两个相关联视频标识降维后的视频向量的相似度大于第二预设相似度,说明图网络模型所提取的视频标识对应的视频向量的准确度较高,此时,可以将图网络模型确定为训练后的图网络模型。如果两个相关联视频标识降维后的视频向量的相似度小于第二预设相似度,说明图网络模型所提取的视频标识对应的视频向量的准确度较低,此时,需要继续对图网络模型进行训练,即调整图网络模型的模型参数,直至降维后的视频向量的相似度大于第二预设相似度。
111.需要说明的是,本公开实施例对第二预设相似度的大小不做具体限定。
112.可以理解的是,可以采用上述任一种实施方式对图网络模型进行评估。当然,为了提高图网络模型的准确度,可以同时采用上述三种实施方式对图网络模型进行评估,这都是合理的。
113.可见,通过本公开实施例提供的技术方案,可以基于用户观看视频的历史行为数据生成连通图,并根据所生成的连通图进行图网络模型训练,得到训练后的图网络模型,这样,有利于后续步骤中,通过图网络模型为用户推荐用户感兴趣的视频,进而为用户推荐的视频具有多样性,能够满足用户的视频观看需求。
114.为了方案描述清楚,将在下面实施例中对确定连通图中每条边的边权重的具体实现方式进行阐述。
115.在一种实施方式中,连通图为有向连通图,连通图中的边为有向边,有向边的方向是根据历史行为数据中用户对视频的视频交互顺序确定的;
116.此时,确定连通图中每条边的边权重,可以包括如下步骤:
117.对于有向连通图中的任意一条有向边,按照如下公式确定该条有向边的边权重:
118.edge_weight=edge_number/math.log10(dst_node_popularity a);
119.其中,edge_weight为该条有向边的边权重,edge_number为该条有向边的起点对应的连接边数和终点对应的连接边数之和,dst_node_popularity为该条有向边的终点的视频标识对应的视频的热度,a为常数。
120.在该实施方式中,连通图为有向连通图,有向连通图中有向边的方向是根据历史行为数据中用户对视频的视频交互顺序确定的,举例而言,用户观看视频的历史行为数据中显示用户先观看了视频标识1对应的视频,后观看了视频标识2对应的视频,那么,连接视频标识1对应的节点与视频标识2对应的节点的有向边的方向可以为:视频标识1对应的节点指向视频标识2对应的节点。
121.为了解决边权重的大小对图网络模型的影响,在计算边权重时,可以对连通图中的热门节点做降权处理,可以利用公式edge_weight=edge_number/math.log10(dst_node_popularity a)计算每一条边的边权重,从该公式可以看出,通过将dst_node_popularity a设置为计算边权重的分母,可以实现对连通图中的热门节点做降权处理的目
的,从而所得的边权重更加准确。
122.可见,通过本实施方式,计算所得的有向连通图中有向边的边权重更加准确,以减少边权重对图网络模型准确度的影响。
123.第二方面,将对本公开实施例提供的一种视频推荐方法进行详细介绍。
124.如图2所示,本公开实施例提供的一种视频推荐方法,可以包括如下步骤:
125.在步骤s21中,将各个视频的视频标识输入第一方面所述的训练后的图网络模型,得到各个视频的视频标识对应的视频向量。
126.具体的,由第一方面的描述可知,训练后的图网络模型可以准确地提取视频标识对应的视频向量,因此,在为目标用户推荐视频时,可以将各个视频的视频标识输入到训练后的图网络模型中,图网络模型接收到各个视频的视频标识后,可以提取各个视频的视频标识对应的视频向量,进而得到各个视频的视频标识对应的视频向量。
127.在步骤s22中,基于目标用户历史交互过的视频的视频标识对应的视频向量,确定目标用户对应的目标用户向量。
128.具体的,目标用户可以是观看视频的任一用户。在得到各个视频的视频标识对应的视频向量后,即可以得到目标用户历史交互过的视频的视频标识对应的视频向量,为了准确地得到目标用户对应的目标用户向量,可以对目标用户历史交互过的视频的视频对应的视频向量进行池化操作,得到目标用户对应的目标用户向量。
129.在一种实施方式中,基于目标用户历史交互过的视频的视频标识对应的视频向量,确定目标用户对应的目标用户向量,可以包括如下步骤:
130.将目标用户历史交互过的视频的视频标识对应的视频向量进行加权求和,得到加权后的视频向量;
131.将加权后的视频向量确定为目标用户对应的目标用户向量。
132.在该实施方式中,在确定目标用户对应的目标用户向量时,可以对目标用户历史交互过的视频的视频标识对应的视频向量进行加权求和,得到加权后的视频向量,并将加权后的视频向量确定为目标用户对应的目标用户向量。
133.其中,在进行加权求和时,一个视频标识对应的视频向量的加权系数可以根据目标用户与具有该视频标识的视频的交互紧密度确定。举例而言,目标用户对某一视频进行多次观看、点赞或者评论,则可以确定该视频的视频标识的加权系数较大;如果目标用户对某一视频只是进行一次观看,且没有点赞或者评论等行为,则可以确定该视频的视频标识的加权系数较小。
134.当然,上述只是以举例的形式说明了如何确定视频标识对应的视频向量的加权系数的大小,在实际应用中,还可以根据实际情况确定各个视频标识对应的视频向量的加权系数,本公开实施例对此不做具体限定。
135.在步骤s23中,计算目标用户向量与各个视频的视频标识对应的视频向量之间的相似度。
136.在得到各个视频的视频标识对应的视频向量,以及目标用户对应的目标用户向量后,可以计算目标用户向量与各个视频的视频标识对应的视频向量之间的相似度。可以理解的是,目标用户向量与一个视频的视频标识对应的视频向量之间的相似度越高,说明目标用户喜欢观看该视频的概率越大;相反地,目标用户向量与一个视频的视频标识对应的
视频向量之间的相似度越低,说明目标用户喜欢观看该视频的概率越小。
137.在实际应用中,由于目标用户的数量较多,目标用户对应的目标用户向量的数量也较多,且视频的视频标识对应的视频向量的数量也较多,因此,为了降低计算相似度时的计算量,在一种实现方式中,计算目标用户向量与各个视频的视频标识对应的视频向量之间的相似度,可以包括如下步骤:
138.通过近似最邻近方法计算计算目标用户向量与各个视频的视频标识对应的视频向量之间的相似度。
139.在该实现方式中,可以通过近似最邻近方法ann计算目标用户向量与视频向量之间的相似度,这样,在确保计算相似度准确度的情况下,还可以降低计算量,并且,可以提高计算相似度的速率。
140.在步骤s24中,为目标用户推荐相似度大于预定相似度的视频标识对应的视频。
141.由上述描述可知,目标用户向量与一个视频的视频标识对应的视频向量之间的相似度越高,说明目标用户喜欢观看该视频的概率越大,因此,可以为目标用户推荐相似度大于预定相似度的视频标识对应的视频,这样,为目标用户推荐的视频是目标用户感兴趣的视频的概率较高,并且为目标用户推荐的视频具有多样性,能够满足用户的视频观看需求。
142.本公开实施例提供的技术方案,将各个视频的视频标识输入训练后的图网络模型,得到各个视频的视频标识对应的视频向量;基于目标用户历史交互过的视频的视频标识对应的视频向量,确定目标用户对应的目标用户向量;计算目标用户向量与各个视频的视频标识对应的视频向量之间的相似度;并为目标用户推荐相似度大于预定相似度的视频标识对应的视频。可见,通过本公开实施例提供的技术方案,为目标用户推荐的视频是目标用户感兴趣的视频的概率较高,并且为目标用户推荐的视频具有多样性,能够满足目标用户的视频观看需求。
143.根据本公开实施例的第三方面,提供了一种图网络模型训练装置,如图3所示,包括:
144.历史行为数据获取模块310,被配置为执行获取用户观看视频的历史行为数据;
145.连通图生成模块320,被配置为执行基于所述历史行为数据生成连通图,其中,所述连通图中的节点的节点标识为视频标识,所述连通图中的边用于连接所述历史行为数据中具有直接相关性的视频标识所对应的节点,所述连通图中每条边的边权重用于表征该条边连接的两个节点的视频标识对应的视频的相关性大小;
146.视频标识确定模块330,被配置为执行根据所述连通图中视频标识之间的相关性以及相关性大小,确定与各视频标识相关联的视频标识;
147.样本数据确定模块340,被配置为执行对于每一视频标识,将与该视频标识相关联的视频标识确定为正样本数据,将与该视频标识不相关联的视频标识确定为负样本数据;
148.图网络模型训练模块350,被配置为执行利用所述正样本数据与所述负样本数据对所述图网络模型进行训练,得到训练后的图网络模型,以通过所述训练后的图网络模型提取视频标识对应的视频向量。
149.可见,通过本公开实施例提供的技术方案,可以基于用户观看视频的历史行为数据生成连通图,并根据所生成的连通图进行图网络模型训练,得到训练后的图网络模型,这样,有利于后续步骤中,通过图网络模型为用户推荐用户感兴趣的视频,进而为用户推荐的
视频具有多样性,能够满足用户的视频观看需求。
150.可选的,所述视频标识之间的相关性包括:视频标识之间的直接相关性以及间接相关性,视频标识之间的间接相关性用于表示视频标识通过所述连通图中的多条边间接相连接;
151.所述视频标识确定模块,具体被配置为执行:
152.对于所述连通图中的任一视频标识,根据该视频标识与其他视频标识之间的直接相关性,直接相关性的相关性大小,间接相关性以及间接相关性的相关性大小,利用随机游走方式确定该视频标识对应的随机游走序列;
153.对于所述连通图中的任一视频标识,将该视频标识对应的随机游走序列中的各个视频标识,确定为与该视频标识相关联的视频标识。
154.可选的,所述连通图为有向连通图,所述连通图中的边为有向边,所述有向边的方向是根据历史行为数据中用户对视频的视频交互顺序确定的;
155.所述连通图生成模块,具体被配置为执行:
156.对于有向连通图中的任意一条有向边,按照如下公式确定该条有向边的边权重:
157.edge_weight=edge_number/math.log10(dst_node_popularity a);
158.其中,edge_weight为该条有向边的边权重,edge_number为该条有向边的起点对应的连接边数和终点对应的连接边数之和,所述dst_node_popularity为该条有向边的终点的视频标识对应的视频的热度,所述a为常数。
159.可选的,在所述图网络模型满足预设条件时,得到所述训练后的图网络模型,其中,所述预设条件用于表征所述图网络模型对所述正样本数据与所述负样本数据的识别准确度大于预设准确度;
160.所述预设条件包括以下条件中的至少一种:
161.所述图网络模型的损失函数的损失值小于预设损失值;所述图网络模型所确定的相关联视频标识对应的视频描述信息之间的语义相似度大于第一预设相似度;以及,将所述图网络模型所确定的相关联视频标识对应的视频向量降维后,降维后的视频向量的相似度大于第二预设相似度。
162.根据本公开实施例的第四方面,提供了一种视频推荐装置,如图4所示,包括:
163.视频向量获取模块410,被配置为执行将各个视频的视频标识输入第三方面所述的训练后的图网络模型,得到各个视频的视频标识对应的视频向量;
164.用户向量确定模块420,被配置为执行基于目标用户历史交互过的视频的视频标识对应的视频向量,确定所述目标用户对应的目标用户向量;
165.相似度计算模块430,被配置为执行计算所述目标用户向量与各个视频的视频标识对应的视频向量之间的相似度;
166.视频推荐模块440,被配置为执行为所述目标用户推荐相似度大于预定相似度的视频标识对应的视频。
167.本公开实施例提供的技术方案,将各个视频的视频标识输入训练后的图网络模型,得到各个视频的视频标识对应的视频向量;基于目标用户历史交互过的视频的视频标识对应的视频向量,确定目标用户对应的目标用户向量;计算目标用户向量与各个视频的视频标识对应的视频向量之间的相似度;并为目标用户推荐相似度大于预定相似度的视频
标识对应的视频。可见,通过本公开实施例提供的技术方案,为目标用户推荐的视频是目标用户感兴趣的视频的概率较高,并且为目标用户推荐的视频具有多样性,能够满足目标用户的视频观看需求。
168.可选的,所述用户向量确定模块,具体被配置为执行:
169.将目标用户历史交互过的视频的视频标识对应的视频向量进行加权求和,得到加权后的视频向量;
170.将所述加权后的视频向量确定为所述目标用户对应的目标用户向量。
171.可选的,所述相似度计算模块,具体被配置为执行:
172.通过近似最邻近装置计算计算所述目标用户向量与各个视频的视频标识对应的视频向量之间的相似度。
173.根据本公开实施例的第五方面,提供了一种电子设备,如图5所示,包括:
174.处理器510;
175.用于存储所述处理器可执行指令的存储器520;
176.其中,所述处理器被配置为执行所述指令,以实现第一方面所述的图网络模型训练方法,或者,第二方面所述的视频推荐方法。
177.可见,通过本公开实施例提供的技术方案,可以基于用户观看视频的历史行为数据生成连通图,并根据所生成的连通图进行图网络模型训练,得到训练后的图网络模型,这样,有利于后续步骤中,通过图网络模型为用户推荐用户感兴趣的视频,进而为用户推荐的视频具有多样性,能够满足用户的视频观看需求。
178.图6是根据一示例性实施例示出的一种用于训练图网络模型或推荐视频的装置600的框图。例如,装置600可以被提供为一服务器。参照图6,装置600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行第一方面所述的图网络模型训练方法,或者,第二方面所述的视频推荐方法。。
179.装置600还可以包括一个电源组件626被配置为执行装置600的电源管理,一个有线或无线网络接口650被配置为将装置600连接到网络,和一个输入输出(i/o)接口658。装置600可以操作基于存储在存储器632的操作系统,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm或类似。
180.可见,通过本公开实施例提供的技术方案,可以基于用户观看视频的历史行为数据生成连通图,并根据所生成的连通图进行图网络模型训练,得到训练后的图网络模型,这样,有利于后续步骤中,通过图网络模型为用户推荐用户感兴趣的视频,进而为用户推荐的视频具有多样性,能够满足用户的视频观看需求。
181.图7是根据一示例性实施例示出的一种用于训练图网络模型或推荐视频的装置700的框图。例如,装置700可以是移动电话,计算机,数字广播电子设备,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
182.参照图7,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电力组件706,多媒体组件708,音频组件710,输入/输出(i/o)的接口712,传感器组件714,以及通信组件716。
183.处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
184.存储器704被配置为存储各种类型的数据以支持在设备700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。
185.电源组件707为装置700的各种组件提供电力。电源组件707可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
186.多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当设备700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
187.音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(mic),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
188.i/o接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
189.传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到设备700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
190.通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如wifi,运营商网络(如2g、3g、4g或5g),或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理系统的广
播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。
191.在示例性实施例中,装置700可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行第一方面所述的图网络模型训练方法,或者,第二方面所述的视频推荐方法。
192.在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述方法。可选地,例如,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性非临时性计算机可读存储介质计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。
193.可见,通过本公开实施例提供的技术方案,可以基于用户观看视频的历史行为数据生成连通图,并根据所生成的连通图进行图网络模型训练,得到训练后的图网络模型,这样,有利于后续步骤中,通过图网络模型为用户推荐用户感兴趣的视频,进而为用户推荐的视频具有多样性,能够满足用户的视频观看需求。
194.根据本公开实施例的第八方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机实现第一方面所述的图网络模型训练方法,或者,第二方面所述的视频推荐方法。
195.可见,通过本公开实施例提供的技术方案,可以基于用户观看视频的历史行为数据生成连通图,并根据所生成的连通图进行图网络模型训练,得到训练后的图网络模型,这样,有利于后续步骤中,通过图网络模型为用户推荐用户感兴趣的视频,进而为用户推荐的视频具有多样性,能够满足用户的视频观看需求。
196.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
197.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献