一种视频推荐方法、装置、计算机设备和存储介质与流程

2023-01-14 17:41:52 来源：中国专利 TAG：

1.本技术实施例涉及计算机技术领域，具体涉及一种视频推荐方法、装置、计算机设备和存储介质。

背景技术：

2.如今，人们越来越喜欢在youtube、instagram、抖音、快手等社交媒体平台上分享记录日常生活或个人喜好的个人视频。
3.在这些个人视频中，经过精心编辑并总结了特定事件要点的视频对观众更具吸引力。但是，在大多数情况下，个人视频的原始视频中包含许多与要点无关的内容，对原始视频中的要点进行手动剪辑是一项繁重且耗时的任务。因此，如何利用人工智能技术来自动进行视频精彩片段检测，提高视频编辑的效率，以更好地服务于人们是目前发展的趋势。
4.目前，人工智能技术利用视频高光检测(video highlight detection，vhd)技术对原始视频的要点进行提取，也即从原始视频中提取最有趣的片段或帧。视频高光检测技术在体育赛事、电子竞技等领域中，受到越来越广泛的应用。
5.但是，在确定原始视频的要点时，是比较主观的，是基于用户的偏好来进行确定的，而且，同一个用户的偏好可能会发生改变，对于相同的原始视频，不同的用户可能具有不同的高光偏好，例如，对于体育比赛视频，有部分用户更喜欢计分视频片段，有部分用户则喜欢团队合作视频片段，因而出现了个性化的视频高光检测(personalized video highlight detection，p-vhd)问题。针对该个性化的视频高光检测问题，需要通过提取高光视频片段，并且适应不同用户个性化的偏好来解决。
6.从高光视频片段的层面上讲，目前的视频推荐方法只使用了用户历史浏览视频中的高光视频片段来对用户的偏好进行归纳，没有利用到历史浏览视频中的非高光视频片段，不能够全面客观地归纳出用户的偏好，从而无法准确地判定用户的偏好。从偏好的层面上讲，目前的视频推荐方法一般是基于用户只有一个偏好的假设，即将用户的历史浏览视频视为整体信息来预测用户的偏好。但是，由于同一个用户的兴趣可能具有多种，例如，同一个用户的兴趣有旅行、游泳、养宠物等，如此一来，将用户的历史浏览视频视为整体信息提取一种整体偏好来代表用户的多种兴趣是不合理的，这也无法准确地判断用户的偏好。因而导致现有技术视频推荐的准确性不高。

技术实现要素：

7.本技术实施例提供一种视频推荐方法、装置、计算机设备和存储介质，能够提高视频推荐的准确性。
8.一种视频推荐方法，包括：
9.获取目标对象的历史浏览视频和待推荐视频，历史浏览视频包括至少两个视频帧；
10.对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段，目
标视频片段包括高光视频帧和非高光视频帧；
11.对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息；
12.根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度；
13.根据相似度从至少一个目标视频片段中选择参考视频片段；
14.从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段。
15.相应的，本技术实施例提供一种视频推荐装置，包括：
16.获取单元，用于获取目标对象的历史浏览视频和待推荐视频，历史浏览视频包括至少两个视频帧；
17.识别单元，用于对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段，目标视频片段包括高光视频帧和非高光视频帧；
18.提取单元，用于对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息；
19.计算单元，用于根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度；
20.选择单元，用于根据相似度从至少一个目标视频片段中选择参考视频片段；
21.推荐单元，用于从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段。
22.在一些实施例中，提取单元，可以用于对目标视频片段内的视频帧进行特征提取，得到视频特征；对视频特征进行特征映射处理，以生成目标视频片段对应的特征信息。
23.在一些实施例中，提取单元，具体可以用于对目标视频片段进行视频片段特征提取，得到初始视频特征；对目标视频片段中的高光视频帧进行视频帧特征提取，得到高光视频特征；对目标视频片段中的非高光视频帧进行视频帧特征提取，得到非高光视频特征；根据初始视频特征、高光视频特征和非高光视频特征生成视频特征。
24.在一些实施例中，提取单元，具体可以用于对初始视频特征进行特征映射处理，得到初始特征信息；对高光视频特征进行特征映射处理，得到高光特征信息；对非高光视频特征进行特征映射处理，得到非高光特征信息；将初始特征信息、高光特征信息和非高光特征信息进行融合，得到目标视频片段对应的特征信息。
25.在一些实施例中，提取单元，具体可以用于将初始特征信息和高光特征信息进行融合，得到融合后的高光特征信息；将初始特征信息和非高光特征信息进行融合，得到融合后的非高光特征信息；将融合后的高光特征信息和融合后的非高光特征信息进行融合，得到目标视频片段对应的特征信息。
26.在一些实施例中，识别单元，具体可以用于对历史浏览视频进行切分，得到候选视频片段；对候选视频片段中视频帧的标签进行高光视频帧识别，得到至少一个目标视频片段。
27.在一些实施例中，选择单元，具体可以用于根据目标视频片段的初始特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的初始相似度；根据初始相
似度对相似度进行优化，得到优化后的相似度；根据优化后的相似度，从至少一个目标视频片段中选择参考视频片段。
28.本技术实施例可以获取目标对象的历史浏览视频和待推荐视频，历史浏览视频包括至少两个视频帧；对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段，目标视频片段包括高光视频帧和非高光视频帧；对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息；根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度；根据相似度从至少一个目标视频片段中选择参考视频片段；从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段；由于本技术实施例能够通过基于对历史浏览视频中进行高光识别，得到包括高光视频帧和非高光视频帧的至少一个目标视频片段，其一方面，充分利用历史浏览视频中的非高光视频帧，另一方面，所得到的至少一个目标视频片段可以满足用户具有至少一种偏好的需求，从而提高视频推荐的准确性。
附图说明
29.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术实施例的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
30.图1是本技术实施例提供的视频推荐方法的场景示意图；
31.图2是本技术实施例提供的视频推荐方法的流程示意一图；
32.图3是本技术实施例提供的得到至少一个目标视频片段的流程示意图；
33.图4是本技术实施例提供的对目标视频片段内的视频帧进行特征提取的流程示意图；
34.图5是本技术实施例提供的得到视频特征的流程示意图；
35.图6是本技术实施例提供的得到目标视频片段的特征信息的流程示意图；
36.图7是本技术实施例提供的将初始特征信息、高光特征信息和非高光特征信息进行融合的流程示意图；
37.图8是本技术实施例提供的对相似度进行优化的流程示意图；
38.图9是本技术实施例提供的pacnet算法框架图；
39.图10是本技术实施例提供的视频推荐方法的流程示意二图；
40.图11是本技术实施例提供的对视频特征进行特征映射处理，以生成目标视频片段对应的特征信息的示意图；
41.图12是本技术实施例提供的计算机设备根据相似度从至少一个目标视频片段中选择参考视频片段的示意图。
42.图13是本技术实施例提供的pacnet算法的推荐结果与现有技术采用高光检测基线算法的推荐结果的效果对比图。
43.图14是本技术实施例提供的视频推荐装置的结构示意图；
44.图15是本技术提供的计算机设备的结构示意图。
具体实施方式
45.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术实施例一部分实施例，而不是全部的实施例。基于本技术实施例中，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术实施例保护的范围。
46.本技术实施例提供一种视频推荐方法、装置、计算机设备和存储介质。其中，该视频推荐装置可以集成在计算机设备中，该计算机设备可以是服务器，也可以是终端等设备。
47.其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(content delivery network，cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能电视机等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本技术实施例在此不做限制。
48.本技术实施例涉及人工智能(artificial intelligence，ai)，人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。
49.人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
50.例如，参见图1，以视频推荐装置集成在智能手机中为例，智能手机可以通过安装于智能手机上的视频应用获取目标对象的历史浏览视频和待推荐视频，历史浏览视频包括至少两个视频帧；对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段，目标视频片段包括高光视频帧和非高光视频帧；对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息；根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度；根据相似度从至少一个目标视频片段中选择参考视频片段；从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并通过该视频应用向目标对象推荐目标推荐视频片段。
51.其中，目标对象是指被提供视频推荐服务的对象。例如，目标对象可以是终端、登录在终端的通信账号。
52.其中，历史浏览视频是指目标对象在历史时间内浏览过的视频，该历史时间可以是历史时间内的某一个时间段，该历史时间也可以是所有的历史时间。例如，当历史时间为历史时间内的某一个时间段时，确定历史浏览视频为目标对象在该时间段内浏览过的视频，比如，历史时间为近一个月，确定历史浏览视频为目标对象在近一个月内浏览过的视频。例如，当历史时间为所有的历史时间时，确定历史浏览视频为目标对象在所有的历史时
间内浏览过的视频。
53.历史浏览视频中携带属性信息，该属性信息表征用户的偏好，例如，属性信息包括悬疑剧、科幻剧、神话剧、警匪剧、现代剧、古装剧、动画剧、搞笑视频、美食视频、时尚视频、旅游视频、娱乐视频、生活视频等信息。不同的历史浏览视频可以携带相同的属性信息，也可以携带不同的属性信息。例如，视频推荐装置接收到多个历史浏览视频，所有的历史浏览视频可以携带相同的属性信息；不同的历史浏览视频可以携带不同的属性信息；多个历史浏览视频中可以一部分历史浏览视频均携带相同的属性信息，另一部分历史浏览视频中的每一个历史浏览视频携带不同的属性信息。
54.其中，待推荐视频可以是视频推荐装置获取到的任一个视频。待推荐视频可以是某一平台上的热点视频，也可以是和目标对象的历史浏览视频的属性信息相同或相似的视频。
55.如图2所示，以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。
56.101、获取目标对象的历史浏览视频和待推荐视频。
57.其中，目标对象是指被提供视频推荐服务的对象。例如，目标对象可以是终端、登录在终端的通信账号等被提供视频推荐服务的对象。
58.其中，历史浏览视频包括至少两个视频帧。历史浏览视频是指用户通过目标对象在历史时间内浏览过的视频，该历史时间可以是历史时间内的某一个时间段，该历史时间也可以是所有的历史时间。例如，当历史时间为历史时间内的某一个时间段时，确定历史浏览视频为用户通过目标对象在该时间段内浏览过的视频，比如，历史时间为近一个月，确定历史浏览视频为用户通过目标对象在近一个月内浏览过的视频。例如，当历史时间为所有的历史时间时，确定历史浏览视频为用户通过目标对象在所有的历史时间内浏览过的视频。
59.历史浏览视频中携带属性信息，该属性信息表征用户的偏好，例如，属性信息包括悬疑剧、科幻剧、神话剧、警匪剧、现代剧、古装剧、动画剧、搞笑视频、美食视频、时尚视频、旅游视频、娱乐视频、生活视频等信息。不同的历史浏览视频可以携带相同的属性信息，也可以携带不同的属性信息。
60.其中，待推荐视频包括多个视频帧，待推荐视频可以是视频推荐装置获取到的任一个视频。待推荐视频可以是某一平台上的热点视频，也可以是和目标对象的历史浏览视频的属性信息相同或相似的视频，也可以是其他用户的视频，也可以是用户自己的视频，这些都可以根据实际的需求进行设定。
61.102、对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段。
62.其中，用户偏好可以根据历史浏览视频中的视频帧进行推断。目标视频片段包括高光视频帧和非高光视频帧。高光视频帧是用户偏好的视频帧。非高光视频帧不是用户偏好的视频帧。
63.例如，历史浏览视频中包括多个视频帧，多个视频帧中包括了高光视频帧和非高光视频帧，可以通过设定观看次数来确定视频帧为高光视频帧或非高光视频帧，例如，当视频帧的观看次数大于或等于设定阈值时，确定该视频帧为高光视频帧；当视频帧的观看次
数小于设定阈值时，确定该视频帧为非高光视频帧。另外，确定出高光视频帧或非高光视频帧后，可以对高光视频帧或非高光视频帧设置标识或标签，以便于视频推荐装置对高光视频帧以及非高光视频帧进行识别。
64.非高光视频帧能够作为负样本使得本技术实施例所采用的神经网络更好地来对高光视频帧的特征信息进行提取，这是由于高光视频帧是相对于非高光视频帧存在的，通过非高光视频帧能够更好地界定高光视频帧，如果只利用高光视频帧来归纳用户的偏好，而忽略用户的非偏好，是不够客观准确的，因此，将非高光视频帧和高光视频帧来共同归纳用户的偏好，可以更加准确地表征用户的偏好，从而可以提高视频推荐的准确性，有利于减少错误推荐的概率。
65.其中，由于目标视频片段中的高光视频帧本身表征了用户的偏好，目标视频片段的数量包括有至少一个，如此可以满足用户具有至少一种偏好的需求。再者，若目标视频片段是对不同的历史浏览视频进行高光视频帧识别得到的，且不同的历史浏览视频若携带有不同的属性信息，则所得的至少一个目标视频片段也表征了用户的至少一个偏好，也即，可以满足用户具有至少一种偏好的需求。
66.具体地，如图3所示，得到至少一个目标视频片段的流程可以如下：
67.a1、对历史浏览视频进行切分，得到候选视频片段。
68.其中，采用固定的长度对该历史浏览视频进行切分，如此，可以得到至少一个长度固定的候选视频片段。当然，也可以采用任意的长度对该历史浏览视频进行切分，所得到的是至少一个长度不统一的候选视频片段。
69.其中，候选视频片段包括全部视频帧均为高光视频帧的视频片段、全部视频帧均为非高光视频帧的视频片段、视频帧包括高光视频帧和非高光视频帧的视频片段。
70.a2、对候选视频片段中视频帧的标签进行高光视频帧识别，得到至少一个目标视频片段。
71.其中，目标视频片段包括高光视频帧和非高光视频帧。高光视频帧的标签可以为1，非高光视频帧的标签可以为0，视频推荐装置若识别到视频帧的标签为1，则确定该视频帧为高光视频帧；视频推荐装置若识别到视频帧的标签为0，则确定该视频帧为非高光视频帧。
72.103、对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息。
73.其中，对目标视频片段内的视频帧进行特征提取，本技术实施例可以将目标视频片段内的视频帧经过神经网络中至少一层的特征提取层进行特征提取，每层特征提取层提取出对应的候选特征信息，该候选特征信息即为目标视频片段对应的特征信息；本技术实施例还可以将目标视频片段内的视频帧经过特征提取层以及输出层进行特征提取，从而得到目标视频片段对应的特征信息。也即，目标视频片段的特征信息可以是任意一层特征提取层或输出层得到的候选特征信息，这可以根据需求来进行确定，当然，其中，目标视频片段的特征信息更优选的是经过了更深层次的特征提取层提取的候选特征信息，如此所得到的目标视频片段的特征信息可以提高视频推荐的准确性。
74.具体地，如图4所示，对目标视频片段内的视频帧进行特征提取，具体流程如下：
75.b1、对目标视频片段内的视频帧进行特征提取，得到视频特征。
76.其中，通过神经网络的特征提取层对目标视频片段中的视频帧进行初步的特征提取，得到目标视频片段的候选视频特征信息，也即视频特征。此过程中，目标视频片段中的视频帧可以仅经过一层特征提取层进行特征提取，使得目标视频片段中的视频帧生成为视频特征。由于该目标视频片段包括高光视频帧以及非高光视频帧，因此，所得到的视频特征中包括高光视频特征以及非高光视频特征。
77.本技术实施例除了可以直接对目标视频片段直接进行特征提取之外，还可以对目标视频片段进行更深入地处理，具体地，如图5所示，得到视频特征的具体流程如下：
78.b11、对目标视频片段进行视频片段特征提取，得到初始视频特征。
79.其中，由于该目标视频片段包括高光视频帧以及非高光视频帧，因此，所得到的初始视频特征中包括高光视频特征以及非高光视频特征。
80.其中，本技术实施例可以基于视频帧的标识或标签对目标视频片段进行拆分处理，得到高光视频帧集合，以及非高光视频帧集合，以便于后续对高光视频帧进行视频帧特征提取，以及对非高光视频帧进行非高光视频帧特征提取。当然，本技术实施例可以不需要对目标视频片段进行拆分处理，直接对高光视频帧进行视频帧特征提取，以及直接对非高光视频帧进行视频帧特征提取。
81.b12、对目标视频片段中的高光视频帧进行视频帧特征提取，得到高光视频特征。
82.其中，本技术实施例可以基于高光视频帧的标识或标签从目标视频片段中提取高光视频帧，形成高光视频帧集合；对该高光视频帧集合进行视频帧特征提取，得到高光视频特征。
83.b13、对目标视频片段中的非高光视频帧进行视频帧特征提取，得到非高光视频特征。
84.其中，本技术实施例可以基于非高光视频帧的标识或标签从目标视频片段中提取非高光视频帧，形成非高光视频帧集合；对该非高光视频帧集合进行视频帧特征提取，得到非高光视频特征。
85.b14、根据初始视频特征、高光视频特征和非高光视频特征生成视频特征。
86.其中，本技术实施例可以对该初始视频特征、高光视频特征和非高光视频特征进行融合，从而生成视频特征，融合方式可以将初始视频特征、高光视频特征和非高光视频特征按照初始视频特征、高光视频特征和非高光视频特征的顺序进行拼接，也可以将初始视频特征、高光视频特征和非高光视频特征按照高光视频特征和非高光视频特征、初始视频特征的顺序进行拼接。
87.其中，本技术实施例也可以不对初始视频特征、高光视频特征和非高光视频特征做融合处理，初始视频特征、高光视频特征和非高光视频特征三者相互独立，也即，视频特征包括初始视频特征、高光视频特征和非高光视频特征。
88.b2、对视频特征进行特征映射处理，以生成目标视频片段对应的特征信息。
89.其中，该视频特征通过神经网络的输出层，该输出层可以是全连接层，得到特征信息。视频特征可以包括初始视频特征、高光视频特征和非高光视频特征。
90.本技术实施例除了可以将视频特征直接进行映射处理之外，还可以对视频特征进行更深入地处理，具体地，如图6所示，得到目标视频片段的特征信息的具体流程如下：
91.b21、对初始视频特征进行特征映射处理，得到初始特征信息。
92.其中，该初始视频特征可以通过神经网络输出层的映射处理，得到初始特征信息。由于初始视频特征是由目标视频片段经过特征提取所得到的，目标视频片段中包括高光视频帧和非高光视频帧，因此，所得到的初始视频特征中包括高光视频特征和非高光视频特征；由于初始特征信息是对初始视频特征进行特征映射处理得到的，因此，初始特征信息中包括高光特征信息以及非高光特征信息。
93.b22、对高光视频特征进行特征映射处理，得到高光特征信息。
94.其中，该高光视频特征可以通过神经网络输出层的映射处理，得到高光特征信息。
95.b23、对非高光视频特征进行特征映射处理，得到非高光特征信息。
96.其中，该非高光视频特征可以通过神经网络输出层的映射处理，得到非高光特征信息。
97.b24、将初始特征信息、高光特征信息和非高光特征信息进行融合，得到目标视频片段对应的特征信息。
98.其中，初始特征信息、高光特征信息和非高光特征信息均为特征向量。将初始特征信息、高光特征信息和非高光特征信息进行融合的方式可以有多种，例如，将初始特征信息、高光特征信息和非高光特征信息三者直接进行拼接；例如，将高光特征信息和非高光特征信息进行拼接后，再乘以初始特征信息，从而得到特征信息。
99.除上述之外，如图7所示，将初始特征信息、高光特征信息和非高光特征信息进行融合的方式具体可以为：
100.c1、将初始特征信息和高光特征信息进行融合，得到融合后的高光特征信息。
101.其中，将初始特征信息和高光特征信息进行融合的方式有多种，例如，将初始特征信息和高光特征信息相加，得到融合后的高光特征信息，如此，由于初始特征信息中包括高光特征信息以及非高光特征信息，因此，初始特征信息和高光特征信息相加可以增强高光特征信息在融合后的高光特征信息中的影响作用。例如，将初始特征信息和两倍的高光特征信息相加，得到融合后的高光特征信息，如此能够增强高光特征信息在融合后的高光特征信息中的影响作用。
102.c2、将初始特征信息和非高光特征信息进行融合，得到融合后的非高光特征信息。
103.同理，其中，将初始特征信息和非高光特征信息进行融合的方式有多种，例如，将初始特征信息和非高光特征信息相加，得到融合后的非高光特征信息，如此，由于初始特征信息中包括高光特征信息以及非高光特征信息，因此，初始特征信息和非高光特征信息相加可以增强非高光特征信息在融合后的非高光特征信息中的影响作用。例如，将初始特征信息和两倍的非高光特征信息相加，得到融合后的非高光特征信息，如此能够增强非高光特征信息在融合后的非高光特征信息中的影响作用。
104.c3、将融合后的高光特征信息和融合后的非高光特征信息进行融合，得到目标视频片段对应的特征信息。
105.其中，将融合后的高光特征信息和融合后的非高光特征信息进行融合的方式可以有多种，例如，将融合后的高光特征信息和融合后的非高光特征信息进行拼接，如纵向拼接，从而得到该特征信息；例如，将融合后的高光特征信息和融合后的非高光特征信息进行相加，从而得到该特征信息。
106.其中，该特征信息也可以通过多模态的特征提取器来得到，此种情况下，所得到的
目标视频片段的特征信息为目标视频片段的融合特征，该融合特征可以为音频特征、人脸特征或动作特征等。
107.104、根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度。
108.其中，待推荐视频的特征信息可以通过至少一层神经网络的特征提取层进行特征提取得到。
109.其中，本技术实施例可以根据目标视频片段的特征信息和待推荐视频的特征信息，利用高斯核函数得到目标视频片段与待推荐视频之间的相似度；还可以根据目标视频片段的特征信息和待推荐视频的特征信息，利用余弦相似度得到目标视频片段与待推荐视频之间的相似度；还可以根据目标视频片段的特征信息和待推荐视频的特征信息，利用transformer神经网络得到目标视频片段与待推荐视频之间的相似度。
110.105、根据相似度从至少一个目标视频片段中选择参考视频片段。
111.其中，参考视频片段的数量有至少一个。由于每个目标视频片段与待推荐视频之间对应有一个相似度，因此，将相似度从高到低进行排序，相似度越高代表目标视频片段和待推荐视频越相似。按照从高到低的排序，从多个相似度中选出至少一个排序高的相似度，并从目标视频片段中得到与该排序高的相似度对应的参考视频片段。
112.例如，目标视频片段有三个，分别为第一目标视频片段、第二目标视频片段、第三目标视频片段。每个目标视频片段与待推荐视频之间对应有一个相似度，第一目标视频片段与待推荐视频之间的相似度为第一相似度，第二目标视频片段与待推荐视频之间的相似度为第二相似度，第三目标视频片段与待推荐视频之间的相似度为第三相似度。按相似度从高到低排序，第一相似度高于第二相似度，第二相似度高于第三相似度。本技术实施例可以为相似度设置预设阈值，如此，当相似度达到预设阈值，则该相似度为目标相似度，例如，第一相似度和第二相似度均达到预设阈值，则第一相似度和第二相似度均为目标目标相似度，从而筛选出第一相似度和第二相似度，并基于第一相似度，从目标视频片段中筛选出与第一相似度对应的参考视频片段；基于第二相似度，从目标视频片段中筛选出与第二相似度对应的参考视频片段。本技术实施例还预设参考视频片段的数量，例如，预设参考视频片段的数量为一个，此处不限于一个，则确定排序最高相似度对应的目标视频片段为参数视频片段。
113.其中，如图8所示，本技术实施例可以对该相似度进行优化，具体如下：
114.d1、根据目标视频片段的初始特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的初始相似度。
115.其中，对目标视频片段内的视频帧进行特征提取，可以经过神经网络中至少一层的特征提取层进行特征提取，每层特征提取层提取出对应的候选特征信息，目标视频片段的特征信息可以是任意一层特征提取层或输出层得到的候选特征信息。
116.在本技术实施例对相似度进行优化的情况下，相似度和初始相似度的计算，相似度采用的特征信息和初始相似度采用的初始特征信息分别为通过不同神经网络层得到目标视频片段的候选特征信息。例如，相似度采用更深层次的神经网络层，例如全连接层，得到目标视频片段的候选特征信息作为目标视频片段的特征信息，并将目标视频片段的特征信息和待推荐视频的特征信息进行计算得到；初始相似度通过较浅层次的神经网络层，例
如第一层特征提取层，得到目标视频片段的候选特征信息作为目标视频片段的初始特征信息，并将目标视频片段的初始特征信息和待推荐视频的特征信息进行计算得到。
117.另外，在本技术实施例对相似度进行优化的情况下，相似度和初始相似度的计算，可以采用不同的计算方式进行计算得到。例如，相似度是根据目标视频片段的特征信息和待推荐视频的特征信息，利用高斯核函数计算得到；初始相似度是根据目标视频片段的初始特征信息和待推荐视频的特征信息，利用余弦相似度计算得到。其中，目标视频片段的特征信息和目标视频片段的初始特征信息可以相同，也可以不同。
118.另外，在本技术实施例对相似度进行优化的情况下，相似度和初始相似度的计算，可以采用不同神经网络层得到的待推荐视频的候选特征信息作为待推荐视频的特征信息，并将目标视频片段的特征信息和待推荐视频的特征信息进行计算得到。例如，相似度采用较浅层的特征提取层得到待推荐视频的候选特征信息作为待推荐视频的特征信息，并将目标视频片段的特征信息和待推荐视频的特征信息进行计算得到；初始相似度采用较深层的特征提取层得到待推荐视频的候选特征信息作为待推荐视频的特征信息，并将目标视频片段的初始特征信息和待推荐视频的特征信息进行计算得到。其中，目标视频片段的特征信息和目标视频片段的初始特征信息可以相同，也可以不同。
119.d2、根据初始相似度对相似度进行优化，得到优化后的相似度。
120.其中，本技术实施例可以将初始相似度和相似度进行融合，以对相似度进行优化，从而得到优化后的相似度。例如，将初始相似度和相似度相加或相乘，以实现对相似度进行优化，如此可以提高视频推荐的准确性。
121.d3、根据优化后的相似度，从至少一个目标视频片段中选择参考视频片段。
122.106、从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段。
123.其中，基于参考视频片段和待推荐视频之间相似度，确定与参考视频片段相似的视频帧在待推荐视频中的位置，本技术实施例可以采用固定长度，对待推荐视频进行切分，从而得到具有与参考视频片段相似视频帧的目标推荐视频片段；本技术实施例也可以直接对与参考视频片段相似的视频帧进行切分并提取，生成目标推荐视频片段。目标推荐视频片段的数量至少有一个。
124.其中，向目标对象推荐该目标推荐视频片段之后，当目标对象为终端时，用户打开终端，终端可以接收到该目标推荐视频片段；当目标对象为登录账号时，用户登录该登录账号，该登录账号可以接收到该目标推荐视频片段。
125.本技术实施例可以获取目标对象的历史浏览视频和待推荐视频，历史浏览视频包括至少两个视频帧；对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段，目标视频片段包括高光视频帧和非高光视频帧；对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息；根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度；根据相似度从至少一个目标视频片段中选择参考视频片段；从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段；由于本技术实施例能够通过基于对历史浏览视频中进行高光识别，得到包括高光视频帧和非高光视频帧的至少一个目标视频片段，其一方面，充分利用历史浏览视频中的非高光视频帧，另一方面，所得到的至少一个目
标视频片段可以满足用户具有至少一种偏好的需求，从而能够提高视频推荐的准确性。
126.根据上面申请实施例所描述的方法，以下将举例作进一步详细说明。
127.在本技术实施例中，将以视频装置具体集成在计算机设备为例进行说明。首先要说明的是，本技术实施例自定义了一种名为pacnet的算法来实现本技术实施例，pacnet算法框架图如图9所示，pacnet算法包括了决策边界定制器(dbc)模块和迷你历史记录(mi-hi)模块。该pacnet算法可以应用于游戏直播、体育赛事、自然风景、美食制作领域的视频推荐。本技术实施例通过该pacnet算法能够端到端地实时给出用户对应的视频推荐。
128.如图10所示，一种视频推荐方法，具体流程如下：
129.201、计算机设备获取目标对象的历史浏览视频和待推荐视频。
130.其中，目标对象可以是终端、登录在终端的通信账号等被提供视频推荐服务的对象。
131.其中，历史浏览视频包括至少两个视频帧。历史浏览视频为用户通过目标对象在历史时间内的某一个时间段内浏览过的视频。由于用户的偏好可能会发生改变，因此，可以将该某一个时间段确定为近三个月，如此即使用户的偏好发生改变，也不会产生太大的波动，从而可以提高视频推荐的准确性。如图9所示，历史浏览视频可以至少有一个，历史浏览视频采用符号h表示，例如，h1、h2......hm分别表示不同的历史浏览视频。
132.其中，待推荐视频包括多个视频帧，待推荐视频可以是计算机设备获取到的某一平台上的热点视频，某一平台可以为如腾讯视频平台、微信中的视频号平台或微信中的其他小程序平台等；待推荐视频也可以是用户待剪辑的视频。
133.202、计算机设备对历史浏览视频进行切分，得到候选视频片段。
134.其中，计算机设备对历史浏览视频进行切分，得到候选视频片段可以理解为是通过pacnet算法中的迷你历史记录(mi-hi)模块采用固定的长度对该历史浏览视频进行切分实现的，如此，所得到至少一个长度固定的候选视频片段相比历史浏览视频为更细粒度、更精细的视频。
135.其中，候选视频片段包括全部视频帧均为高光视频帧的视频片段、全部视频帧均为非高光视频帧的视频片段、视频帧包括高光视频帧和非高光视频帧的视频片段。
136.203、计算机设备对候选视频片段中视频帧的标签进行高光视频帧识别，得到至少一个目标视频片段。
137.其中，目标视频片段包括高光视频帧和非高光视频帧。高光视频帧的标签可以为1，非高光视频帧的标签可以为0，计算机设备若识别到视频帧的标签为1，则确定该视频帧为高光视频帧；计算机设备若识别到视频帧的标签为0，则确定该视频帧为非高光视频帧。计算机设备通过对候选视频片段中视频帧的标签进行高光视频帧识别，得到至少一个包括高光视频帧和非高光视频帧的目标视频片段。
138.204、对所述目标视频片段内的视频帧进行特征提取，得到每个所述目标视频片段对应的特征信息。
139.其中，对目标视频片段内的视频帧进行特征提取，可以将目标视频片段内的视频帧经过特征提取层以及输出层进行特征提取，从而得到目标视频片段对应的特征信息。
140.具体地，对目标视频片段内的视频帧进行特征提取，具体过程如下：
141.对目标视频片段内的视频帧进行特征提取，得到视频特征；对视频特征进行特征
映射处理，以生成目标视频片段对应的特征信息。
142.本技术实施例可以理解为，计算机设备将至少一个目标视频片段输入到特征编码器中，特征编码器可以理解为神经网络中的特征提取层，特征编码器对目标视频片段进行特征提取，得到目标视频片段的视频特征，视频特征用符号c表示，不同的目标视频片段对应的视频特征不同，例如，c1、c2......cn分别表示不同的视频特征。待推荐视频与目标视频片段共享相同的特征编码器。
143.本技术实施例可以理解为，在神经网络的输出层中引入了决策边界定制器(dbc)，决策边界定制器通过学习生成分类器的目标参数，该目标参数即目标视频片段的特征信息，目标视频片段的特征信息用符号θ表示，不同目标视频片段的特征信息不同，例如，θ1、θ2......θn分别表示不同目标视频片段的特征信息。目标视频片段的特征信息与目标视频片段的视频特征一一对应。
144.具体地，对目标视频片段内的视频帧进行特征提取，得到视频特征的具体过程如下：
145.对目标视频片段进行视频片段特征提取，得到初始视频特征；对目标视频片段中的高光视频帧进行视频帧特征提取，得到高光视频特征；对目标视频片段中的非高光视频帧进行视频帧特征提取，得到非高光视频特征；根据初始视频特征、高光视频特征和非高光视频特征生成视频特征。
146.其中，初始视频特征、高光视频特征和非高光视频特征三者相互独立，也即，视频特征包括初始视频特征、高光视频特征和非高光视频特征。
147.在此基础上，具体地，对视频特征进行特征映射处理，以生成目标视频片段对应的特征信息，如图11所示，具体过程如下：
148.例如，本技术实施例可以采用符号c'表示初始视频特征，采用符号c
pos
表示高光视频特征，采用符号c
neg
表示非高光特征，采用符号fc表示全连接层，采用符号φ表示初始特征信息，采用符号φ
pos
表示高光特征信息，采用符号φ
neg
表示非高光特征信息，用符号θ
pos
表示融合后的高光特征信息，用符号θ
neg
表示融合后非高光特征信息，用符号θ表示目标视频片段的特征信息。
149.对初始视频特征c'进行特征映射处理，也即，可以经过全连接层fc的映射处理，得到初始特征信息φ；对高光视频特征c
pos
进行特征映射处理，得到高光特征信息φ
pos
；对非高光视频特征c
neg
进行特征映射处理，得到非高光特征信息φ
neg
；将初始特征信息φ、高光特征信息φ
pos
和非高光特征信息φ
neg
进行融合，得到目标视频片段的特征信息θ，也即目标参数。
150.具体地，将初始特征信息φ、高光特征信息φ
pos
和非高光特征信息φ
neg
进行融合，得到特征信息θ的具体过程可以为：
151.将初始特征信息φ和高光特征信息φ
pos
进行融合，得到融合后的高光特征信息θ
pos
，融合方式可以为相加，例如，θ
pos
＝φ φ
pos
。
152.将初始特征信息φ和非高光特征信息φ
neg
进行融合，得到融合后的非高光特征信息θ
neg
，融合方式可以为相加，例如，θ
neg
＝φ φ
neg
。
153.将融合后的高光特征信息θ
pos
和融合后的非高光特征信息θ
neg
进行融合，得到目标视频片段对应的特征信息，即目标参数θ，融合方式可以为拼接，例如，θ＝[θ
pos
；θ
neg
]。
[0154]
本技术实施例可以理解的是，决策边界定制器(dbc)对三种数据进行处理，这三种数据分别是初始视频特征、高光视频特征和非高光视频特征，初始视频特征、高光视频特征和非高光视频特征都经过一个非共享的全连接层，然后得到最终的迷你高光分类器的目标参数θ，即目标视频片段的特征信息。迷你高光分类器为一种自适应分类器。
[0155]
本技术实施例可以通过该迷你高光分类器来刻画用户的偏好，该迷你高光分类器在高光视频帧和非高光视频帧之间绘制高光视频帧的决策边界。此外，为了鼓励决策边界定制器(dbc)生成迷你高光分类器，本技术实施例为决策边界定制器(dbc)配备了正则化模块，正则化模块使得该迷你高光分类器仅关注待推荐视频高光视频帧决策边界，从而防止分类器退化，使得视频推荐结果不准确。可以理解的是，正则化模块相当于是对神经网络层中的参数进行优化。
[0156]
205、计算机设备根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度。
[0157]
其中，决策边界定制器通过学习生成分类器的目标参数θ，从而为用户定制化的生成个性化的迷你高光分类器，使迷你高光分类器具有适应性。该目标视频片段的特征信息不需要通过任何重新训练得到，只需一次训练即可获得并被保存起来。如图9所示，迷你高光分类器采用符号t
θ
表示，表示不同的迷你高光分类器。
[0158]
其中，对待推荐视频的特征信息f
in
可以通过至少一层神经网络的特征提取层进行特征提取得到，可以通过如图9中的特征编码器进行特征提取得到，还可以通过表达能力更好、深度更深的视觉几何群网络(vgg)或深度残差网络(resnet)进行特征提取得到。
[0159]
可以理解的是，如图9所示，迷你高光分类器对目标视频片段的特征信息，即目标参数θ和待推荐视频的特征信息f
in
进行计算得到目标视频片段和待推荐视频之间的相似度，相似度用分数s表示。不同目标视频片段和待推荐视频之间得到的分数用不同的符号表示，例如s1、s2、s3......sn。
[0160]
其中，本技术实施例可以根据目标视频片段的特征信息和待推荐视频的特征信息，利用高斯核函数得到目标视频片段与待推荐视频之间的相似度；还可以根据目标视频片段的特征信息和待推荐视频的特征信息，利用余弦相似度得到目标视频片段与待推荐视频之间的相似度；还可以根据目标视频片段的特征信息和待推荐视频的特征信息，利用transformer神经网络得到目标视频片段与待推荐视频之间的相似度。
[0161]
本技术实施例可以对该相似度进行优化，具体过程为：根据目标视频片段的初始特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的初始相似度；根据初始相似度对相似度进行优化，得到优化后的相似度；根据优化后的相似度，从至少一个目标视频片段中选择参考视频片段。
[0162]
由前述可知，相似度是由决策边界定制器(dbc)得到的目标参数θ，即目标视频片段的特征信息与待推荐视频的特征信息f
in
进行计算得到。本技术实施例中，对初始相似度计算所采用的目标视频片段的初始特征信息为由经如图9中的特征编码器提取到的视频特征，例如，c1、c2......cn，初始相似度是由初始特征信息与待推荐视频的特征信息f
in
进行计算得到。
[0163]
然后，本技术实施例可以根据目标视频片段的初始特征信息和待推荐视频的特征信息，利用高斯核函数得到目标视频片段与待推荐视频之间的初始相似度；还可以根据目
标视频片段的初始特征信息和待推荐视频的特征信息，利用余弦相似度得到目标视频片段与待推荐视频之间的初始相似度；还可以根据目标视频片段的初始特征信息和待推荐视频的特征信息，利用transformer神经网络得到目标视频片段与待推荐视频之间的初始相似度。其中，初始相似度可以用权重w表示，不同目标视频片段与与待推荐视频之间的初始相似度用不同的符号表示，例如，w1、w2、w3......wn。
[0164]
其中，根据初始相似度对相似度进行优化，得到优化后的相似度，可以将初始相似度与相似度相乘实现，例如，w1与s1相乘，w2与s2相乘......wn与sn相乘。
[0165]
206、计算机设备根据相似度从至少一个目标视频片段中选择参考视频片段。
[0166]
例如，如图12所示，历史浏览视频包括第一历史浏览视频、第二历史浏览视频、第三历史浏览视频和第四历史浏览视频，第一历史浏览视频中的目标视频片段为食物特写视频片段，第二历史浏览视频中的目标视频片段为森林漫步视频片段，第三历史浏览视频中的目标视频片段为唱歌视频片段，第四历史浏览视频中的目标视频片段为大本钟视频片段。食物特写视频片段与待推荐视频之间的相似度为第一相似度，森林漫步视频片段与待推荐视频之间的相似度为第二相似度，唱歌视频片段与待推荐视频之间的相似度为第三相似度，大本钟视频片段与待推荐视频之间的相似度为第四相似度。其中，第二相似度的排序高于第一相似度、第三相似度和第四相似度，相似度越高，其代表目标视频片段与待推荐视频越相似。本技术实施例预设参考视频片段为一个，则确定第二相似度对应的森林漫步视频片段为参考视频片段。
[0167]
207、计算机设备从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段。
[0168]
例如，由前述可知，本技术实施例确定第二相似度对应的森林漫步视频片段为参考视频片段，则基于森林漫步视频片段和待推荐视频之间相似度，确定与参考视频片段相似的视频帧在待推荐视频中的位置，对与参考视频片段相似的视频帧进行切分并提取，生成目标推荐视频片段。如图12所示，也即，目标推荐视频片段为推荐视频中的森林漫步视频片段。
[0169]
其中，向目标对象推荐该目标推荐视频片段之后，当目标对象为终端时，用户打开终端，终端可以接收到该目标推荐视频片段；当目标对象为登录账号时，用户登录该登录账号，该登录账号可以接收到该目标推荐视频片段。
[0170]
本技术实施例可以获取目标对象的历史浏览视频和待推荐视频，历史浏览视频包括至少两个视频帧；对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段，目标视频片段包括高光视频帧和非高光视频帧；对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息；根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度；根据相似度从至少一个目标视频片段中选择参考视频片段；从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段；由于本技术实施例能够通过基于对历史浏览视频中进行高光识别，得到包括高光视频帧和非高光视频帧的至少一个目标视频片段，其一方面，充分利用历史浏览视频中的非高光视频帧，另一方面，所得到的至少一个目标视频片段可以满足用户具有至少一种偏好的需求，从而能够提高视频推荐的准确性。
[0171]
例如，本技术实施例采用pacnet算法从多个历史浏览视频中选出对应多个目标视
频片段，根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度，基于该相似度，从多个目标视频片段中选出三个参考视频片段，基于参考视频片段，从待推荐视频中选出三个目标推荐视频片段。现有技术采用高光检测基线算法，根据多个历史浏览视频，从待推荐视频中选出三个目标推荐视频片段。
[0172]
本技术实施例采用pacnet算法的推荐结果与现有技术采用高光检测基线算法的推荐结果对比如图13所示。待推荐视频包括第一待推荐视频和第二待推荐视频，从图13中可以看出，基于第一待推荐视频，本技术实施例成功地提取了萤火虫特写视频片段；基于第二待推荐视频，本技术实施例成功地提取了蛋糕装饰视频片段，而通用的高光检测基线算法无法达到这种效果。
[0173]
为便于更好的实施本技术实施例提供的视频推荐方法，本技术实施例还提供一种基于上述视频推荐方法的视频推荐装置，该视频推荐装置具体可以集成在计算机设备中，比如终端中，该终端可以包括平板电脑、笔记本电脑和/或个人计算机等。
[0174]
例如，如图14所示，视频推荐装置可以包括获取单元301、识别单元302、提取单元303、计算单元304、选择单元305和推荐单元306，如下：
[0175]
(1)获取单元301；
[0176]
获取单元301，可以用于获取目标对象的历史浏览视频和待推荐视频，历史浏览视频包括至少两个视频帧；
[0177]
(2)识别单元302；
[0178]
识别单元302，可以用于对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段，目标视频片段包括高光视频帧和非高光视频帧。
[0179]
在一些实施例中，识别单元，具体可以用于对历史浏览视频进行切分，得到候选视频片段；对候选视频片段中视频帧的标签进行高光视频帧识别，得到至少一个目标视频片段。
[0180]
(3)提取单元303；
[0181]
提取单元303，可以用于对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息。
[0182]
在一些实施例中，提取单元303，可以用于对目标视频片段内的视频帧进行特征提取，得到视频特征；对视频特征进行特征映射处理，以生成目标视频片段对应的特征信息。
[0183]
在一些实施例中，提取单元303，具体可以用于对目标视频片段进行视频片段特征提取，得到初始视频特征；对目标视频片段中的高光视频帧进行视频帧特征提取，得到高光视频特征；对目标视频片段中的非高光视频帧进行视频帧特征提取，得到非高光视频特征；根据初始视频特征、高光视频特征和非高光视频特征生成视频特征。
[0184]
在一些实施例中，提取单元303，具体可以用于对初始视频特征进行特征映射处理，得到初始特征信息；对高光视频特征进行特征映射处理，得到高光特征信息；对非高光视频特征进行特征映射处理，得到非高光特征信息；将初始特征信息、高光特征信息和非高光特征信息进行融合，得到目标视频片段对应的特征信息。
[0185]
在一些实施例中，提取单元303，具体可以用于将初始特征信息和高光特征信息进行融合，得到融合后的高光特征信息；将初始特征信息和非高光特征信息进行融合，得到融合后的非高光特征信息；将融合后的高光特征信息和融合后的非高光特征信息进行融合，
得到目标视频片段对应的特征信息。
[0186]
(4)计算单元304；
[0187]
计算单元304，可以用于根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度。
[0188]
(5)选择单元305；
[0189]
选择单元305，用于根据相似度从至少一个目标视频片段中选择参考视频片段。
[0190]
在一些实施例中，选择单元305，具体可以用于根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的初始相似度；根据初始相似度对相似度进行优化，得到优化后的相似度；根据优化后的相似度，从至少一个目标视频片段中选择参考视频片段。
[0191]
(6)推荐单元306；
[0192]
推荐单元306，可以用于从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段。
[0193]
本技术实施例的获取单元301可以获取目标对象的历史浏览视频和待推荐视频，历史浏览视频包括至少两个视频帧；识别单元302可以对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段，目标视频片段包括高光视频帧和非高光视频帧；提取单元303可以对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息；计算单元304可以根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度；选择单元305可以根据相似度从至少一个目标视频片段中选择参考视频片段；推荐单元306可以从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段；由于本技术实施例能够通过基于对历史浏览视频中进行高光识别，得到包括高光视频帧和非高光视频帧的至少一个目标视频片段，其一方面，充分利用历史浏览视频中的非高光视频帧，另一方面，所得到的至少一个目标视频片段可以满足用户具有至少一种偏好的需求，从而能够提高视频推荐的准确性。
[0194]
本技术实施例还提供一种计算机设备，该计算机设备可以是服务器，如图15所示，其示出了本技术实施例所涉及的服务器的结构示意图，具体来讲：
[0195]
该服务器可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图15中示出的服务器结构并不构成对服务器的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：
[0196]
处理器401是该服务器的控制中心，利用各种接口和线路连接整个服务器的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行服务器的各种功能和处理数据，从而对服务器进行整体监控。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。
[0197]
存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程
序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据服务器的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。
[0198]
服务器还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理系统与处理器401逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0199]
该服务器还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息通讯，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0200]
尽管未示出，服务器还可以包括显示单元等，在此不再赘述。具体在本实施例中，服务器中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现各种功能，如下：
[0201]
获取目标对象的历史浏览视频和待推荐视频，历史浏览视频包括至少两个视频帧；对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段，目标视频片段包括高光视频帧和非高光视频帧；对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息；根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度；根据相似度从至少一个目标视频片段中选择参考视频片段；从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段。
[0202]
以上各个操作的具体实施可参见前面的实施例，在此不作赘述。应当说明的是，本技术实施例提供的计算机设备与上文实施例中的适用于视频推荐方法属于同一构思，其具体实现过程详见以上方法实施例，此处不再赘述。
[0203]
本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。
[0204]
为此，本技术实施例提供一种存储介质，其中存储介质存储有计算机程序，计算机程序适于处理器进行加载，以执行本技术实施例所提供的任一种视频推荐方法中的步骤。例如，该指令可以执行如下步骤：
[0205]
获取目标对象的历史浏览视频和待推荐视频，历史浏览视频包括至少两个视频帧；对历史浏览视频中视频帧进行高光视频帧识别，得到至少一个目标视频片段，目标视频片段包括高光视频帧和非高光视频帧；对目标视频片段内的视频帧进行特征提取，得到每个目标视频片段对应的特征信息；根据目标视频片段的特征信息和待推荐视频的特征信息，计算目标视频片段与待推荐视频之间的相似度；根据相似度从至少一个目标视频片段中选择参考视频片段；从待推荐视频确定与参考视频片段相似的目标推荐视频片段，并向目标对象推荐目标推荐视频片段。
[0206]
根据本技术的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机程序，该计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序，处理器执行该计算机程序，使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
[0207]
以上各个操作的具体实施可参见前面的实施例，在此不再赘述。
[0208]
其中，该存储介质可以包括：只读存储器(rom，read only memory)、随机存取记忆体(ram，random access memory)、磁盘或光盘等。
[0209]
由于该存储介质中所存储的程序，可以执行本技术实施例所提供的任一种视频推荐方法中的步骤，因此，可以实现本技术实施例所提供的任一种视频推荐方法所能实现的有益效果，详见前面的实施例，在此不再赘述。
[0210]
以上对本技术实施例所提供的一种视频推荐方法、装置、计算机设备和存储介质进行了详细介绍，本文中应用了具体个例对本技术实施例的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本技术实施例的方法及其核心思想；同时，对于本领域的技术人员，依据本技术实施例的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本技术实施例的限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：区块链共识方法和装置、电子设备和存储介质

一种视频推荐方法、装置、计算机设备和存储介质与流程

相关文献

最热文献