视频剪辑方法、装置、设备及存储介质与流程

2021-11-26 22:26:00 来源：中国专利 TAG：

1.本技术实施例涉及视频处理技术领域，特别涉及一种视频剪辑方法、装置、设备及存储介质。

背景技术：

2.目前，一些视频处理工具提供有视频剪辑的功能，视频剪辑是指从素材视频中截取视频片段。
3.在相关技术中，若需要从一个素材视频中，截取一段质量较优的视频片段，需要用户先播放并查看该素材视频，并基于用户对视频内容的主观质量评价，手动从素材视频中选取质量较优片段的起始时间戳和终止时间戳，然后截取该起始时间戳至终止时间戳之间的视频片段。
4.由于这种视频剪辑方式完全依赖于用户的主观质量评价及操作，因此采用这种方式截取的视频片段的质量不可控，且效率较低。

技术实现要素：

5.本技术实施例提供了一种视频剪辑方法、装置、设备及存储介质，能够高效地截取高质量的视频片段，从而提升视频剪辑的效率和质量效果。所述技术方案如下：
6.根据本技术实施例的一个方面，提供了一种视频剪辑方法，所述方法包括：
7.从素材视频中抽取多个图像帧；
8.确定各个所述图像帧的质量分；
9.在时域上对各个所述图像帧进行排列，并对所述质量分进行插值处理，得到所述素材视频的质量分曲线；
10.基于所述质量分曲线和视频剪辑策略，从所述素材视频中剪辑得到目标视频。
11.根据本技术实施例的一个方面，提供了一种视频剪辑装置，所述装置包括：
12.视频抽帧模块，用于从素材视频中抽取多个图像帧；
13.质量打分模块，用于确定各个所述图像帧的质量分；
14.曲线构建模块，用于在时域上对各个所述图像帧进行排列，并对所述质量分进行插值处理，得到所述素材视频的质量分曲线；
15.视频剪辑模块，用于基于所述质量分曲线和视频剪辑策略，从所述素材视频中剪辑得到目标视频。
16.根据本技术实施例的一个方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述视频剪辑方法。
17.根据本技术实施例的一个方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一
段程序、所述代码集或指令集由处理器加载并执行以实现上述视频剪辑方法。
18.根据本技术实施例的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述视频剪辑方法。
19.本技术实施例提供的技术方案可以带来如下有益效果：
20.通过对素材视频中的图像帧进行质量打分，生成该素材视频的质量分曲线，然后基于该质量分曲线和视频剪辑策略，从素材视频中剪辑得到目标视频，实现了自动化地从素材视频中截取高质量的视频片段，从而提升了视频剪辑的效率和质量效果。
21.另外，在生成素材视频的质量分曲线时，一方面通过抽帧的方式，仅需对素材视频中的部分图像帧进行质量打分，而不需要对全量图像帧进行质量打分，减少了计算量，这有助于进一步减少视频剪辑所需耗时；另一方面在时域上对抽取的各个图像帧进行排列，并对质量分进行插值处理，得到素材视频的质量分曲线，从而能够准确地刻画出素材视频中所有图像帧的质量变化规律，这有助于提升剪辑得到的目标视频的质量效果。
附图说明
22.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
23.图1是本技术一个实施例提供的方案实施环境的示意图；
24.图2是本技术一个实施例提供的视频剪辑功能的相关产品界面图；
25.图3是本技术一个实施例提供的视频剪辑方法的流程图；
26.图4是本技术另一个实施例提供的视频剪辑方法的流程图；
27.图5示例性示出了质量分曲线的构建过程的示意图；
28.图6示例性示出了水位下降法的示意图；
29.图7示例性示出了滑动窗口法的示意图；
30.图8是本技术一个实施例提供的方案整体流程的示意图；
31.图9是本技术一个实施例提供的视频剪辑装置的框图；
32.图10是本技术另一个实施例提供的视频剪辑装置的框图；
33.图11是本技术一个实施例提供的计算机设备的结构框图。
具体实施方式
34.为使本技术的目的、技术方案和优点更加清楚，下面将结合附图对本技术实施方式作进一步地详细描述。
35.请参考图1，其示出了本技术一个实施例提供的方案实施环境的示意图。该方案实施环境可以实现成为一个视频处理系统，该方案实施环境可以包括：终端10和服务器20。
36.终端10可以是诸如手机、平板电脑、可穿戴设备、pc(personal computer，个人计算机)等电子设备。终端10中安装运行有目标应用程序的客户端，该目标应用程序可以是任
意一个具有视频处理功能(包括视频剪辑功能)的应用程序。例如，该目标应用程序可以是短视频应用程序、社交类应用程序、或者专用于视频处理的应用程序等，本技术对此不作限定。
37.服务器20可以是上述目标应用程序的后台服务器，用于为目标应用程序的客户端提供后台服务。服务器20可以是一台服务器，也可以是由多台服务器组成的服务器集群，或者是一个云计算服务中心。服务器20可以通过网络与终端10进行通信。
38.本技术实施例提供的视频剪辑方法，可以由终端10执行，如各步骤的执行主体可以是终端10中安装运行的目标应用程序的客户端，也可以由服务器20执行，或者由终端10和服务器20交互配合执行。在下文实施例中，为了便于说明，除特别说明之外，仅以各步骤执行主体为计算机设备进行介绍说明。计算机设备可以是任何具备数据处理和存储能力的电子设备，包括但不限于上文介绍的终端10和服务器20等。
39.示例性地，如图2所示，其示出了本技术提供的视频剪辑功能的相关产品界面图。用户打开目标应用程序的视频剪辑界面21，该视频剪辑界面21中提供多种剪辑相关选项，如剪一下选项22、分割选项、转场选项、变速选项、调序选项、删除选项等。剪一下选项22对应本技术提供的基于ai能力的自动剪辑功能，如自动剪辑出素材视频中的高光片段。用户点击剪一下选项22之后，客户端可以显示固定时长30秒和推荐时长两个选项，其中，固定时长30秒是指剪辑生成的目标视频的时长为固定时长30秒，推荐时长是指剪辑生成的目标视频的时长为推荐时长，该推荐时长可以由客户端基于素材视频的时长、质量等因素进行确定。假设用户选择推荐时长之后，触发客户端进行视频自动剪辑。对比图2中的左右两张图示可以发现，左侧图示为待剪辑的素材视频23，其时长是21s，右侧图示为剪辑得到的目标视频24，其时长是10秒。并且，该目标视频是由3个视频片段拼接构成，如该3个视频片段可以是素材视频中3个质量较高的片段。
40.请参考图3，其示出了本技术一个实施例提供的视频剪辑方法的流程图。该方法可以包括如下几个步骤(310～340)：
41.步骤310，从素材视频中抽取多个图像帧。
42.素材视频即是指待剪辑的视频，在一次剪辑过程中(也即基于素材视频剪辑生成目标视频的过程)，所用到的素材视频的数量可以是1个，也可以是多个(即2个或者2个以上)，本技术对此不作限定。
43.每一个素材视频都包括多个图像帧，在本技术实施例中，为了减少计算量，并不需要对素材视频中的每一个图像帧均进行质量打分，而是通过抽帧的方式，从素材视频中抽取多个图像帧，仅对这部分抽取的图像帧进行质量打分，而那些未被抽取的图像帧则不必进行质量打分。
44.可选地，采用等时间间隔抽样的方式，从素材视频中抽取多个图像帧。例如，每隔125ms抽取一个图像帧。
45.步骤320，确定各个图像帧的质量分。
46.对于抽取的每一个图像帧，对其进行质量打分，得到该图像帧的质量分。质量分用于表征图像帧的质量。需要说明的是，质量分的影响因素可以结合实际需求预先设定，例如包括但不限于曝光、清晰度、颜色、质感、噪音、对焦、伪像等。
47.可选地，通过预先训练好的ai(artificial intelligence，人工智能)模型对图像
帧进行质量打分。在一个示例中，通过一个ai模型直接输出图像帧的质量分，该ai模型可以从一个打分维度或者多个打分维度提取图像帧的图像特征，并基于图像特征确定图像帧的质量分。在另一个示例中，通过多个ai模型分别从多个打分维度输出图像帧的单项分，然后将各个单项分进行直接求和或者加权求和，得到图像帧的质量分。可选地，上述单个打分维度可以对应于一种影响因素。
48.步骤330，在时域上对各个图像帧进行排列，并对质量分进行插值处理，得到素材视频的质量分曲线。
49.在得到各个图像帧的质量分之后，以时间为横轴，质量分为纵轴，构建二维直角坐标系，并在二维直角坐标系中标注出各个图像帧对应的位置点。由于各个图像帧的质量分在时间上是离散的，为了生成素材视频的质量分曲线，可以对质量分进行差值处理，然后基于插值后的各个质量分拟合生成素材视频的质量分曲线。例如，以0.1s为单位进行插值，则质量分曲线可以达到0.1s的时间精度。
50.在本技术实施例中，质量分曲线是指获取素材视频中若干个离散时间点的质量分之后，通过一定的处理，得到描述整个素材视频质量的函数曲线。
51.步骤340，基于质量分曲线和视频剪辑策略，从素材视频中剪辑得到目标视频。
52.视频剪辑策略可以由用户自定义设定，也可以由系统默认设定，本技术对此不作限定。视频剪辑策略用于规定对素材视频的剪辑方式，如规定了从素材视频中剪辑获取的视频片段的数量、单个视频片段的时长、所有视频片段的总时长、片段剪辑方式等视频剪辑参数。
53.在得到素材视频的质量分曲线之后，可以根据设定的视频剪辑策略对素材视频进行剪辑，最终得到目标视频。
54.综上所述，本技术实施例提供的技术方案，通过对素材视频中的图像帧进行质量打分，生成该素材视频的质量分曲线，然后基于该质量分曲线和视频剪辑策略，从素材视频中剪辑得到目标视频，实现了自动化地从素材视频中截取高质量的视频片段，从而提升了视频剪辑的效率和质量效果。
55.另外，在生成素材视频的质量分曲线时，一方面通过抽帧的方式，仅需对素材视频中的部分图像帧进行质量打分，而不需要对全量图像帧进行质量打分，减少了计算量，这有助于进一步减少视频剪辑所需耗时；另一方面在时域上对抽取的各个图像帧进行排列，并对质量分进行插值处理，得到素材视频的质量分曲线，从而能够准确地刻画出素材视频中所有图像帧的质量变化规律，这有助于提升剪辑得到的目标视频的质量效果。
56.请参考图4，其示出了本技术另一个实施例提供的视频剪辑方法的流程图。该方法可以包括如下几个步骤(410～460)：
57.步骤410，从素材视频中抽取多个图像帧。
58.可选地，针对用户选择的素材视频，按照时间轴顺序将素材视频中包括的各个图像帧进行排列，等时间间隔抽取一个图像帧，比如每100ms抽取一帧，将抽到的每一个图像帧送入步骤420进行质量打分。
59.可选地，为了保证抽帧的效率，可以使用解码器并发、图像尺寸压缩、图像缓存等方式来提高抽帧效率。其中，解码器并发是指采用多个解码器并行对素材视频进行解码得到图像帧，图像尺寸压缩是指对图像帧的尺寸进行压缩以提升解码速度，图像缓存是指采
用多级高速缓存技术对解码得到的图像帧进行缓存，因为视频解码和图像帧缓存是抽帧的前提步骤，通过降低解码和缓存所需耗时，也就能够缩减抽帧所需耗时，提升抽帧效率。
60.可选地，基于设备机型确定设备性能等级，根据设备性能等级确定抽帧配置策略，该抽帧配置策略用于指示抽帧过程中的解码策略和/或缓存策略，按照抽帧配置策略对素材视频进行抽帧处理，得到多个图像帧。考虑到不同机型的设备具有不同的设备性能等级，一些性能较优的设备能够采用较高配置的解码策略和/或缓存策略，例如适当增加解码器的并发数量、适当增加缓存处理速度，而对于一些性能较差的设备则可以采用较低配置的解码策略和/或缓存策略，例如适当减少解码器的并发数量、适当减少缓存处理速度。上述设备机型所属的设备性能等级，以及设备性能等级与抽帧配置策略之间的对应关系，可以预先设定并建立相应的表格，通过查表即可得到当前设备的设备机型以及适合的抽帧配置策略，从而提升了本技术方案对于不同设备的兼容性，保证本技术方案能够在不同设备上正常执行。需要说明的是，上述设备性能等级的划分数量和划分方式，在本技术中不作限定，例如可以划分为高、中、低共3种设备性能等级，也可以划分为5种设备性能等级，等等。
61.步骤420，确定各个图像帧的质量分。
62.可选地，通过多个ai模型从多个不同维度对图像帧进行打分，得到图像帧的多个单项分，对图像帧的多个单项分进行加权求和处理，得到图像帧的初始质量分，然后基于分值调整策略，对图像帧的初始质量分进行调整，确定图像帧的质量分。例如，上述多个ai模型可以从高光、美学、分类等多个不同维度分别对图像帧进行打分，得到图像帧的多个单项分，然后基于各个维度的单项分和权重，加权求和得到图像帧的初始质量分。在一个示例中，可以直接将该初始质量分确定为最终的质量分。在另一个示例中，基于分值调整策略，对图像帧的初始质量分进行调整，确定图像帧的质量分。此处的分值调整是为了对一些特殊的图像帧进行特殊处理，以提升后续剪辑生成的目标视频的视频质量。
63.例如，若图像帧中存在人脸区域，则对图像帧的初始质量分进行上调，确定图像帧的质量分。由于包含人脸的图像帧往往是视频中较为重要的图像帧，因此对于这类图像帧可以适当上调质量分，以提升其被选中的概率。图像帧中是否存在人脸区域，可以采用经机器学习得到的人脸识别模型进行识别确定。
64.又例如，若图像帧属于场景分割图像帧，则对图像帧的初始质量分进行下调，确定图像帧的质量分。场景分割图像帧是指从一个场景切换至另一个场景的过程中，位于前一个场景的尾部的图像帧以及位于后一个场景的头部的图像帧。例如，第1～10帧为室内场景，从11帧开始切换至室外场景，那么场景分割图像帧包括第10帧和第11帧。在目标视频中引入过多的场景分割图像帧，会导致目标视频的场景切换过于频繁，看上去画面内容紊乱。因此，通过调低场景分割图像帧的质量分，能够尽可能地降低其被选中的概率。图像帧对应的场景可以采用经机器学习得到的场景识别模型进行识别确定。
65.又例如，若图像帧属于起始时段图像帧或结尾时段图像帧，则对图像帧的初始质量分进行上调，确定图像帧的质量分。起始时段图像帧是指位于素材视频的起始时间段内的图像帧，如素材视频前1s内的图像帧。结尾时段图像帧是指位于素材视频的结尾时段内的图像帧，如素材视频最后1s内的图像帧。对于素材视频中开头和结尾等比较敏感的时段内的图像帧，应当适当增加其质量分，以提升其被选中的概率。
66.需要说明的是，上述分值调整策略中对质量分上调/下调的数值，可以结合实际情
况预先设定，本技术对此不作限定。
67.另外，在通过多个ai模型从多个不同维度对图像帧进行打分时，该多个ai模型可以并行运行，从而提升打分效率。另外，各ai模型可以共享图像帧的画面数据，在各自图像处理的过程中，可以再次根据自身需求对画面进行压缩等处理，从而能够兼顾打分的效率和精准度。
68.步骤430，在时域上对各个图像帧进行排列，并对质量分进行插值处理，得到素材视频的质量分曲线。
69.可选地，构建以时间为横轴、质量分为纵轴的二维直角坐标系，基于各个图像帧的时间戳和质量分，在二维直角坐标系中添加图像帧对应的位置点，然后基于各个位置点对质量分进行插值处理，得到插值后的位置点序列，最后基于插值后的位置点序列，拟合生成素材视频的质量分曲线。
70.如图5所示，假设从素材视频中抽取第1帧、第11帧、第21帧
……
，图中黑点是基于各个抽取的图像帧的时间戳和质量分，在二维直角坐标系中标注的各个抽取的图像帧对应的位置点，白点是对质量分进行插值处理得到的插值点，上述各位置点和插值点组成插值后的位置点序列，最终拟合出一条曲线50即为素材视频的质量分曲线。
71.在本技术实施例中，对插值算法和曲线拟合算法所采用的方式不作限定。
72.步骤440，根据视频剪辑策略确定视频剪辑参数。
73.可选地，视频剪辑参数包括以下至少一项：从素材视频中剪辑获取的视频片段的数量、单个视频片段的时长、所有视频片段的总时长、片段剪辑方式。
74.可选地，在本技术实施例中，提供了如下几种视频剪辑策略：智能优选策略、固定时长策略、多片段固定时长策略、多素材片段对应固定时长策略。
75.其中，智能优选策略是指基于素材视频自动化确定剪辑生成的目标视频的总时长。可选地，在视频剪辑策略为智能优选策略的情况下，根据素材视频的时长，确定从素材视频中剪辑获取的所有视频片段的总时长；以及，确定片段剪辑方式为水位下降法。采用智能优选策略可以从素材视频中选取一个或者多个质量较优的视频片段，且每个视频片段的时长是不固定的。可选地，从素材视频中剪辑获取的所有视频片段的总时长，与素材视频的时长呈正相关关系。
76.固定时长策略是指剪辑生成的目标视频的总时长是固定值，该固定时长可以由用户自定义设定，也可以由系统默认设定。可选地，在视频剪辑策略为固定时长策略的情况下，根据预设的单个固定时长，确定从素材视频中剪辑获取的所有视频片段的总时长；以及，若素材视频的数量为1个，则确定片段剪辑方式为水位下降法；或者，若素材视频的数量为多个，则确定片段剪辑方式为滑动窗口法。例如，将预设的单个固定时长，确定为从素材视频中剪辑获取的所有视频片段的总时长，也即目标视频的总时长。例如，用户设定固定时长为10s，则从素材视频中剪辑获取一个时长为10s的视频片段作为目标视频，或者从素材视频中剪辑获取多个视频片段且该多个视频片段的总时长为10s，然后将该多个视频片段拼接生成目标视频。
77.多片段固定时长策略是指从素材视频中截取多个固定时长的视频片段，然后用该多个视频片段拼接生成目标视频。各个视频片段对应的固定时长，可以相同，也可以不同。上述各个固定时长，可以由用户自定义设定，也可以由系统默认设定。可选地，在视频剪辑
策略为多片段固定时长策略的情况下，根据预设的多个固定时长，确定从素材视频中剪辑获取的视频片段的数量以及单个视频片段的时长；以及，确定片段剪辑方式为滑动窗口法。例如，预先设定3个固定时长，分别是3s、2s和3s，那么从素材视频中截取3个视频片段，该3个视频片段的时长分别为3s、2s和3s，然后用该多个视频片段拼接生成目标视频。
78.多素材片段对应固定时长策略是指素材视频的数量为多个，且从每一个素材视频中截取一段固定时长的视频片段，该固定时长可以由用户自定义设定，也可以由系统默认设定。可选地，在视频剪辑策略为多素材片段对应固定时长策略的情况下，根据针对多个素材视频分别设置的固定时长，确定从每一个素材视频中剪辑获取的视频片段的时长；以及，确定片段剪辑方式为滑动窗口法。例如，包括2段素材视频，针对第1段素材视频设定的固定时长为5s，针对第2段素材视频设定的固定时长为7s，那么从第1段素材视频中截取一段5s的视频片段，从第2段素材视频中截取一段7s的视频片段，然后将这2段视频片段拼接得到目标视频。
79.步骤450，基于质量分曲线从素材视频中剪辑获取满足视频剪辑参数要求的视频片段。
80.在从素材视频中截取视频片段的片段剪辑方式方面，本技术提供了水位下降法和滑动窗口法。水位下降法适合一步截取一个或多个视频片段，且该截取的各个视频片段的总时长是固定值。滑动窗口法适合一步截取一个视频片段，且该单个视频片段的时长是固定值。
81.在采用水位下降法截取视频片段的情况下，在质量分曲线所在的二维直角坐标系中添加水位线，其中，二维直角坐标系的横轴为时间且纵轴为质量分，水位线与横轴相平行；沿纵轴移动水位线；在水位线移动至第一目标位置处，使得位于水位线的第一方向上存在满足视频剪辑参数要求的视频片段时，从素材视频中截取视频片段；其中，水位线的第一方向上的质量分，大于水位线的第二方向上的质量分。
82.例如，如图6所示，以x轴(横轴)作为时间轴，y轴(纵轴)作为质量分轴，质量分曲线61可表示为y＝f(x)。假设素材视频的总时长为t，需要剪辑出的目标视频为固定时长t0(t0＜t)，通过从上往下(也即沿纵轴正方向)移动水位线62，位于水位线62下方的曲线段保留，假设保留的曲线段对应的总时长为t1。由于质量分曲线61是一个连续曲线，因此在水位线62移动的过程中，有且只有一个目标位置，使得水位线62以下的视频片段的总时长t1＝目标视频的时长t0。在满足该条件时，截取位于水位线62以下的视频片段即可。例如，假设水位线62在图6所示位置时，满足t1＝t0，那么截取2个视频片段，1个是从t1到t2的视频片段，另一个是从t3到t4的视频片段。
83.需要说明的是，如果初始构建的质量分曲线所在的二维直角坐标系如图5所示，纵轴的正方向向上，纵轴的负方向向下，那么在采用水位下降法截取视频片段时，一种可能的实现方式是将上述二维直角坐标系(包括质量分曲线)进行上下翻转，即使得纵轴的正方向向下，纵轴的负方向向上(如图6所示)，然后在翻转后的二维直角坐标系中添加水位线，然后通过从上往下(也即沿纵轴正方向)移动水位线(使得水位线下降)，来选取位于水位线下方的符合条件的高质量视频片段进行截取；另一种可能的实现方式是不翻转二维直角坐标系(也不翻转质量分曲线)，即保持纵轴的正方向向上，纵轴的负方向向下(如图5所示)，在二维直角坐标系中添加水位线，然后通过从下往上(也即沿纵轴正方向)移动水位线(使得
水位线上升)，来选取位于水位线上方的符合条件的高质量视频片段进行截取。
84.在采用滑动窗口法截取视频片段的情况下，根据视频剪辑参数，确定待添加的滑动窗口的数量n以及每个滑动窗口的时长，n为正整数；在质量分曲线所在的二维直角坐标系中添加n个滑动窗口；其中，二维直角坐标系的横轴为时间且纵轴为质量分，滑动窗口的窗口边界与横轴垂直；沿横轴移动滑动窗口，并获取位于滑动窗口中的曲线段的积分；其中，在滑动窗口的数量为多个的情况下，任意两个滑动窗口均不存在重叠区域；在n个滑动窗口位于第二目标位置处，使得积分总和取最大值时，从素材视频中截取n个滑动窗口中的视频片段。
85.例如，如图7所示，以x轴(横轴)作为时间轴，y轴(纵轴)作为质量分轴，质量分曲线71可表示为y＝f(x)。假设素材视频的总时长为t，需要剪辑出的目标视频为固定时长t0(t0＜t)，滑动窗口的左右两个窗口边界在图中以虚线表示，通过移动滑动窗口，当窗口边界位于t1和t2位置处时，假设位于滑动窗口中的曲线段的积分取最大值，那么截取该滑动窗口中从t1到t2的视频片段。
86.步骤460，基于视频片段得到目标视频。
87.如果截取获得的视频片段数量为1，则直接将该视频片段作为目标视频。如果截取获得的视频片段数量大于1，那么将这些视频片段拼接得到目标视频。
88.下面，结合图8，对本技术技术方案进行概述性说明，在获取素材视频之后，通过抽帧工具从素材视频中抽取多个图像帧，然后通过ai打分组件确定各个图像帧的质量分，基于各个图像帧的质量分进行插值，得到素材视频的质量分曲线，然后运行剪辑算法基于质量分曲线和视频剪辑策略，从素材视频中剪辑得到目标视频作为结果返回。
89.另外，本技术提供了多种视频剪辑策略以及相应的片段剪辑方式，具体可以如下表1所示：
90.表1
91.序号视频剪辑策略片段剪辑方式1智能优选策略水位下降法2固定时长策略水位下降法或滑动窗口法3多片段固定时长策略滑动窗口法4多素材片段对应固定时长策略滑动窗口法
92.综上所述，本技术实施例提供的技术方案，提供了多种不同的视频剪辑策略，且每一种视频剪辑策略均是基于素材视频的质量分曲线进行视频剪辑，因此一次打分结果可以进行多次复用，用户更换视频剪辑策略时，不需要对素材视频重新进行打分，复用之前保存的该素材视频的质量分曲线即可，做到了质量打分和剪辑算法的分离设计，即便用户更换视频剪辑策略也可快速生成符合该策略需求的目标片段。
93.另外，本技术提供的视频剪辑方案，剪辑效果取决于ai模型的打分能力以及剪辑算法，因此剪辑效果相比于手动剪辑更加稳定可控，在方案迭代优化的过程中只需要不断地更新ai模型和剪辑算法，就能够实现更好的剪辑效果。
94.下述为本技术装置实施例，可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节，请参照本技术方法实施例。
95.请参考图9，其示出了本技术一个实施例提供的视频剪辑装置的框图。该装置具有实现上述方法示例的功能，所述功能可以由硬件实现，也可以由硬件执行相应的软件实现。该装置可以是计算机设备，也可以设置在计算机设备中。该装置900可以包括：视频抽帧模块910、质量打分模块920、曲线构建模块930和视频剪辑模块940。
96.视频抽帧模块910，用于从素材视频中抽取多个图像帧。
97.质量打分模块920，用于确定各个所述图像帧的质量分。
98.曲线构建模块930，用于在时域上对各个所述图像帧进行排列，并对所述质量分进行插值处理，得到所述素材视频的质量分曲线。
99.视频剪辑模块940，用于基于所述质量分曲线和视频剪辑策略，从所述素材视频中剪辑得到目标视频。
100.在示例性实施例中，如图10所示，所述视频剪辑模块940，包括：参数确定单元942、片段截取单元944和结果生成单元946。
101.参数确定单元942，用于根据所述视频剪辑策略确定视频剪辑参数，所述视频剪辑参数包括以下至少一项：从所述素材视频中剪辑获取的视频片段的数量、单个视频片段的时长、所有视频片段的总时长、片段剪辑方式。
102.片段截取单元944，用于基于所述质量分曲线从所述素材视频中剪辑获取满足所述视频剪辑参数要求的视频片段。
103.结果生成单元946，用于基于所述视频片段得到所述目标视频。
104.可选地，所述片段截取单元944，用于：
105.在采用水位下降法截取所述视频片段的情况下，在所述质量分曲线所在的二维直角坐标系中添加水位线；其中，所述二维直角坐标系的横轴为时间且纵轴为质量分，所述水位线与所述横轴相平行；
106.沿所述纵轴移动所述水位线；
107.在所述水位线移动至第一目标位置处，使得位于所述水位线的第一方向上存在满足所述视频剪辑参数要求的视频片段时，从所述素材视频中截取所述视频片段；
108.其中，所述水位线的第一方向上的质量分，大于所述水位线的第二方向上的质量分。
109.可选地，所述片段截取单元944，用于：
110.在采用滑动窗口法截取所述视频片段的情况下，根据所述视频剪辑参数，确定待添加的滑动窗口的数量n以及每个滑动窗口的时长，所述n为正整数；
111.在所述质量分曲线所在的二维直角坐标系中添加所述n个滑动窗口；其中，所述二维直角坐标系的横轴为时间且纵轴为质量分，所述滑动窗口的窗口边界与所述横轴垂直；
112.沿所述横轴移动所述滑动窗口，并获取位于所述滑动窗口中的曲线段的积分；其中，在所述滑动窗口的数量为多个的情况下，任意两个滑动窗口均不存在重叠区域；
113.在所述n个滑动窗口位于第二目标位置处，使得所述积分总和取最大值时，从所述素材视频中截取所述n个滑动窗口中的视频片段。
114.可选地，所述参数确定单元942，用于：
115.在所述视频剪辑策略为智能优选策略的情况下，根据所述素材视频的时长，确定从所述素材视频中剪辑获取的所有视频片段的总时长；
116.以及，确定所述片段剪辑方式为水位下降法。
117.可选地，所述参数确定单元942，用于：
118.在所述视频剪辑策略为固定时长策略的情况下，根据预设的单个固定时长，确定从所述素材视频中剪辑获取的所有视频片段的总时长；
119.以及，若所述素材视频的数量为1个，则确定所述片段剪辑方式为水位下降法；或者，若所述素材视频的数量为多个，则确定所述片段剪辑方式为滑动窗口法。
120.可选地，所述参数确定单元942，用于：
121.在所述视频剪辑策略为多片段固定时长策略的情况下，根据预设的多个固定时长，确定从所述素材视频中剪辑获取的视频片段的数量以及单个视频片段的时长；
122.以及，确定所述片段剪辑方式为滑动窗口法。
123.可选地，所述参数确定单元942，用于：
124.在所述视频剪辑策略为多素材片段对应固定时长策略的情况下，根据针对多个素材视频分别设置的固定时长，确定从每一个素材视频中剪辑获取的视频片段的时长；
125.以及，确定所述片段剪辑方式为滑动窗口法。
126.在示例性实施例中，如图10所示，所述质量打分模块920，包括：单项打分单元922、打分求和单元924和打分调整单元926。
127.单项打分单元922，用于通过多个人工智能ai模型从多个不同维度对所述图像帧进行打分，得到所述图像帧的多个单项分。
128.打分求和单元924，用于对所述图像帧的多个单项分进行加权求和处理，得到所述图像帧的初始质量分。
129.打分调整单元926，用于基于分值调整策略，对所述图像帧的初始质量分进行调整，确定所述图像帧的质量分。
130.可选地，所述打分调整单元926，用于：
131.若所述图像帧中存在人脸区域，则对所述图像帧的初始质量分进行上调，确定所述图像帧的质量分；
132.或者，若所述图像帧属于场景分割图像帧，则对所述图像帧的初始质量分进行下调，确定所述图像帧的质量分；
133.或者，若所述图像帧属于起始时段图像帧或结尾时段图像帧，则对所述图像帧的初始质量分进行上调，确定所述图像帧的质量分。
134.在示例性实施例中，所述曲线构建模块930，用于：
135.构建以时间为横轴、质量分为纵轴的二维直角坐标系；
136.基于各个所述图像帧的时间戳和质量分，在所述二维直角坐标系中添加所述图像帧对应的位置点；
137.基于各个所述位置点对所述质量分进行插值处理，得到插值后的位置点序列；
138.基于所述插值后的位置点序列，拟合生成所述素材视频的质量分曲线。
139.在示例性实施例中，所述视频抽帧模块910，用于：
140.基于设备机型确定设备性能等级；
141.根据所述设备性能等级确定抽帧配置策略，所述抽帧配置策略用于指示抽帧过程中的解码策略和/或缓存策略；
142.按照所述抽帧配置策略对所述素材视频进行抽帧处理，得到所述多个图像帧。
143.综上所述，本技术实施例提供的技术方案，通过对素材视频中的图像帧进行质量打分，生成该素材视频的质量分曲线，然后基于该质量分曲线和视频剪辑策略，从素材视频中剪辑得到目标视频，实现了自动化地从素材视频中截取高质量的视频片段，从而提升了视频剪辑的效率和质量效果。
144.另外，在生成素材视频的质量分曲线时，一方面通过抽帧的方式，仅需对素材视频中的部分图像帧进行质量打分，而不需要对全量图像帧进行质量打分，减少了计算量，这有助于进一步减少视频剪辑所需耗时；另一方面在时域上对抽取的各个图像帧进行排列，并对质量分进行插值处理，得到素材视频的质量分曲线，从而能够准确地刻画出素材视频中所有图像帧的质量变化规律，这有助于提升剪辑得到的目标视频的质量效果。
145.需要说明的是，上述实施例提供的装置，在实现其功能时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内容结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的装置与方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。
146.请参考图11，其示出了本技术一个实施例提供的计算机设备1100的结构框图。该计算机设备1100可以是手机、平板电脑、智能电视、多媒体播放设备、pc等终端，也可以是服务器。该计算机设备1100可用于实施上述视频剪辑方法。
147.通常，计算机设备1100包括有：处理器1101和存储器1102。
148.处理器1101可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器1101可以采用dsp(digital signal processing，数字信号处理)、fpga(field programmable gate array，现场可编程门阵列)、pla(programmable logic array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1101也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称cpu(central processing unit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1101可以在集成有gpu(graphics processing unit，图像处理器)，gpu用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1101还可以包括ai(artificial intelligence，人工智能)处理器，该ai处理器用于处理有关机器学习的计算操作。
149.存储器1102可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1102还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1102中的非暂态的计算机可读存储介质用于存储计算机程序，所述计算程序经配置以由一个或者一个以上处理器执行，以实现上述视频剪辑方法。
150.在一些实施例中，计算机设备1100还可选包括有：外围设备接口1103和至少一个外围设备。处理器1101、存储器1102和外围设备接口1103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1103相连。具体地，外围设备可以包括：显示屏1104、音频电路1105、通信接口1106和电源1107中的至少一种。
151.本领域技术人员可以理解，图11中示出的结构并不构成对计算机设备1100的限
定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。
152.在示意性实施例中，还提供了一种计算机可读存储介质，所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被计算机设备的处理器执行时实现上述视频剪辑方法。
153.可选地，上述计算机可读存储介质可以是rom(read
‑
only memory，只读存储器)、ram(random access memory，随机存取存储器)、cd
‑
rom(compact disc read
‑
only memory，只读光盘)、磁带、软盘和光数据存储设备等。
154.在示例性实施例中，还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述视频剪辑方法。
155.应当理解的是，在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。另外，本文中描述的步骤编号，仅示例性示出了步骤间的一种可能的执行先后顺序，在一些其它实施例中，上述步骤也可以不按照编号顺序来执行，如两个不同编号的步骤同时执行，或者两个不同编号的步骤按照与图示相反的顺序执行，本技术实施例对此不作限定。
156.以上所述仅为本技术的示例性实施例，并不用以限制本技术，凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：用于无线通信的电子设备和方法、计算机可读存储介质与流程

视频剪辑方法、装置、设备及存储介质与流程

相关文献

最热文献