视频生成方法、装置、终端设备及介质与流程

2021-10-19 20:44:00 来源：中国专利 TAG：终端设备视频介质装置生成

1.本技术实施例属于视频技术领域，特别是涉及一种视频生成方法、装置、终端设备及介质。

背景技术：

2.矿产资源是发展经济的物质基础。在我国，矿产资源多以地下矿产为主，开采地下矿产资源相对复杂，经常出现各种安全事故。因此，对下井人员进行岗前培训就显得尤为重要。
3.岗前培训是地下矿产生产企业的一项重要的安全教育内容，也是进行井下活动必不可少的环节之一。其中，生产认知培训便是岗前培训的重要组成部分。通过生产认知培训，下井人员可以了解矿产的地表分布、地质资源等多种知识。
4.现有技术中，地下矿产生产企业进行生产认知培训通常是通过视频的方式来进行的。拍摄这些视频资源后，需要再对其进行配音等处理，才能作为生产认知培训的培训视频，整个过程十分繁琐。

技术实现要素：

5.有鉴于此，本技术实施例提供了一种视频生成方法、装置、终端设备及介质，用以提高视频生成的效率。
6.本技术实施例的第一方面提供了一种视频生成方法，包括：
7.获取按照预先规划的设计方案拍摄得到的多个视频段，每个视频段具有相应的视频顺序号；
8.针对目标视频段，从多段视频解说词中获取与所述目标视频段相匹配的目标解说词，所述目标视频段为所述多个视频段中的任一视频段；
9.确定所述目标解说词在所述目标视频段中的起始位置；
10.通过从所述起始位置开始播放所述目标解说词的方式，将所述目标解说词与所述目标视频段组合为有声视频段；
11.按照所述视频顺序号，将组合得到的多个有声视频段生成为视频。
12.本技术实施例的第二方面提供了一种视频生成装置，包括：
13.视频段获取模块，用于获取按照预先规划的设计方案拍摄得到的多个视频段，每个视频段具有相应的视频顺序号；
14.目标解说词获取模块，用于针对目标视频段，从多段视频解说词中获取与所述目标视频段相匹配的目标解说词，所述目标视频段为所述多个视频段中的任一视频段；
15.起始位置确定模块，用于确定所述目标解说词在所述目标视频段中的起始位置；
16.有声视频段组合模块，用于通过从所述起始位置开始播放所述目标解说词的方式，将所述目标解说词与所述目标视频段组合为有声视频段；
17.视频生成模块，用于按照所述视频顺序号，将组合得到的多个有声视频段生成为
视频。
18.本技术实施例的第三方面提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述第一方面所述的视频生成方法。
19.本技术实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如上述第一方面所述的视频生成方法。
20.本技术实施例的第五方面提供了一种计算机程序产品，当所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述第一方面所述的视频生成方法。
21.与现有技术相比，本技术实施例包括以下优点：
22.本技术实施例，通过获取按照预先规划的设计方案拍摄得到的多个视频段，可以针对目标视频段，首先从多段视频解说词中获取与目标视频段相匹配的目标解说词。在确定目标解说词在目标视频段中的起始位置后，可以通过从该起始位置开始播放目标解说词的方式，将目标解说词与目标视频段组合为有声视频段，从而按照视频顺序号，将组合得到的多个有声视频段生成为视频。本技术实施例可以根据设计方案独立地进行视频段拍摄和解说词录制，由终端设备自动地对视频段和解说词进行组合，提高了视频生成的效率。
附图说明
23.为了更清楚地说明本技术实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍。显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
24.图1是本技术实施例的一种视频生成方法的步骤流程示意图；
25.图2是本技术实施例的一种视频生成方法的步骤s102的实现方式示意图；
26.图3是本技术实施例的一种视频生成方法的步骤s103的一种实现方式示意图；
27.图4是本技术实施例的一种视频生成方法的步骤s103的另一种实现方式示意图；
28.图5是本技术实施例的一种视频生成装置的示意图；
29.图6是本技术实施例的一种终端设备的示意图。
具体实施方式
30.以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本技术实施例。然而，本领域技术人员应当清楚，在没有这些具体细节的其他实施例中也可以实现本技术。在其他情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本技术的描述。
31.下面通过具体实施例来说明本技术的技术方案。
32.参照图1，示出了本技术一个实施例的一种视频生成方法的步骤流程示意图，具体可以包括如下步骤：
33.s101、获取按照预先规划的设计方案拍摄得到的多个视频段，每个视频段具有相应的视频顺序号。
34.需要说明的是，本方法可以应用于终端设备，该终端设备可以是具有音视频处理能力的电子设备，本技术实施例对终端设备的具体类型不作限定。
35.在本技术实施例中，预先规划的设计方案可以是生成视频的分镜设计方案。该设计方案中包括组成视频的多个视频段的场景内容，以及每个视频段的时长、对应的解说词等信息。
36.如表一所示，是一种视频的设计方案示例。该视频是一种矿产生产企业的生产认知培训视频。
37.表一：
[0038][0039]
在本技术实施例中，可以按照上述设计方案拍摄多个视频段，每个视频段的时长、场景内容及景别应当符合上述设计方案的实际要求。每个视频段具有相应的视频顺序号，该视频顺序号与设计方案中的编号相同。
[0040]
需要说明的是，上述表一中的解说词以及场景内容等仅仅是一种示例，并非完整的解说词及场景内容。
[0041]
s102、针对目标视频段，从多段视频解说词中获取与所述目标视频段相匹配的目标解说词，所述目标视频段为所述多个视频段中的任一视频段。
[0042]
在本技术实施例中，目标视频段可以是多个视频段中的任一视频段。每个视频段对应的视频解说词可以按照设计方案预先录制得到。每段视频解说词具有相应的解说词顺序号，该解说词顺序号与表一中的编号相同。
[0043]
在本技术实施例的一种可能的实现方式中，如图2所示，从多段视频解说词中获取与目标视频段相匹配的目标解说词可以包括如下子步骤s1021
‑
s1022：
[0044]
s1021、确定所述目标视频段的目标视频顺序号，所述目标视频顺序号为所述设计方案中规划的所述目标视频段的播放顺序。
[0045]
s1022、从多段视频解说词中获取所述解说词顺序号与所述目标视频顺序号相同的目标解说词。
[0046]
在具体实现中，可以首先确定目标视频段的目标视频顺序号。例如，表一中场景内容为“矿山大场景、工业场地、生产设备”的视频段，其视频顺序号为1。
[0047]
然后，可以从多段视频解说词中获取解说词顺序好与上述视频顺序号相同的目标解说的。例如，在上述示例中，与视频顺序号1对应的解说词为“企业概述：生产规模、业绩、生产系统建设情况”的解说词。
[0048]
s103、确定所述目标解说词在所述目标视频段中的起始位置。
[0049]
在本技术实施例中，确定目标解说词在目标视频段中的起始位置可以是指确定在最终生成的视频中，目标解说词应当从当前视频段的何处开始解说。
[0050]
在本技术实施例的一种可能的实现方式中，如图3所示，确定目标解说词在目标视频段中的起始位置可以包括如下子步骤s1031
‑
s1032：
[0051]
s1031、识别所述目标视频段中的至少一个音频标记帧。
[0052]
在本技术实施例中，音频标记帧可以是在对拍摄得到的视频段进行处理时标记在某一视频帧上的，该音频标记帧可以用于表示某段解说词应当从本视频帧开始进行解说。
[0053]
需要说明的是，每段视频段中被标记的音频标记帧可以包括多个，也可以只包括一个。在某些情况下，若本段视频段中无需解说词，则本段视频段中也可以没有音频标记帧，本技术实施例对此不作限定。
[0054]
s1032、按照所述目标视频段的播放顺序，将所述至少一个音频标记帧中位置最靠前的音频标记帧确定为所述目标解说词的起始位置。
[0055]
在本技术实施例中，由于音频标记帧表示的是解说词开始的位置，因此，在识别出目标视频段中的音频标记帧后，可以按照目标视频段的播放顺序，将音频标记帧中位置最靠前的音频标记帧确定为目标解说词的起始位置。上述目标视频段的播放顺序可以是指播放目标视频段时，从视频段开始到视频段结束的顺序。
[0056]
在本技术实施例的一种可能的实现方式中，目标解说词可以包括多个解说词段。例如，在表一的设计方案中，解说词“企业概述：生产规模、业绩、生产系统建设情况”可以被划分为“生成规模”、“业绩”、“生产系统建设情况”等多个解说词段。
[0057]
对于多个解说词段，终端设备可以根据目标解说词和/或目标视频段的播放顺序，确定每个解说词段与每个音频标记帧之间的对应关系，然后，将具有上述对应关系的音频标记帧确定为对应的解说词段的起始位置。其中，解说词段的数量可以根据设计方案的要求，与音频标记帧的数量保持一致。即，有多少个解说词段，就标记多个少音频标记帧。
[0058]
示例性的，对于上述“生成规模”、“业绩”、“生产系统建设情况”三个解说词段，可以按照设计方案在视频段中标记三个音频标记帧。这样，每个音频标记帧可以作为一个解说词段的起始位置。
[0059]
在本技术实施例的另一种可能的实现方式中，终端设备还可以通过语义识别和图像识别的方式，来确定目标解说词在目标视频段中的起始位置。
[0060]
如图4所示，通过语义识别和图像识别的方式，确定目标解说词在目标视频段中的起始位置可以包括如下子步骤s1033
‑
s1035：
[0061]
s1033、对所述目标解说词开头预设长度的内容进行语义识别，以提取所述目标解说词中的首个实体对象。
[0062]
在本技术实施例中，对于目标解说词，可以首先对其开头预设长度的内容进行语义识别，得到这段内容中的实体对象。上述预设长度可以是解说词的解说时长，也可以是解说词的文字个数。
[0063]
以预设长度为文字个数为例。可以对目标解说词开头前15个文字进行语义识别，得到其中包含的首个实体对象。
[0064]
在本技术实施例中，实体对象可以人物、物体等具有实际意义的对象。
[0065]
示例性的，对于如下的一段解说词“新型矿井安全系统的使用，提高了井下作业的安全性”，经语义识别可知，“矿井”为这段接收词中的首个实体对象。
[0066]
s1034、确定所述目标视频段中首次出现所述首个实体对象的视频帧。
[0067]
在本技术实施例中，图像识别可以用于识别出目标视频段的各个视频帧中包含的实体对象。例如，通过图像识别，可以确定哪些视频帧中包含有“矿井”这一实体对象。
[0068]
s1035、将所述视频帧确定为所述首个实体对象的起始位置。
[0069]
在本技术实施例中，可以将首次出现上述首个实体对象的视频帧确定为目标解说词中该首个实体对象的起始位置。
[0070]
例如，对于目标视频段中的各个视频帧，若n帧为首次出现“矿井”这一实体对象的视频帧，则可以将解说词中首次出现的“矿井”与第n帧对齐。由于在解说词中出现“矿井”这一实体对象前，还包括解说词“新型”，因此，可以将解说词“新型”适当前移，与第n帧前的某一视频帧对齐。例如，将n帧前的第m帧作为“新型”这一解说词的起始位置，保证在播放到第n帧时，能够正常播放“矿井”这一解说词。
[0071]
需要说明的是，上述将解说词第n帧前的某一视频帧对齐时，可以根据解说词的语速等数据，确定每一帧可容纳的解说词数量，从而确定具体需要前移的视频帧数量。
[0072]
s104、通过从所述起始位置开始播放所述目标解说词的方式，将所述目标解说词与所述目标视频段组合为有声视频段。
[0073]
在本技术实施例中，确定出目标解说词的起始位置后，终端设备可以从该起始位置播放视频段和解说词，并将二者组合为有声视频段。
[0074]
由于拍摄得到的视频段包括多个，因此，组合得到的有声视频段也应当包括多个。
[0075]
s105、按照所述视频顺序号，将组合得到的多个有声视频段生成为视频。
[0076]
在本技术实施例中，对于组合得到的多个有声视频段，终端设备可以首先确定每个有声视频段的拼接顺序号，该拼接顺序号与有声视频段对应的目标视频段的视频顺序号相同。然后，可以按照拼接顺序号，将多个有声视频段拼接为视频。这样，就生成了包含有解说词的一段完整的视频内容。
[0077]
在本技术实施例中，由于上述处理过程均有终端设备自动完成，其在确定解说词的起始位置等时候可能存在一定的偏差，导致解说词与视频画面可能存在些许偏移。因此，在按照拼接顺序号，将多个有声视频段拼接为培训视频之后，终端设备还可以接收用户针对视频的调整指令，该调整指令可以用于对视频中的解说词的播放位置进行微调，从而得到音频与画面准确匹配的视频。
[0078]
在本技术实施例中，通过获取按照预先规划的设计方案拍摄得到的多个视频段，可以针对目标视频段，首先从多段视频解说词中获取与目标视频段相匹配的目标解说词。在确定目标解说词在目标视频段中的起始位置后，可以通过从该起始位置开始播放目标解说词的方式，将目标解说词与目标视频段组合为有声视频段，从而按照视频顺序号，将组合得到的多个有声视频段生成为视频。本技术实施例可以根据设计方案独立地进行视频段拍摄和解说词录制，由终端设备自动地对视频段和解说词进行组合，提高了视频生成的效率。
[0079]
需要说明的是，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本技术实施例的实施过程构成任何限定。
[0080]
参照图5，示出了本技术一个实施例的一种视频生成装置的示意图，具体可以包括视频段获取模块501、目标解说词获取模块502、起始位置确定模块503、有声视频段组合模块504和视频生成模块505，其中：
[0081]
视频段获取模块501，用于获取按照预先规划的设计方案拍摄得到的多个视频段，每个视频段具有相应的视频顺序号；
[0082]
目标解说词获取模块502，用于针对目标视频段，从多段视频解说词中获取与所述目标视频段相匹配的目标解说词，所述目标视频段为所述多个视频段中的任一视频段；
[0083]
起始位置确定模块503，用于确定所述目标解说词在所述目标视频段中的起始位置；
[0084]
有声视频段组合模块504，用于通过从所述起始位置开始播放所述目标解说词的方式，将所述目标解说词与所述目标视频段组合为有声视频段；
[0085]
视频生成模块505，用于按照所述视频顺序号，将组合得到的多个有声视频段生成为视频。
[0086]
在本技术实施例中，每段视频解说词具有相应的解说词顺序号，所述目标解说词获取模块502具体用于：
[0087]
确定所述目标视频段的目标视频顺序号，所述目标视频顺序号为所述设计方案中规划的所述目标视频段的播放顺序；
[0088]
从多段视频解说词中获取所述解说词顺序号与所述目标视频顺序号相同的目标解说词。
[0089]
在本技术实施例中，所述起始位置确定模块503具体用于：
[0090]
识别所述目标视频段中的至少一个音频标记帧；
[0091]
按照所述目标视频段的播放顺序，将所述至少一个音频标记帧中位置最靠前的音频标记帧确定为所述目标解说词的起始位置。
[0092]
在本技术实施例中，所述目标解说词包括多个解说词段，所述目标视频段包括多个音频标记帧，所述起始位置确定模块503还用于：
[0093]
根据所述目标解说词和/或所述目标视频段的播放顺序，确定每个解说词段与每个音频标记帧之间的对应关系；
[0094]
将具有所述对应关系的音频标记帧确定为对应的解说词段的起始位置。
[0095]
在本技术实施例中，所述起始位置确定模块503还用于：
[0096]
对所述目标解说词开头预设长度的内容进行语义识别，以提取所述目标解说词中的首个实体对象；
[0097]
确定所述目标视频段中首次出现所述首个实体对象的视频帧；
[0098]
将所述视频帧确定为所述首个实体对象的起始位置。
[0099]
在本技术实施例中，所述视频生成模块505具体用于：
[0100]
确定每个有声视频段的拼接顺序号，所述拼接顺序号与所述有声视频段对应的目标视频段的视频顺序号相同；
[0101]
按照所述拼接顺序号，将所述多个有声视频段拼接为视频。
[0102]
在本技术实施例中，所述装置还包括：
[0103]
微调模块，用于接收用户针对所述视频的调整指令，所述调整指令用于对所述视频中的解说词的播放位置进行微调。
[0104]
对于装置实施例而言，由于其与方法实施例基本相似，所以描述得比较简单，相关之处参见方法实施例部分的说明即可。
[0105]
参照图6，示出了本技术一个实施例的一种终端设备的示意图。如图6所示，本实施例的终端设备600包括：处理器610、存储器620以及存储在所述存储器620中并可在所述处理器610上运行的计算机程序621。所述处理器610执行所述计算机程序621时实现上述视频生成方法各个实施例中的步骤，例如图1所示的步骤s101至s105。或者，所述处理器610执行所述计算机程序621时实现上述各装置实施例中各模块/单元的功能，例如图5所示模块501至505的功能。
[0106]
示例性的，所述计算机程序621可以被分割成一个或多个模块/单元，所述一个或者多个模块/单元被存储在所述存储器620中，并由所述处理器610执行，以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段可以用于描述所述计算机程序621在所述终端设备600中的执行过程。例如，所述计算机程序621可以被分割成视频段获取模块、目标解说词获取模块、起始位置确定模块、有声视频段组合模块和视频生成模块，各模块具体功能如下：
[0107]
视频段获取模块，用于获取按照预先规划的设计方案拍摄得到的多个视频段，每个视频段具有相应的视频顺序号；
[0108]
目标解说词获取模块，用于针对目标视频段，从多段视频解说词中获取与所述目标视频段相匹配的目标解说词，所述目标视频段为所述多个视频段中的任一视频段；
[0109]
起始位置确定模块，用于确定所述目标解说词在所述目标视频段中的起始位置；
[0110]
有声视频段组合模块，用于通过从所述起始位置开始播放所述目标解说词的方式，将所述目标解说词与所述目标视频段组合为有声视频段；
[0111]
视频生成模块，用于按照所述视频顺序号，将组合得到的多个有声视频段生成为视频。
[0112]
所述终端设备600可包括，但不仅限于，处理器610、存储器620。本领域技术人员可以理解，图6仅仅是终端设备600的一种示例，并不构成对终端设备600的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述终端设备600还可以包括输入输出设备、网络接入设备、总线等。
[0113]
所述处理器610可以是中央处理单元(central processing unit，cpu)，还可以是其他通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现成可编程门阵列(field
‑
programmable gate array，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0114]
所述存储器620可以是所述终端设备600的内部存储单元，例如终端设备600的硬盘或内存。所述存储器620也可以是所述终端设备600的外部存储设备，例如所述终端设备
600上配备的插接式硬盘，智能存储卡(smart media card，smc)，安全数字(secure digital，sd)卡，闪存卡(flash card)等等。进一步地，所述存储器620还可以既包括所述终端设备600的内部存储单元也包括外部存储设备。所述存储器620用于存储所述计算机程序621以及所述终端设备600所需的其他程序和数据。所述存储器620还可以用于暂时地存储已经输出或者将要输出的数据。
[0115]
本技术实施例还公开了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如前述各个实施例所述的视频生成方法。
[0116]
本技术实施例还公开了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如前述各个实施例所述的视频生成方法。
[0117]
本技术实施例还公开了一种计算机程序产品，当所述计算机程序产品在终端设备上运行时，使得所述终端设备执行前述各个实施例所述的视频生成方法。
[0118]
以上所述实施例仅用以说明本技术的技术方案，而非对其限制。尽管参照前述实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种大数据采集系统的数据安全防护系统的制作方法

视频生成方法、装置、终端设备及介质与流程

相关文献

最热文献