一种视频编辑方法、装置、设备及存储介质与流程

2022-11-30 10:22:49 来源：中国专利 TAG：

1.本发明涉及多媒体技术领域，尤其涉及一种视频编辑方法、装置、设备及存储介质。

背景技术：

2.在推广游戏、电子产品等业务对象的场景中，常使用视频数据介绍游戏、电子产品等业务对象，视频数据以声音、画面呈现游戏、电子产品等业务对象的信息，内容直观明了，方便用户阅读。
3.目前，更新迭代业务对象的速度较快，如推出新的业务对象、更新原有业务对象的版本等，在更新迭代业务对象时，通常会对该业务对象配置新的视频数据进行宣传、推广。
4.如果美术人员在业务对象每更新迭代时，独立制作适配该业务对象的视频数据，这种模式的工作量较大，制作周期较长，人力、时间等成本将大大增加，整体效率较低，并且，对于游戏等业务对象，推广周期一般较短，较长的制作周期将无法满足时限性的要求。

技术实现要素：

5.本发明提供了一种视频编辑方法、装置、设备及存储介质，以解决如何在推广业务对象时提高制作适配不同渠道的视频数据的效率。
6.根据本发明的一方面，提供了一种视频编辑方法，包括：
7.确定第一业务对象，所述第一业务对象配置有用于推广所述第一业务对象的多个第一业务信息；
8.查找内容与所述第一业务对象相似的第二业务对象；
9.查找内容为介绍所述第二业务对象的原始视频数据，所述原始视频数据中具有用于推广所述第二业务对象的多个第二业务信息；
10.在所述原始视频数据中，将多个所述第二业务信息依次替换为多个所述第一业务信息，获得内容为介绍所述第一业务对象的目标视频数据。
11.根据本发明的另一方面，提供了一种视频编辑装置，包括：
12.业务对象确定模块，用于确定第一业务对象，所述第一业务对象配置有用于推广所述第一业务对象的多个第一业务信息；
13.业务对象查找模块，用于查找内容与所述第一业务对象相似的第二业务对象；
14.原始视频数据查找模块，用于查找内容为介绍所述第二业务对象的原始视频数据，所述原始视频数据中具有用于推广所述第二业务对象的多个第二业务信息；
15.目标视频数据生成模块，用于在所述原始视频数据中，将多个所述第二业务信息依次替换为多个所述第一业务信息，获得内容为介绍所述第一业务对象的目标视频数据。
16.根据本发明的另一方面，提供了一种电子设备，所述电子设备包括：
17.至少一个处理器；以及
18.与所述至少一个处理器通信连接的存储器；其中，
19.所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例所述的视频编辑方法。
20.根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序用于使处理器执行时实现本发明任一实施例所述的视频编辑方法。
21.在本实施例中，确定第一业务对象，第一业务对象配置有用于推广第一业务对象的多个第一业务信息；查找内容与第一业务对象相似的第二业务对象；查找内容为介绍第二业务对象的原始视频数据，原始视频数据中具有用于推广第二业务对象的多个第二业务信息；在原始视频数据中，将多个第二业务信息依次替换为多个第一业务信息，获得内容为介绍第一业务对象的目标视频数据。第一业务对象与第二业务对象在内容上相似，可以保证第一业务对象与原始视频数据在内容上存在一定的相似性，可以复用原始视频数据，将原始视频数据中的第二业务信息替换为第一业务信息，提高目标视频数据与第一业务对象之间的匹配程度，可以大大降低美术人员的工作量，减少目标视频数据的制作周期，大大减少人力、时间等成本，提升整体效率，并且，对于游戏等业务对象，较短的制作周期可以满足其较短的推广周期的时限性要求。
22.应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
23.为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
24.图1是根据本发明实施例一提供的一种视频编辑方法的流程图；
25.图2是根据本发明实施例一提供的一种编辑目标视频数据的示意图；
26.图3是根据本发明实施例一提供的一种横幅信息的示例图；
27.图4是根据本发明实施例一提供的一种结束片段的示例图；
28.图5是根据本发明实施例二提供的一种视频编辑装置的结构示意图；
29.图6是实现本发明实施例三提供的一种电子设备的结构示意图。
具体实施方式
30.为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。
31.需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用
的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
32.实施例一
33.图1为本发明实施例一提供的一种视频编辑方法的流程图，本实施例可适用于将旧业务对象的视频数据中的旧业务信息替换为新业务对象的新业务信息、从而编辑为新业务对象的视频数据的情况，该方法可以由视频编辑装置来执行，该视频编辑装置可以采用硬件和/或软件的形式实现，该视频编辑装置可配置于电子设备中。如图1所示，该方法包括：
34.步骤101、确定第一业务对象。
35.在不同的业务场景中分布有具备该业务场景中业务特性的对象，记为业务对象，业务对象可以是实体物品，例如，手机、平板电脑、智能手表，等等，业务对象也可以为虚拟物品，多为第三方的应用程序，例如，游戏、短视频应用、直播应用、购物应用，等等，本实施例对此不加以限制。
36.为使本领域技术人员更好地理解本发明，在本实施例中，将游戏作为业务对象的一种示例进行说明。
37.其中，游戏的类型可以包括moba(multiplayer online battle arena，多人在线战术竞技游戏)、rpg(role-playing game，角色扮演游戏)、slg(simulation game，策略类游戏)，等等，本实施例对此不加以限制。
38.在本实施例中，将某个待推广的业务对象记为第一业务对象，该第一业务对象可以为新制作的业务对象，也可以为对旧业务对象进行版本、硬件等更新得到的业务对象，本实施例对此不加以限制。
39.美术人员可以对待推广的第一业务对象制作多个业务信息，得到第一业务信息，第一业务信息的类型可以为文本信息、图像数据、音频数据，等等，其作用为推广第一业务对象，所谓推广，可以指第一业务信息可用于告知用户第一业务对象自身的信息(如游戏中的角色、名称)，或者，吸引用户购置或下载第一业务对象的信息(如礼品码、优惠券等)，或者，购置或下载第一业务对象的方式(如应用分发平台的名称及图标、购物平台的名称及图标等)。
40.那么，在为第一业务对象编辑内容为介绍第一业务对象的视频数据时，第一业务对象配置有用于推广第一业务对象的多个第一业务信息。
41.步骤102、查找内容与第一业务对象相似的第二业务对象。
42.在本实施例中，将在先已推广的、除第一业务对象之外的其他业务对象记为第二业务对象，第二业务对象在推广时已制作内容为介绍第二业务对象的视频数据(即原始视频数据)，如果第一业务对象与第二业务对象在内容上存在一定的相似性，那么，原始视频数据与第一业务对象在内容上也会存在一定的相似性，可以作为编辑内容为介绍第一业务对象的视频数据的基础。
43.以游戏作为示例，开发游戏的厂商在先开发了一款题材为模拟商业经营的游戏
(即第二业务对象)，在推广该款游戏时制作了内容主要讲述经营商业故事的视频数据(即原始视频数据)，该厂商目前开发了一款题材为商业经营的卡片放置类游戏(即第一业务对象)，等待推广，这两款游戏的题材较为接近，均是商业经营，在设计该原始视频数据时，其故事情节主要是偏向在先的游戏的题材(即商业经营)，并没有过多展示或讲解在先的游戏的特性(如角色、玩法等)，这种故事情节同样适用于目前待推广的游戏，因而可以直接复用制作为推广目前的游戏的视频数据(即目标视频数据)。
44.因此，本实施例可以将第一业务对象与各个第二业务对象进行匹配，从而查找内容与第一业务对象相似的第二业务对象。
45.在美术人员熟悉第二业务对象的情况下，可以由美术人员筛选内容与第一业务对象相似的第二业务对象，而在第二业务对象累积数量较多的情况下，美术人员并不一定熟悉所有的第二业务对象，为提高筛选内容与第一业务对象相似的第二业务对象的效率，本实施例可以又机器自动挑选内容与第一业务对象相似的第二业务对象，为进一步保证内容的相似性，这些第二业务对象可以提供给美术人员进行审核、确认。
46.在具体实现中，一方面，从第一业务对象中提取表征内容特征的第一向量，另一方面，在本地的数据库中查询各个第二业务对象，并从第二业务对象中提取表征内容特征的第二向量，根据第一向量与第二向量计算第一业务对象与第二业务对象之间的相似度，从而根据相似度选择内容与第一业务对象相似的第二业务对象。
47.一般情况下，相似度大于或等于预设的阈值，顺序排序时、相似度排列在前n(n为正整数)个等条件可以表征第一业务对象与第二业务对象相似。
48.在本发明的一个实施例中，步骤102可以包括如下步骤：
49.步骤1021、确定多个第二业务对象。
50.在本实施例中，可以从数据库中召回多个在先已进行推广的第二业务对象，即，第二业务对象已制作内容为介绍第二业务对象的原始视频数据。
51.步骤1022、分别查询第一业务对象的第一人物信息、第一类型、第一画风信息，以及，查询每个第二业务对象的第二人物信息、第二类型、第二画风信息。
52.一方面，针对既定的第一业务对象，可以查询第一业务对象的第一人物信息、第一类型、第一画风信息，作为第一向量。
53.另一方面，针对每个第二业务对象，可以分别查询每个第二业务对象的第二人物信息、第二类型、第二画风信息，作为第二向量。
54.其中，第一人物信息与第二人物信息均可以为图像数据，可以从第一业务对象与第二业务对象中通过人脸识别检测得到，也可以由研发人员提供，等等。
55.第一画风信息与第二画风信息可以为描述画风的文本信息，也可以为使用神经网络提取的、表征画风的多维特征，等等。
56.以游戏作为示例，在应用分发平台发布游戏时，要求上传游戏的几帧代表图、类型及简要描述，这些信息均会在本地备份存储，那么，如果代表图中具有游戏中的人物，则可以挑选该代表图为人物信息(即第一人物信息、第二人物信息)，如果简要描述中具有描述画风的关键词和/或标签，则可以挑选该关键词和/或标签为画风信息(即第一画风信息、第二画风信息)。
57.步骤1023、分别计算第一人物信息与第二人物信息之间的第一相似度、第一类型
与第二类型之间的第二相似度、第一画风信息与第二画风信息之间的第三相似度。
58.在本实施例中，分别计算第一业务对象的第一人物信息与每个第二业务对象的第二人物信息之间的第一相似度，计算第一业务对象的第一类型与每个第二业务对象的第二类型之间的第二相似度，计算第一业务对象的第一画风信息与每个第二业务对象的第二画风信息之间的第三相似度。
59.由于人物信息(即第一人物信息与第二人物信息)、类型(即第一类型与第二类型)、画风信息(即第一画风信息与第二画风信息)的形式有所不同，因而计算相似度(即第一相似度、第二相似度与第三相似度)的方式也有所不同。
60.示例性地，如果人物信息的形式为图像数据，则第一人物信息与第二人物信息之间可以使用哈希算法hash(如均值哈希算法ahash、差值哈希算法dhash、感知哈希算法phash等)、均方误差mse、结构相似性ssim、峰值信噪比psnr等方式计算第一相似度。
61.如果类型的形式为既定范围内的标识(如1代表moba、2代表rgp等)，则可以比较第一类型与第二类型是否相同，如果相同，则第一类型与第二类型之间的第二相似度为1，如果不同，第一类型与第二类型之间的第二相似度为0。
62.如果画风信息的形式为文本信息或多维特征，则可以使用最小编辑距离、欧式距离、余弦距离、杰卡德相似度、汉明距离等方式计算第一画风信息与第二画风信息之间的第三相似度。
63.步骤1024、基于第一相似度、第二相似度与第三相似度筛选与第一业务对象相似的第二业务对象。
64.在本实施例中，可以综合考虑第一相似度、第二相似度与第三相似度去评估第一业务对象与第二业务对象之间的相似度，从而根据相似度选择内容与第一业务对象相似的第二业务对象。
65.例如，将第一相似度、第二相似度与第三相似度线性融合为第一业务对象与第二业务对象之间的相似度，分别识别第一相似度、第二相似度与第三相似度归属的等级并将这些等级共同映射为第一业务对象与第二业务对象之间的相似度，等等。
66.当然，上述筛选与第一业务对象相似的第二业务对象的方式只是作为示例，在实施本实施例时，可以根据实际情况设置其它筛选与第一业务对象相似的第二业务对象的方式，本实施例对此不加以限制。另外，除了上述筛选与第一业务对象相似的第二业务对象的方式外，本领域技术人员还可以根据实际需要采用其它筛选与第一业务对象相似的第二业务对象的方式，本实施例对此也不加以限制。
67.步骤103、查找内容为介绍第二业务对象的原始视频数据。
68.在先推广第二业务对象时已制作内容为介绍第二业务对象的原始视频数据，这些原始视频数据存储在本地的数据库中，那么，在为第一业务对象编辑内容为介绍第一业务对象的视频数据时，可以从该数据库中查找内容为介绍第二业务对象的原始视频数据。
69.在具体实现中，原始视频数据的内容可以划分为游戏的内容、真实的剧情两种主要的形式，其中，游戏的内容可以为用户控制游戏的过程介绍，也可以为代言人介绍游戏，还可以是代言人穿着游戏中的服饰进行介绍，而剧情可以进一步划分为如下类别：
70.1、伪美食分享
71.原始视频数据包含一些美食类的素材，吸引起用户的注意，植入玩游戏吃美食的
玩法。
72.2、贴近用户生活题材
73.原始视频数据的内容贴近用户现在的生活状态，将游戏植入到生活的方方面面，如玩游戏吃饭、买零食等。这类素材前半段主要以2人对话为主，后半段为游戏的植入片段。
74.3、夸张情景剧
75.原始视频数据包含情景剧的素材，某些剧情较为夸张，用以吸引起用户的注意。
76.当然，上述原始视频数据只是作为示例，在实施本实施例时，可以根据实际情况设置其它原始视频数据，本实施例对此不加以限制。另外，除了上述原始视频数据外，本领域技术人员还可以根据实际需要采用其它原始视频数据，本实施例对此也不加以限制。
77.在先已针对第二业务对象制作多个业务信息，得到第二业务信息，第二业务信息的类型可以为文本信息、图像数据、音频数据，等等，其作用为推广第二业务对象，所谓推广，可以指第二业务信息可用于告知用户第二业务对象自身的信息(如游戏中的角色、名称)，或者，吸引用户购置或下载第二业务对象的信息(如礼品码、优惠券等)，或者，购置或下载第二业务对象的方式(如应用分发平台的名称及图标、购物平台的名称及图标等)。
78.这些业务信息已写入原始视频数据中，因而原始视频数据中具有用于推广第二业务对象的多个第二业务信息。
79.步骤104、在原始视频数据中，将多个第二业务信息依次替换为多个第一业务信息，获得内容为介绍第一业务对象的目标视频数据。
80.一般情况下，对第一业务对象配置的第一业务信息与对第二业务对象配置的第二业务信息是配对的，即各个第一业务信息的类型与各个第二业务信息的类型是相同的。
81.在原始视频数据中可检测各个第二业务信息，针对各个第二业务信息，将第二业务信息替换为对应的第一业务信息，编辑之后的原始视频数据记为内容为介绍第一业务对象的目标视频数据。
82.进一步而言，在原始视频数据中检测各个第二业务信息时，由于第二业务信息之间的内容存在一定的交杂，而且，第二业务信息均存在原始视频数据的画面上，某些第二业务信息可能会对其他第二业务信息存在一定的干扰，为了降低这种干扰造成的影响，本实施例中可以依据各个第二业务信息之间的干扰程度，分析并制定将各个第二业务信息替换为对应的第一业务信息的顺序，按照该顺序多个第二业务信息依次替换为对应的多个第一业务信息。
83.在本发明的一个实施例中，如图2所示，第一业务信息包括第一横幅信息213、第一图标214、第一结束片段212，第二业务信息包括第二横幅信息222、第二图标221、第二结束片段223。
84.其中，第一横幅信息与第二横幅信息均属于横幅信息(banner)，如图3所示，banner一般为矩形的信息，位于顶部301和/或底部302，可记录业务对象(即第一业务对象、第二业务对象)自身的信息(如游戏中的画面、游戏中的角色、名称(如“xx游戏”))、吸引用户购置或下载第一业务对象的信息(如礼品码(如“cl888”))。
85.第一图标、第二图标均属于图标(logo)，logo为业务对象(即第一业务对象、第二业务对象)自身的标志，可以为文字性的logo(如名称)、也可以为图形性的logo。
86.第一结束片段、第二结束片段均属于结束片段(ending card，ec)，如图4所示，ec
记录业务对象(即第一业务对象、第二业务对象)自身的信息(如游戏中的角色、名称)、购置或下载业务对象的方式(如应用分发平台的图标、应用分发平台的名称(如“abc app stroe”、“efg play”)及图标、购物平台的名称及图标等)。
87.在本实施例中，步骤104可以包括如下步骤：
88.步骤1041、在原始视频数据中检测并删除第二结束片段；若已删除第二结束片段，则执行步骤1042。
89.由于第二结束片段并不包含第二横幅信息，如果先检测第二横幅信息再检测第二结束片段，在检测第二横幅信息时会有一定概率抽取到第二结束片段中的图像数据，由于无静止不变的内容，会使得无法检测出第二横幅信息，即，第二结束片段会干扰对第二横幅信息的检测，
90.因此，如图2所示，在本实施例中可首先依据第二结束片段的特性在原始视频数据210的各帧图像数据211中检测第二结束片段212，在检测到第二结束片段212时，删除第二结束片段212。
91.在一种检测方式中，考虑到ec一般位于视频数据的末尾，且时长通常在某一范围内，因此，可以以原始视频数据的结束点为起点、对原始视频数据添加时间窗口，该时间窗口具有一定的时间长度，使得该时间窗口可覆盖原始视频数据最后一定时间长度的数据，例如，时间窗口覆盖原始视频数据最后6秒的数据，等等。
92.在原始视频数据提取位于时间窗口内的多帧图像数据，以最后一帧图像数据为起始，倒序遍历检查每帧图像数据，每遍历检查一次图像数据可记为一轮检查，遍历至某帧图像数据时，可将该帧图像数据记为当前帧图像数据，即，当前帧图像数据初始为最后一帧图像数据。
93.在每轮检查中，在当前帧图像数据中执行光写字符识别(optical character recognition，ocr)，从而识别得到第一文本信息。
94.考虑到由其他内容转入到ec时，通常会有明显的转场画面(如全黑的画面)，因此，判断第一文本信息中是否包含表征结束片段的第一关键词，例如，适于安装第二业务对象的操作系统的名称，用于下载第二业务对象的应用分发平台的名称，等等。
95.若否，则表示检测到转场画面，当前帧图像数据属于转场画面，可以确定在原始视频数据中位于当前帧图像数据之后的数据为第二结束片段，从而在原始视频数据中移除第二结束片段，在移除第二结束片段之后，原始视频数据的时长减少。
96.若是，则表示检测到ec的特征，当前帧图像数据属于第二结束片段的内容，从而前移至排序在当前帧图像数据前一位的图像数据，作为新的当前帧图像数据，进入下一轮检查，直至识别出第二结束片段。
97.步骤1042、在原始视频数据中检测并删除第二横幅信息；若已删除第二横幅信息数据，则执行步骤1043。
98.如果在原始视频数据中已删除第二结束片段，则在原始视频数据中剩余第二横幅信息与第二图标，由于第二横幅信息与第二图标中均可能包含相同的信息，如第二业务对象的名称等，如果先检测第二图标再检测第二横幅信息，将有可能将第二横幅信息误判为第二图标，即，第二横幅信息会干扰对第二图标的检测。
99.因此，在本实施例中，如图2所示，如果在原始视频数据中已删除第二结束片段
212，则可以在已删除第二结束片段212的原始视频数据210中依据第二横幅信息213的特性检测第二横幅信息213，在检测到第二横幅信息213时，删除第二横幅信息213。
100.在本发明的一个实施例中，步骤1042进一步可以包括如下步骤：
101.步骤10421、在原始视频数据中检测多帧不连续、且与第二结束片段无关的图像数据。
102.在本实施例中，在检测并删除第二结束片段时，可能会遗漏部分第二结束片段未删除，尤其为转场画面(如全黑的画面)，此时，为了避免遗漏的部分第二结束片段造成干扰，可以在已删除第二结束片段的原始视频数据中，检测多帧图像数据，这些图像数据在时间上并不连续，即，这些图像数据之间间隔其他图像数据，并且，这些图像数据从可以明显规避第二结束片段的区域选取，使得这些图像数据与第二结束片段无关。
103.在一个示例中，如图2所示，可以从已删除第二结束片段212的原始视频数据210的起始点开始顺序(自起始点往结束点)延伸第一范围，作为头部215，第一范围可以以时长、帧数等方式进行计数。
104.在已删除第二结束片段212的原始视频数据210中，从头部215之后划分出第二范围，作为中部216，第二范围可以以时长、帧数等方式进行计数，中部216位于头部215之后，可以指中部215的任一时间点均小于头部216的任一时间点。
105.为了保证头部215与中部216之间、中部216与尾部217之间间隔最大化，中部216覆盖了位于中位值的图像数据，其中，中位值为已删除第二结束片段212的原始视频数据210总帧数的一半。
106.以中部216之后的干扰点开始倒序(自结束点往起始点)延伸第三范围，作为尾部217，第三范围可以以时长、帧数等方式进行计数，尾部位于中部之后，可以指尾部的任一时间点均小于中部的任一时间点。
107.其中，干扰点为与已删除第二结束片段212的原始视频数据210的结束点相距超过预设的距离的时间点，该距离可以以时长、帧数等方式进行计数，属于一个经验值，在干扰点与与已删除第二结束片段212的原始视频数据210的结束点之间可能存在遗漏的部分第二结束片段212，而在第三范围内并不存在遗漏的部分第二结束片段212。
108.分别在头部215、中部216与尾部217中按照随机或指定帧的位置等方式各提取一帧图像数据，即，在头部215中提取一帧图像数据，如第1帧图像数据，在中部216提取一帧图像数据，如位于中位值或对中位值取整的图像数据，在尾部217提取一帧图像数据，如倒数第10帧图像数据。
109.在本示例中，在已删除第二结束片段的原始视频数据中划分出头部、中部、尾部，在头部、中部与尾部中各提取一帧图像数据，头部、中部、尾部之间的间隔最大化，使得三帧图像数据之间的间隔最大化、三帧图像数据之间的内容差异最大化，避免出现三帧图像数据之间间隔较小时、画面的内容较为相似影响检测第二横幅信息的情况。
110.步骤10422、对任意两帧图像数据在灰度上的差值取绝对值。
111.步骤10423、标记绝对值为0的第一区域，作为第二横幅信息。
112.在已删除第二结束片段的原始视频数据中存在移动的物体时，帧间在灰度上会有差别，那么，本实施例可以对任意两帧图像数据在灰度上的差值取绝对值，表征灰度的变化，静止的物体在灰度的变化全是0，而移动的物体(尤其是移动物体的轮廓)存在灰度的变
化为非0。
113.由于第二横幅信息一般固定，因此，标记绝对值为0的第一区域，作为第二横幅信息，从而保证检测的复杂度低，运算量小，能够适应各种动态环境，稳定性较好。
114.步骤10424、若第二横幅信息位于图像数据的顶部和/或底部，则在原始视频数据中截取位于第一区域之外的其他区域的数据，以滤除第二横幅信息。
115.一般情况下，第二横幅信息位于图像数据的顶部和/或底部，本实施例中可以将图像数据中位于顶部和/或底部之外的其他区域设置为掩膜(mask)，将mask嵌套在已删除第二结束片段的原始视频数据中的每一帧图像数据上，截取位于mask中的数据，作为更新之后的原始视频数据，从而在更新之后的原始视频数据中滤除第二横幅信息，滤除第二横幅信息之后，原始视频数据的时长并不会发生变化，而是画面的高度减少。
116.步骤1043、在原始视频数据中检测第二图标并将第二图标替换为第一图标；若已替换第一图标，则执行步骤1044。
117.如图2所示，如果在原始视频数据210中已删除第二横幅信息213，则在原始视频数据210中剩余第二图标214，此时，可以在原始视频数据214中的每帧图像数据211中依据第二图标214的特性检测第二图标214，若检测到第二图标214，则可以直接将第二图标214替换为第一图标221。
118.在本发明的一个实施例中，步骤1043进一步可以包括如下步骤：
119.步骤10431、在原始视频数据的每帧图像数据中识别第二文本信息。
120.在已删除第二结束片段、第二横幅信息的原始视频数据中，对每帧图像数据中执行光写字符识别，得到第二文本信息。
121.考虑到第二业务对象是投放在不同国家或地区，为便于不同国家或地区的用户浏览原始视频数据，因此，原始视频数据中使用不同国家或地区的语言，因此，为保证识别第二文本信息的准确率，可以确定第二业务对象使用的语言，从而加载与语言适配的光学字符模型。
122.其中，光学字符模型用于提供光学字符识别的操作，与语言适配可以指使用该语言下的文字训练光学字符模型，使得该光学字符模型可识别该语言的文字。
123.将已删除第二结束片段、第二横幅信息的原始视频数据中的每帧图像数据输入光学字符模型中执行光学字符识别，得到第二文本信息。
124.进一步地，考虑到某些第二图标中包含较长的文字，且第二文本信息通常以矩形的文本框标识，因此，可以将位于同一行的文本框合并，得到完整的第二文本信息。
125.步骤10432、检测第二文本信息在图像数据中所处的位置。
126.第二文本信息通常以矩形的文本框标识，可以以该文本框的角点或中心点作为代表，计算角点或中心点在图像数据中所处的位置。
127.步骤10433、计算第二文本信息与为第二业务对象配置的第二关键词之间的第四相似度。
128.在本实施例中，可以预先为第二业务对象配置的第二关键词，如第二业务对象的名称等。
129.使用最小编辑距离、汉明距离等方式计算第二文本信息与第二关键词之间的第四相似度。
130.步骤10434、若位置与图像数据的角点相邻、且相似度大于预设的阈值，则确定第二文本信息所处的第二区域包含第二图标。
131.一般情况下，为了减少第二图标对原始视频数据的画面的干扰，第二图标多放置在角点附近，如果当前检测到的第二文本信息的位置与图像数据的角点相邻(即第二文本信息靠近图像数据的角点)、且相似度大于预设的阈值(表示第二文本信息与表征第二业务对象的第二关键词较为相似)，表示第二文本信息属于第二图标的一部分的概率较高，因此，可以确定第二文本信息所处的第二区域包含第二图标。
132.其中，第二文本信息所处的第二区域可以是第二文本信息的文本框本身，也可以为在第二文本信息的文本框的基础上，向四周(上下左右)扩展一定的距离得到的区域，本实施例对此不加以限制。
133.步骤10435、将第一图标写在第二区域上，以覆盖第二图标。
134.在本实施例中，将第一图标依次写在各个第二区域上，使得第一图标覆盖第二图标。
135.在具体实现中，如果第一图标与第二图标的尺寸保持一致，则可以直接将第一图标依次写在各个第二区域上，这样子可以保证第一图标覆盖第二图标。
136.如果第一图标与第二图标的尺寸并不一致，则可以分别识别第一图标的第一尺寸(含第一宽度w、第一高度h)、识别第二区域的第二尺寸(含第二宽度w、第二高度h)。
137.对第一图标进行缩放(如等高缩放和/或等宽缩放等)，以使缩放之后的第一尺寸大于或等于第二尺寸，即，第一宽度大于或等于第二宽度、且第一高度大于或等于第二高度。
138.将缩放之后的第一图标写在第二区域上，以覆盖第二图标。
139.步骤1044、在原始视频数据中分别添加第一横幅信息与第一结束片段，获得内容为介绍第一业务对象的目标视频数据。
140.如图2所示，对于已删除第二结束片段212、第二横幅信息213并将第二图标214替换为第一图标221的原始视频数据210，可以分别添加第一横幅信息222与第一结束片段223，此时，该原始视频数据的内容为介绍第一业务对象，为便于区分，可记为目标视频数据220。
141.在具体实现中，对于已删除第二结束片段、第二横幅信息并将第二图标替换为第一图标的原始视频数据，可以遍历原始视频数据中的每帧图像数据，在图像数据的头部和/或底部添加第一横幅信息。
142.由于横幅信息的设计规范较为稳定，第一横幅信息的尺寸与第二横幅信息的尺寸基本相同，因此，添加第一横幅信息之后的原始视频数据的画面的高度增加，恢复原有的高度。
143.在原始视频数据的结束点拼接第一结束片段，获得内容为介绍第一业务对象的目标视频数据。
144.由于删除第二结束片段时可能存在波动，漏删除部分第二结束片段，因此，添加第一结束片段之后的原始视频数据的时长增加，但并不一定与原有的时长相同。
145.对于目标视频数据，可输出给美术人员浏览，美术人员根据编辑的情况对目标视频数据进行后处理，例如，对第一图标进行模糊处理，以使第一图标写入画面时显得更加自
然，删除目标视频数据中遗漏的部分第二结束片段，对目标视频数据整体进行风格化处理、以增大与原始视频数据之间的差异，等等。
146.若完成后处理，可以在指定的渠道(如新闻资讯、短视频、小说阅读、运动健康等)发布目标视频数据，那么，在客户端访问该渠道时，将目标视频数据推送至客户端进行播放，用户在对第一业务对象感兴趣时，可以通过目标视频数据中的信息搜索第一业务对象，例如，从应用分发平台中搜索并下载游戏，等等。
147.在本实施例中，确定第一业务对象，第一业务对象配置有用于推广第一业务对象的多个第一业务信息；查找内容与第一业务对象相似的第二业务对象；查找内容为介绍第二业务对象的原始视频数据，原始视频数据中具有用于推广第二业务对象的多个第二业务信息；在原始视频数据中，将多个第二业务信息依次替换为多个第一业务信息，获得内容为介绍第一业务对象的目标视频数据。第一业务对象与第二业务对象在内容上相似，可以保证第一业务对象与原始视频数据在内容上存在一定的相似性，可以复用原始视频数据，将原始视频数据中的第二业务信息替换为第一业务信息，提高目标视频数据与第一业务对象之间的匹配程度，可以大大降低美术人员的工作量，减少目标视频数据的制作周期，大大减少人力、时间等成本，提升整体效率，并且，对于游戏等业务对象，较短的制作周期可以满足其较短的推广周期的时限性要求。
148.实施例二
149.图5为本发明实施例三提供的一种视频编辑装置的结构示意图。如图3所示，该装置包括：
150.业务对象确定模块501，用于确定第一业务对象，所述第一业务对象配置有用于推广所述第一业务对象的多个第一业务信息；
151.业务对象查找模块502，用于查找内容与所述第一业务对象相似的第二业务对象；
152.原始视频数据查找模块503，用于查找内容为介绍所述第二业务对象的原始视频数据，所述原始视频数据中具有用于推广所述第二业务对象的多个第二业务信息；
153.目标视频数据生成模块504，用于在所述原始视频数据中，将多个所述第二业务信息依次替换为多个所述第一业务信息，获得内容为介绍所述第一业务对象的目标视频数据。
154.在本发明的一个实施例中，所述业务对象查找模块502包括：
155.候选确定模块，用于确定多个第二业务对象；
156.业务特征查询模块，用于分别查询所述第一业务对象的第一人物信息、第一类型、第一画风信息，以及，查询每个所述第二业务对象的第二人物信息、第二类型、第二画风信息；
157.特征相似度计算模块，用于分别计算所述第一人物信息与所述第二人物信息之间的第一相似度、所述第一类型与所述第二类型之间的第二相似度、所述第一画风信息与所述第二画风信息之间的第三相似度；
158.相似度筛选模块，用于基于所述第一相似度、所述第二相似度与所述第三相似度筛选与所述第一业务对象相似的所述第二业务对象。
159.在本发明的一个实施例中，所述第一业务信息包括第一横幅信息、第一图标、第一结束片段，所述第二业务信息包括第二横幅信息、第二图标、第二结束片段；
160.所述目标视频数据生成模块504包括：
161.结束片段删除模块，用于在所述原始视频数据中检测并删除所述第二结束片段；若已删除所述第二结束片段，则调用横幅信息删除模块；
162.横幅信息删除模块，用于在所述原始视频数据中检测并删除所述第二横幅信息；若已删除所述第二横幅信息数据，则调用图标替换模块；
163.图标替换模块，用于在所述原始视频数据中检测所述第二图标并将所述第二图标替换为所述第一图标；若已替换所述所述第一图标，则调用业务信息添加模块；
164.业务信息添加模块，用于在所述原始视频数据中分别添加所述第一横幅信息与所述第一结束片段，获得内容为介绍所述第一业务对象的目标视频数据。
165.在本发明的一个实施例中，所述结束片段删除模块包括：
166.时间窗口添加模块，用于以所述原始视频数据的结束点为起点、对所述原始视频数据添加时间窗口；
167.窗口数据提取模块，用于在所述原始视频数据提取位于所述时间窗口内的多帧图像数据；
168.文本信息识别模块，用于在当前帧所述图像数据中识别第一文本信息，当前帧所述图像数据初始为最后一帧所述图像数据；
169.关键词判断模块，用于判断所述第一文本信息中是否包含表征结束片段的第一关键词；若否，则调用确定删除模块，若是，则调用前移模块；
170.确定删除模块，用于确定在所述原始视频数据中位于当前帧所述图像数据之后的数据为所述第二结束片段，在所述原始视频数据中移除所述第二结束片段；
171.前移模块，用于前移至排序在当前帧所述图像数据前一位的所述图像数据，返回调用所述文本信息识别模块。
172.在本发明的一个实施例中，所述横幅信息删除模块包括：
173.多帧数据提取模块，用于在所述原始视频数据中检测多帧不连续、且与所述第二结束片段无关的图像数据；
174.灰度差异计算模块，用于对任意两帧所述图像数据在灰度上的差值取绝对值；
175.第二横幅信息标记模块，用于标记所述绝对值为0的第一区域，作为所述第二横幅信息；
176.非横幅数据截取模块，用于若所述第二横幅信息位于所述图像数据的顶部和/或底部，则在所述原始视频数据中截取位于所述第一区域之外的其他区域的数据，以滤除所述第二横幅信息。
177.在本发明的一个实施例中，所述多帧数据提取模块包括：
178.头部划分模块，用于从所述原始视频数据的起始点开始顺序延伸第一范围，作为头部；
179.中部划分模块，用于在所述原始视频数据中，从所述头部之后划分出第二范围，作为中部；
180.尾部划分模块，用于以所述中部之后的干扰点开始倒序延伸第三范围，作为尾部，所述干扰点为与所述原始视频数据的结束点相距超过预设的距离的时间点；
181.各部提取模块，用于分别在所述头部、所述中部与所述尾部各提取一帧图像数据。
182.在本发明的一个实施例中，所述图标替换模块包括：
183.文本信息检测模块，用于在所述原始视频数据的每帧图像数据中识别第二文本信息；
184.位置检测模块，用于检测所述第二文本信息在所述图像数据中所处的位置；
185.关键词匹配模块，用于计算所述第二文本信息与为所述第二业务对象配置的第二关键词之间的第四相似度；
186.图标确定模块，用于若所述位置与所述图像数据的角点相邻、且所述第四相似度大于预设的阈值，则确定所述第二文本信息所处的第二区域包含所述第二图标；
187.图标覆盖模块，用于将所述第一图标写在所述第二区域上，以覆盖所述第二图标。
188.在本发明的一个实施例中，所述文本信息检测模块包括：
189.语言确定模块，用于确定所述第二业务对象使用的语言；
190.光学字符模型加载模块，用于加载与所述语言适配的光学字符模型；
191.光学字符模型调用模块，用于将所述原始视频数据的每帧图像数据输入所述光学字符模型中执行光学字符识别，得到第二文本信息。
192.在本发明的一个实施例中，所述图标覆盖模块包括：
193.尺寸识别模块，用于分别识别所述第一图标的第一尺寸、识别所述第二区域的第二尺寸；
194.图标缩放模块，用于对所述第一图标进行缩放，以使缩放之后的所述第一尺寸大于或等于所述第二尺寸；
195.缩放覆盖模块，用于将缩放之后的所述第一图标写在所述第二区域上，以覆盖所述第二图标。
196.在本发明的一个实施例中，所述业务信息添加模块包括：
197.横幅信息添加模块，用于遍历所述原始视频数据中的每帧图像数据，在所述图像数据的头部和/或底部添加所述第一横幅信息；
198.结束片段添加模块，用于在所述原始视频数据的结束点拼接所述第一结束片段，获得内容为介绍所述第一业务对象的目标视频数据。
199.本发明实施例所提供的视频编辑装置可执行本发明任意实施例所提供的视频编辑方法，具备执行视频编辑方法相应的功能模块和有益效果。
200.实施例三
201.图6示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明的实现。
202.如图6所示，电子设备10包括至少一个处理器11，以及与至少一个处理器11通信连接的存储器，如只读存储器(rom)12、随机访问存储器(ram)13等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序，来执行各种
适当的动作和处理。在ram 13中，还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
203.电子设备10中的多个部件连接至i/o接口15，包括：输入单元16，例如键盘、鼠标等；输出单元17，例如各种类型的显示器、扬声器等；存储单元18，例如磁盘、光盘等；以及通信单元19，例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
204.处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理，如视频编辑方法。
205.在一些实施例中，视频编辑方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元18。在一些实施例中，计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时，可以执行上文描述的视频编辑方法的一个或多个步骤。备选地，在其他实施例中，处理器11可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行视频编辑方法。
206.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
207.用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
208.在本发明的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
209.为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子
设备具有：用于向用户显示信息的显示装置(例如，crt(阴极射线管)或者lcd(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
210.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(lan)、广域网(wan)、区块链网络和互联网。
211.计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与vps服务中，存在的管理难度大，业务扩展性弱的缺陷。
212.实施例四
213.本发明实施例还提供了一种计算机程序产品，该计算机程序产品包括计算机程序，该计算机程序在被处理器执行时实现如本发明任一实施例所提供的视频编辑方法。
214.计算机程序产品在实现的过程中，可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，程序设计语言包括面向对象的程序设计语言，诸如java、smalltalk、c ，还包括常规的过程式程序设计语言，诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
215.应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本发明的技术方案所期望的结果，本文在此不进行限制。
216.上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

一种视频编辑方法、装置、设备及存储介质与流程

相关文献

最热文献