一种视频生成方法、装置、电子设备及存储介质与流程

2022-04-02 07:30:32 来源：中国专利 TAG：

1.本公开涉及互联网技术领域，尤其涉及一种视频生成方法、装置、电子设备及存储介质。

背景技术：

2.网络技术的发展，使得视频应用在人们的日常生活中非常流行。在一些场景中，由于视频的实时性以及时长的关系，用户较难通过观看完整的视频，以了解视频的内容。相关技术中，通过从视频中选取一段连续部分，生成目标视频，这种方式下生成的目标视频并不能很好的帮助用户快速了解原视频的内容，无法满足用户需求。

技术实现要素：

3.本公开提供一种视频生成方法、装置、电子设备及存储介质，本公开的技术方案如下：
4.根据本公开实施例的第一方面，提供一种视频生成方法，包括：
5.获取待处理视频；
6.从待处理视频中确定出多个视频片段；多个视频片段中每个视频片段表征描述预设类别对象的图像序列；
7.确定每个视频片段的片段类型；片段类型是根据每个视频片段中的对象信息确定的，对象信息包括预设类别对象；
8.从多个视频片段中确定多个目标视频片段；多个目标视频片段中每个目标视频片段的片段类型相同；
9.基于多个目标视频片段生成目标视频。
10.在一些可能的实施例中，确定每个视频片段的片段类型之后，从多个视频片段中确定多个目标视频片段之前，方法还包括：
11.获取目标音频；目标音频包括多个点位；
12.从多个视频片段中确定多个目标视频片段，包括：
13.从多个视频片段中确定与多个点位的数量相匹配的多个目标视频片段；
14.基于多个目标视频片段生成目标视频，包括：
15.根据多个目标视频片段和目标音频生成目标视频。
16.在一些可能的实施例中，获取待处理视频，包括：
17.对获取的直播视频流数据进行处理，得到待处理视频。
18.在一些可能的实施例中，待处理视频的时长为第一预设时长；对获取的直播视频流数据进行处理，得到待处理视频，包括：
19.当接收到处于直播状态的第一账户的第一视频生成请求时，将接收到第一视频生成请求的时刻当作起始时刻；
20.从起始时刻开始计时，在到达预设时长时，将实时获取的直播视频流数据作为待
处理视频；
21.将当前时刻再次作为起始时刻，得到新的待处理视频。
22.在一些可能的实施例中，对获取的直播视频流数据进行处理，得到待处理视频，包括：
23.当接收到处于非直播状态的第一账户的第二视频生成请求时，根据第二视频生成请求中携带的直播数据标识，获取直播数据标识对应的直播视频流数据；
24.按照第二预设时长，对直播视频流数据进行切分处理，得到多个待处理视频；其中，每个待处理视频的时长为第二预设时长。
25.在一些可能的实施例中，从待处理视频中确定出多个视频片段，包括：
26.对待处理视频进行视频内容理解处理，得到视频内容描述信息；视频内容描述信息包括多个视频片段和多个视频片段中每个视频片段对应的对象描述信息，对象描述信息中对象的类别包括预设类别。
27.在一些可能的实施例中，确定每个视频片段的片段类型，包括：
28.对每个视频片段进行对象识别，得到每个视频片段的对象信息；
29.当对象信息中包括目标对象和至少一个预设类别对象时，确定视频片段为第一片段类型；或者；当对象信息中仅包括多个预设属性相同的预设类别对象，且不包括目标对象时，确定视频片段为第二片段类型；或者；当对象信息中包括至少两个预设属性不同的预设类别对象，且不包括目标对象时，确定视频片段为第三片段类型。
30.在一些可能的实施例中，从多个视频片段中确定多个目标视频片段，包括：
31.根据目标片段类型，从多个视频片段中确定多个候选视频片段；
32.获取多个候选视频片段中每个候选视频片段的多个特征信息；
33.根据每个候选视频片段的多个特征信息，对多个候选视频片段进行排序，得到排序后的多个候选视频片段；
34.从排序后的多个候选视频片段中，确定与多个点位的数量相匹配的多个目标视频片段。
35.在一些可能的实施例中，从排序后的多个候选视频片段中，确定与多个点位的数量相匹配的多个目标视频片段，包括：
36.将排序后的多个候选视频片段中排序前n位的候选视频片段确定为多个目标视频片段；其中，n的大小根据多个点位的数量确定。
37.在一些可能的实施例中，多个目标视频片段用于依次与对应的音频片段进行融合；音频片段表征多个点位中相邻点位之间的音频片段；根据所述多个目标视频片段与目标音频生成目标视频，包括：
38.针对多个目标视频片段中的每个目标视频片段：
39.若目标视频片段的时长大于对应的音频片段的时长，根据音频片段的时长对目标视频片段进行裁剪或者以第一倍速进行播放；
40.或者；
41.若目标视频片段的时长小于对应的音频片段的时长，根据音频片段的时长将目标视频片段进行复播或者以第二倍速进行播放；
42.其中，第一倍速大于第二倍速。
43.在一些可能的实施例中，从排序后的多个候选视频片段中，确定与多个点位的数量相匹配的多个目标视频片段，包括：
44.将多个点位中的第一个点位当作当前点位；
45.根据当前点位与下一个相邻点位之间的音频片段的时长，在排序后的多个候选视频片段中，确定出与音频片段的时长相匹配的目标视频片段；
46.将下一个相邻点位再次当作当前点位，得到新的多个目标视频片段。
47.在一些可能的实施例中，多个特征信息包括多个直播属性数据；
48.根据每个候选视频片段的多个特征信息，对多个候选视频片段进行排序，包括：
49.根据预设直播属性优先级顺序和每个候选视频片段的多个直播属性数据，对多个候选视频片段进行排序。
50.在一些可能的实施例中，多个直播属性数据包括直播间观看人数峰值、对象链接点击数量中的至少一个。
51.在一些可能的实施例中，获取目标音频，包括：
52.确定待生成目标视频的目标时长；
53.从音频资源池中确定出与目标时长匹配的目标音频。
54.根据本公开实施例的第二方面，提供一种视频生成装置，包括：
55.第一获取模块，被配置为执行获取待处理视频；
56.第一确定模块，被配置为执行从待处理视频中确定出多个视频片段；多个视频片段中每个视频片段表征描述预设类别对象的图像序列；
57.第二确定模块，被配置为执行确定每个视频片段的片段类型；片段类型是根据每个视频片段中的对象信息确定的，对象信息包括预设类别对象；
58.第三确定模块，被配置为执行从多个视频片段中确定多个目标视频片段；多个目标视频片段中每个目标视频片段的片段类型相同；
59.生成模块，被配置为执行基于多个目标视频片段生成目标视频。
60.在一些可能的实施例中，装置还包括：
61.第二获取模块，被配置为执行获取目标音频；目标音频包括多个点位；
62.第三确定模块，被配置为执行从多个视频片段中确定与多个点位的数量相匹配的多个目标视频片段；
63.生成模块，被配置为执行根据多个目标视频片段和目标音频生成目标视频。
64.在一些可能的实施例中，第一获取模块，还被配置为执行对获取的直播视频流数据进行处理，得到待处理视频。
65.在一些可能的实施例中，待处理视频的时长为第一预设时长；第一获取模块，包括：
66.第一处理单元，被配置为执行当接收到处于直播状态的第一账户的第一视频生成请求时，将接收到第一视频生成请求的时刻当作起始时刻；
67.第二处理单元，被配置为执行从起始时刻开始计时，在到达预设时长时，将实时获取的直播视频流数据作为待处理视频；
68.第三处理单元，被配置为执行将当前时刻再次作为起始时刻，得到新的待处理视频。
69.在一些可能的实施例中，第一获取模块，包括：
70.第四处理单元，被配置为执行当接收到处于非直播状态的第一账户的第二视频生成请求时，根据第二视频生成请求中携带的直播数据标识，获取直播数据标识对应的直播视频流数据；
71.第五处理单元，被配置为执行按照第二预设时长，对直播视频流数据进行切分处理，得到多个待处理视频；其中，每个待处理视频的时长为第二预设时长。
72.在一些可能的实施例中，第一确定模块，还被配置为执行对待处理视频进行视频内容理解处理，得到视频内容描述信息；视频内容描述信息包括多个视频片段和多个视频片段中每个视频片段对应的对象描述信息，对象描述信息中对象的类别包括预设类别。
73.在一些可能的实施例中，第二确定模块，包括：
74.识别单元，被配置为执行对每个视频片段进行对象识别，得到每个视频片段的对象信息；
75.类型确定单元，被配置为执行当对象信息中包括目标对象和至少一个预设类别对象时，确定视频片段为第一片段类型；或者；当对象信息中仅包括多个预设属性相同的预设类别对象，且不包括目标对象时，确定视频片段为第二片段类型；或者；当对象信息中包括至少两个预设属性不同的预设类别对象，且不包括目标对象时，确定视频片段为第三片段类型。
76.在一些可能的实施例中，第三确定模块，包括：
77.第一确定单元，被配置为执行根据目标片段类型，从多个视频片段中确定多个候选视频片段；
78.获取单元，被配置为执行获取多个候选视频片段中每个候选视频片段的多个特征信息；
79.排序单元，被配置为执行根据每个候选视频片段的多个特征信息，对多个候选视频片段进行排序，得到排序后的多个候选视频片段；
80.第二确定单元，被配置为执行从排序后的多个候选视频片段中，确定与多个点位的数量相匹配的多个目标视频片段。
81.在一些可能的实施例中，第二确定单元，还被配置为执行将排序后的多个候选视频片段中排序前n位的候选视频片段确定为多个目标视频片段；其中，n的大小根据多个点位的数量确定。
82.在一些可能的实施例中，多个目标视频片段用于依次与对应的音频片段进行融合；音频片段表征多个点位中相邻点位之间的音频片段；
83.生成模块，被配置为执行针对多个目标视频片段中的每个目标视频片段：若目标视频片段的时长大于对应的音频片段的时长，根据音频片段的时长对目标视频片段进行裁剪或者以第一倍速进行播放；或者；若目标视频片段的时长小于对应的音频片段的时长，根据音频片段的时长将目标视频片段进行复播或者以第二倍速进行播放；其中，第一倍速大于第二倍速。
84.在一些可能的实施例中，第二确定单元，还被配置为执行将多个点位中的第一个点位当作当前点位；根据当前点位与下一个相邻点位之间的音频片段的时长，在排序后的多个候选视频片段中，确定出与音频片段的时长相匹配的目标视频片段；将下一个相邻点
位再次当作当前点位，得到新的多个目标视频片段。
85.在一些可能的实施例中，多个特征信息包括多个直播属性数据；
86.排序单元，还被配置为执行根据预设直播属性优先级顺序和每个候选视频片段的多个直播属性数据，对多个候选视频片段进行排序。
87.在一些可能的实施例中，多个直播属性数据包括直播间观看人数峰值、对象链接点击数量中的至少一个。
88.在一些可能的实施例中，第一获取模块，还被配置为执行确定待生成目标视频的目标时长；从音频资源池中确定出与目标时长匹配的目标音频。
89.根据本公开实施例的第三方面，提供一种电子设备，包括：
90.处理器；
91.用于存储处理器可执行指令的存储器；
92.其中，处理器被配置为执行指令，以实现本公开实施例第一方面提供的视频生成方法。
93.根据本公开实施例的第四方面，提供一种计算机可读存储介质，当计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行本公开实施例第一方面提供的视频生成方法。
94.根据本公开实施例的第五方面，提供一种计算机程序产品，计算机程序产品包括计算机程序，计算机程序存储在可读存储介质中，计算机设备的至少一个处理器从可读存储介质读取并执行计算机程序，使得计算机设备执行本公开实施例第一方面提供的视频生成方法。
95.本公开的实施例提供的技术方案至少带来以下有益效果：
96.通过对待处理视频进行处理，得到与预设类别对象相关的多个视频片段，确定视频片段的片段类型，从多个视频片段中选取所需要的片段类型的多个目标视频片段，生成目标视频；最终生成的目标视频中各目标视频片段的类型相同，且展示有待处理视频中的预设类别对象，使得目标视频与待处理视频的内容关联度较高，目标视频整体的显示效果比较统一，可以帮助用户快速了解原视频内容，可以提升用户体验。
97.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
98.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。
99.图1是根据一示例性实施例示出的一种应用环境的示意图；
100.图2是根据一示例性实施例示出的一种视频生成方法的流程图；
101.图3是根据一示例性实施例示出的一种得到待处理视频的流程图；
102.图4是根据一示例性实施例示出的另一种得到待处理视频的流程图；
103.图5是根据一示例性实施例示出的一种确定每个视频片段的片段类型的流程图；
104.图6是根据一示例性实施例示出的一种确定多个目标视频片段的流程图；
105.图7是根据一示例性实施例示出的另一种确定多个目标视频片段的流程图；
106.图8是根据一示例性实施例示出的一种确定目标视频片段的示意图；
107.图9是根据一示例性实施例示出的一种视频生成装置框图；
108.图10是根据一示例性实施例示出的一种用于视频生成的电子设备的框图。
具体实施方式
109.为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。
110.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的第一对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
111.需要说明的是，本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)，均为经用户授权或者经过各方充分授权的信息。
112.请参阅图1，图1是根据一示例性实施例示出的一种视频生成方法的应用环境的示意图，如图1所示，该应用环境可以包括服务器01和客户端02。
113.在一些可能的实施例中，服务器01可以获取待处理视频，从待处理视频中确定出多个视频片段；多个视频片段中每个视频片段表征描述预设类别对象的图像序列；确定每个视频片段的片段类型；片段类型是根据每个视频片段中的对象信息确定的，对象信息包括预设类别对象；从多个视频片段中确定多个目标视频片段；多个目标视频片段中每个目标视频片段的片段类型相同；基于多个目标视频片段生成目标视频，然后向客户端02发送目标视频。
114.在一些可能的实施例中，服务器01可以包括是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network，内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。服务器上运行的操作系统可以包括但不限于安卓系统、ios系统、linux、windows、unix等。
115.在一些可能的实施例中，上述的客户端02可以包括但不限于智能手机、台式计算机、平板电脑、笔记本电脑、智能音箱、数字助理、增强现实(augmented reality，ar)/虚拟现实(virtual reality，vr)设备、智能可穿戴设备等类型的客户端。也可以为运行于上述客户端的软体，例如应用程序、小程序等。可选的，客户端上运行的操作系统可以包括但不限于安卓系统、ios系统、linux、windows、unix等。
116.此外，需要说明的是，图1所示的仅仅是本公开提供的视频生成方法的一种应用环境，在实际应用中，还可以包括其他应用环境。
117.图2是根据一示例性实施例示出的一种视频生成方法的流程图，如图2所示，视频生成方法可以应用于服务器，也可以应用于其他节点设备，包括以下步骤：
118.在步骤s201中，获取待处理视频。
119.在一些可能的实施例中，服务器可以接收到其他设备传输的待处理视频；或者；服务器可以接收到其他设备传输的原始视频，由服务器对该原始视频进行预处理操作后，得到待处理视频。其中，其他设备为待处理视频或者原始视频的提供方的设备。
120.在一些可能的实施例中，服务器也可以从本地存储区域或者远端存储区域中获取到待处理视频或者原始视频，当获取的是原始视频时，由服务器对该原始视频进行预处理操作后，得到待处理视频。其中，待处理视频或者原始视频是服务器预先存储在本地存储区域或者远端存储区域上的。
121.本公开实施例中，待处理视频可以是客户端用户使用视频交互类软件拍摄得到的视频。在一个具体的应用场景中，比如直播场景，待处理视频还可以是对直播视频流数据进行处理得到的视频。
122.相关技术中，用户进入视频直播间之后才能了解商家所售卖的是何种类型的商品，导致用户在寻找自己所需要的商品的直播间时，可能会重复进入多个不相关的视频直播间，效率低。因而，本公开可以基于直播视频流数据生成目标视频，该目标视频中仅展示与直播间的商品相关的片段，如此，可以节约用户寻找直播间的时间，提升用户体验。
123.相应的，在一些可能的实施例中，上述步骤s201中，获取待处理视频具体可以包括：获取直播视频流数据；对获取的直播视频流数据进行处理，得到待处理视频。
124.具体的，服务器可以对正在直播的视频流数据或者已经直播完毕的直播回放视频进行处理，得到待处理视频，再通过后续步骤对待处理视频进行进一步的处理，生成相应的目标视频。该目标视频可以投放至推广平台，用户在通过客户端浏览推广平台的推广界面时，可以观看到该目标视频，通过观看该目标视频，使得用户可以快速理解对应的直播间内所展示的对象；根据不同的直播间类型，相应的，直播间内所展示的对象的类型不同，比如，当直播间为购物直播间时，所展示的对象为商品；当直播间为游戏直播间时，所展示的对象可以包括游戏中的虚拟人物。
125.上述实施例中，通过对获取的直播视频流数据进行处理，得到待处理视频，进一步结合后续步骤生成目标视频；一方面，对直播用户而言，将目标视频通过推广平台进行推广，可以吸引更多对其展示的对象所感兴趣的观看用户；另一方面，对于观看直播的用户而言，通过观看该目标视频，可以快速了解对应的直播间所展示的商品，从而用户无需频繁地进入退出直播间，即可快速找到其寻找的对象所在的直播间，可以极大地提升用户体验。
126.在一些可能的实施例中，待处理视频的时长为第一预设时长；上述对获取的直播视频流数据进行处理，得到待处理视频，具体可以包括如图3所示的以下步骤：
127.在步骤s301中，当接收到处于直播状态的第一账户的第一视频生成请求时，将接收到第一视频生成请求的时刻当作起始时刻。
128.实际应用中，正在直播的直播用户即处于直播状态的第一账户可以根据需要，在客户端所显示的直播界面上执行预设操作以触发第一视频生成请求的生成，同时向服务器发送该第一视频生成请求，该第一视频生成请求用于指示服务器对第一账户对应的直播视频流数据进行处理，以生成相应的目标视频。
129.在步骤s303中，从起始时刻开始计时，在到达预设时长时，将实时获取的直播视频流数据作为待处理视频。
130.在步骤s305中，将当前时刻作为起始时刻，重复步骤：从起始时刻开始计时，在到
达第一预设时长时，将实时获取的直播视频流数据作为待处理视频。
131.对于处于直播状态的第一账户，服务器获取该第一账户对应的直播视频流数据。相应的，服务器可以每隔预设时长对第一账户的直播视频流数据进行处理，将该预设时长的直播视频流数据作为待处理视频，并经后续处理步骤得到目标视频。如此，可以及时地生成相应的目标视频，以便用户及时地观看到该目标视频，通过目标视频了解到相应的直播间正在展示的对象，以减少用户的重复操作，可以提升用户体验。
132.其中，第一预设时长可以是10分钟、20分钟或者30分钟等；具体时长可以根据实际需求设定。
133.在一个具体的实施例中，处于直播状态的某一购物直播间的主播，通过其客户端的直播界面上点击目标视频生成按钮，可以触发第一视频生成请求的生成，服务器在接收到客户端发送的第一视频生成请求后，开始计时并获取该主播对应的直播视频流数据，在到达第一个10分钟时，将该第一个10分钟内获取的直播视频流数据作为待处理视频，对待处理视频进行后续步骤的处理，得到目标视频；同时，将计时清零，重新开始新一轮的计时，在到达第二个10分钟时，基于该第二个10分钟内获取的直播视频流数据又可以得到一个待处理视频，然后同样地对该待处理视频进行后续步骤的处理，可以得到一个新的目标视频。
134.上述实施例中，服务器每隔预设时长可以得到一个待处理视频，该待处理视频包含最新的直播数据，从而基于该待处理视频可以得到反映当前直播对象的目标视频，使得目标视频中所展示的对象与实际直播间内所展示的对象能够尽量保持一致，使得观看用户可以了解到直播间的最新状况。
135.在一些可能的实施例中，上述对获取的直播视频流数据进行处理，得到待处理视频，具体可以包括如图4所示的以下步骤：
136.在步骤s401中，当接收到处于非直播状态的第一账户的第二视频生成请求时，根据第二视频生成请求中携带的直播数据标识，获取直播数据标识对应的直播视频流数据。
137.实际应用中，对于第一账户过去的直播回放视频，服务器也可以对其进行处理得到待处理视频，再经后续步骤处理得到目标视频；相应的，直播数据标识表征直播回放视频的标识。具体的，第一账户可以在客户端所显示的直播回放视频列表中选择目标直播回放视频，以触发第二视频生成请求的生成，同时向服务器发送该第二视频生成请求，该第二视频生成请求携带有所述目标直播回放视频的标识，该第二视频生成请求用于指示服务器根据目标直播回放视频的标识获取目标直播回放视频，对目标直播回放视频进行处理，得到目标视频。
138.在步骤s403中，按照第二预设时长，对直播视频流数据进行切分处理，得到多个待处理视频；其中，每个待处理视频的时长为第二预设时长。
139.相应的，服务器在获取到目标直播回放视频后，可以对目标直播回放视频进行切分处理。具体的，服务器按照目标直播回放视频中各图像帧的时序，对目标直播回放视频进行切分处理，得到多个待处理视频，每个待处理视频的时长为第二预设时长；其中，第二预设时长可以是10分钟、20分钟或者30分钟等；具体时长可以根据实际需求设定。
140.服务器可以对多个待处理视频中的每个待处理视频进行后续步骤的处理；或者；服务器可以从多个待处理视频中选取预设数量的待处理视频进行后续步骤的处理，其中选取预设数量的待处理视频可以由服务器来执行，也可以由服务器向第一账户的客户端发送
相应的选取指令，选取指令指示第一账户从多个待处理视频中选取预设数量的待处理视频，服务器根据客户端返回选取指令反馈信息，确定预设数量的待处理视频，然后对其中的每个待处理视频进行后续步骤的处理。如此，基于直播回放视频生成的目标视频中，包含有过去直播间展示过的对象，通过将该目标视频在客户端中相应的对象描述页面中进行展示，增加关于对象的动态讲解效果。
141.比如，某化妆品商家选取其过去直播的关于化妆品的直播回放视频，服务器可以将该关于化妆品的直播回放视频进行切分处理，得到多个待处理视频，每个待处理视频中可能包含一段与化妆品无关的内容，也可能包含多个不同类型的化妆品的介绍，服务器通过后续步骤对待处理视频进行处理后，可以将与化妆品无关的内容删除，得到的目标视频中仅包含相同类型的化妆品的介绍，服务器可以将目标视频在客户端中的购物软件中的相应化妆品的购物页面中进行展示，增加关于该化妆品的动态讲解效果，帮助购买用户快速直观的了解该化妆品，可以提升用户体验。
142.在步骤s203中，从待处理视频中确定出多个视频片段；多个视频片段中每个视频片段表征描述预设类别对象的图像序列。
143.本公开实施例中，服务器对待处理视频进行处理，从待处理视频中确定出多个视频片段，每个视频片段均包括一定数量的图像帧，即每个视频片段是一个图像序列，不同视频片段之间各自包含的图像帧的数量可以不同。预设类别对象指的是预先设定的某一类别的对象。
144.在一些可能的实施例中，服务器通过预设算法对待处理视频进行处理，将待处理视频中与所述预先设定的某一类别的对象相关的图像帧识别出来，每个视频片段中相邻的两个图像帧在原待处理视频中，可以是连续的两个图像帧，也可以是间隔预设帧数内的两个图像帧。
145.在一些可能的实施例中，上述从待处理视频中确定出多个视频片段，具体可以包括以下步骤：
146.对待处理视频进行视频内容理解处理，得到视频内容描述信息；视频内容描述信息包括多个视频片段和多个视频片段中每个视频片段对应的对象描述信息，对象描述信息中对象的类别包括预设类别。
147.其中，预设类别即为上述的预先设定的某一类别。对待处理视频进行视频内容理解处理的主要目的是，将待处理视频中与所述预先设定的某一类别的对象相关的片段识别出来；相应的，服务器可以采用视频内容理解算法或者相关机器学习模型对待处理视频进行处理，或者，通过图像语义提取、视频动作识别、视频场景理解等方式中的一种或多种的结合，从视频内容描述信息将与预设类别有关的对象描述信息提取出来，得到多个视频片段。
148.在一个具体的实施例中，预设类别为商品；基于购物直播间的直播视频流数据得到待处理视频，假设该待处理视频的时长为10分钟，该待处理视频经过视频内容理解后，得到的视频内容描述信息包括多个视频片段，即视频片段1、视频片段2、视频片段3、视频片段4
……
，以及每个视频片段对应的对象描述信息，比如视频片段1的对象描述信息包括：对象的类别包括商品、人，视频片段2的对象描述信息包括：对象的类别包括商品、人，视频片段3的对象描述信息包括：对象的类别包括商品，视频片段4的对象描述信息包括：对象的类别
包括商品。需要说明的是，视频内容理解处理可以仅对待处理视频进行粗粒度的识别，即只需要将对象的大致类别识别出来即可，比如，该具体的实施例中，对象描述信息中对象的类别包括商品，至于该对象具体的是何种属性的商品，可以在后续步骤中进行细粒度的识别。
149.上述实施例中，通过视频内容理解将待处理视频中与预设类别(商品)对象有关的片段提取出来，得到的多个视频片段均是与预设类别(商品)对象相关的内容，如此，可以将无效内容进行剔除，使得最终基于该多个视频片段生成的目标视频的内容均是围绕预设类别(商品)对象的内容，便于观看用户从中获取有效信息。
150.在一些可能的实施例中，每个视频片段的时长不超过预设时长。相应的，服务器在对待处理视频进行视频内容理解处理，得到多个视频片段之后，还可以包括以下步骤：
151.服务器确定每个视频片段中的图像帧数；
152.若视频片段的图像帧数大于预设帧数，对视频片段进行减帧或者提高帧率处理。
153.其中，减帧指的是减少视频片段中图像帧的数量；提高帧率指的是增加每秒所显示的图像帧的数量。预设帧数与视频片段的预设时长相对应，两者之间根据原视频片段的帧率可以进行换算。如此，通过减帧或者提高帧率处理，可以控制视频片段的时长不超过预设时长；由于后续需要将多个视频片段进行拼接合成以生成目标视频，因而实际应用中，该预设时长可以设定的相对较短，比如2秒、4秒、5秒或10秒等。
154.在步骤s205中，确定每个视频片段的片段类型；片段类型是根据每个视频片段中的对象信息确定的，对象信息包括预设类别对象。
155.本公开实施例中，服务器针对每个视频片段，根据该视频片段中的对象信息确定该视频片段的片段类型。
156.在一些可能的实施例中，对象信息可以是基于上述实施例中视频内容描述信息中的对象描述信息得到的；此时，对上述实施例中服务器使用的相应的视频内容理解算法或者机器学习模型的识别细粒度要求较高，即需要将待处理视频中每个对象的属性信息识别出来，这样做的好处是，可以省略对每个视频片段进行识别的步骤。
157.在一些可能的实施例中，对象信息可以是服务器对每个视频片段进行细粒度的识别后得到的。相应的，上述确定每个视频片段的片段类型，具体可以包括如图5所示的以下步骤：
158.在步骤s501中，对每个视频片段进行对象识别，得到每个视频片段的对象信息。
159.具体的，服务器可以采用对象识别算法，得到每个视频片段的对象信息；其中，对象信息包括视频片段中所有对象的属性信息；其中，属性信息可以包括名称、颜色、型号、品牌中的至少一种。可以理解的，在一个视频片段中，可以包含多个预设类别对象，多个预设类别对象出现在该视频片段中的不同图像帧中。
160.服务器可以根据每个视频片段的对象信息，确定视频片段的片段类型。即，根据视频片段中所包含的对象的类别和/或属性信息确定对应的片段类型，比如下述步骤s503提供了一种具体的确定方式。
161.在步骤s503中，当对象信息中包括目标对象和至少一个预设类别对象时，确定视频片段为第一片段类型；或者；当对象信息中仅包括多个预设属性相同的预设类别对象，且不包括目标对象时，确定视频片段为第二片段类型；或者；当对象信息中包括至少两个预设属性不同的预设类别对象，且不包括目标对象时，确定视频片段为第三片段类型。
162.其中，目标对象是预先设定的某一类别的对象，目标对象的类别与预设类别对象的类别不同。预设属性可以是上述名称、颜色、型号、品牌中的任一种。
163.在直播场景中，目标对象可以是主播，预设类别对象可以是主播正在介绍的商品对象。预设属性可以是对象名称。基于上文的实施例，服务器对视频片段1进行对象识别，得到该视频片段1的对象信息包括4个对象，即对象1的类别为人，名称为主播；对象2的类别为商品，名称为口红，颜色为201；对象3的类别为商品，名称为口红，颜色为202；对象4的类别为商品，名称为粉饼，颜色为01；由于视频片段1的对象信息中包含目标对象(对象1)和三个预设类别对象(对象2、对象3和对象4的类别均为商品)，则确定视频片段1为第一片段类型。同理，视频片段2的对象信息包括主播、口红203和口红204，则相应的，确定视频片段2为第一片段类型。同理，视频片段3的对象信息仅包括口红205、口红206、口红207，则相应的，确定视频片段3为第二片段类型。同理，视频片段4的对象信息包括口红208、粉饼02，则相应的，确定视频片段4为第三片段类型。
164.上述实施例中，通过确定每个视频片段的片段类型，从而在后续步骤中，基于相同片段类型的视频片段生成目标视频，可以保证目标视频的整体画风一致，可以提高用户观看体验。实际应用中，还可以根据不同的需求选择相应的片段类型，生成符合特定用户需求的目标视频。比如，考虑到某些用户对特定直播间的偏好，服务器可以基于第一片段类型下的视频片段生成目标视频，或者，某些用户对某具体种类的商品的兴趣度较高，服务器可以基于第二片段类型下的视频片段生成目标视频。
165.在步骤s207中，从多个视频片段中确定多个目标视频片段；多个目标视频片段中每个目标视频片段的片段类型相同。
166.在步骤s209中，基于多个目标视频片段生成目标视频。
167.本公开实施例中，目标视频中各目标视频片段的类型相同，且展示有待处理视频中的预设类别对象，使得目标视频与待处理视频的内容关联度较高，且目标视频整体的显示效果比较统一。
168.在一些可能的实施例中，在步骤s205之后，步骤s207之前，本公开实施例的视频生成方法还可以包括：
169.在步骤s206中，获取目标音频；目标音频包括多个点位。
170.本公开实施例中，服务器获取目标音频，并得到目标音频的多个点位，点位表征目标音频中卡点节拍所在的时刻。服务器从多个视频片段中确定与多个点位的数量相匹配的多个目标视频片段，每个目标视频片段用于填充至相邻两个点位之间，以生成目标视频，目标视频的背景音乐即为所述目标音频。
171.相应的，上述从多个视频片段中确定多个目标视频片段，可以包括：从多个视频片段中确定与多个点位的数量相匹配的多个目标视频片段。
172.相应的，上述基于多个目标视频片段生成目标视频，可以包括：根据多个目标视频片段和目标音频生成目标视频。
173.本公开实施例中，服务器根据多个目标视频片段与目标音频生成目标视频，具体的，服务器可以先将多个目标视频片段的原始背景音乐去除，再将各目标视频片段与对应的音频片段进行融合，得到目标视频；如此，目标视频中每个点位即卡点节拍所在的时刻能够进行目标视频片段的切换，可以实现精准卡点，相较于传统展示预设类别对象的视频，显
示效果更加丰富，可以提高用户观看体验。
174.在一些可能的实施例中，卡点节拍是预先通过节拍识别模型得到并存储在服务器中的。
175.在一些可能的实施例中，上述获取目标音频，具体可以包括以下步骤：
176.确定待生成目标视频的目标时长；
177.从音频资源池中确定出与目标时长匹配的目标音频。
178.具体的，服务器中存储有音频资源池，音频资源池中包含海量的音频资源；服务器可以接收客户端发送的用户请求，用户请求携带有用户所需的目标视频的目标时长；服务器根据用户所需的目标时长，从音频资源池中确定出与目标时长相匹配的目标音频；其中，与目标时长相匹配的目标音频，可以包括时长为目标时长的音频，也可以包括时长接近于目标时长的音频。
179.上述实施例中，优先考虑用户需求，基于用户对目标视频的时长需求，首先确定符合时长需求的目标音频，再根据目标音频的点位数量从多个视频片段中确定相同数量的多个目标视频片段。
180.在本公开的其他实施例中，服务器也可以基于用户对目标视频片段的需求，基于用户在客户端选取的多个目标视频片段，根据用户所选取的目标视频片段的数量，确定点位数量，然后在音频资源池中搜索满足该点位数量的音频，将其作为目标音频。
181.在一些可能的实施例中，上述从多个视频片段中确定多个目标视频片段，具体可以包括如图6所示的以下步骤：
182.在步骤s601中，根据目标片段类型，从多个视频片段中确定多个候选视频片段。
183.其中，多个候选视频片段中每个候选视频片段均为目标片段类型。目标片段类型可以是上述实施例中的第一片段类型、第二片段类型和第三片段类型中的任一种；服务器可以将基于每个片段类型，生成对应的目标视频。以目标片段类型为第一片段类型为例，则此时，视频片段1和视频片段2为候选视频片段。
184.在步骤s603中，获取多个候选视频片段中每个候选视频片段的多个特征信息。
185.在步骤s605中，根据每个候选视频片段的多个特征信息，对多个候选视频片段进行排序，得到排序后的多个候选视频片段。
186.实际应用中，候选视频片段的数量可能较多，而一个目标视频中能够容纳的视频片段数量是有限的。因而，上述实施例中，基于每个候选视频片段的多个特征信息，对多个候选视频片段进行排序，从排序后的多个候选视频片段中确定与多个点位的数量相匹配的多个目标视频片段，如此，可以保证具备重要特征的候选视频片段能够出现在目标视频中，可以提高目标视频的内容质量。
187.当应用在直播场景中时，上述多个特征信息可以包括多个直播属性数据；相应的，上述根据每个候选视频片段的多个特征信息，对多个候选视频片段进行排序，具体包括：根据预设直播属性优先级顺序和每个候选视频片段的多个直播属性数据，对多个候选视频片段进行排序。
188.其中，直播属性数据指的是与直播间相关的指标数据；
189.在一个具体的实施例中，上述多个直播属性数据包括直播间观看人数峰值、对象链接点击数量、直播间点赞数量、评论数量、转发数量中的至少一个；其中，对象链接点击数
量表征直播间画面中显示的购物车图标的点击数量。
190.实际应用中，可以根据上述各直播属性数据的重要程度确定各自的优先级顺序，再根据优先级顺序对多个候选视频片段进行排序。比如，首先选出直播间观看人数峰值最大的候选视频片段，其次选出购物车图标的点击数量最大的候选视频片段，如此，按照预设直播属性优先级顺序直至确定完所有的候选视频片段的排序，或者，当确定到预设排位时停止排序。为了保证后续有足够数量的目标视频片段与目标音频的点位进行匹配，预设排位不宜设定的太小。
191.上述实施例中，按照预设直播属性优先级顺序，对多个候选视频片段进行排序，可以综合考虑不同维度指标下的数据，以根据实际需求选取目标视频片段。
192.在步骤s607中，从排序后的多个候选视频片段中，确定与多个点位的数量相匹配的多个目标视频片段。
193.在一些可能的实施例中，当确定完所有的候选视频片段的排序之后，上述从排序后的多个候选视频片段中，确定与多个点位的数量相匹配的多个目标视频片段，具体可以包括：将排序后的多个候选视频片段中排序前n位的候选视频片段确定为多个目标视频片段；其中，n的大小根据多个点位的数量确定。
194.具体的，服务器可以将目标音频中的点位数量确定为n的大小；即，根据目标音频中的点位数量选取相等数量的候选视频片段作为目标视频片段。
195.相应的，在后续步骤中，按照多个目标视频片段的顺序依次对应填充至对应的点位，以生成目标视频。
196.在一些可能的实施例中，服务器先执行获取目标音频的步骤，再执行确定多个目标视频片段的步骤；从而，上述从排序后的多个候选视频片段中，确定与多个点位的数量相匹配的多个目标视频片段，具体还可以包括如图7所示的以下步骤：
197.在步骤s701中，将多个点位中的第一个点位当作当前点位。
198.实际应用中，为了计算方便，服务器将目标音频的起始时刻作为多个点位中的第一个点位对应的时刻，将目标音频的结束时刻作为多个点位中的最后一个点位。则，相应的，若目标音频包括n个点位，则相应的需要从多个候选视频片段中确定出n-1个目标视频片段。
199.为了便于理解，下面通过一个简单的例子进行说明。如图8所示，目标音频包括10个点位，其中第一个点位(点位0)对应的时刻为00’00”，其余点位对应的时刻如图所示；假设存在已排序的100个候选视频片段，且该100个候选视频片段的片段类型相同，比如片段类型均为上述第二片段类型；下面介绍如何从这100个候选视频片段中选取9个目标视频片段，以生成目标视频。
200.在步骤s703中，根据当前点位与下一个相邻点位之间的音频片段的时长，在排序后的多个候选视频片段中，确定出与音频片段的时长相匹配的目标视频片段。
201.如图8所示，下一个相邻点位(点位1)对应的时刻为00’02”，则确定音频片段的时长为2秒，然后在排序后的多个候选视频片段中，确定当前最高排位的候选视频片段的时长是否为2秒；若当前最高排位的候选视频片段的时长为2秒，则将当前最高排位的候选视频片段作为目标视频片段；或者；若当前最高排位的候选视频片段的时长不为2秒，则判断当前最高排位的下一个排位的候选视频片段的时长是否为2秒，若下一个排位的候选视频片
段的时长为2秒，则将其作为目标视频片段；若下一个排位的候选视频片段的时长也不为2秒，则继续往下寻找，直至找到时长为2秒的候选视频片段；
202.若100个候选视频片段中不存在时长为2秒的候选视频片段，则基于预设调节阈值对2秒进行调整，获得调节后的时长，然后再从100个候选视频片段中，从最高排位的候选视频片段开始，判断其时长是否满足调节后的时长；比如，调节后的时长可以是1秒至3秒区间内的任一时长，即预设调节阈值为1秒；则候选视频片段的时长只要在1秒至3秒区间内，即可确定为目标视频片段。
203.在步骤s705中，将下一个相邻点位当作当前点位，重复步骤s703：根据当前点位与下一个相邻点位之间的音频片段的时长，在排序后的多个候选视频片段中，确定出与音频片段的时长相匹配的目标视频片段；直至当前点位为多个点位中的最后一个点位，得到多个目标视频片段。
204.如图8所示，将点位1当作当前点位，重复上述步骤s703；下一个相邻点位(点位2)对应的时刻为00’06”，则确定当前点位(点位1)与点位2之间的音频片段的时长为4秒，在排序后的多个候选视频片段中，参照上文实施例介绍的方式确定出与点位1与点位2之间的音频片段对应的目标候选视频；直至当前点位为点位9时，得到9个目标视频片段。
205.上述实施例中，服务器在获取目标音频之后，根据目标音频的多个点位中相邻点位之间的音频片段的时长，优先将多个候选视频片段中时长与音频片段的时长相匹配的候选视频片段作为目标视频片段，如此，目标视频片段能够保持原画面的播放速率，且保证画面完整度。
206.在一些可能的实施例中，多个目标视频片段用于依次与对应的音频片段进行融合；音频片段表征多个点位中相邻点位之间的音频片段；上述根据所述多个目标视频片段与目标音频生成目标视频，具体可以包括以下步骤：
207.针对多个目标视频片段中的每个目标视频片段：若目标视频片段的时长大于对应的音频片段的时长，根据音频片段的时长对目标视频片段进行裁剪或者以第一倍速进行播放；或者；若目标视频片段的时长小于对应的音频片段的时长，根据音频片段的时长将目标视频片段进行复播或者以第二倍速进行播放；其中，第一倍速大于第二倍速；
208.将处理后的目标视频片段与对应的音频片段进行融合，得到目标视频。
209.其中，裁剪指的是对目标视频片段进行减帧处理，以使得减帧后的目标视频片段的时长等于对应的音频片段的时长；第一倍速大于1，第二倍速小于1，如此，在目标视频片段的时长大于对应的音频片段的时长时，将目标视频片段以大于1的速率进行快放，可以起到缩短目标视频片段的作用；在目标视频片段的时长小于对应的音频片段的时长时，将目标视频片段以小于1的速率进行慢放，可以起到延长目标视频片段的时长的作用。
210.在一个具体的实施例中，多个目标视频片段，是排序后的多个候选视频片段中排序前n位的候选视频片段，比如，图8中排序后的100个候选视频片段中选取的前9个候选视频片段，前9个候选视频片段用于依次与对应的音频片段进行融合。相应的，在根据该前9个候选视频片段和目标音频生成目标视频的过程中，针对该前9个候选视频片段中每个候选视频片段，确定其时长与对应的音频片段的时长之间的大小关系，以第一个候选视频片段为例，其对应的音频片段的时长为2秒，假设第一个候选视频片段的时长为4秒，则可以减少第一个候选视频片段中的图像帧数，或者，以2倍速进行快放，以将第一个候选视频片段的
时长调节为2秒，使得与对应的音频片段的时长相等；又比如第二个候选视频片段，其对应的音频片段的时长为4秒，假设第二个候选视频片段的时长为2秒，则，在对应的音频片段中，可以重复播放该第二个候选视频片段，第二次播放时，只需播放前1秒的内容，或者，将该第二个候选视频片段以0.5倍速进行慢放，以将第二个候选视频片段的时长调节为4秒。
211.该实施例的时长调整方法同样适用于上述实施例中，时长在1秒至3秒区间内但不为2秒的候选视频片段，通过对其进行裁剪、倍速调节、复播等方式，将候选视频片段的时长修整为与对应的音频片段的时长相同，以便于融合得到能够准确卡点的目标视频。
212.在一些可选的实施例中，可以在目标视频中增加辅助说明信息，包括预设类别对象的宣传语。
213.上述实施例中，通过对待处理视频进行处理，得到与预设类别对象相关的多个视频片段，确定视频片段的片段类型，根据实际需求，从多个视频片段中选取所需要的片段类型多个目标视频片段，结合目标音频的多个点位，生成目标视频；相邻点位之间可以展示一个目标视频片段，且由于目标视频片段的类型相同，使得目标视频整体的显示效果比较统一；且目标视频中每个点位即卡点节拍所在的时刻能够进行目标视频片段的切换，实现精准卡点，相较于传统展示预设类别对象的视频，显示效果更加丰富，可以提高用户观看体验。
214.当应用到直播场景中时，基于直播视频流数据得到待处理视频，经上述步骤处理后，可以得到多种风格的目标视频，生成的目标视频中仅展示与商品相关的片段，比如，仅包含商品的目标视频，商品可以是不同属性的商品，也可以是相同属性的商品；
215.服务器可以将目标视频投放至推广平台，用户在通过客户端浏览推广平台的推广界面时，可以观看到该目标视频，通过点击观看该目标视频，使得用户可以快速理解对应的直播间内所展示的对象，如此，可以帮助用户快速了解直播间播放内容，节约用户寻找直播间的时间，可以提升用户体验。
216.图9是根据一示例性实施例示出的一种视频生成装置框图。参照图9，该装置包括第一获取模块901、第一确定模块902、第二确定模块903、第三确定模块904和生成模块905；
217.第一获取模块901，被配置为执行获取待处理视频；
218.第一确定模块902，被配置为执行从待处理视频中确定出多个视频片段；多个视频片段中每个视频片段表征描述预设类别对象的图像序列；
219.第二确定模块903，被配置为执行确定每个视频片段的片段类型；片段类型是根据每个视频片段中的对象信息确定的，对象信息包括预设类别对象；
220.第三确定模块904，被配置为执行从多个视频片段中确定多个目标视频片段；多个目标视频片段中每个目标视频片段的片段类型相同；
221.生成模块905，被配置为执行基于多个目标视频片段生成目标视频。
222.在一些可能的实施例中，装置还包括：
223.第二获取模块，被配置为执行获取目标音频；目标音频包括多个点位；
224.第三确定模块904，被配置为执行从多个视频片段中确定与多个点位的数量相匹配的多个目标视频片段；
225.生成模块905，被配置为执行根据多个目标视频片段和目标音频生成目标视频。
226.在一些可能的实施例中，第一获取模块901，还被配置为执行对获取的直播视频流
数据进行处理，得到待处理视频。
227.在一些可能的实施例中，待处理视频的时长为第一预设时长；第一获取模块901，包括：
228.第一处理单元，被配置为执行当接收到处于直播状态的第一账户的第一视频生成请求时，将接收到第一视频生成请求的时刻当作起始时刻；
229.第二处理单元，被配置为执行从起始时刻开始计时，在到达预设时长时，将实时获取的直播视频流数据作为待处理视频；
230.第三处理单元，被配置为执行将当前时刻再次作为起始时刻，得到新的待处理视频。
231.在一些可能的实施例中，第一获取模块901，包括：
232.第四处理单元，被配置为执行当接收到处于非直播状态的第一账户的第二视频生成请求时，根据第二视频生成请求中携带的直播数据标识，获取直播数据标识对应的直播视频流数据；
233.第五处理单元，被配置为执行按照第二预设时长，对直播视频流数据进行切分处理，得到多个待处理视频；其中，每个待处理视频的时长为第二预设时长。
234.在一些可能的实施例中，第一确定模块902，还被配置为执行对待处理视频进行视频内容理解处理，得到视频内容描述信息；视频内容描述信息包括多个视频片段和多个视频片段中每个视频片段对应的对象描述信息，对象描述信息中对象的类别包括预设类别。
235.在一些可能的实施例中，第二确定模块903，包括：
236.识别单元，被配置为执行对每个视频片段进行对象识别，得到每个视频片段的对象信息；
237.类型确定单元，被配置为执行当对象信息中包括目标对象和至少一个预设类别对象时，确定视频片段为第一片段类型；或者；当对象信息中仅包括多个预设属性相同的预设类别对象，且不包括目标对象时，确定视频片段为第二片段类型；或者；当对象信息中包括至少两个预设属性不同的预设类别对象，且不包括目标对象时，确定视频片段为第三片段类型。
238.在一些可能的实施例中，第三确定模块905，包括：
239.第一确定单元，被配置为执行根据目标片段类型，从多个视频片段中确定多个候选视频片段；
240.获取单元，被配置为执行获取多个候选视频片段中每个候选视频片段的多个特征信息；
241.排序单元，被配置为执行根据每个候选视频片段的多个特征信息，对多个候选视频片段进行排序，得到排序后的多个候选视频片段；
242.第二确定单元，被配置为执行从排序后的多个候选视频片段中，确定与多个点位的数量相匹配的多个目标视频片段。
243.在一些可能的实施例中，第二确定单元，还被配置为执行将排序后的多个候选视频片段中排序前n位的候选视频片段确定为多个目标视频片段；其中，n的大小根据多个点位的数量确定。
244.在一些可能的实施例中，多个目标视频片段用于依次与对应的音频片段进行融
合；音频片段表征多个点位中相邻点位之间的音频片段；
245.生成模块906，被配置为执行针对多个目标视频片段中的每个目标视频片段：若目标视频片段的时长大于对应的音频片段的时长，根据音频片段的时长对目标视频片段进行裁剪或者以第一倍速进行播放；或者；若目标视频片段的时长小于对应的音频片段的时长，根据音频片段的时长将目标视频片段进行复播或者以第二倍速进行播放；其中，第一倍速大于第二倍速。
246.在一些可能的实施例中，第二确定单元，还被配置为执行将多个点位中的第一个点位当作当前点位；根据当前点位与下一个相邻点位之间的音频片段的时长，在排序后的多个候选视频片段中，确定出与音频片段的时长相匹配的目标视频片段；将下一个相邻点位再次当作当前点位，得到新的多个目标视频片段。
247.在一些可能的实施例中，多个特征信息包括多个直播属性数据；
248.排序单元，还被配置为执行根据预设直播属性优先级顺序和每个候选视频片段的多个直播属性数据，对多个候选视频片段进行排序。
249.在一些可能的实施例中，多个直播属性数据包括直播间观看人数峰值、对象链接点击数量中的至少一个。
250.在一些可能的实施例中，第一获取模块901，还被配置为执行确定待生成目标视频的目标时长；从音频资源池中确定出与目标时长匹配的目标音频。
251.关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
252.图10是根据一示例性实施例示出的一种用于视频生成的电子设备1000的框图。
253.该电子设备可以是服务器，还可以是终端设备，其内部结构图可以如图10所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频生成方法。
254.本领域技术人员可以理解，图10中示出的结构，仅仅是与本公开方案相关的部分结构的框图，并不构成对本公开方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
255.在示例性实施例中，还提供了一种电子设备，包括：处理器；用于存储该处理器可执行指令的存储器；其中，该处理器被配置为执行该指令，以实现如本公开实施例中的视频生成方法。
256.在示例性实施例中，还提供了一种计算机可读存储介质，当该计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行本公开实施例中的视频生成方法。
257.在示例性实施例中，还提供了一种计算机程序产品，计算机程序产品包括计算机程序，计算机程序存储在可读存储介质中，计算机设备的至少一个处理器从可读存储介质读取并执行计算机程序，使得计算机设备执行本公开实施例的视频生成方法。
258.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以
通过计算机程序来指令相关的硬件来完成，该计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
259.本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
260.应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：点云数据发送装置、点云数据发送方法、点云数据接收装置和点云数据接收方法与流程

一种视频生成方法、装置、电子设备及存储介质与流程

相关文献

最热文献