一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种视频配音方法、装置、电子设备和存储介质与流程

2021-09-22 17:20:00 来源:中国专利 TAG:互联网 配音 电子设备 装置 公开


1.本公开涉及互联网技术领域,尤其涉及一种视频配音方法、装置、电子设备和存储介质。


背景技术:

2.随着互联网技术的发展,可以进行语音交互的应用程序也成了人们日常生活不可或缺的一部分,而在语音社交、视频剪辑配音等应用语音交互的场景中,若周围环境噪音较大,则需要对语音信息进行降噪处理。
3.相关技术中,在对语音信息进行降噪处理时,需要先完成语音输入,再进行降噪处理,录音场景和降噪场景之间较为割裂,缺少场景下的连贯交互操作,从而降低了语音交互的效率,降低了用户体验。


技术实现要素:

4.本公开提供一种视频配音方法、装置、电子设备和存储介质,以至少解决相关技术中录音场景和降噪场景不连贯,语音交互效率低,用户体验低的问题。本公开的技术方案如下:
5.根据本公开实施例的第一方面,提供一种视频配音方法,所述方法包括:
6.显示录音页面,所述录音页面包括录音操作信息和目标视频;
7.响应于基于所述录音操作信息触发的录音启动指令,录制语音信息;
8.在所述语音信息的录制过程中,播放所述目标视频,并对所述语音信息进行降噪处理;
9.响应于基于所述录音操作信息触发的录音结束指令,显示包括目标语音信息的语音信息展示页面,所述目标语音信息为降噪处理后的语音信息,所述目标语音信息根据所述目标视频对应的显示时间轴上的时间填充所述目标视频对应的音频轨道。
10.作为一个可选的实施例,所述录音页面还包括处于第一状态的降噪操作信息,所述处于第一状态的降噪操作信息指示降噪功能关闭,所述方法还包括:
11.响应于基于所述处于第一状态的降噪操作信息触发的降噪启动指令,将所述录音页面中的降噪操作信息由第一状态更新为第二状态;
12.所述处于第二状态的降噪操作信息指示降噪功能开启。
13.作为一个可选的实施例,所述方法还包括:
14.响应于基于所述处于第一状态的降噪操作信息触发的降噪启动指令,获取语音降噪模型;
15.所述在所述语音信息的录制过程中,对所述语音信息进行降噪处理包括:
16.在所述语音信息的录制过程中,基于所述语音降噪模型,对所述语音信息进行降噪处理。
17.作为一个可选的实施例,所述获取语音降噪模型包括:
18.在所述降噪启动指令为预设时间段内的非首次启动指令的情况下,从缓存中获取所述语音降噪模型。
19.作为一个可选的实施例,所述获取语音降噪模型包括:
20.在所述降噪启动指令为预设时间段内的首次启动指令的情况下,从服务器中获取所述语音降噪模型。
21.作为一个可选的实施例,所述方法还包括:
22.在所述录音页面中显示所述语音降噪模型的获取进度信息。
23.作为一个可选的实施例,所述语音信息展示页面包括降噪调节信息,所述降噪调节信息表征所述目标语音信息对应的降噪程度信息;所述响应于基于所述录音操作信息触发的录音结束指令,显示包括目标语音信息的语音信息展示页面之后,所述方法还包括:
24.响应于基于所述降噪调节信息触发的降噪调节指令,更新展示在所述语音信息展示页面中所述降噪调节信息对应的降噪程度信息,所述降噪调节指令用于对所述目标语音信息的降噪程度进行调节;
25.基于所述降噪调节指令对应的降噪程度,更新所述目标语音信息;
26.在所述语音信息展示页面中展示更新后的目标语音信息。
27.作为一个可选的实施例,所述语音信息展示页面包括处于第三状态的降噪设置信息,所述处于第三状态的降噪设置信息指示降噪功能开启,所述响应于基于所述录音操作信息触发的录音结束指令,显示包括目标语音信息的语音信息展示页面之后,所述方法包括:
28.响应于基于所述降噪设置信息触发的降噪功能关闭指令,将所述语音信息展示页面中的降噪设置信息由第三状态更新为第四状态,所述第四状态的降噪设置信息指示降噪功能关闭;
29.将所述语音信息展示页面中展示的目标语音信息更新为原始语音信息,所述原始语音信息表征未降噪的语音信息。
30.根据本公开实施例的第二方面,提供一种视频配音装置,所述装置包括:
31.录音页面显示模块,被配置为执行显示录音页面,所述录音页面包括录音操作信息和目标视频;
32.录音模块,被配置为执行响应于基于所述录音操作信息触发的录音启动指令,录制语音信息;
33.降噪模块,被配置为执行在所述语音信息的录制过程中,播放所述目标视频,并对所述语音信息进行降噪处理;
34.目标语音展示模块,被配置为执行响应于基于所述录音操作信息触发的录音结束指令,显示包括目标语音信息的语音信息展示页面,所述目标语音信息为降噪处理后的语音信息,所述目标语音信息根据所述目标视频对应的显示时间轴上的时间填充所述目标视频对应的音频轨道。
35.作为一个可选的实施例,所述录音页面还包括处于第一状态的降噪操作信息,所述处于第一状态的降噪操作信息指示降噪功能关闭,所述装置还包括:
36.降噪操作信息更新模块,被配置为响应于基于所述处于第一状态的降噪操作信息触发的降噪启动指令,将所述录音页面中的降噪操作信息由第一状态更新为第二状态;所
述处于第二状态的降噪操作信息指示降噪功能开启。
37.作为一个可选的实施例,所述装置还包括:
38.模型获取模块,被配置为执行响应于基于所述处于第一状态的降噪操作信息触发的降噪启动指令,获取语音降噪模型;
39.所述录音模块包括:
40.模型处理单元,被配置为执行在所述语音信息的录制过程中,基于所述语音降噪模型,对所述语音信息进行降噪处理。
41.作为一个可选的实施例,所述模型获取模块包括:
42.第一模型获取单元,被配置为执行在所述降噪启动指令为预设时间段内的非首次启动指令的情况下,从缓存中获取所述语音降噪模型。
43.作为一个可选的实施例,所述模型获取模块包括:
44.第二模型获取单元,被配置为执行在所述降噪启动指令为预设时间段内的首次启动指令的情况下,从服务器中获取所述语音降噪模型。
45.作为一个可选的实施例,所述装置还包括:
46.进度信息显示模块,被配置为执行在所述录音页面中显示所述语音降噪模型的获取进度信息。
47.作为一个可选的实施例,所述语音信息展示页面包括降噪调节信息,所述降噪调节信息表征所述目标语音信息对应的降噪程度信息;所述装置还包括:
48.降噪调节信息更新模块,被配置为执行响应于基于所述降噪调节信息触发的降噪调节指令,更新展示在所述语音信息展示页面中所述降噪调节信息对应的降噪程度信息,所述降噪调节指令用于对所述目标语音信息的降噪程度进行调节;
49.目标语音更新模块,被配置为执行基于所述降噪调节指令对应的降噪程度,更新所述目标语音信息;
50.更新后语音展示模块,被配置为执行在所述语音信息展示页面中展示更新后的目标语音信息。
51.作为一个可选的实施例,所述语音信息展示页面包括处于第三状态的降噪设置信息,所述处于第三状态的降噪设置信息指示降噪功能开启,所述装置还包括:
52.降噪功能关闭模块,被配置为执行响应于基于所述降噪设置信息触发的降噪功能关闭指令,将所述语音信息展示页面中的降噪设置信息由第三状态更新为第四状态,所述第四状态的降噪设置信息指示降噪功能关闭;
53.原始语音展示模块,被配置为执行将所述语音信息展示页面中展示的目标语音信息更新为原始语音信息,所述原始语音信息表征未降噪的语音信息。
54.根据本公开实施例的第三方面,提供一种电子设备,所述电子设备包括:
55.处理器;
56.用于存储所述处理器可执行指令的存储器;
57.其中,所述处理器被配置为执行所述指令,以实现如上述所述的视频配音方法。
58.根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述所述的视频配音方法。
59.根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现上述所述的视频配音方法。
60.本公开的实施例提供的技术方案至少带来以下有益效果:
61.显示录音页面,录音页面包括录音操作信息和目标视频,响应于基于录音操作信息触发的录音启动指令,录制语音信息。在语音信息的录制过程中,播放目标视频并同步对获取的语音信息进行降噪处理。响应于基于所述录音操作信息触发的录音结束指令,显示包括降噪后的目标语音信息的语音信息展示页面。该方法可以在录制语音的同时对语音进行降噪处理,得到目标语音信息,可以在录音结束后得到具有降噪效果的语音信息,使得录音场景与降噪场景连贯,提高了语音处理效率,从而提高了用户体验。
62.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
63.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
64.图1是根据一示例性实施例示出的一种视频配音方法的流程图。
65.图2是根据一示例性实施例示出的一种视频配音方法中录音页面的示意图。
66.图3是根据一示例性实施例示出的一种视频配音方法中录音页面上处于第一状态的降噪操作信息的示意图。
67.图4是根据一示例性实施例示出的一种视频配音方法中录音页面上处于第二状态的降噪操作信息的示意图。
68.图5是根据一示例性实施例示出的一种视频配音方法中将降噪操作信息从第一状态切换到第二状态的示意图。
69.图6是根据一示例性实施例示出的一种视频配音方法中以弹窗的形式展示获取进度信息的示意图。
70.图7是根据一示例性实施例示出的一种视频配音方法中以横幅的形式展示获取进度信息的示意图。
71.图8是根据一示例性实施例示出的一种视频配音方法中以弹窗的形式展示降噪提示信息的示意图。
72.图9是根据一示例性实施例示出的一种视频配音方法中处于录音过程中的录音界面的示意图。
73.图10是根据一示例性实施例示出的一种视频配音方法中语音信息展示界面的示意图。
74.图11是根据一示例性实施例示出的一种视频配音方法中配音功能对应的录音页面的示意图。
75.图12是根据一示例性实施例示出的一种视频配音方法中更新降噪调节信息的示意图。
76.图13是根据一示例性实施例示出的一种视频配音方法中更新降噪设置信息的示意图。
77.图14是根据一示例性实施例示出的一种视频配音装置的框图。
78.图15是根据一示例性实施例示出的一种客户端侧的电子设备的框图。
具体实施方式
79.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
80.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
81.图1是根据一示例性实施例示出的一种视频配音方法的流程图,如图1所示,该方法用于客户端中,包括以下步骤。
82.s110.显示录音页面,录音页面包括录音操作信息和目标视频;
83.作为一个可选的实施例,录音页面可以为应用软件中的启动页面或预设页面的子页面,录音页面为应用软件中的启动页面时,响应于页面启动指令,显示录音页面。录音页面为预设页面的子页面时,响应于预设页面上的录音页面启动信息触发的页面启动指令,跳转到录音页面。
84.在实际应用中,该方法可以应用在视频配音的场景中,预设页面可以为视频上传页面,在用户上传视频后,视频上传页面可以包括配音功能信息,响应于配音功能信息触发的页面启动指令,显示配音功能对应的录音页面,录音页面包括目标视频。配音功能信息可以为指示配音功能区域的控件,例如按钮控件等,用户可以通过点击操作、滑动操作、手势操作、语音操作等不同的操作方式,进行配音功能信息的触发。
85.s120.响应于基于录音操作信息触发的录音启动指令,录制语音信息;
86.作为一个可选的实施例,请参见图2,如图2所示,录音页面上具有降噪功能开关,在降噪功能开关为开启的情况下录制语音信息,可以在录制结束后得到降噪处理后的语音信息。在实际应用中,可以获取本次语音信息录制的上一次语音信息录制时降噪功能的状态信息。若上一次语音信息录制时降噪功能为开启状态,则在本次语音信息录制时,在显示录音页面之后,显示降噪功能为开启状态。
87.在上述实施例中客户端可以根据上次设置自动启动降噪功能,从而使得在录音时可以直接对接收到的语音信息进行降噪,使得录音场景和降噪场景相连贯,无需用户进行操作,提高了场景间的结合度,并提高了语音处理的效率。
88.若上一次语音信息录制的时候,降噪功能关闭,则在本次语音信息录制时,在显示录音页面之后,显示降噪功能为关闭状态,即显示处于第一状态的降噪操作信息。
89.作为一个可选的实施例,在录音页面还包括处于第一状态的降噪操作信息时,该方法还包括:
90.响应于基于处于第一状态的降噪操作信息触发的降噪启动指令,将录音页面中的降噪操作信息由第一状态更新为第二状态。
91.作为一个可选的实施例,降噪功能还可以通过降噪启动指令开启,降噪启动指令可以由处于第一状态的降噪操作信息触发,降噪操作信息可以在两种状态间转换,其中处于第一状态的降噪操作信息指示降噪功能关闭,处于第二状态的降噪操作信息指示降噪功能开启。以降噪操作信息为通过滑动操作获取的信息为例,请参见图3,如图3所示为处于第一状态的降噪操作信息。请参见图4,如图4所示为处于第二状态的降噪操作信息。
92.请参见图5,如图5所示为对降噪操作信息的状态进行切换的示意图。响应于基于处于第一状态的降噪操作信息触发的降噪启动指令,将降噪功能从关闭状态切换到开启状态,也就是将录音页面中的降噪操作信息由第一状态更新为第二状态。
93.降噪操作信息可以为指示降噪操作区域的控件,降噪操作区域位于录音页面中,例如按钮控件等,用户可以通过点击操作、滑动操作、手势操作、语音操作等不同的操作方式,对降噪操作信息进行状态切换。可以通过降噪操作信息的图标指示降噪操作信息当前的状态,降噪操作信息的图标可以在降噪操作信息处于不同状态时显示不同的形态。
94.例如,降噪操作信息的图标为滑动按钮,滑动按钮在左侧对应降噪操作信息的第一状态,滑动按钮在右侧对应降噪操作信息的第二状态,在基于用户输入的滑动操作,将滑动按钮从左侧拖动到右侧,就可以将降噪操作信息从第一状态切换到第二状态,开启降噪功能。
95.例如,降噪操作信息对应的图标为点击按钮,点击按钮显示的第一颜色信息对应降噪操作信息的第一状态,点击按钮显示的第二颜色信息对应降噪操作信息的第二状态,在基于用户输入的点击操作,将点击按钮显示的第一颜色信息更新为第二颜色信息,就可以将降噪操作信息从第一状态切换到第二状态,开启降噪功能。
96.在上述实施例中通过切换录音页面中降噪操作信息的状态,对应触发降噪启动指令,可以增加用户对降噪功能的控制方式,便于用户进行操作。在录音开始前启动降噪功能,从而使得在录音时可以直接对接收到的语音信息进行降噪,使得录音场景和降噪场景可以无缝衔接,提高了场景间的结合度。
97.作为一个可选的实施例,该方法还包括:
98.响应于基于处于第一状态的降噪操作信息触发的降噪启动指令,获取语音降噪模型;
99.在语音信息的录制过程中,基于语音降噪模型,对语音信息进行降噪处理。
100.作为一个可选的实施例,在实际对语音信息进行降噪处理的过程中,可以将语音信息实时输入到语音降噪模型中,对语音信息进行降噪处理。语音降噪模型可以为基于隐马尔科夫方法构成的降噪模型、基于非负矩阵分解方法构成的降噪模型、基于神经网络降噪方法构成的降噪模型等不同的语音降噪模型。语音降噪模型可以进行更新,在语音降噪模型更新后,客户端可以在录音页面展示模型更新信息,响应于模型更新信息触发的模型更新指令,获取更新后的语音降噪模型。
101.响应于降噪启动指令,获取语音降噪模型。在语音信息的录制过程中,将实时获取的语音信息输入到后台运行的语音降噪模型中进行降噪处理,得到语音降噪模型输出的目标降噪信息。
102.在上述实施例中可以采用语音降噪模型对语音信息进行降噪处理,可以提高降噪处理的准确性。
103.作为一个可选的实施例,获取语音降噪模型包括:
104.在降噪启动指令为预设时间段内的首次启动指令的情况下,从服务器中获取语音降噪模型。
105.作为一个可选的实施例,在用户使用降噪功能时,根据客户端应用中的历史操作数据,确定用户是否是首次使用降噪功能,在用户首次使用降噪功能的情况下,也就是降噪启动指令为预设时间段内的首次启动指令的情况下,客户端中不存在语音降噪模型,因此需要从服务器中获取语音降噪模型。获取语音降噪模型的方式可以为在客户端向服务器发送模型获取请求后,在客户端后台接收服务器传输的语音降噪模型。
106.作为一个可选的实施例,在显示录音页面时,可以检测客户端应用中的历史操作数据,确定用户是否是首次打开录音页面,在首次显示录音页面的情况下,在触发降噪启动指令之前就可以在客户端后台获取语音降噪模型。响应于降噪启动指令,若此时已获取到语音降噪模型,则可以从客户端缓存中获取语音降噪模型,若此时还未完全获取到语音降噪模型,则显示语音降噪模型的获取进度信息。
107.作为一个可选的实施例,在从服务器获取语音降噪模型时,可以先检测用户当前的网络情况,若检测到用户使用无线网络上网时,可以在后台静默下载语音降噪模型,无需通知用户。若检测到用户使用流量上网时,可以在录音页面显示获取提示信息,该获取提示信息可以为“当前未连接到wi

fi,是否需要使用流量下载语音降噪模型”。
108.在上述实施例中在首次启动降噪功能时,可以下载语音降噪模型,从而避免语音降噪模型占用无需使用降噪功能的用户的内存空间,提高用户体验。
109.作为一个可选的实施例,获取语音降噪模型包括:
110.在降噪启动指令为预设时间段内的非首次启动指令的情况下,从缓存中获取语音降噪模型。
111.作为一个可选的实施例,根据客户端应用中的历史操作数据,确定用户是否是首次使用降噪功能,当检测到用户不是首次使用降噪功能时,由于在响应预设时间段内的首次启动指令时,客户端已经获取了语音降噪模型,因此,在降噪启动指令为预设时间段内的非首次启动指令的情况下,客户端中已存在语音降噪模型,可以从客户端缓存中直接获取语音降噪模型。
112.在上述实施例中在非首次启动降噪功能时,可以从缓存中直接获取语音降噪模型,提高了模型获取速度,简化了模型获取步骤,提高了用户体验。
113.作为一个可选的实施例,该方法还包括:
114.在录音页面中显示语音降噪模型的获取进度信息。
115.作为一个可选的实施例,在客户端在获取语音降噪模型的过程中,在录音页面中显示语音降噪模型的获取进度信息。获取进度信息可以在用户触发降噪启动指令时显示,获取进度信息也可以在用户触发降噪启动指令之后,在触发录音启动指令时显示。
116.在实际应用中显示获取进度信息时,可以通过弹窗页面的方式显示。请参见图6,响应于基于处于第一状态的降噪操作信息触发的降噪启动指令,显示获取进度信息对应的弹窗页面,获取进度信息对应的弹窗页面包括语音降噪模型的获取进度信息,获取进度信息可以对应实时的下载情况进行更新。在获取进度信息显示进度完成100%时,指示客户端下载完成语音降噪模型,关闭获取进度信息对应的弹窗页面。
117.在实际应用中显示获取进度信息时,可以以横幅方式显示获取进度信息。请参见图7,在语音降噪模型的获取过程中,在屏幕上方显示获取进度信息对应的横幅信息,获取进度信息可以对应实时的下载情况进行更新。在获取进度信息显示进度完成100%时,指示客户端下载完成语音降噪模型,关闭获取进度信息对应的横幅信息。
118.在获取进度信息显示进度完成100%时,指示客户端下载完成语音降噪模型,可以将获取进度信息更新为获取完成信息,并显示获取完成信息,获取完成信息可以显示为“语音降噪模型已下载完成”。在下载语音降噪模型的过程中,若发生下载中断的情况,可以将获取进度信息更新为获取中断信息,并显示获取中断信息,获取中断信息可以显示为“已停止下载语音降噪模型”。
119.在上述实施例中可以在录音页面中显示语音降噪模型的获取进度信息,从而提示用户模型下载的情况,提高了用户体验。
120.s130.在语音信息的录制过程中,播放目标视频并对语音信息进行降噪处理;
121.作为一个可选的实施例,在降噪功能开启的情况下,在语音信息的录制过程中,播放目标视频并对语音信息进行降噪处理。在降噪功能开启时,录音页面可以包括处于第二状态的降噪操作信息。
122.在降噪功能关闭的情况下,在语音信息的录制过程中,不对语音信息进行降噪处理。在降噪功能关闭的情况下,响应于基于录音操作信息触发的录音启动指令,对环境噪音进行检测。在检测到环境噪音满足预设条件的情况下,显示降噪提示信息,降噪提示信息用于提示用户启动降噪功能,降噪提示信息可以通过弹窗页面的方式显示,降噪提示信息对应的弹窗页面还可以包括降噪功能的降噪确认信息和状态维持信息,响应于降噪确认信息触发的降噪启动指令,启动降噪功能并关闭降噪提示信息对应的弹窗页面。响应于状态维持信息触发的状态维持指令,关闭降噪提示信息对应的弹窗页面,维持降噪功能为关闭状态。
123.在实际应用中,请参见图8,可以在录音页面中展示降噪提示信息对应的弹窗页面,在降噪提示信息对应的弹窗页面上显示“当前环境噪音过大,是否需要开启降噪功能”,同时,在降噪提示信息对应的弹窗页面上显示“是”和“否”两个按钮控件。在用户点击“是”的情况下,触发降噪启动指令,启动降噪功能并关闭降噪提示信息对应的弹窗页面,在用户点击“否”的情况下,触发状态维持指令,维持降噪功能关闭并关闭降噪提示信息对应的弹窗页面。
124.在上述实施例中可以在录音结束后得到具有降噪效果的语音信息,使得录音场景与降噪场景连贯,提高了语音处理效率,从而提高了用户体验。
125.s140.响应于基于录音操作信息触发的录音结束指令,显示包括目标语音信息的语音信息展示页面,目标语音信息为降噪处理后的语音信息,目标语音信息根据目标视频对应的显示时间轴上的时间填充目标视频对应的音频轨道。
126.作为一个可选的实施例,录音操作信息可以为指示录音操作区域的控件,例如按钮控件等,用户可以通过点击操作、滑动操作、手势操作等不同的操作方式,触发录音启动指令和录音结束指令,在实际应用中,请参见图9,用户可以长按录音操作区域,在录制语音的过程中检测到用户按压的信息时,基于录音操作信息触发录音开启指令,录制语音信息。请参见图10,在录制语音的过程中未检测到用户按压的信息时,基于录音操作信息触发录
音结束指令,结束语音信息的录制,跳转到语音信息展示页面,展示目标语音信息。在语音录制的过程中,可以实时对语音信息进行降噪处理,因此,在语音录制结束后得到的目标语音信息即为降噪处理后的语音信息。
127.在实际应用中,请参见图11,若录音页面为配音功能对应的录音页面,则录音页面包括待配音的目标视频的时间,目标视频的时间可以通过目标视频对应的显示时间轴进行显示,则在录制时间达到目标视频的时间时,基于录音操作信息触发录音结束指令,目标语音信息就可以根据目标视频对应的显示时间轴上的时间填充目标视频对应的音频轨道。若在录制语音的过程中未检测到用户按压的信息,且录制时间未达到视频时间时,显示录音页面,录音页面中可以包括语音信息的录制暂停信息。
128.在上述实施例中,可以在语音信息展示页面直接显示降噪后的语音信息,使得录音场景与降噪场景连贯,在录音场景和降噪场景的转换间无需用户进行操作,提高了语音处理效率,从而提高了用户体验。
129.作为一个可选的实施例,语音信息展示页面包括降噪调节信息,降噪调节信息表征目标语音信息对应的降噪程度信息;响应于基于录音操作信息触发的录音结束指令,显示包括目标语音信息的语音信息展示页面之后,该方法还包括:
130.响应于基于降噪调节信息触发的降噪调节指令,更新展示在语音信息展示页面中降噪调节信息对应的降噪程度信息,降噪调节指令用于对目标语音信息的降噪程度进行调节;
131.基于降噪调节指令对应的降噪程度,更新目标语音信息;
132.在语音信息展示页面中展示更新后的目标语音信息。
133.作为一个可选的实施例,请参见图12,如图12所示为降噪调节信息对应的降噪程度信息的更新。降噪调节信息可以为降噪调节功能区域中的控件,用户通过点击目标降噪程度信息对应的区域或拖动降噪调节功能区域中的滑块达到目标降噪程度信息,触发降噪调节指令。
134.例如,若用户点击降噪调节功能区域中的对应降噪程度信息为50%的区域,则目标降噪程度信息为降噪50%的降噪程度信息,触发降噪调节指令。响应于基于降噪调节信息触发的降噪调节指令,将展示在语音信息展示页面中降噪调节信息对应的降噪程度信息更新为降噪50%的降噪程度信息。
135.例如,若用户拖动降噪调节功能区域中的滑块,在检测到用户松开滑块时该滑块位于降噪程度信息为50%的区域,则目标降噪程度信息为降噪50%的降噪程度信息,触发降噪调节指令。响应于基于降噪调节信息触发的降噪调节指令,将展示在语音信息展示页面中降噪调节信息对应的降噪程度信息更新为降噪50%的降噪程度信息。
136.响应于降噪调节指令,将展示在语音信息展示页面中降噪调节信息对应的降噪程度信息更新为目标降噪程度信息,降噪调节指令用于对目标语音信息的降噪程度进行调节。
137.基于降噪调节指令对应的降噪程度,更新目标语音信息,使得目标语音信息的降噪程度与目标降噪程度信息相对应。在语音信息展示页面中展示更新后的目标语音信息,响应于用户的操作触发的语音播放指令,播放更新后的目标语音信息。
138.在上述实施例中可以在录音结束后对目标语音信息的降噪程度进行调整,可以得
到用户个性化设置的目标语音信息,增加了用户选择的多样性,从而提高了用户体验。
139.作为一个可选的实施例,语音信息展示页面包括处于第三状态的降噪设置信息,处于第三状态的降噪设置信息指示降噪功能开启,响应于基于录音操作信息触发的录音结束指令,显示包括目标语音信息的语音信息展示页面之后,该方法包括:
140.响应于基于降噪设置信息触发的降噪功能关闭指令,将语音信息展示页面中的降噪设置信息由第三状态更新为第四状态,第四状态的降噪设置信息指示降噪功能关闭;
141.将语音信息展示页面中展示的目标语音信息更新为原始语音信息,原始语音信息表征未降噪的语音信息。
142.作为一个可选的实施例,请参见图13,如图13所示为降噪设置信息对应的降噪程度信息的更新。降噪设置信息可以在两种状态间转换,第三状态的降噪设置信息指示降噪功能开启,第四状态的降噪设置信息指示降噪功能关闭。降噪设置信息可以为指示降噪设置区域的控件,降噪设置区域位于语音信息展示页面中,例如按钮控件等,用户可以通过点击操作、滑动操作、手势操作、语音操作等不同的操作方式,对降噪设置信息进行状态切换。可以通过降噪设置信息对应的图标指示降噪设置信息当前的状态,对应的图标可以在降噪设置信息处于不同状态时显示不同的形态。
143.例如,降噪设置信息的图标为滑动按钮,滑动按钮在右侧对应降噪设置信息的第三状态,滑动按钮在左侧对应降噪操作信息的第四状态,在基于用户输入的滑动操作,将滑动按钮从右侧拖动到左侧,就可以将降噪操作信息从第三状态切换到第四状态,关闭降噪功能。
144.例如,降噪设置信息对应的图标为点击按钮,点击按钮显示的第三颜色信息对应降噪操作信息的第三状态,点击按钮显示的第四颜色信息对应降噪操作信息的第四状态,在基于用户输入的点击操作,将点击按钮显示的第三颜色信息更新为第四颜色信息,就可以将降噪操作信息从第三状态切换到第四状态,关闭降噪功能。
145.在降噪设置信息处于第四状态中时,将语音信息展示页面中展示的目标语音信息更新为原始语音信息,原始语音信息表征未降噪的语音信息。响应于用户的操作触发的语音播放指令,播放原始语音信息。
146.在降噪设置信息处于第四状态时,根据处于第四状态的降噪设置信息对应的降噪程度信息,更新降噪调节信息。
147.在上述实施例中可以在录音结束后关闭目标语音信息的降噪效果,可以得到用户的原始语音信息,增加了用户选择的多样性,从而提高了用户体验。
148.作为一个可选的实施例,在录制语音信息的过程中不进行降噪处理,在响应于基于录音操作信息触发的录音结束指令,显示包括原始语音信息的语音信息展示页面之后,检测原始语音信息中的噪声信息,并在语音信息展示页面展示噪音提示信息,提示用户原始语音信息中存在噪声信息,是否需要进行降噪处理。展示噪音提示信息时,可以在语音信息展示页面中显示噪音提示信息对应的弹窗页面,响应于噪音提示信息对应的弹窗页面中的降噪确认信息触发的降噪操作指令,对原始语音信息进行降噪处理,可以得到目标语音信息。在语音信息展示页面展示目标语音信息。
149.作为一个可选的实施例,在录制语音信息的过程中不进行降噪处理,且录音页面不包括降噪操作信息,在语音信息展示页面包括处于第四状态的降噪设置信息,在响应于
基于录音操作信息触发的录音结束指令,显示包括原始语音信息的语音信息展示页面之后,响应于基于处于第四状态的降噪设置信息触发的语音降噪指令,对原始语音信息进行降噪处理,得到目标语音信息。在语音信息展示页面展示目标语音信息。
150.本公开实施例提出了一种视频配音方法,该方法可以在对目标视频进行配音的同时对语音进行降噪处理,得到目标语音信息,可以在录音结束后得到具有降噪效果的语音信息,使得录音场景与降噪场景连贯,在录音场景和降噪场景的转换间无需用户进行操作,提高了语音处理效率,从而提高了用户体验。该方法还可以在录音结束后对目标语音信息进行调整,可以得到用户个性化设置的目标语音信息,增加了用户选择的多样性,从而提高了用户体验。
151.图14是根据一示例性实施例示出的一种视频配音装置框图。参照图2,该装置包括:
152.录音页面显示模块1410,被配置为执行显示录音页面,录音页面包括录音操作信息和目标视频;
153.录音模块1420,被配置为执行响应于基于录音操作信息触发的录音启动指令,录制语音信息;
154.降噪模块1430,被配置为执行在语音信息的录制过程中,播放所述目标视频,并对语音信息进行降噪处理;
155.目标语音展示模块1440,被配置为执行响应于基于录音操作信息触发的录音结束指令,显示包括目标语音信息的语音信息展示页面,目标语音信息为降噪处理后的语音信息,目标语音信息根据目标视频对应的显示时间轴上的时间填充目标视频对应的音频轨道。
156.作为一个可选的实施例,录音页面还包括处于第一状态的降噪操作信息,处于第一状态的降噪操作信息指示降噪功能关闭,该装置还包括:
157.降噪操作信息更新模块,被配置为响应于基于处于第一状态的降噪操作信息触发的降噪启动指令,将录音页面中的降噪操作信息由第一状态更新为第二状态;处于第二状态的降噪操作信息指示降噪功能开启。
158.作为一个可选的实施例,该装置还包括:
159.模型获取模块,被配置为执行响应于基于处于第一状态的降噪操作信息触发的降噪启动指令,获取语音降噪模型;
160.录音模块包括:
161.模型处理单元,被配置为执行在语音信息的录制过程中,基于语音降噪模型,对语音信息进行降噪处理。
162.作为一个可选的实施例,模型获取模块包括:
163.第一模型获取单元,被配置为执行在降噪启动指令为预设时间段内的非首次启动指令的情况下,从缓存中获取语音降噪模型。
164.作为一个可选的实施例,模型获取模块包括:
165.第二模型获取单元,被配置为执行在降噪启动指令为预设时间段内的首次启动指令的情况下,从服务器中获取语音降噪模型。
166.作为一个可选的实施例,该装置还包括:
167.进度信息显示模块,被配置为执行在录音页面中显示语音降噪模型的获取进度信息。
168.作为一个可选的实施例,语音信息展示页面包括降噪调节信息,降噪调节信息表征目标语音信息对应的降噪程度信息;该装置还包括:
169.降噪调节信息更新模块,被配置为执行响应于基于降噪调节信息触发的降噪调节指令,更新展示在语音信息展示页面中降噪调节信息对应的降噪程度信息,降噪调节指令用于对目标语音信息的降噪程度进行调节;
170.目标语音更新模块,被配置为执行基于降噪调节指令对应的降噪程度,更新目标语音信息;
171.更新后语音展示模块,被配置为执行在语音信息展示页面中展示更新后的目标语音信息。
172.作为一个可选的实施例,语音信息展示页面包括处于第三状态的降噪设置信息,处于第三状态的降噪设置信息指示降噪功能开启,该装置还包括:
173.降噪功能关闭模块,被配置为执行响应于基于降噪设置信息触发的降噪功能关闭指令,将语音信息展示页面中的降噪设置信息由第三状态更新为第四状态,第四状态的降噪设置信息指示降噪功能关闭;
174.原始语音展示模块,被配置为执行将语音信息展示页面中展示的目标语音信息更新为原始语音信息,原始语音信息表征未降噪的语音信息。
175.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
176.图15是根据一示例性实施例示出的一种用于视频配音的电子设备的框图,该电子设备可以是终端,其内部结构图可以如图15所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频配音方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
177.本领域技术人员可以理解,图15中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
178.在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置1500的处理器1520执行以完成上述方法。可选地,计算机可读存储介质可以是rom、随机存取存储器(ram)、cd

rom、磁带、软盘和光数据存储设备等。
179.在示例性实施例中,还提供一种计算机程序产品,包括计算机指令,计算机指令被处理器执行时实现上述的视频配音方法。
180.本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其
它实施方案。本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
181.应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜