一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于音频处理的方法及装置、电子设备、存储介质与流程

2022-03-09 08:14:45 来源:中国专利 TAG:


1.本技术涉及音频处理技术领域,例如涉及一种用于音频处理的方法及装置、电子设备、存储介质。


背景技术:

2.随着数字化技术在各个领域应用的不断深入,数字化所带来的商业价值以及管理价值也得到了不断的验证。目前在各个线下服务及线下销售的场景,数字化技术也得到了大量的应用及普及。比如在线下销售过程对销售人员以及顾客的交流过程进行全程录音,以便于提取相关信息,实现销售过程数字化。在进行录音时,工作人员和顾客都作为录音对象进行了音频信息的采集,但现有技术中只能对获取到的整个录音数据进行音频处理,无法实现根据不同类型的录音对象进行不同的音频隐私处理。而为了保护不同类型的录音对象的隐私信息,亟需一种能够针对不同类型的录音对象的音频数据进行不同的音频隐私处理的方法。


技术实现要素:

3.为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
4.本公开实施例提供了一种用于音频处理的方法及装置、电子设备、存储介质,能够对不同类型的录音对象进行不同的音频隐私处理。
5.在一些实施例中,所述用于音频处理的方法,包括:获取录音文件;所述录音文件包括若干个音频数据;确定各所述音频数据对应的录音对象的类型;根据所述录音对象的类型对相应的所述音频数据进行音频隐私处理;所述音频隐私处理包括音频消除处理或音频抑制处理。
6.在一些实施例中,所述用于音频处理的装置,应用的场景包括录音设备侧、边缘服务器侧或云端服务器侧,所述装置包括:获取模块,被配置为获取录音文件;所述录音文件包括若干个音频数据;确定模块,被配置为确定各所述音频数据对应的录音对象的类型;音频处理模块,被配置为根据所述录音对象的类型对相应的所述音频数据进行音频隐私处理;所述音频隐私处理包括音频消除处理或音频抑制处理。
7.在一些实施例中,所述电子设备包括处理器和存储有程序指令的存储器,所述处理器被配置为在运行所述程序指令时,执行如上述的用于音频处理的方法。
8.在一些实施例中,所述存储介质存储有程序指令,所述程序指令在运行时,执行上述的用于音频处理的方法。
9.本公开实施例提供的用于音频处理的方法及装置、电子设备、存储介质,可以实现以下技术效果:通过获取录音文件;录音文件包括若干个音频数据;确定各音频数据对应的录音对象的类型;根据录音对象的类型对相应的音频数据进行音频隐私处理;音频隐私处
理包括音频消除处理或音频抑制处理。通过确定录音文件中各音频数据对应的录音对象的类型,能够实现针对不同类型的录音对象的音频数据进行不同的音频隐私处理,从而实现了对不同类型录音对象的隐私保护,提高了录音数据的私密性。
10.以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本技术。
附图说明
11.一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:图1是本公开实施例提供的一个用于音频处理的方法的示意图;图2是本公开实施例提供的另一个用于音频处理的方法的示意图;图3是本公开实施例提供的另一个用于音频处理的方法的示意图;图4是本公开实施例提供的另一个用于音频处理的方法的示意图;图5是本公开实施例提供的一个用于音频处理的装置的示意图;图6是本公开实施例提供的一个电子设备的示意图。
具体实施方式
12.为了能够更加详尽地了解本公开实施例的特点与技术内容,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
13.本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
14.除非另有说明,术语“多个”表示两个或两个以上。
15.本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,a/b表示:a或b。
16.术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,a和/或b,表示:a或b,或,a和b这三种关系。
17.术语“对应”可以指的是一种关联关系或绑定关系,a与b相对应指的是a与b之间是一种关联关系或绑定关系。
18.结合图1所示,本公开实施例提供一种用于音频处理的方法,包括:步骤s101,获取录音文件;录音文件包括若干个音频数据。
19.步骤s102,确定各音频数据对应的录音对象的类型。
20.步骤s103,根据录音对象的类型对相应的音频数据进行音频隐私处理;音频隐私处理包括音频消除处理或音频抑制处理。
21.采用本公开实施例提供的用于音频处理的方法,通过获取录音文件;录音文件包括若干个音频数据;确定各音频数据对应的录音对象的类型;根据录音对象的类型对相应
的音频数据进行音频隐私处理;音频隐私处理包括音频消除处理或音频抑制处理。通过确定录音文件中各音频数据对应的录音对象的类型,能够实现针对不同类型的录音对象的音频数据进行不同的音频隐私处理,从而实现了对不同类型录音对象的隐私保护,提高了录音数据的私密性。
22.可选地,录音对象的类型包括第一目标对象和第二目标对象。可选地,第一目标对象包括主动录音者,第二目标对象包括被动录音者。
23.在一些实施例中,主动录音者包括因工作或线下销售原因和线下服务需要,在过程中使用录音设备的人,即工作人员;被动录音者包括在已告知需要录音或进入标识有提示录音区域的情况下,与主动录音者进行交流的人,即顾客。
24.可选地,确定各音频数据对应的录音对象的类型,包括:对各音频数据进行声源定位确定各音频数据对应的声源位置方向;根据各声源位置方向确定各录音对象的类型。
25.可选地,根据各声源位置方向确定各音频数据对应的录音对象的类型,包括:获取预设的目标方向,将与目标方向相同的声源位置方向对应的录音对象的类型确定为第一目标对象;和/或,将与目标方向不相同的声源位置方向对应的录音对象的类型确定为第二目标对象。可选地,目标方向为第一目标对象的声源位置方向,干扰方向为第二目标对象的声源位置方向。在一些实施例中,目标方向为用户语音输入的方向。
26.在一些实施例中,录音文件中包括第一目标对象的音频数据和第二目标对象的音频数据;且第一目标对象的声源位置方向和第二目标对象的声源位置方向是不同的,通过采集音频数据从声源位置方向到达录音设备中不同麦克风的时间和强度,根据时间和强度进行时域/频域的运算和对比,能够确定音频数据的声源相对于麦克风的声源位置方向;通过获取第一目标对象的位置方向,根据第一目标对象的位置方向对不同声源位置方向的音频数据进行分类,从而实现将第一目标对象的音频数据和第二目标对象的音频数据进行区分。这样,按照录音对象将录音文件中的各音频数据进行分类,获得第一目标对象的音频数据和第二目标对象的音频数据,便于用户对不同录音对象的音频数据进行处理,从而实现针对不同录音对象的音频数据进行不同的音频隐私处理,实现对各录音对象的隐私保护,提高录音数据的私密性。
27.可选地,确定各音频数据对应的录音对象的类型,包括:将各音频数据输入预设的音频分离模型,获得各录音对象的类型;音频分离模型通过样本音频数据和样本录音对象获得,样本音频数据中包括若干个样本音频。
28.在一些实施例中,根据录音设备的麦克风阵列的几何分布构建语音采集仿真模型,通过语音采集仿真模型生成若干个仿真音频数据,并对各仿真音频数据进行样本标签标注,样本标签用于表征仿真音频数据为主动录音者对应的音频数据或被动录音者对应的音频数据;将带有样本标签的仿真音频数据输入深度学习的神经网络模型中进行模型训练,获得音频分离模型。这样,通过深度学习的神经网络模型对采集到的音频数据进行分离,能够更准确的将主动录音者对应的音频数据和被动录音者对应的音频数据进行分离,从而便于用户对被动录音者的音频数据进行语音抑制处理,同时,能够对主动录音者的音频数据进行语音增强,从而实现对被动录音者隐私保护。
29.在一些实施例中,对录音文件中的各个音频数据进行波束形成处理,在目标方向上进行语音增强处理,在干扰方向上进行语音抑制处理,实现空域滤波。从而实现对第一目
标对象的音频数据进行保留,将第二目标对象的音频数据进行抑制或消除。可选地,目标方向为第一目标对象的声源位置方向,干扰方向为第二目标对象的声源位置方向和噪音的声源位置方向。
30.可选地,录音对象的类型包括第一目标对象和第二目标对象。可选地,第一目标对象包括主动录音者,第二目标对象包括被动录音者。
31.可选地,根据录音对象的类型对相应的音频数据进行音频隐私处理,包括:确定录音对象的类型是否为预设的第一目标对象;在录音对象的类型为预设的第一目标对象的情况下,对第一目标对象对应的音频数据进行音频抑制处理。
32.可选地,根据录音对象的类型对相应的音频数据进行音频隐私处理,包括:确定录音对象的类型是否为预设的第二目标对象;在录音对象的类型为预设的第二目标对象的情况下,对第二目标对象对应的音频数据进行音频消除处理;或,对第二目标对象对应的音频数据进行音频抑制处理。
33.在一些实施例中,从各音频数据中分离出第一目标对象对应的音频数据和第二目标对象对象音频数据,只对第二目标对象对应的音频数据均进行语音抑制处理。这样,能够通过改变各音频数据的音频信号特征,使得音频数据不会被人耳所识别,从而实现对第二目标对象的身份信息的隐私保护。
34.可选地,各录音对象的类型包括第一目标对象和第二目标对象,根据录音对象的类型对相应的音频数据进行音频隐私处理,包括:在录音对象的类型为预设的第一目标对象的情况下,对第一目标对象对应的音频数据进行音频抑制处理;在录音对象的类型为预设的第二目标对象的情况下,对第二目标对象对应的音频数据进行音频消除处理;或,对第二目标对象对应的音频数据进行音频抑制处理。
35.在一些实施例中,从各音频数据中分离出第一目标对象对应的音频数据和第二目标对象对象音频数据;对第一目标对象对应的音频数据和第二目标对象对应的音频数据均进行语音抑制处理。
36.在一些实施例中,从各音频数据中分离出第一目标对象对应的音频数据和第二目标对象对象音频数据;对第一目标对象对应的音频数据进行语音抑制处理,并对第二目标对象对应的音频数据进行语音消除处理。这样,通过保留第一目标对象对应的音频数据,并对第一目标对象对应的音频数据进行语音抑制处理,直接消除第二目标对象对应的音频数据。以能够对第一目标对象和第二目标对象的身份信息进行了隐私保护的同时,使得第二目标对象对应的音频数据不会被人耳所识别,但能够通过asr(automatic speech recognition,自动语音识别技术)识别出音频数据的语义信息,避免在音频数据的使用过程中导致第一目标对象和第二目标对象的身份信息被泄露,有效提高了音频数据的私密性。
37.可选地,对第一目标对象对应的音频数据进行音频抑制处理,包括:对第一目标对象对应的音频数据进行语音变速处理,使得处理后的音频能够进行语音识别;和/或,对第一目标对象对应的音频数据进行语音变调处理,使得处理后的音频能够进行语音识别。
38.可选地,语音变速处理包括将音频数据的语速变快或变慢。
39.在一些实施例中,在将第一目标对象对应的音频数据的语速变快的情况下,预设的第一备选语速范围为“8倍速-10倍速”;在将第一目标对象对应的音频数据的语速变慢的
情况下,预设的第一备选语速范围为“0.01倍速-0.05倍速”。
40.可选地,对第一目标对象对应的音频数据进行语音变速处理,包括:每隔第一预设时间段从预设的第一备选语速范围内随机选取一个第一备选语速;将第一目标对象对应的音频数据的语速调整为第一备选语速。可选地,第一预设时间段为5s。
41.在一些实施例中,通过将音频数据的语速调整至第一预设语速及以上或调整至第二预设语速及以下,能够保证人耳无法识别音频数据的语义,但通过asr(automatic speech recognition,自动语音识别技术)能够将调整语速后的音频数据转换为语音文本。可选地,第一预设语速为8倍语速;第二预设语速为0.01倍语速。这样,通过每隔第一预设时间段从预设的第一备选语速范围内随机选取一个第一备选语速,根据第一备选语速对第二录音对象对应的音频数据的语速进行调整,由于录音数据的语速每隔第一预设时间段都会改变,使得调整后的音频数据更难以被人耳所识别,能够有效保证第二目标对象的身份信息不被泄露,提高了录音数据的私密性。
42.可选地,语音变调处理包括将音频数据的语调升高或降低。
43.在一些实施例中,在将第二目标对象对应的音频数据的语调升高的情况下,预设的第一变调范围为[ 2, 5];在将第二目标对象对应的音频数据的语调降低的情况下,预设的第一变调范围为[-5,-2]。
[0044]
可选地,对第一目标对象对应的音频数据进行语音变调处理,包括:每隔第二预设时间段从预设的第一变调范围内随机选取一个第一变调数值;根据第一变调数值对第一目标对象对应的音频数据的语调进行调整。可选地,第二预设时间段为5s。
[0045]
在一些实施例中,通过将音频数据的语调调整第一预设语调及以上或调整第二预设语调及以上,能够保证人耳无法识别音频数据的语义,但通过asr(automatic speech recognition,自动语音识别技术)识别能够将调整语调后的音频数据转换为语音文本。可选地,第一预设语调为升高5个调,第二预设语调为降低5个调。
[0046]
在一些实施例中,同时对第一目标对象对应的音频数据进行语音变速处理和语音变调处理,使得经过语音变速处理和语音变调处理后的第二目标对象对应的音频数据无法被人耳识别,但能够通过asr进行识别,在一定程度上提高了音频数据的私密性,实现了对第一目标对象的隐私保护。
[0047]
这样,通过每隔第二预设时间段从预设的第一变调范围内随机选取一个第一变调数值,根据第一变调数值对第一目标对象对应的音频数据的语调进行调整,由于录音数据的语调每隔第二预设时间段都会改变,使得调整后的音频数据更难以被人耳所识别,能够有效保证第一目标对象的身份信息不被泄露,提高了录音数据的私密性。
[0048]
结合图2所示,本公开实施例提供一种用于音频处理的方法,包括:步骤s201,获取录音文件;录音文件包括若干个音频数据。
[0049]
步骤s202,确定各音频数据对应的录音对象的类型。
[0050]
步骤s203,确定类型是否为预设的第一目标对象。
[0051]
步骤s204,在录音对象的类型为预设的第一目标对象的情况下,对第一目标对象对应的音频数据进行音频抑制处理。
[0052]
采用本公开实施例提供的用于音频处理的方法,通过从录音文件中确定出第一目标对象的对应的音频数据,并对第一目标对象对应的音频数据进行音频抑制处理,使得在
录音文件的使用过程中人耳无法识别录音文件中第一目标对象对应的音频数据的语义,能够保证第一目标对象的身份信息不容易被泄露,从而实现了隐私保护,提高了录音数据的私密性。
[0053]
可选地,对第二目标对象对应的音频数据进行音频消除处理,包括:删除第二目标对象对应的音频数据。
[0054]
可选地,对第二目标对象对应的音频数据进行音频抑制处理,包括:对第二目标对象对应的音频数据进行语音变速处理,使得处理后的音频数据能够进行语音识别;和/或,对第二目标对象对应的音频数据进行语音变调处理,使得处理后的音频数据能够进行语音识别。
[0055]
可选地,对第二目标对象对应的音频数据进行语音变速处理,包括:每隔第三预设时间段从预设的第二备选语速范围内随机选取一个第二备选语速;将第二目标对象对应的音频数据的语速调整为第二备选语速。可选地,第三预设时间段为5s。
[0056]
在一些实施例中,在将第二目标对象对应的音频数据的语速变快的情况下,预设的第二备选语速范围为“8倍速-10倍速”;在第二目标对象对应的音频数据的语速变慢的情况下,预设的第二备选语速范围为“0.01倍速-0.05倍速”。
[0057]
这样,通过每隔第三预设时间段从预设的第二备选语速范围内随机选取一个第二备选语速,根据第二备选语速对第二录音对象对应的音频数据的语速进行调整,由于录音数据的语速每隔第三预设时间段都会改变,使得调整后的音频数据更难以被人耳所识别,能够有效保证第二目标对象的身份信息不被泄露,提高了录音数据的私密性。
[0058]
可选地,对第二目标对象对应的音频数据进行语音变调处理,包括:每隔第四预设时间段从预设的第二变调范围内随机选取一个第二变调数值;根据第二变调数值对第二目标对象对应的音频数据的语调进行调整。可选地,第四预设时间段为5s。
[0059]
在一些实施例中,在将第二目标对象对应的音频数据的语调升高的情况下,预设的第二变调范围为[ 2, 5];在将第二目标对象对应的音频数据的语调降低的情况下,预设的第二变调范围为[-5,-2]。
[0060]
这样,通过每隔第四预设时间段从预设的第二变调范围内随机选取一个第二变调数值,根据第二变调数值对第二目标对象对应的音频数据的语调进行调整,由于录音数据的语调每隔第四预设时间段都会改变,使得调整后的音频数据更难以被人耳所识别,能够有效保证第二目标对象的身份信息不被泄露,提高了录音数据的私密性。
[0061]
结合图3所示,本公开实施例提供一种用于音频处理的方法,包括:步骤s301,获取录音文件;录音文件包括若干个音频数据。
[0062]
步骤s302,确定各音频数据对应的录音对象的类型。
[0063]
步骤s303,确定类型是否为预设的第二目标对象。
[0064]
步骤s304,在录音对象的类型为预设的第二目标对象的情况下,对第二目标对象对应的音频数据进行音频消除处理;或,对第二目标对象对应的音频数据进行音频抑制处理。
[0065]
采用本公开实施例提供的用于音频处理的方法,通过从录音文件中确定出第二录音对象的对应的音频数据,并对第二录音对象对应的音频数据进行音频消除处理或音频抑制处理,使得在录音文件的使用过程中人耳无法识别第二目标对象对应的音频数据的语
义,第二目标对象的身份信息不容易被泄露,从而实现了隐私保护,提高了录音数据的私密性。
[0066]
结合图4所示,本公开实施例提供一种用于音频处理的方法,包括:步骤s401,获取录音文件;录音文件包括若干个音频数据。
[0067]
步骤s402,确定各音频数据对应的录音对象的类型。
[0068]
步骤s403,对第二目标对象对应的音频数据进行随机变速处理和随机变调处理。
[0069]
采用本公开实施例提供的用于音频处理的方法,通过从录音文件中确定出第二目标对象对应的音频数据,并对第二目标对象的对应的音频数据进行随机变速处理和随机变调处理,使得在录音文件的使用过程中人耳无法识别音频数据的语义,第二目标对象的身份信息不容易被泄露,从而实现了隐私保护,提高了录音数据的私密性。
[0070]
在一些实施例中,对第二目标对象对应的音频数据进行语音变速处理,包括:把语音在时域上拉长或者缩短,同时保证语音的采样率、基频以及共振峰保持不变。
[0071]
在一些实施例中,对第二目标对象对应的音频数据进行语音变调处理,包括:把语音的基频降低或者升高,同时对应调整共振峰,保持采样频率不变。
[0072]
通过对音频数据进行变速处理和/或变调处理,能够抹除音频数据的身份信息,同时,由于变声处理和/或变调处理后的音频数据不可逆,这样能够实现对第二目标对象的隐私保护,提高音频数据的私密性。
[0073]
可选地,在对第二目标对象对应的音频数据进行语音抑制处理后,还包括:对第二目标对象对应的音频数据进行权限设置。这样,通过对进行语音抑制处理后的第二目标对象对应的音频数据进行权限设置,使得第二目标对象的身份信息得到了更好的隐私保护。
[0074]
结合图5所示,本公开实施例提供一种用于音频处理的装置,应用的场景包括录音设备侧、边缘服务器侧或云端服务器侧,用于音频处理的装置包括:获取模块501、确定模块502和音频处理模块503;获取模块501被配置为获取录音文件;录音文件包括若干个音频数据,并将录音文件发送给确定模块;确定模块502被配置为接收获取模块501发送的录音文件,确定各音频数据对应的录音对象的类型,并将各音频数据对应的录音对象的类型发送给音频处理模块;音频处理模块503被配置为接收确定模块发送的各音频数据对应的录音对象的类型,并根据录音对象的类型对相应的音频数据进行音频隐私处理;音频隐私处理包括音频消除处理或音频抑制处理。
[0075]
采用本公开提供的用于音频处理的装置,通过获取模块获取录音文件;确定模块确定各音频数据对应的录音对象的类型;音频处理模块根据录音对象的类型对相应的音频数据进行音频隐私处理;音频隐私处理包括音频消除处理或音频抑制处理。通过确定录音文件中各音频数据对应的录音对象的类型,能够实现针对不同类型的录音对象的音频数据进行不同的音频隐私处理,从而实现了对不同类型录音对象的隐私保护,提高了录音数据的私密性。
[0076]
可选地,确定模块被配置为通过以下方式确定各音频数据对应的录音对象的类型:对各音频数据进行声源定位确定各音频数据对应的声源位置方向;根据各声源位置方向确定各录音对象的类型。
[0077]
可选地,确定模块被配置为通过以下方式确定各音频数据对应的录音对象的类型:将各音频数据输入预设的音频分离模型,获得各音频分别对应的录音对象的类型;音频
分离模型通过样本录音文件和样本录音对象获得,样本录音文件中包括若干个样本音频。
[0078]
可选地,音频处理模块被配置为通过以下方式根据录音对象的类型对相应的音频数据进行音频隐私处理:确定类型是否为预设的第一目标对象;在录音对象的类型为预设的第一目标对象的情况下,对第一目标对象对应的音频数据进行音频抑制处理。
[0079]
可选地,音频处理模块被配置为通过以下方式根据录音对象的类型对相应的音频数据进行音频隐私处理:确定类型是否为预设的第二目标对象;在录音对象的类型为预设的第二目标对象的情况下,对第二目标对象对应的音频数据进行音频消除处理;或,对第二目标对象对应的音频数据进行音频抑制处理。
[0080]
可选地,各录音对象的类型包括第一目标对象和第二目标对象,音频处理模块被配置为通过以下方式根据录音对象的类型对相应的音频数据进行音频隐私处理,包括:在录音对象的类型为预设的第一目标对象的情况下,对第一目标对象对应的音频数据进行音频抑制处理;在录音对象的类型为预设的第二目标对象的情况下,对第二目标对象对应的音频数据进行音频消除处理;或,对第二目标对象对应的音频数据进行音频抑制处理。
[0081]
可选地,音频处理模块被配置为通过以下方式对第一目标对象对应的音频数据进行音频抑制处理:对第一目标对象对应的音频数据进行语音变速处理,使得处理后的音频数据能够进行语音识别;和/或,对第一目标对象对应的音频数据进行语音变调处理,使得处理后的音频数据能够进行语音识别。
[0082]
可选地,音频处理模块被配置为通过以下方式对第二目标对象对应的音频数据进行音频消除处理:删除第二目标对象对应的音频数据。
[0083]
可选地,音频处理模块被配置为通过以下方式对第二目标对象对应的音频数据进行音频抑制处理:对第二目标对象对应的音频数据进行语音变速处理,使得处理后的音频数据能够进行语音识别;和/或,对第二目标对象对应的音频数据进行语音变调处理,使得处理后的音频数据能够进行语音识别。
[0084]
可选地,音频处理模块被配置为通过以下方式对第一目标对象对应的音频数据进行语音变速处理:每隔第一预设时间段从预设的第一备选语速范围内随机选取一个第一备选语速;将第一目标对象对应的音频数据的语速调整为第一备选语速。
[0085]
可选地,音频处理模块被配置为通过以下方式对第一目标对象对应的音频数据进行语音变调处理:每隔第二预设时间段从预设的第一变调范围内随机选取一个第一变调数值;根据第一变调数值对第一目标对象对应的音频数据的语调进行调整。
[0086]
可选地,音频处理模块被配置为通过以下方式对第二目标对象对应的音频数据进行语音变速处理:每隔第三预设时间段从预设的第二备选语速范围内随机选取一个第二备选语速;将第二目标对象对应的音频数据的语速调整为第二备选语速。
[0087]
可选地,音频处理模块被配置为通过以下方式对第二目标对象对应的音频数据进行语音变调处理:每隔第四预设时间段从预设的第二变调范围内随机选取一个第二变调数值;根据第二变调数值对第二目标对象对应的音频数据的语调进行调整。
[0088]
结合图6所示,本公开实施例提供一种电子设备,包括处理器(processor)600和存储器(memory)601。可选地,该电子设备还可以包括通信接口(communication interface)602和总线603。其中,处理器600、通信接口602、存储器601可以通过总线603完成相互间的通信。通信接口602可以用于信息传输。处理器600可以调用存储器601中的逻辑指令,以执
行上述实施例的用于音频处理的方法。
[0089]
采用本公开实施例提供的电子设备,通过获取录音文件;录音文件包括若干个音频数据;确定各音频数据对应的录音对象的类型;根据录音对象的类型对相应的音频数据进行音频隐私处理;音频隐私处理包括音频消除处理或音频抑制处理。通过确定录音文件中各音频数据对应的录音对象的类型,能够实现针对不同类型的录音对象的音频数据进行不同的音频隐私处理,从而实现了对不同类型录音对象的隐私保护,提高了录音数据的私密性。
[0090]
此外,上述的存储器601中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
[0091]
存储器601作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序,如本公开实施例中的方法对应的程序指令/模块。处理器600通过运行存储在存储器601中的程序指令/模块,从而执行功能应用以及数据处理,即实现上述实施例中用于音频处理的方法。
[0092]
存储器601可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端设备的使用所创建的数据等。此外,存储器601可以包括高速随机存取存储器,还可以包括非易失性存储器。
[0093]
可选地,电子设备包括录音设备、边缘服务器或云端服务器等。
[0094]
在一些实施例中,在电子设备为录音设备的情况下,通过录音设备对采集到的音频数据进行语音抑制处理,能够抹除被动录音者的身份信息,实现对被动录音者的隐私保护;同时实现了智能设备技术,在录音设备进行语音抑制处理过程中,没有对原始音频数据进行存储,录音设备在进行录音的同时,对采集到的音频数据进行语音抑制处理,在后续的云端服务器进行存储或边缘服务器存储的都是处理后的音频数据,从而实现对被动录音者的隐私保护。
[0095]
在一些实施例中,在电子设备为边缘服务器的情况下,通过录音设备对音频数据进行采集,并将采集到的音频数据通过无线传输或特定方式传输的方式存储到边缘服务器,实现了智能设备技术,并在边缘服务器通过边缘计算对音频数据进行语音抑制处理,同时,在后续的数据传输,包括远端传输、存储识别等环节所使用的音频数据均为进行语音抑制处理后的音频数据,并且无法通过其他方式对录音设备内的音频数据进行读取和拷贝,以实现对被动录音者的隐私保护。可选地,边缘服务器设置在主动录音者和被动录音者的沟通交流现场,这样能够减少录音设备的处理能力的要求。在一些实施例中,边缘服务器为录音采集站。
[0096]
在一些实施例中,在电子设备为云端服务器的情况下,通过录音设备对音频数据进行采集,并将采集到的音频数据通过加密通信的方式发送给云端服务器,通过云端服务器对音频数据进行语音抑制处理,以实现对被动录音者的隐私保护。
[0097]
本公开实施例提供了一种存储介质,存储有程序指令,程序指令在运行时,执行上述用于音频处理的方法。
[0098]
本公开实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述用于音频处理的方法。
[0099]
上述的计算机可读存储介质可以是暂态计算机可读存储介质,也可以是非暂态计算机可读存储介质。
[0100]
本公开实施例的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括一个或多个指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等多种可以存储程序代码的介质,也可以是暂态存储介质。
[0101]
以上描述和附图充分地示出了本公开的实施例,以使本领域的技术人员能够实践它们。其他实施例可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施例的部分和特征可以被包括在或替换其他实施例的部分和特征。而且,本技术中使用的用词仅用于描述实施例并且不用于限制权利要求。如在实施例以及权利要求的描述中使用的,除非上下文清楚地表明,否则单数形式的“一个”(a)、“一个”(an)和“所述”(the)旨在同样包括复数形式。类似地,如在本技术中所使用的术语“和/或”是指包含一个或一个以上相关联的列出的任何以及所有可能的组合。另外,当用于本技术中时,术语“包括”(comprise)及其变型“包括”(comprises)和/或包括(comprising)等指陈述的特征、整体、步骤、操作、元素,和/或组件的存在,但不排除一个或一个以上其它特征、整体、步骤、操作、元素、组件和/或这些的分组的存在或添加。在没有更多限制的情况下,由语句“包括一个
…”
限定的要素,并不排除在包括所述要素的过程、方法或者设备中还存在另外的相同要素。本文中,每个实施例重点说明的可以是与其他实施例的不同之处,各个实施例之间相同相似部分可以互相参见。对于实施例公开的方法、产品等而言,如果其与实施例公开的方法部分相对应,那么相关之处可以参见方法部分的描述。
[0102]
本领域技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,可以取决于技术方案的特定应用和设计约束条件。所述技术人员可以对每个特定的应用来使用不同方法以实现所描述的功能,但是这种实现不应认为超出本公开实施例的范围。所述技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0103]
本文所披露的实施例中,所揭露的方法、产品(包括但不限于装置、设备等),可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,可以仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例。另外,在本公开实施例中的各功能单元可以集成在一个
处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0104]
附图中的流程图和框图显示了根据本公开实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。在附图中的流程图和框图所对应的描述中,不同的方框所对应的操作或步骤也可以以不同于描述中所披露的顺序发生,有时不同的操作或步骤之间不存在特定的顺序。例如,两个连续的操作或步骤实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这可以依所涉及的功能而定。框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献