一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音降噪方法、装置、滤波器的确定方法、语音交互设备与流程

2021-06-25 17:04:00 来源:中国专利 TAG:语音 方法 滤波器 交互 信号处理


1.本申请涉及语音信号处理技术领域,具体而言涉及一种语音降噪方法、装置、滤波器的确定方法、语音交互设备。


背景技术:

2.近年来,随着人工智能的发展,基于智能语音技术的人机交互方式对汽车、家电(扫地机、空调等)、消费电子(耳机、智能音箱)等产品产生了深远影响。人机交互方式下,用户对智能设备讲出语音控制指令,智能设备对语音控制指令进行解析就能够实现相应操作,极大地便利了人类的生活。
3.然而,在各种实际使用场景中,由于普遍存在不可忽略的环境噪声,智能设备所接收的信号中不可避免的既会包含用户的语音信号,也会包含有环境噪声信号。噪声将影响智能设备对用户语音的识别精度。当智能设备所接收的信号具有很低信噪比时,智能设备可能发生误识别,甚至完全无法识别用户的语音指令。


技术实现要素:

4.本申请针对现有技术的不足,提供一种语音降噪方法、装置、滤波器的确定方法、语音交互设备,本申请通过滤波器等效抵消噪声信号,能够提取出具有更高信噪比的用户语音,从而提高语音识别的精度。本申请具体采用如下技术方案。
5.首先,为实现上述目的,提出一种语音降噪方法,其包括:获取声音信号;对所述声音信号按照相对应的第一滤波参数进行信号处理,滤除所述声音信号中的环境噪声信号,获得所述声音信号中的语音信号;其中,所述第一滤波参数基于所述声音信号的频谱以及所述环境噪声信号的估计频谱而确定。
6.可选的,如上任一所述的语音降噪方法,其中,在对所述声音信号按照相对应的第一滤波参数进行信号处理之前,所述方法还包括:将所述声音信号分割为多个声音信号帧;对所述声音信号按照相对应的第一滤波参数进行信号处理包括:对于每一个声音信号帧,分别按照与所述声音信号帧相对应的第二滤波参数进行所述信号处理,滤除所述声音信号帧中的环境噪声信号,获得所述声音信号帧中的语音信号;其中,所述第二滤波参数基于所述声音信号帧的频谱以及所述声音信号帧中的环境噪声信号的估计频谱而确定。
7.可选的,如上任一所述的语音降噪方法,其中,所述声音信号帧中的环境噪声信号的估计频谱根据此前的多个声音信号帧的信噪比确定。
8.可选的,如上任一所述的语音降噪方法,其中,所述第一滤波参数基于所述环境噪声信号的估计幅值谱与所述声音信号的幅值谱之间的比值而确定。
9.可选的,如上任一所述的语音降噪方法,其中,所述第一滤波参数基于所述环境噪声信号的估计自功率谱与所述声音信号的自功率谱之间的比值而确定。
10.可选的,如上任一所述的语音降噪方法,其中,在对所述声音信号按照相对应的第一滤波参数进行信号处理之前,所述方法还包括:将所述声音信号的前预设数量个声音信
号帧的频谱作为所述环境噪声信号的估计频谱。
11.同时,为实现上述目的,本申请还提供一种语音降噪装置,其包括:信号获取模块,用于获取声音信号;语音降噪模块,用于对所述声音信号按照相对应的第一滤波参数进行信号处理,滤除所述声音信号中的环境噪声信号,获得所述声音信号中的语音信号;其中,所述第一滤波参数基于所述声音信号的频谱以及所述环境噪声信号的估计频谱而确定。
12.此外,本申请还提供有一种计算机设备,其包括:处理器;存储器,所述存储器包括存储在其上的计算机指令,所述计算机指令在被所述处理器执行时,使得所述处理器执行以上任一项所述的语音降噪方法。
13.本申请还提供有一种滤波器的确定方法,所述滤波器应用于语音降噪,并通过以下步骤确定滤波参数:获取声音信号;对所述声音信号中的环境噪声成分进行估计,确定噪声估计信号;基于所述声音信号的频谱以及所述噪声估计信号的频谱,确定所述滤波器的滤波参数。
14.本申请所提供的语音交互设备,其包括:声音采集装置,用于采集声音信号;根据上述方法确定的滤波器,其连接所述声音采集装置,用于滤除所述声音信号中的环境噪声信号,获得所述声音信号中的语音信号。
15.有益效果
16.本申请通过对滤波器滤波参数的设置,能够保证智能设备在进行语音识别之前,获得信噪比更高的语音信号,从而保证语音识别的精度,提高智能设备的工作效率。
17.本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。
附图说明
18.附图用来提供对本申请的进一步理解,并且构成说明书的一部分,并与本申请的实施例一起,用于解释本申请,并不构成对本申请的限制。在附图中:
19.图1是本申请的语音降噪方法的步骤流程图。
具体实施方式
20.为使本申请实施例的目的和技术方案更加清楚,下面将结合本申请实施例的附图,对本申请实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于所描述的本申请的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
21.本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
22.在本申请的第一实施例中,参考图1所示,提供有一种语音降噪方法以去除声音采集装置所采集获得的声音信号中的环境噪声,从声音信号中恢复出具有更高信噪比的纯净的用户语音。该语音降噪方法10包括以下步骤:
23.s11,获取包含有环境噪声的声音信号;以及
24.s14,对声音信号按照与之相对应的第一滤波参数进行信号处理,滤除声音信号中的环境噪声信号,获得声音信号中的语音信号;
25.其中,第一滤波参数基于声音信号的频谱以及环境噪声信号的估计频谱而确定。
26.由此所获得的语音信号,在智能设备后端进行语音识别时,能够提高语音识别的精度从而提升智能设备的工作效率。
27.其中,包含有环境噪声的声音信号具体可通过位于手机、电脑、智能音箱等智能设备前端的声音信号采集装置获取。其可以设置为单麦克风,该麦克风采集工作环境中夹杂着环境噪声和用户语音的声音信号:
28.x
m
(n)=x
s
(n) x
d
(n) 式(1)
29.其中,x
m
(n)为采集得到的声音信号,x
s
(n)为x
m
(n)中的纯净的语音信号,x
d
(n)为环境噪声信号。
30.在一些实施例中、基于步骤s14进行信号处理之前,上述方法10还可包括步骤:
31.s12,将声音信号分割为多个声音信号帧。
32.由此,上述步骤s14通过对声音信号按照与之相对应的第一滤波参数进行信号处理,获得声音信号中的语音信号的过程,对于每一个声音信号帧,具体可包括步骤:
33.s142,按照与该声音信号帧相对应的第二滤波参数进行上述信号处理过程,滤除该声音信号帧中的环境噪声信号并获得该声音信号帧中的语音信号。
34.由此,可分别获得每一个声音信号帧中的语音信号,将相应的帧进行拼接即可完全还原出所需的语音。其中,第二滤波参数基于该声音信号帧的频谱以及该声音信号帧中的环境噪声信号的估计频谱而确定。
35.鉴于帧长的小尺度,各声音信号帧所包含的语音信号和环境噪声信号均可认为是平稳信号,统计特性不随时间变化,因此在一些实施例中,第k个声音信号帧中的环境噪声信号的估计频谱可根据第(k

1)个声音信号帧、第(k

2)个声音信号帧、......等多个此前声音信号帧的信噪比和第k个声音信号帧的频谱确定。
36.将上述语音降噪方法应用于手机、电脑、智能音箱等智能设备中后,可为智能设备中的语音识别系统提供更为可靠的语音信号输入,从而实现更为准确快速的语音识别效果。
37.在其他实现方式下,本申请还可提供一种语音降噪装置,其可作为语音识别系统的前端。该语音降噪装置包括:
38.信号获取模块,用于获取夹杂着环境噪声和用户语音的声音信号;以及
39.语音降噪模块,用于对声音信号按照相对应的第一滤波参数进行信号处理,滤除声音信号中的环境噪声信号,获得声音信号中的语音信号;其中,第一滤波参数基于声音信号的频谱以及环境噪声信号的估计频谱而确定。
40.由此,语音降噪装置所获得的语音信号可供语音识别系统后端进行自然语言处理(natural language processing,nlp),识别出相应指令,并根据指令信息控制智能设备执行相应的操作。由于语音识别系统通过语音降噪装置所获得的语音信号中环境噪声被有效滤除,具有更高信噪比,因此,其进行指令识别时所受干扰更小,能够更加快速准确地获得正确的语音指令以执行相应操作。
41.承上述,式(1)关于步骤s14的频域表达为:通过傅里叶变换将混合有环境噪声的
声音信号x
m
(n)转换至频域,得到声音信号的频谱x
m
(f)。从混合有环境噪声的声音信号的频谱x
m
(f)中减去对应环境噪声频域特征的噪声频谱x
d
(f)得到语音频谱x
s
(f),对语音频谱x
s
(f)进行傅里叶逆变换可恢复出纯净的语音信号x
s
(n)。
42.为通过基于滤波的信号处理过程等效地抵消声音信号中的环境噪声信号,第一滤波参数所对应的滤波器频响特性h(f)需要满足:
43.|x
s
(f)|=|x
m
(f)|
·
|h(f)|
ꢀꢀꢀ
式(2)
44.其中,|x
m
(f)|、|x
s
(f)|分别为声音信号x
m
(n)、语音信号x
s
(n)的频谱x
m
(f)、x
s
(f)中的幅值谱。
45.由此,步骤s14基于第一滤波参数从混合有环境噪声的声音信号频谱x
m
(f)中减去环境噪声频谱x
d
(f),也即通过第一滤波参数对混合有环境噪声的声音信号的幅值谱|x
m
(f)|进行频率加权,从而得到语音信号的幅值谱|x
s
(f)|。
46.为进一步恢复出声音信号中的语音信号,则可对幅值谱|x
s
(f)|和声音信号x
m
(n)的频谱x
m
(f)中的相位谱进行傅里叶逆变换,分别得到语音的幅值信息和相位信息从而恢复语音信号x
s
(n)。
47.在一些实施例中,第一滤波参数可基于环境噪声信号的估计幅值谱与声音信号的幅值谱|x
m
(f)|之间的比值λ(f)而确定。又因为环境噪声与语音通常无相关性,对于上式(2),第一滤波参数所对应的滤波器频响特性h(f)的表达式为:
[0048][0049]
在又一些实施例中,第一滤波参数也可基于环境噪声信号的估计自功率谱与声音信号的自功率谱x
m
(f)
·
x
*m
(f)=|x
m
(f)|2之间的比值μ(f)而确定。又因为环境噪声与语音通常无相关性,对于上式(2),第一滤波参数所对应的滤波器频响特性h(f)的表达式为:
[0050][0051]
由上述可知,确定第一滤波参数的关键在于先验估计环境噪声信号的频谱。在用户与智能设备进行语音交互的实际场景中,麦克风开启后所采集声音信号的前n帧一般认为不含语音,也即环境的背景噪声中暂未发生语音活动事件。因此,在一些实施例中、基于步骤s14进行信号处理之前,上述方法10还可包括步骤:
[0052]
s13,将声音信号的前预设数量个声音信号帧的频谱作为环境噪声信号的估计频谱。
[0053]
具体地,例如可分别对前n个声音信号帧的每一帧做傅里叶变换,得到n个频谱,取其平均值作为环境噪声信号的估计频谱。
[0054]
承上述,先验估计环境噪声信号的频谱是确定第一滤波参数的关键。对于近似平稳的噪声环境,基于步骤s13确定的环境噪声信号的估计幅值谱而确定的第一滤波参数足以使步骤s14实现有效的语音降噪;
[0055]
对于可能存在演变的噪声环境,更为优选地,可根据此前的多个声音信号帧的信噪比确定当前声音信号帧中的环境噪声信号的估计频谱,也即如前文所述,第k个声音信号帧中的环境噪声信号的估计幅值谱可根据第1个声音信号帧至第(k

1)个声音信号帧的信噪比进行后验修正。相应地,对于每一个声音信号帧,基于下式(5)或(6)而确定的第二滤波参数能够使步骤s142实现该帧内的语音降噪。
[0056][0057][0058]
本申请的其他实施例还提供一种计算机设备,该计算机设备包括:处理器和存储器。
[0059]
其中,存储器包括存储在其上的计算机指令,计算机指令在被处理器执行时,使得处理器执行如上述任一实施例所提供的语音降噪方法10。
[0060]
另一方面,本申请实施例还提供一种滤波器的确定方法,用于确定语音降噪场景所需的滤波参数。该滤波器的确定方法20包括以下步骤:
[0061]
s22,获取声音信号。
[0062]
s24,对声音信号中的环境噪声成分进行估计,确定噪声估计信号。
[0063]
s26,基于声音信号的频谱以及噪声估计信号的频谱,确定滤波器的滤波参数。
[0064]
在该实现方式下,本申请还提供一种语音交互设备,例如蓝牙耳机、智能音箱、声控扫地机等,其包括:
[0065]
声音采集装置,例如至少一个麦克风,用于采集声音信号;以及
[0066]
根据上述方法20确定的滤波器,其连接声音采集装置,用于滤除声音信号中的环境噪声信号,获得声音信号中的语音信号。
[0067]
对于蓝牙耳机产品,其所获得的语音信号可通过蓝牙发送至手机端进而经基站发送至耳机用户的通话远端;对于智能音箱、声控扫地机等家电产品,其所获得的语音信号可供其语音识别系统进行语音指令识别。
[0068]
以上仅为本申请的实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些均属于本申请的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜