一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种微型双麦克风语音增强方法及微型双麦克风与流程

2021-09-10 22:39:00 来源:中国专利 TAG:麦克风 传声器 语音 增强 方法


1.本发明涉及传声器技术领域,特别是涉及一种微型双麦克风语音增强方法及微型双麦克风。


背景技术:

2.在拾音过程中,不可避免的会引入各种各样的噪声,包括自然界存在的各类噪声、干扰语音以及拾音设备内部的噪声等。噪声的引入会严重影响拾音结果,需要采用各种手段予以去除。去除语音噪声的技术称为语音增强技术,其中,单麦克风语音增强技术有多种,如谱减法、维纳滤波、最小均方误差法等。但是现有对双麦克风进行语音增强的研究则较少,因此如何降低双麦克风的噪声干扰成为现在亟待需要解决的问题。


技术实现要素:

3.本发明提供了一种微型双麦克风语音增强方法及微型双麦克风,以解决现有不能很好地降低双麦克风的噪声干扰的问题。
4.第一方面,本发明提供了一种微型双麦克风语音增强方法,其特征在于,包括:利用阵列布置的双麦克风采集带噪语音信号,所述阵列布置的双麦克风包括第一麦克风和第二麦克风;对所采集的带噪语音信号进行处理,将所述带噪语音信号转换为单帧频域带噪语音信号;对转换后的单帧频域带噪语音信号进行相干系数计算和空域滤波器设计,使所述空域滤波器的最大响应方向对准所述双麦克风的语音增强方向,利用所述空域滤波器对所述单帧频域带噪语音信号进行空域滤波,对空域滤波后的信号进行快速傅里叶逆变换ifft,得到单帧时域增强语音信号,并对所述单帧时域增强语音信号进行拼接得到整段带噪语音的语音增强信号;其中,所述双麦克风的语音增强方向为所述第二麦克风到所述第一麦克风的端射方向。
5.可选地,所述阵列布置的双麦克风中第一麦克风的中心点与第二麦克风的中心点之间的间距为1.5

3厘米。
6.可选地,所述对所采集的带噪语音信号进行处理,将所述带噪语音信号转换为单帧频域带噪语音信号,包括:对所采集的带噪语音信号进行分帧与加窗处理,并通过快速傅里叶变换将单帧的带噪语音信号转换为单帧频域带噪语音信号。
7.可选地,所述对所采集的带噪语音信号进行分帧与加窗处理,包括:设定所述第一麦克风采集的带噪语音信号为x1,所述第二麦克风采集的带噪语音信号为x2,对所述第一麦克风采集的带噪语音信号x1以及所述第二麦克风采集的带噪语音信号x2进行分帧加窗,得到对应的单帧时域带噪语音信号x
1win
(l),x
2win
(l),其中,l为单帧时域带噪语音信号长度,l=1,2,

,l。
8.可选地,所述通过快速傅里叶变换将单帧的带噪语音信号转换为单帧频域带噪语音信号,包括:对单帧时域带噪语音信号x
1win
(l),x
2win
(l)进行如下处理,
9.[0010][0011]
将计算得到的x
1fwin
(k),x
2fwin
(k)利用fft转换到频域,得到单帧频域带噪语音信号,x
1win
(k)=fft(x
1fwin
(k)),x
2win
(k)=fft(x
2fwin
(k));
[0012]
其中,ceil为向上取整,x
1fwin
(k),x
2fwin
(k)分别为所述第一麦克风和所述第二麦克风的待变换的单帧时域带噪语音信号,x
1win
(k)为所述第一麦克风的单帧频域带噪语音信号,x
2win
(k)为所述第二麦克风的单帧频域带噪语音信号,fft为快速傅里叶变换算子。
[0013]
可选地,所述对转换后的单帧频域带噪语音信号进行相干系数计算和空域滤波器设计,使所述空域滤波器的最大响应方向对准所述双麦克风的语音增强方向,包括:根据计算转换后的单帧频域带噪语音信号所对应的相干系数,其中,数,其中,数,其中,e为数学期望;
[0014]
根据相干系数γ(ω)的实部与虚部的幅值大小与单帧频域带噪语音信号方位和信噪比的对应关系,设计所述空域滤波器,以使所述空域滤波器的最大响应方向对准所述双麦克风的语音增强方向。
[0015]
可选地,设计所述空域滤波器的步骤包括:设γ(ω)的实部为real(γ(ω)),虚部为img(γ(ω)),第一空域滤波器设计为,g1(ω)=1

|real(γ(ω))|
p(ω)
,其中,g1(ω)为第一空域滤波器的增益函数,p(ω)满足其中,α
low
和α
high
为正整数,且α
low
>α
high
>1;
[0016]
第二空域滤波器设计为,其中,g2(ω)为第二滤波器的增益函数,μ为接近于0的正数,q(ω)满足:
[0017]
式中β
low
和β
high
为负数,且β
low
>β
high


1;
[0018]
将g1(ω)和g2(ω)相乘得到最终空域滤波器增益函数g
final
(ω)=g1(ω)
×
g2(ω);
[0019]
可选地,所述方法还包括:基于所述空域滤波器增益函数g
final
(ω),将所述第一麦克风的单帧频域带噪语音信号x
1win
(k)与g
final
(ω)相乘,得到单帧频域增强语音信号:x
enhwin
(k)=x
1win
(k)
×
g
final
(ω);
[0020]
并对单帧频域增强语音信号进行快速傅里叶逆变换,得到对应的单帧时域增强语
音信号x
enhwin
(k)=ifft(x
enhwin
(k));
[0021]
其中,x
enhwin
(k)为单帧频域增强语音信号,x
enhwin
(k)为单帧时域增强语音信号,ifft为傅里叶逆变换算子。
[0022]
可选地,所述对所述单帧时域增强语音信号进行拼接得到整段带噪语音的语音增强信号,包括:
[0023]
将所有单帧时域增强语音按分帧和加窗参数进行拼接,得到整段带噪语音的增强结果。
[0024]
第二方面,本发明提供了一种微型双麦克风,所述微型双麦克风为采用上述任一种所述方法进行制备的。
[0025]
本发明有益效果如下:
[0026]
本发明是利用双麦克风阵列形式,通过相干系数设计滤波器,实现对带噪语音的语音增强,相对于单麦克风语音增强技术,本发明具有空域滤波的作用,可以抑制非平稳噪声,相对于其它传统的的麦克风阵列语音增强技术,本发明具有更小的尺寸和更低的功耗。
[0027]
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
[0028]
图1是本发明第一实施例提供的一种微型双麦克风语音增强方法的流程示意图;
[0029]
图2是本发明第一实施例提供的阵列布置的双麦克风的结构示意图;
[0030]
图3是本发明第一实施例提供的另一种微型双麦克风语音增强方法的流程示意图。
具体实施方式
[0031]
以下结合附图以及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不限定本发明。
[0032]
本发明第一实施例提供了一种微型双麦克风语音增强方法,参见图1,该方法包括:
[0033]
s101、利用阵列布置的双麦克风采集带噪语音信号,所述阵列布置的双麦克风包括第一麦克风和第二麦克风;
[0034]
其中,如图2所示,本发明实施例中,所述阵列布置的双麦克风中第一麦克风的中心点与第二麦克风的中心点之间的间距为1.5

3厘米。
[0035]
具体实施时,本发明实施例是利用阵列布置的双麦克风上的质点振速传声器采集所述带噪语音信号。通过利用质点振速传声器进行声信号采集,本发明实施例可以充分利用传声器本身的噪声抑制特性,以进一步提高语音增强效果。
[0036]
s102、对所采集的带噪语音信号进行处理,将所述带噪语音信号转换为单帧频域带噪语音信号;
[0037]
即,本发明实施例是对所采集的带噪语音信号进行分帧与加窗处理,并通过快速傅里叶变换将单帧的带噪语音信号转换为单帧频域带噪语音信号;
[0038]
具体来说,本发明实施例是设定所述第一麦克风采集的带噪语音信号为x1,所述第二麦克风采集的带噪语音信号为x2,对所述第一麦克风采集的带噪语音信号x1以及所述第二麦克风采集的带噪语音信号x2进行分帧加窗,得到对应的单帧时域带噪语音信号x
1win
(l),x
2win
(l),其中,l为单帧时域带噪语音信号长度,l=1,2,

,l。
[0039]
对单帧时域带噪语音信号x
1win
(l),x
2win
(l)进行如下处理,
[0040][0041][0042]
将计算得到的x
1fwin
(k),x
2fwin
(k)利用fft转换到频域,得到单帧频域带噪语音信号,x
1win
(k)=fft(x
1fwin
(k)),x
2win
(k)=fft(x
2fwin
(k));
[0043]
其中,ceil为向上取整,x
1fwin
(k),x
2fwin
(k)分别为所述第一麦克风和所述第二麦克风的待变换的单帧时域带噪语音信号,x
1win
(k)为所述第一麦克风的单帧频域带噪语音信号,x
2win
(k)为所述第二麦克风的单帧频域带噪语音信号,fft为快速傅里叶变换算子。
[0044]
s103、对转换后的单帧频域带噪语音信号进行相干系数计算和空域滤波器设计,使所述空域滤波器的最大响应方向对准所述双麦克风的语音增强方向,利用所述空域滤波器对所述单帧频域带噪语音信号进行空域滤波,对空域滤波后的信号进行快速傅里叶逆变换ifft,得到单帧时域增强语音信号;
[0045]
具体实施时,本发明实施例是根据计算转换后的单帧频域带噪语音信号所对应的相干系数,其中,的单帧频域带噪语音信号所对应的相干系数,其中,的单帧频域带噪语音信号所对应的相干系数,其中,e为数学期望;
[0046]
根据相干系数γ(ω)的实部与虚部的幅值大小与单帧频域带噪语音信号方位和信噪比的对应关系,设计所述空域滤波器,以使所述空域滤波器的最大响应方向对准所述双麦克风的语音增强方向。
[0047]
其中,本发明实施例是通过以下步骤来设置空域滤波器的:设γ(ω)的实部为real(γ(ω)),虚部为img(γ(ω)),第一空域滤波器设计为,g1(ω)=1

|real(γ(ω))|
p(ω)
,其中,g1(ω)为第一空域滤波器的增益函数,p(ω)满足其中,α
low
和α
high
为正整数,且α
low
>α
high
>1;
[0048]
第二空域滤波器设计为,其中,g2(ω)为第二滤
波器的增益函数,μ为接近于0的正数,q(ω)满足:
[0049]
式中β
low
和β
high
为负数,且β
low
>β
high


1;
[0050]
将g1(ω)和g2(ω)相乘得到最终空域滤波器增益函数g
final
(ω)=g1(ω)
×
g2(ω)。
[0051]
然后,基于所述空域滤波器增益函数g
final
(ω),将所述第一麦克风的单帧频域带噪语音信号x
1win
(k)与g
final
(ω)相乘,得到单帧频域增强语音信号:x
enhwin
(k)=x
1win
(k)
×
g
final
(ω);
[0052]
并对单帧频域增强语音信号进行快速傅里叶逆变换,得到对应的单帧时域增强语音信号x
enhwin
(k)=ifft(x
enhwin
(k));
[0053]
其中,x
enhwin
(k)为单帧频域增强语音信号,x
enhwin
(k)为单帧时域增强语音信号,ifft为傅里叶逆变换算子。
[0054]
s104、对所述单帧时域增强语音信号进行拼接得到整段带噪语音的语音增强信号。
[0055]
具体实施时,本发明实施例是将所有单帧时域增强语音按分帧和加窗参数进行拼接,得到整段带噪语音的增强结果。
[0056]
需要说明的是,所述双麦克风的语音增强方向为所述第二麦克风到所述第一麦克风的端射方向。
[0057]
总体来说,本发明实施例是利用双麦克风阵列形式,通过相干系数设计滤波器,实现对带噪语音的语音增强。相对于单麦克风语音增强技术,本发明具有空域滤波的作用,可以抑制非平稳噪声,并且相对于传统的麦克风阵列语音增强技术,本发明具有更小的阵列尺寸与更低的功耗。
[0058]
为了更好地对本发明进行详细的说明,下面结合图3以一个具体的例子来对本发明所述方法进行说明:
[0059]
如图3所示,本发明提供了一种基于质点振速传声器的微型双麦克风语音增强方法,本发明利用两只间距小、敏感方向一致的质点振速传声器作为原始声信号采集单元,根据两只传声器信号的相干系数设计空域滤波器,实现对目标语音的增强。具体本发明实施例所述的方法包括:
[0060]
s301、阵列布置与带噪语音信号采集;
[0061]
如图2所示,本发明实施例是将两只质点振速传声器并排放置,间距为2cm,定义其中一只质点振速传声器为前麦,即上述的第一麦克风,另外一只质点振速传声器为后麦,即上述的第二麦克风,语音增强方向为后麦到前麦的端射方向。两只质点振速传声器的敏感方向均与增强方向一致。
[0062]
阵列布设完毕后,利用两只质点振速传声器进行带噪语音信号采集,前麦和后麦采集到的带噪语音信号分别记为x1,x2。
[0063]
s302、带噪语音分帧与加窗处理;
[0064]
分帧和加窗是语音信号处理中的基本预处理过程,其目的是保证所处理的语音信
号为近似平稳信号。对模块1中的x1,x2进行分帧加窗,得到对应的单帧时域带噪语音信号x
1win
(l),x
2win
(l)(l=1,2,

,l,l为单帧时域带噪语音信号长度)。分帧加窗参数选择如下:帧长为20ms,帧移为10ms,窗函数为汉宁窗。
[0065]
s303、单帧信号快速傅里叶变换;
[0066]
本步骤具体是将单帧时域带噪语音信号转换到频域。由于fft要求信号长度为2的整数次幂,而对于采样率不同的信号,根据模块2的帧长参数选择,单帧时域带噪语音信号的长度不一定满足该条件。为此,对单帧时域带噪语音信号x
1win
(l),x
2win
(l)进行如下处理,
[0067][0068][0069]
其中,ceil表示向上取整,x
1fwin
(k),x
2fwin
(k)分别为前麦和后麦的待变换的单帧时域带噪语音信号。
[0070]
得到x
1fwin
(k),x
2fwin
(k)后,就可以利用fft将其转换到频域,得到单帧频域带噪语音信号,
[0071]
x
1win
(k)=fft(x
1fwin
(k))
ꢀꢀꢀꢀꢀ
(3)
[0072]
x
2win
(k)=fft(x
2fwin
(k))
ꢀꢀꢀꢀꢀ
(4)
[0073]
其中,x
1win
(k),x
2win
(k)分别为前麦和后麦的单帧频域带噪语音信号,fft为快速傅里叶变换算子。
[0074]
s304、相干系数计算与滤波器设计;
[0075]
具体来说,本发明实施例是将上述步骤得到的单帧频域带噪语音信号x
1win
(k),x
2win
(k),计算其对应的相干系数,具体计算公式为,
[0076][0077]
其中,
[0078][0079][0080][0081][0082]
其中,e表示数学期望。
[0083]
相干系数γ(ω)为复数,包含实部与虚部,实部与虚部的幅值大小与信号方位和信噪比具有对应关系,可据此设计空域滤波器。将γ(ω)的实部和虚部分别记为real(γ(ω))和img(γ(ω)),滤波器1设计为,
[0084]
g1(ω)=1

|real(γ(ω))|
p(ω)
ꢀꢀꢀꢀꢀ
(10)
[0085]
其中,g1(ω)为滤波器1的增益函数,p(ω)满足如下条件,
[0086][0087]
式中α
low
和α
high
为正整数,满足α
low
>α
high
>1。
[0088]
滤波器2设计为,
[0089][0090]
其中,g2(ω)为滤波器2的增益函数,μ为接近于0的正数,q(ω)满足如下条件,
[0091][0092]
式中β
low
和β
high
为负数,满足β
low
>β
high


1。
[0093]
最后,将g1(ω)和g2(ω)相乘得到最终滤波器增益函数,
[0094]
g
final
(ω)=g1(ω)
×
g2(ω)
ꢀꢀꢀꢀꢀꢀ
(14)
[0095]
s305、进行空域滤波与快速傅里叶逆变换(inverse fast fourier transform,ifft);
[0096]
得到最终滤波器增益函数g
final
(ω)后,将前麦单帧频域带噪语音信号x
1win
(k)与g
final
(ω)相乘,可得到单帧频域增强语音信号,
[0097]
x
enhwin
(k)=x
1win
(k)
×
g
final
(ω)
ꢀꢀꢀꢀꢀꢀꢀ
(15)
[0098]
其中,x
enhwin
(k)为单帧频域增强语音信号。
[0099]
得到x
enhwin
(k)后,对其进行ifft,可以得到对应的单帧时域增强语音信号,
[0100]
x
enhwin
(k)=ifft(x
enhwin
(k))
ꢀꢀꢀꢀꢀ
(16)其中,x
enhwin
(k)为单帧时域增强语音信号,ifft为ifft算子。
[0101]
s306、单帧时域增强语音拼接。
[0102]
即,在得到所有单帧时域增强语音后,将其按分帧和加窗参数进行拼接,得到整段带噪语音的增强结果。
[0103]
总体来说,本发明实施例是利用双麦克风阵列形式,通过相干系数设计滤波器,实现对带噪语音的语音增强。相对于单麦克风语音增强技术,本发明实施例的麦克风具有空域滤波的作用,可以抑制非平稳噪声;而相对于传统的麦克风阵列语音增强技术,本发明实施例的麦克风具有更小的阵列尺寸与更低的功耗。同时,本发明的麦克风是利用质点振速传声器进行声信号采集,可以充分利用传声器本身的噪声抑制特性,进而可以提高语音增强效果。
[0104]
本发明第二实施例提供了一种微型双麦克风,该微型双麦克风采用上述任一种所述方法进行语音增强处理。本发明实施例的相关内容可参见本发明第一实施例和第二实施例进行理解,在此不做详细论述。
[0105]
尽管为示例目的,已经公开了本发明的优选实施例,本领域的技术人员将意识到各种改进、增加和取代也是可能的,因此,本发明的范围应当不限于上述实施例。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜