一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于麦克风阵列的声源定位方法、装置、设备及存储介质与流程

2021-10-20 00:25:00 来源:中国专利 TAG:声源 阵列 麦克风 信号处理 装置


1.本发明涉及声源信号处理技术领域,特别是涉及一种基于麦克风阵列的声源定位方法、装置、设备及存储介质。


背景技术:

2.传统麦克风阵列信号处理方法分为声源定位和波束形成两个过程。其中,声源定位的作用是利用麦克风阵列原始入射信号计算得出声源的入射方向;波束形成的作用是根据麦克风阵列的原始入射信号以及声源定位所得出的入射方向,调整波束形成器的参数,使波束形成器指向声源方向,保证声源方向信号通过的同时,对其他方向的信号进行抑制,从而提升输出信号的信噪比。
3.在现有的声源定位算法中,常用的算法是tdoa(time difference of arrival,到达时间差)算法。tdoa算法在时域使用相关函数,计算不同麦克风对之间的相对时延,从所有麦克风对的所有相对时延及麦克风间几何位置来推断出声源方位。但是,这种声源定位算法只能计算采样间隔整数倍的时延,分辨率太低,声源定位的准确率低。


技术实现要素:

4.本发明实施例所要解决的技术问题是:提供一种基于麦克风阵列的声源定位方法、装置、设备及存储介质,提高声源定位的准确率。
5.为了解决上述技术问题,第一方面,本发明实施例提供一种基于麦克风阵列的声源定位方法,所述声源定位方法包括:
6.获取麦克风阵列的基准阵元以及每一其它阵元的待处理信号;
7.根据所述待处理信号分别计算得到所述每一其它阵元相对于所述基准阵元的阵列相位差和频谱相位差;
8.根据所述阵列相位差和所述频谱相位差计算得到声源的入射方向。
9.结合第一方面,在一种可能的实现方式中,所述获取麦克风阵列的基准阵元及每一其它阵元的待处理信号,具体包括:
10.获取所述麦克风阵列的基准阵元及每一其它阵元的入射信号;
11.对所述入射信号进行时频变换,得到频域信号;
12.将所述入射信号以及所述频域信号作为所述待处理信号。
13.结合第一方面,在一种可能的实现方式中,所述对所述入射信号进行时频变换,具体为:
14.对所述入射信号进行傅立叶变换;或者,
15.对所述入射信号进行短时傅立叶变换;或者,
16.对所述入射信号进行小波变换。
17.结合第一方面,在一种可能的实现方式中,所述每一其它阵元相对于所述基准阵元的阵列相位差具体通过如下步骤进行计算:
18.计算所述入射信号在所述每一其它阵元中相对于所述基准阵元的时延;
19.根据所述时延以及所述入射信号在所述每一其它阵元中的每一个频点的频率,计算所述阵列相位差。
20.结合第一方面,在一种可能的实现方式中,所述计算所述入射信号在所述每一其它阵元中相对于所述基准阵元的时延,具体为:
21.通过如下公式计算所述时延:
22.τ
m


a
t
p
m
/v;其中,τ
m
为第m个阵元相对于所述基准阵元的时延,a为所述入射信号的入射方向,a
t
表示a的转置,p
m
为第m个阵元的阵元坐标,v为声速。
23.结合第一方面,在一种可能的实现方式中,所述根据所述时延以及所述入射信号在所述每一其它阵元中的每一个频点的频率,计算所述阵列相位差,具体为:
24.通过如下公式计算所述阵列相位差:
25.σ(m,n)=τ
m
f
m,n


a
t
p
m
f
m,n
/v;其中,σ(m,n)为第m个阵元中的第n个频点相对于所述基准阵元的阵列相位差,f
m,n
为第m个阵元中的第n个频点的频率。
26.结合第一方面,在一种可能的实现方式中,所述根据所述阵列相位差和频谱相位差计算得到声源的入射方向,具体为:
27.通过如下公式对所述频谱相位差以及所述阵列相位差对所述入射信号的入射方向进行寻优:
28.其中,θ为寻优结果,μ(m,n)为第m个阵元中的第n个频点的频谱相位,μ(1,n)为基准阵元中的第n个频点的频谱相位,m为所述麦克风阵列中阵元的数量,n为所述入射信号的帧长。
29.为了解决上述技术问题,第二方面,本发明实施例提供一种基于麦克风阵列的声源定位装置,所述声源定位装置包括:
30.信号获取模块,用于获取麦克风阵列的基准阵元以及每一其它阵元的待处理信号;
31.信号处理模块,用于根据所述待处理信号分别计算得到所述每一其它阵元相对于所述基准阵元的阵列相位差和频谱相位差;
32.声源定位模块,用于根据所述阵列相位差和所述频谱相位差计算得到声源的入射方向。
33.为了解决上述技术问题,第三方面,本发明实施例提供一种基于麦克风阵列的声源定位设备,所述设备包括存储器、处理器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述计算机程序由所述处理器执行时实现如第一方面任一项所述的基于麦克风阵列的声源定位方法。
34.为了解决上述技术问题,第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被执行时实现如第一方面任一项所述的基于麦克风阵列的声源定位方法。
35.与现有技术相比,本发明实施例提供的一种基于麦克风阵列的声源定位方法、装置、设备及存储介质,其有益效果在于:首先获取麦克风阵列的所有阵元的待处理信号,并
根据待处理信号计算出每一其他阵元相对于基准阵元的阵列相位差和频谱相位差,然后结合阵列相位差和频谱相位差对声源的入射方向进行寻优计算,将得到的最优值作为声源入射方向,综合考虑了阵列相位差和频谱相位差对声源进行定位,提高了声源定位的准确率。
附图说明
36.为了更清楚地说明本发明实施例的技术特征,下面将对本发明实施例中所需要使用的附图做简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
37.图1是本发明提供的一种基于麦克风阵列的声源定位方法的一个优选实施例的流程示意图;
38.图2是本发明提供的一种基于麦克风阵列的声源定位装置的一个优选实施例的结构示意图;
39.图3是本发明提供的一种基于麦克风阵列的声源定位设备的一个优选实施例的结构示意图。
具体实施方式
40.为了对本发明的技术特征、目的、效果有更加清楚的理解,下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例仅用于说明本发明,但是不用来限制本发明的保护范围。基于本发明的实施例,本领域技术人员在没有付出创造性劳动的前提下所获得的其他实施例,都应属于本发明的保护范围。
41.图1所示为本发明提供的一种基于麦克风阵列的声源定位方法的一个优选实施例的流程示意图。
42.如图1所示,所述声源定位方法包括:
43.s11:获取麦克风阵列的基准阵元以及每一其它阵元的待处理信号;
44.s12:根据所述待处理信号分别计算得到所述每一其它阵元相对于所述基准阵元的阵列相位差和频谱相位差;
45.s13:根据所述阵列相位差和所述频谱相位差计算得到声源的入射方向。
46.需要说明的是,在实际情况中,麦克风阵列一般为圆阵或者线阵,即m个麦克风(或者其他声学传感器)均位于同一平面,此时,建立空间笛卡尔坐标系时以阵元所在平面为xoy平面,并将基准阵元的坐标定位在坐标系原点,在坐标系中,第m个阵元用p
m
=[x
m
,y
m
,z
m
]表示其空间位置。
[0047]
具体实施本发明时,首先获取麦克风阵列的所有阵元的待处理信号,并根据待处理信号计算出每一其他阵元相对于基准阵元的阵列相位差和频谱相位差,然后结合阵列相位差和频谱相位差对声源的入射方向进行寻优计算,将得到的最优值作为声源入射方向。
[0048]
在一个可能的实施例中,所述获取麦克风阵列的基准阵元及每一其它阵元的待处理信号,具体包括:
[0049]
获取所述麦克风阵列的基准阵元及每一其它阵元的入射信号;
[0050]
对所述入射信号进行时频变换,得到频域信号;
[0051]
将所述入射信号以及所述频域信号作为所述待处理信号。
[0052]
具体而言,麦克风阵列获取得到的初始输入信号为时域信号,需要对该时域信号进行时频变换,获取其在频域上的频域信号,再将时域信号和频域信号共同作为待处理信号。
[0053]
进一步的,所述对所述入射信号进行时频变换,具体为:
[0054]
对所述入射信号进行傅立叶变换;或者,
[0055]
对所述入射信号进行短时傅立叶变换;或者,
[0056]
对所述入射信号进行小波变换。
[0057]
作为一个举例,对于时域分帧后每一帧x帧长为n个点的入射信号,通过傅里叶变换可以得到,频域数组x长度为n/2 1个点,即x(n),0≤n≤n/2。当麦克风的采样率fs已知时(一般fs=16000hz),便可以得到频域数组x的第m个阵元中的第n个频点的频率为f
m,n
=fs*n/n,并可以得到基准阵元的第n个频点的值为x(1,n)=p
1,n
q
1,n
i,其相位为μ(1,n)=arctan(q
1,n
/p
1,n
),第m个阵元的第n个频点的值为x(m,n)=p
m,n
q
m,n
i,其相位为μ(m,n)=arctan(q
m,n
/p
m,n
),i为虚数单位。
[0058]
在一个可能的实施例中,所述每一其它阵元相对于所述基准阵元的阵列相位差具体通过如下步骤进行计算:
[0059]
计算所述入射信号在所述每一其它阵元中相对于所述基准阵元的时延;
[0060]
根据所述时延以及所述入射信号在所述每一其它阵元中的每一个频点的频率,计算所述阵列相位差。
[0061]
进一步的,所述计算所述入射信号在所述每一其它阵元中相对于所述基准阵元的时延,具体为:
[0062]
通过如下公式计算所述时延:
[0063]
τ
m


a
t
p
m
/v;其中,τ
m
为第m个阵元相对于所述基准阵元的时延,a为所述入射信号的入射方向,a
t
表示a的转置,p
m
为第m个阵元的阵元坐标,v为声速。
[0064]
进一步的,所述根据所述时延以及所述入射信号在所述每一其它阵元中的每一个频点的频率,计算所述阵列相位差,具体为:
[0065]
通过如下公式计算所述阵列相位差:
[0066]
σ(m,n)=τ
m
f
m,n


a
t
p
m
f
m,n
/v;其中,σ(m,n)为第m个阵元中的第n个频点相对于所述基准阵元的阵列相位差,f
m,n
为第m个阵元中的第n个频点的频率。
[0067]
作为一个举例,入射信号的入射方向为其模长为1,则第m个阵元相对于所述基准阵元的时延τ
m


a
t
p
m
/v,再根据时延及频率,计算出每一其他阵元相对基准阵元的阵列相位差:σ(m,n)=τ
m
f
m,n


a
t
p
m
f
m,n
/v。其中,当进行特定角度的声源定位时,为了减少计算量,还可以忽略声源俯仰角,例如将俯仰角θ固定为π/2,此时声源入射方向a简化为
[0068]
在一个可能的实施例中,所述根据所述阵列相位差和频谱相位差计算得到声源的入射方向,具体为:
[0069]
通过如下公式对所述频谱相位差以及所述阵列相位差对所述入射信号的入射方向进行寻优:
[0070]
其中,θ为寻优结果,μ(m,n)为第m个阵元中的第n个频点的频谱相位,μ(1,n)为基准阵元中的第n个频点的频谱相位,m为所述麦克风阵列中阵元的数量,n为所述入射信号的帧长。
[0071]
需要说明的是,阵列相位差是指:当声源入射方向确定后,由阵列和声源几何位置关系所确定的相位差,即,当声源从某方向入射,就应该具有的相位差,也即真值。真值就是通过距离/声速算出的。一个声源方向对应了一个真值。
[0072]
而频谱相位差可看作仅由信号自身特点得出的测量值,但是这个测量值是受到噪声干扰的,若完全没有噪声干扰,求得的频谱相位差和某一个声源方向对应的真值是对应相等的。但正是由于噪声的存在,本发明提出通过argmin函数遍历的方式去在所有真值里找出与这个受干扰的值最近的那个真值。最近的那个真值对应的方向就是声源的入射方向。
[0073]
具体而言,由在前公式可得,σ(m,n)=τ
m
f
m,n


a
t
p
m
f
m,n
/v,μ(m,n)=arctan(q
m,n
/p
m,n
),μ(1,n)=arctan(q
1,n
/p
1,n
),当接收到输入信号时,首先通过μ(m,n)

μ(1,n)部分计算出第m个阵元与基准阵元的频谱相位差,再遍历所有入射方向a,找出使得θ的值最小的a,并将其确定为声源的入射方向。
[0074]
本发明实施例提供的一种基于麦克风阵列的声源定位方法,首先获取麦克风阵列的所有阵元的待处理信号,并根据待处理信号计算出每一其他阵元相对于基准阵元的阵列相位差和频谱相位差,然后结合阵列相位差和频谱相位差对声源的入射方向进行计算,确定声源入射方向,综合考虑阵列相位差和频谱相位差对声源进行定位,提高了声源定位的准确率;同时,时延通过阵列的位置关系直接算出、最后的声源方向通过argmin函数遍历,无需进行大量计算,计算的复杂度也得到了降低。
[0075]
应当理解,本发明实现上述基于麦克风阵列的声源定位方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述基于麦克风阵列的声源定位方法的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0076]
图2所示为本发明提供的一种基于麦克风阵列的声源定位装置的一个优选实施例的结构示意图,所述声源定位装置能够实现上述任一实施例所述的基于麦克风阵列的声源定位方法的全部流程及达到相应的技术效果。
[0077]
如图2所示,所述声源定位装置包括:
[0078]
信号获取模块21,用于获取麦克风阵列的基准阵元以及每一其它阵元的待处理信号;
[0079]
信号处理模块22,用于根据所述待处理信号分别计算得到所述每一其它阵元相对
于所述基准阵元的阵列相位差和频谱相位差;
[0080]
声源定位模块23,用于根据所述阵列相位差和所述频谱相位差计算得到声源的入射方向。
[0081]
在一个可能的实施例中,所述信号获取模块21具体包括:
[0082]
时域信号获取单元,用于获取所述麦克风阵列的基准阵元及每一其它阵元的入射信号;
[0083]
频域信号获取单元,用于对所述入射信号进行时频变换,得到频域信号;
[0084]
信号整合单元,用于将所述入射信号以及所述频域信号作为所述待处理信号。
[0085]
在一个可能的实施例中,所述频域信号获取单元具体用于:
[0086]
对所述入射信号进行傅立叶变换;或者,
[0087]
对所述入射信号进行短时傅立叶变换;或者,
[0088]
对所述入射信号进行小波变换。
[0089]
在一个可能的实施例中,所述信号处理模块22具体通过如下步骤进行所述每一阵元相对于所述基准阵元的阵列相位差的计算:
[0090]
计算所述入射信号在所述每一其它阵元中相对于所述基准阵元的时延;
[0091]
根据所述时延以及所述入射信号在所述每一其它阵元中的每一个频点的频率,计算所述阵列相位差。
[0092]
在一个可能的实施例中,所述信号处理模块22具体通过如下步骤进行所述入射信号在所述每一其他阵元中相对于所述基准阵元的时延的计算:
[0093]
通过如下公式计算所述时延:
[0094]
τ
m


a
t
p
m
/v;其中,τ
m
为第m个阵元相对于所述基准阵元的时延,a为所述入射信号的入射方向,a
t
表示a的转置,p
m
为第m个阵元的阵元坐标,v为声速。
[0095]
在一个可能的实施例中,所述信号处理模块22具体通过如下步骤计算所述阵列相位差:
[0096]
通过如下公式计算所述阵列相位差:
[0097]
σ(m,n)=τ
m
f
m,n


a
t
p
m
f
m,n
/v;其中,σ(m,n)为第m个阵元中的第n个频点相对于所述基准阵元的阵列相位差,f
m,n
为第m个阵元中的第n个频点的频率。
[0098]
在一个可能的实施例中,所述声源定位模块23具体通过如下步骤计算得到声源的入射方向:
[0099]
通过如下公式对所述频谱相位差以及所述阵列相位差对所述入射信号的入射方向进行寻优:
[0100]
其中,θ为寻优结果,μ(m,n)为第m个阵元中的第n个频点的频谱相位,μ(1,n)为基准阵元中的第n个频点的频谱相位,m为所述麦克风阵列中阵元的数量,n为所述入射信号的帧长。
[0101]
本发明实施例提供的一种基于麦克风阵列的声源定位装置,综合考虑阵列相位差和频谱相位差对声源进行定位,提高了声源定位的准确率;同时,时延通过阵列的位置关系直接算出、最后的声源方向通过argmin函数遍历,无需进行大量计算,计算的复杂度也得到
了降低。
[0102]
图3所示为本发明提供的一种基于麦克风阵列的声源定位设备的一个优选实施例的结构示意图,所述声源定位设备能够实现上述任一实施例所述的基于麦克风阵列的声源定位方法的全部流程及达到相应的技术效果。
[0103]
如图3所示,所述声源定位设备包括存储器31、处理器32;其中,所述存储器31中存储有计算机程序,所述计算机程序被配置为由所述处理器32执行,且被所述处理器32执行时实现如上述任一实施例所述的基于麦克风阵列的声源定位方法。
[0104]
本发明实施例提供的基于麦克风阵列的声源定位设备,能够提高声源定位的准确率。
[0105]
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器32执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述基于麦克风阵列的声源定位设备中的执行过程。
[0106]
所称处理器32可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field

programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0107]
所述存储器31可用于存储所述计算机程序和/或模块,所述处理器32通过运行或执行存储在所述存储器31内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于麦克风阵列的声源定位设备的各种功能。所述存储器31可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0108]
需要说明的是,上述基于麦克风阵列的声源定位设备包括,但不仅限于,处理器、存储器,本领域技术人员可以理解,图3结构示意图仅仅是上述基于麦克风阵列的声源定位设备的示例,并不构成对基于麦克风阵列的声源定位设备的限定,可以包括比图示更多部件,或者组合某些部件,或者不同的部件。
[0109]
以上所述,仅是本发明的优选实施方式,但本发明的保护范围并不局限于此,应当指出,对于本领域技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干等效的明显变型方式和/或等同替换方式,这些明显变型方式和/或等同替换方式也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜