声源的定位方法、装置、设备及计算机可读存储介质与流程

2021-12-14 22:01:00 来源：中国专利 TAG：

1.本技术涉及声源定位技术领域，特别是涉及一种声源的定位方法、装置、设备及计算机可读存储介质。

背景技术：

2.基于麦克风阵列的声源定位技术在音视频会议、监控识别、多媒体系统以及智能音箱等领域有广泛的应用，是人机交互领域中的一项重要课题。在实际应用中，阵列对声源定位的精确度将影响到后续的语音增强效果、人机交互体验效果，因此对阵列的定位精度有一定的要求。而阵列定位效果又受到语音宽带特性、麦克风性能、环境噪声以及混响等诸多因素影响，容易导致定位精度下降，这又要求阵列定位算法具备一定的鲁棒性。最后，为了避免空间混叠问题，阵列中麦克风间距不宜过大，应小于信号的半波长。而部分声源定位算法的方位估计精度又和麦克风间距相关，间距越小，阵列的空间分辨能力就越弱。
3.时延估计定位算法的计算量低，有利于算法的快速实现。但是时延估计算法在低信噪比下相关峰的峰值不显著，算法稳健性差。同时受限于信号采样率，麦克风阵列阵型等因素的限制，定位精度较低。高分辨率谱估计技术如music算法通过特征值分解构造正交的信号子空间和噪声子空间，能够实现超分辨率估计。但是music算法需要对信号和噪声有一定的先验知识，同时计算复杂度也较高。

技术实现要素：

4.本技术主要解决的技术问题是提供一种声源的定位方法、装置、设备及计算机可读存储介质，能够高效确定声源精确方位。
5.为了解决上述问题，本技术第一方面提供了一种声源的定位方法，所述声源的定位方法包括：对空间进行划分，确定声源位置的所有候选点，并根据麦克风阵列与候选点之间的位置关系，计算每个候选点对应的时延差矢量、采样点差矢量以及导向矢量；根据每个候选点对应的采样点差矢量，将所有候选点划分为若干个候选区域；对于所述麦克风阵列中的每个麦克风对，根据任意两个候选区域的可控响应功率之间的大小关系，对所有候选区域进行类别划分，得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息；根据每个麦克风对所对应的基于可控响应功率的区域类别划分信息，计算所有候选区域的总可控响应功率，将最大的总可控响应功率对应的候选区域作为目标候选区域；根据所述目标候选区域中的所有候选点对应的导向矢量，计算所有候选点的输出功率，将最大的输出功率对应的候选点作为声源的定位位置。
6.为解决上述问题，本技术第二方面提供了一种声源的定位装置，所述声源的定位装置包括：候选点确定模块，所述候选点确定模块用于对空间进行划分，确定声源位置的所有候选点，并根据麦克风阵列与候选点之间的位置关系，计算每个候选点对应的时延差矢量、采样点差矢量以及导向矢量；第一区域划分模块，所述第一区域划分模块用于根据每个候选点对应的采样点差矢量，将所有候选点划分为若干个候选区域；第二区域划分模块，所
述第二区域划分模块用于对于所述麦克风阵列中的每个麦克风对，根据任意两个候选区域的可控响应功率之间的大小关系，对所有候选区域进行类别划分，得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息；初步定位模块，所述初步定位模块用于根据每个麦克风对所对应的基于可控响应功率的区域类别划分信息，计算所有候选区域的总可控响应功率，将最大的总可控响应功率对应的候选区域作为目标候选区域；最终定位模块，所述最终定位模块用于根据所述目标候选区域中的所有候选点对应的导向矢量，计算所有候选点的输出功率，将最大的输出功率对应的候选点作为声源的定位位置。
7.为解决上述问题，本技术第三方面提供了一种声源的定位设备，所述声源的定位设备包括相互连接的麦克风阵列、处理器和存储器；所述麦克风阵列用于采集音频信号；所述存储器用于存储程序指令，所述处理器用于执行所述程序指令以实现上述第一方面的声源的定位方法。
8.为解决上述问题，本技术第四方面提供了一种计算机可读存储介质，其上存储有程序指令，所述程序指令被处理器执行时实现上述第一方面的声源的定位方法。
9.本发明的有益效果是：区别于现有技术的情况，本技术在利用麦克风阵列确定声源的所有候选点后，可以计算每个候选点对应的时延差矢量、采样点差矢量以及导向矢量，然后根据每个候选点对应的采样点差矢量，将所有候选点划分为若干个候选区域；对于所述麦克风阵列中的每个麦克风对，根据任意两个候选区域的可控响应功率之间的大小关系，对所有候选区域进行类别划分，得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息；然后根据每个麦克风对所对应的基于可控响应功率的区域类别划分信息，计算所有候选区域的总可控响应功率，将最大的总可控响应功率对应的候选区域作为目标候选区域；之后可以根据所述目标候选区域中的所有候选点对应的导向矢量，计算所有候选点的输出功率，将最大的输出功率对应的候选点作为声源的定位位置。通过上述方式，先使用ssc方法将全局空间中所有候选点划分为不同的候选区域，接着根据每个麦克风对在候选区域中的可控响应功率大小关系得到区域类别划分信息，使用改进的srp
‑
phat方法计算不同候选区域的可控响应功率，搜索最大可控响应功率对应的候选区域，作为声源可能存在的目标候选区域，最后使用mvdr算法对目标候选区域进行细致搜索，从而可以高效地确定声源精确方位。
附图说明
10.图1是本技术声源的定位方法一实施例的流程示意图；
11.图2是图1中步骤s11一实施例的流程示意图；
12.图3是图1中步骤s12一实施例的流程示意图；
13.图4是图1中步骤s13一实施例的流程示意图；
14.图5是图1中步骤s14一实施例的流程示意图；
15.图6是图1中步骤s15一实施例的流程示意图；
16.图7是本技术声源的定位装置一实施例的结构示意图；
17.图8是本技术声源的定位设备一实施例的结构示意图；
18.图9是本技术计算机可读存储介质一实施例的结构示意图。
具体实施方式
19.下面结合说明书附图，对本技术实施例的方案进行详细说明。
20.以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、接口、技术之类的具体细节，以便透彻理解本技术。
21.本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。此外，本文中的“多”表示两个或者多于两个。
22.请参阅图1，图1是本技术声源的定位方法一实施例的流程示意图。本实施例中的声源的定位方法，包括以下步骤：
23.s11：对空间进行划分，确定声源位置的所有候选点，并根据麦克风阵列与候选点之间的位置关系，计算每个候选点对应的时延差矢量、采样点差矢量以及导向矢量。
24.声源位置的候选点可以通过人为将空间进行划分后得到，比如一个3*3*3m大小的房间，按照1cm的间隔对空间做划分，可以得到300*300*300＝27*10^6个空间点，这些空间点就是声源位置的所有候选点。麦克风阵列是一个声音采集的系统，使用多个麦克风采集来自于不同空间方向的声音，多个麦克风按照指定要求排列后，加上相应的算法就可以解决声源定位问题。根据麦克风阵列和候选点的位置关系，可以确定每个候选点到麦克风阵列的时延差矢量，然后基于每个候选点对应的时延差矢量，可以计算得到该候选点对应的采样点差矢量以及导向矢量。
25.可以理解的是，本技术的麦克风阵列可以是麦克风线性阵列，例如由两个或多个麦克风组成的线性阵列；麦克风阵列也可以是麦克风平面阵列，例如是4麦阵列和6麦阵列；麦克风阵列也可以是麦克风立体阵列，例如是球状或者圆柱体状的阵列。
26.s12：根据每个候选点对应的采样点差矢量，将所有候选点划分为若干个候选区域。
27.根据ssc(search space clustering，搜索空间聚类)的理论，可以将对应的采样点差矢量一致的两个候选点归类为同一个候选区域，因此，使用ssc方法，可以根据每个候选点对应的采样点差矢量，将所有候选点划分为若干个候选区域。
28.s13：对于所述麦克风阵列中的每个麦克风对，根据任意两个候选区域的可控响应功率之间的大小关系，对所有候选区域进行类别划分，得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息。
29.对于麦克风阵列中的每个麦克风对，可以判断任意两个候选区域的可控响应功率是否相等，将可控响应功率相等的所有的候选区域划分为同一类别，于是对于任意麦克风对，可以将所有候选区域按照可控响应功率进行区域类别划分，得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息。
30.s14：根据每个麦克风对所对应的基于可控响应功率的区域类别划分信息，计算所有候选区域的总可控响应功率，将最大的总可控响应功率对应的候选区域作为目标候选区域。
31.使用改进的srp
‑
phat(steered response power
‑
phase transform,可控功率响应
‑
相位变换)算法，可以根据每个麦克风对所对应的基于可控响应功率的区域类别划分信
息，计算出所有候选区域的总可控响应功率，然后将最大的总可控响应功率对应的候选区域作为目标候选区域，实现对声源位置的初步搜索。
32.s15：根据所述目标候选区域中的所有候选点对应的导向矢量，计算所有候选点的输出功率，将最大的输出功率对应的候选点作为声源的定位位置。
33.在确定出目标候选区域后，根据步骤s12中关于候选区域的划分，可以得到该目标候选区域中的所有候选点及所有候选点对应的导向矢量，然后可以使用mvdr(minimum variance distortionless respons，最小方差无失真响应算法)算法计算所有候选点的输出功率，搜索输出功率最大值所在的位置，该位置对应的候选点就是估计的声源位置，实现声源的定位。
34.上述方案，在利用麦克风阵列确定声源的所有候选点后，可以计算每个候选点对应的时延差矢量、采样点差矢量以及导向矢量，然后根据每个候选点对应的采样点差矢量，将所有候选点划分为若干个候选区域；对于所述麦克风阵列中的每个麦克风对，根据任意两个候选区域的可控响应功率之间的大小关系，对所有候选区域进行类别划分，得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息；然后根据每个麦克风对所对应的基于可控响应功率的区域类别划分信息，计算所有候选区域的总可控响应功率，将最大的总可控响应功率对应的候选区域作为目标候选区域；之后可以根据所述目标候选区域中的所有候选点对应的导向矢量，计算所有候选点的输出功率，将最大的输出功率对应的候选点作为声源的定位位置。通过上述方式，先使用ssc方法将全局空间中所有候选点划分为不同的候选区域，接着根据每个麦克风对在候选区域中的可控响应功率大小关系得到区域类别划分信息，使用改进的srp
‑
phat方法计算不同候选区域的可控响应功率，搜索最大可控响应功率对应的候选区域，作为声源可能存在的目标候选区域，最后使用mvdr算法对目标候选区域进行细致搜索，从而可以高效地确定声源精确方位。
35.请结合图2，图2是图1中步骤s11一实施例的流程示意图。在一实施例中，上述步骤s11具体包括：
36.s111：对空间进行划分，获取声源位置的所有候选点，根据每个候选点的空间位置和所有麦克风对所对应的麦克风的空间位置，得到每个候选点对应的时延差矢量。
37.s112：根据所述时延差矢量和信号采样率，确定每个候选点对应的采样点差矢量。
38.s113：根据所述采样点差矢量，确定每个候选点对应的导向矢量。
39.任意两个麦克风可以组成一组麦克风对，对于m元麦克风阵列，组成的麦克风对的数量为n＝m(m
‑
1)。对于空间中的某个候选点，以q(q∈q)表示该候选点的空间位置，则该候选点到达由第m个麦克风和第n个麦克风组成的麦克风对mn的相对时延差为：
[0040][0041]
其中d
m
和d
n
分别表示第m个麦克风和第n个麦克风的空间位置。上述内容可知，对于空间中的某个候选点，可以根据该候选点的空间位置q和麦克风对mn的两个麦克风的空间位置d
m
和d
n
，计算该候选点对应的相对时延差τ
q,mn
，因此，而第m个麦克风和第n个麦克风组成的麦克风对的采样点差为：
[0042]
s
q，mn
＝round(f
s
*τ
q，mn
)
ꢀꢀꢀ
(2)
[0043]
其中，fs为信号采样率，round表示四舍五入对小数取整。于是，对于候选点q，n对
麦克风对组成的时延差矢量τ
q
和采样点差矢量s
q
分别表示为：
[0044]
τ
q
＝[τ
q，12
，τ
q，13
，...，τ
q，1m
，τ
q，23
，...，τ
q，(m
‑
1)m
]
ꢀꢀꢀꢀꢀꢀ
(3)
[0045]
s
q
＝[s
q，12
，s
q，13
，...，s
q，1m
，s
q，23
，...，s
q，(m
‑
1)m
]
ꢀꢀꢀꢀꢀꢀ
(4)
[0046]
以麦克风阵列中第一个麦克风为参考点，则候选点q处的导向矢量为：
[0047]
a(ω，q)＝[0，exp(jωτ
q，12
)，exp(jωτ
q，13
)，...，exp(jωτ
q，1m
)]
ꢀꢀꢀ
(5)
[0048]
其中jω表示频率点。于是，对于空间中的所有候选点，可以确定每个候选点对应的导向矢量，并将所有候选点q及其导向矢量存在存储器中。
[0049]
请结合图3，图3是图1中步骤s12一实施例的流程示意图。在一实施例中，上述步骤s12具体包括：
[0050]
s121：对所有候选点对应的采样点差矢量进行比较；
[0051]
s122：将具有相同的采样点差矢量的所有候选点归为同一候选区域，使所有候选点划分为若干个候选区域。
[0052]
对空间中所有候选点q的采样点差矢量，计算任意两个位置q1和q2的采样点差矢量的差值，计算公式为：
[0053]
δs
q1q2
＝s
q1
‑
s
q2
ꢀꢀꢀ
(6)
[0054]
根据ssc的理论，如果δs
q1q2
＝0，则说明q1和q2对应的采样点差矢量一致，于是可以将q1和q2归类为同一个候选区域a1。即候选区域a1可以包含若干个候选点，所包含的每个候选点的采样点差矢量一致，用表示。于是，可以将整个空间中的所有候选点q划分成若干个候选区域a＝[a1，a2，...，a
q’]，若干个候选区域对应的采样点差矢量为此时可以将若干个候选区域a以及每个候选区域对应的采样点差矢量存在存储器中，以便于后续进行查找。
[0055]
请结合图4，图4是图1中步骤s13一实施例的流程示意图。在一实施例中，上述步骤s13具体包括：
[0056]
s131：对于任意一个麦克风对，确定该麦克风对在任意两个候选区域的可控响应功率的大小关系。
[0057]
s132：根据该麦克风对在任意两个候选区域的可控响应功率的大小关系，对所有候选区域进行类别划分，将可控响应功率相同的候选区域归类为同一个可控响应功率中，以得到该麦克风对所对应的基于可控响应功率的区域类别划分信息，进而得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息。
[0058]
对于上述若干个候选区域中的某一个区域a
q’(a
q’∈a)，可以使用srp
‑
phat算法计算a
q’的可控响应功率为：
[0059][0060]
其中，r
mn
为第m个麦克风和第n个麦克风之间的互相关函数，s
aq’，mn
表示候选区域a
q
在第m个和第n个麦克风之间的采样点差矢量。对于整个候选区域a，可控响应功率的计算过程可以通过如下公式进行转换：
[0061][0062]
现有的srp
‑
phat算法中，关于候选区域a的可控响应功率的计算，首先选择一个候选区域，叠加所有麦克风对的可控响应功率，得到该候选区域的总可控响应功率，接着遍历全部的候选区域，得到所有的候选区域的可控响应功率。而本技术经过公式(8)改进后的srp
‑
phat算法中，可以首先选择一个麦克风对，计算该麦克风对在所有候选区域的可控响应功率，接着遍历全部的麦克风对，于是可以叠加得到所有候选区域的可控响应功率。
[0063]
尽管ssc方法对空间的候选点进行分类后，不同候选区域的采样点差矢量不一样，然而对于由第m个麦克风和第n个麦克风对组成的麦克风对mn来说，当两个麦克风的间距较小时，两个相邻的候选区域的采样点差矢量仍可能相等，那么该麦克风在这两个候选区域的可控响应功率也是相等的。因此，计算一个麦克风对在一个候选区域的可控响应功率时，可以同时获得两个或者多个候选区域的可控响应功率，从而可以简化srp
‑
phat算法计算可控响应功率的过程。因此，可以根据可控响应功率是否相等的原则，为每一组麦克风对继续划分候选区域。
[0064]
对于第m个麦克风和第n个麦克风组成的麦克风对mn，选择空间所有候选区域a中的任意两个候选区域a1和a2，计算两个候选区域的采样点差的差值，公式为：
[0065][0066]
其中，和分别为麦克风对mn在候选区域a1和a2的采样点差。如果δs＝0，则说明对于麦克风对mn，a1和a2两个候选区域的采样点差相等，即麦克风对mn在a1和a2两个候选区域的可控响应功率相等，便可以将两个候选区域归类为同一个可控响应功率中。遍历所有的候选区域，可以将所有候选区域归类为若干个可控响应功率中。按照如上对可控响应功率的分类方法，对所有麦克风对在所有候选区域的可控响应功率都进行划分，得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息。将每个麦克风对所对应的基于可控响应功率的区域类别划分信息存在存储器中，作为计算可控响应功率的搜索表格。
[0067]
请结合图5，图5是图1中步骤s14一实施例的流程示意图。在一实施例中，上述步骤s14具体包括：
[0068]
s141：对于任意一个麦克风对，根据该麦克风对所对应的基于可控响应功率的区域类别划分信息，计算该麦克风对在所有候选区域的可控响应功率。
[0069]
s142：将所有麦克风对在所有候选区域的可控响应功率进行叠加，得到所有候选区域的总可控响应功率。
[0070]
s143：将所有候选区域的总可控响应功率进行比较，选择最大的总可控响应功率对应的候选区域作为目标候选区域。
[0071]
假定麦克风阵列的接收信号的频域表示为：
[0072]
y(ω)＝[y1(ω)，y2(ω)，
…
y
m
(ω)]
t
，根据srp
‑
phat算法，第m个麦克风和第n个麦克风组成的麦克风对mn在候选区域a1的互相关函数以及可控响应功率分别为：
[0073][0074][0075]
对于麦克风对mn，查找可控响应功率的搜索表格，找到属于同一个可控响应功率的候选区域，同时得到多个候选区域的可控响应功率，然后遍历可控响应功率的搜索表格，可以得到麦克风对mn在所有的候选区域的可控响应功率。根据公式(8)，叠加所有的麦克风对的可控响应功率，得到所有的候选区域的总可控响应功率。然后搜索总可控响应功率的最大值，从而可以确定声源所在的目标候选区域：
[0076][0077]
其中，就是估计得到的声源所在目标候选区域。
[0078]
请结合图6，图6是图1中步骤s15一实施例的流程示意图。在一实施例中，上述步骤s15具体包括：
[0079]
s151：根据所述目标候选区域中的所有候选点对应的导向矢量和所述麦克风阵列接收音频信号的协方差逆矩阵，利用mvdr算法计算所有候选点的输出功率。
[0080]
s152：将所有候选点的输出功率进行比较，选择最大的输出功率对应的候选点作为声源的定位位置。
[0081]
由于目标候选区域内的所有候选点的采样点差矢量相等，srp
‑
phat算法无法继续进行声源定位，需要使用mvdr算法进行精确搜索定位。
[0082]
mvdr算法使用导向矢量计算目标候选区域中每个候选点的输出功率，找到输出功率最大值的位置就是估计的声源位置。在本技术中，mvdr算法不需要计算全局空间的空间谱，只需要计算目标候选区域中的所有候选点的输出功率，进一步提升了srp
‑
phat算法的定位精度。
[0083]
具体地，在确定目标候选区域后，可以确定候选区域中包括的所有候选点，并得到每个候选点对应的导向矢量，于是使用mvdr算法可以计算每个候选点的输出功率，计算公式为：
[0084][0085]
其中，φ
‑1表示为麦克风阵列接收信号协方差逆矩阵。通过搜索每个候选点的输出功率的最大值，确定输出功率的最大值对应的候选点的位置：
[0086][0087]
其中就是mvdr算法估计的声源的定位位置。
[0088]
请参阅图7，图7是本技术声源的定位装置一实施例的结构示意图。本实施例中的
声源的定位装置70包括相互连接的候选点确定模块700、第一区域划分模块702、第二区域划分模块704、初步定位模块706和最终定位模块708；所述候选点确定模块700用于对空间进行划分，确定声源位置的所有候选点，并根据麦克风阵列与候选点之间的位置关系，计算每个候选点对应的时延差矢量、采样点差矢量以及导向矢量；所述第一区域划分模块702用于根据每个候选点对应的采样点差矢量，将所有候选点划分为若干个候选区域；所述第二区域划分模块704用于对于所述麦克风阵列中的每个麦克风对，根据任意两个候选区域的可控响应功率之间的大小关系，对所有候选区域进行类别划分，得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息；所述初步定位模块706用于根据每个麦克风对所对应的基于可控响应功率的区域类别划分信息，计算所有候选区域的总可控响应功率，将最大的总可控响应功率对应的候选区域作为目标候选区域；所述最终定位模块708用于根据所述目标候选区域中的所有候选点对应的导向矢量，计算所有候选点的输出功率，将最大的输出功率对应的候选点作为声源的定位位置。
[0089]
在一实施例中，所述候选点确定模块700执行对空间进行划分，确定声源位置的所有候选点，并根据麦克风阵列与候选点之间的位置关系，计算每个候选点对应的时延差矢量、采样点差矢量以及导向矢量的步骤，包括：对空间进行划分，获取声源位置的所有候选点，根据每个候选点的空间位置和所有麦克风对所对应的麦克风的空间位置，得到每个候选点对应的时延差矢量；根据所述时延差矢量和信号采样率，确定每个候选点对应的采样点差矢量；根据所述采样点差矢量，确定每个候选点对应的导向矢量。
[0090]
在一实施例中，所述第一区域划分模块702执行根据每个候选点对应的采样点差矢量，将所有候选点划分为若干个候选区域的步骤，包括：将具有相同的采样点差矢量的所有候选点归为同一候选区域，使所有候选点划分为若干个候选区域。
[0091]
在一实施例中，所述第二区域划分模块704执行对于所述麦克风阵列中的每个麦克风对，根据任意两个候选区域的可控响应功率之间的大小关系，对所有候选区域进行类别划分，得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息的步骤，包括：对于任意一个麦克风对，确定该麦克风对在任意两个候选区域的可控响应功率的大小关系；根据该麦克风对在任意两个候选区域的可控响应功率的大小关系，对所有候选区域进行类别划分，将可控响应功率相同的候选区域归类为同一个可控响应功率中，以得到该麦克风对所对应的基于可控响应功率的区域类别划分信息，进而得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息。
[0092]
在一实施例中，所述初步定位模块706执行根据每个麦克风对所对应的基于可控响应功率的区域类别划分信息，计算所有候选区域的总可控响应功率，将最大的总可控响应功率对应的候选区域作为目标候选区域的步骤，包括：对于任意一个麦克风对，根据该麦克风对所对应的基于可控响应功率的区域类别划分信息，计算该麦克风对在所有候选区域的可控响应功率；将所有麦克风对在所有候选区域的可控响应功率进行叠加，得到所有候选区域的总可控响应功率；将所有候选区域的总可控响应功率进行比较，选择最大的总可控响应功率对应的候选区域作为目标候选区域。
[0093]
在一实施例中，所述最终定位模块708执行根据所述目标候选区域中的所有候选点对应的导向矢量，计算所有候选点的输出功率，将最大的输出功率对应的候选点作为声源的定位位置的步骤，包括：根据所述目标候选区域中的所有候选点对应的导向矢量和所
述麦克风阵列接收音频信号的协方差逆矩阵，利用mvdr算法计算所有候选点的输出功率；将所有候选点的输出功率进行比较，选择最大的输出功率对应的候选点作为声源的定位位置。
[0094]
关于本技术声源的定位装置70实现声源的定位方法的具体内容请参阅上述声源的定位方法实施例中的内容，此处不再赘述。
[0095]
请参阅图8，图8是本技术声源的定位设备一实施例的结构示意图。本实施例中的声源的定位设备80包括相互连接的麦克风阵列800、处理器802和存储器804；麦克风阵列800用于采集音频信号，存储器804用于存储程序指令，处理器802用于执行存储器804中存储的程序指令，以实现上述任一声源的定位方法实施例的步骤。在一个具体的实施场景中，声源的定位设备80可以包括但不限于：微型计算机、服务器。
[0096]
具体而言，处理器802用于控制其自身以及存储器804以实现上述任一声源的定位方法实施例的步骤。处理器802还可以称为cpu(central processing unit，中央处理单元)。处理器802可能是一种集成电路芯片，具有信号的处理能力。处理器802还可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field
‑
programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外，处理器802可以由集成电路芯片共同实现。
[0097]
上述方案，处理器802在利用麦克风阵列800接收音频信号并确定声源的所有候选点后，可以计算每个候选点对应的时延差矢量、采样点差矢量以及导向矢量，然后根据每个候选点对应的采样点差矢量，将所有候选点划分为若干个候选区域；对于所述麦克风阵列中的每个麦克风对，根据任意两个候选区域的可控响应功率之间的大小关系，对所有候选区域进行类别划分，得到每个麦克风对所对应的基于可控响应功率的区域类别划分信息；然后根据每个麦克风对所对应的基于可控响应功率的区域类别划分信息，计算所有候选区域的总可控响应功率，将最大的总可控响应功率对应的候选区域作为目标候选区域；之后可以根据所述目标候选区域中的所有候选点对应的导向矢量，计算所有候选点的输出功率，将最大的输出功率对应的候选点作为声源的定位位置。通过上述方式，先使用ssc方法将全局空间中所有候选点划分为不同的候选区域，接着根据每个麦克风对在候选区域中的可控响应功率大小关系得到区域类别划分信息，使用改进的srp
‑
phat方法计算不同候选区域的可控响应功率，搜索最大可控响应功率对应的候选区域，作为声源可能存在的目标候选区域，最后使用mvdr算法对目标候选区域进行细致搜索，从而可以高效地确定声源精确方位。
[0098]
请参阅图9，图9是本技术计算机可读存储介质一实施例的结构示意图。本技术计算机可读存储介质90，其上存储有程序指令900，程序指令900被处理器执行时实现上述任一声源的定位方法的实施例中的步骤。
[0099]
该计算机可读存储介质90具体可以为u盘、移动硬盘、只读存储器(rom，read
‑
only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等可以存储程序指令900的介质，或者也可以为存储有该程序指令900的服务器，该服务器可将存储的程序指令900发送给其他设备运行，或者也可以自运行该存储的程序指令900。
[0100]
在本技术所提供的几个实施例中，应该理解到，所揭露的方法、设备和装置，可以通过其它的方式实现。例如，以上所描述的设备和装置实施方式仅仅是示意性的，例如，模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
[0101]
作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
[0102]
另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0103]
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本技术各个实施方式方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read
‑
only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种针对权重平衡陶思沃斯码的混合数据转换跟踪方法与流程

声源的定位方法、装置、设备及计算机可读存储介质与流程

相关文献

最热文献