一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于S变换的未知声源个数DOA估计方法与流程

2022-02-20 14:20:51 来源:中国专利 TAG:

一种基于s变换的未知声源个数doa估计方法
技术领域
1.本发明明属于语音信号定位领域,特别是一种基于s变换的未知声源个数doa估计方法。


背景技术:

2.基于传感器阵列的波达方向(doa)估计一直是声纳、雷达、通信、语音处理等领域的研究热点,而现代化技术发展的需求使其不再能局限于传统窄带信号处理。语音信号作为一种宽带非平稳信号,传统窄带信号处理无法做到对声源位置的高精度定位。
3.宽带信号doa估计算法在原理上主要分为两类:非相干信号子空间方法与相干信号子空间方法。前者利用频率分解的思想,将宽带源信号分解为一系列窄带信号再进行doa估计。后者基于频率聚焦的原理,其中最为典型的为双边相关变换方法,将分解得到的信号通过聚焦矩阵变换到统一的参考频率点上,然后利用窄带的方式进行doa估计,这样的处理方法也使得相干信号子空间法需要预估信号源角度,而聚焦矩阵对预估角度的依赖使得最终doa估计结果产生偏差。
4.针对宽带非平稳信号,研究人员也尝试从时频域角度进行研究,充分利用宽带信号的时频信息来获得更准确的doa估计结果。常用的时频分析方法有短时傅里叶变换、s变换和小波变换,后两者由于窗函数可变,而能进行多分辨率分析。而s变换是介于短时傅里叶变换和小波变换的时频分析方法,它克服了短时傅里叶变换不能调节分析窗口频率的缺点,而且引入多分辨分析,具有小波变换的自适应时频窗和基本小波脱离了容许性条件的限制等优点。


技术实现要素:

5.本发明的目的在于解决上述现有技术问题,提供一种基于s变换的未知声源个数doa估计方法。
6.为实现上述目的,本发明的技术方案是:一种基于s变换的未知声源个数doa估计方法,包括如下步骤:
7.1)在声场中,布置一个均匀线性排布的麦克风阵列,使用数据采集器同步采集一段语音信号,获得阵列接收信号;
8.2)根据阵列接收信号的有效频段设置s变换参数后对信号做s变换,获得s变换结果;
9.3)根据步骤2)得到的s变换结果构建s变换下的时频阵列数据模型,得到时频域导向向量;
10.4)根据步骤3)得到的时频阵列数据模型对s变换结果做相关运算,得到阵列信号的自相关谱协方差矩阵;
11.5)根据步骤3)中的时频域导向向量与步骤4)获得的阵列信号的自相关谱协方差矩阵构建噪声条件下的目标波达方向估计;
12.6)求解步骤5)获得的目标波达方向估计最小化函数,获得空间谱估计结果;
13.7)设置搜索范围和搜索步进,通过谱搜索获得所有谱峰所在的位置,得到doa的最大估计值。
14.在本发明一实施例中,步骤2)中对阵列接收信号做s变换,获得s变换结果,s变换步骤为:
15.首先定义阵列中第m个阵元的接收信号为:
[0016][0017]
p为信号源个数,s
p
(t)为p个宽带信号源的入射信号,τ
mp
是第p个信号到达第m个阵元产生的时延,nm(t)是第m个阵元的加性高斯白噪声;
[0018]
对信号xm(t)做s变换,变换结果stm可表示为:
[0019][0020]
τ为时间因子,fi(i=1,2,

,i)为频率分量,将上式写成傅里叶频谱形式为:
[0021][0022]
为信号分量,为噪声分量。
[0023]
在本发明一实施例中,步骤3)中构建s变换下的时频阵列数据模型,得到时频域导向向量的计算步骤为:
[0024]
假设s变换频窗中心频率和频宽满足窄带信号条件,m个阵元接收信号的时频阵列信号模型表示为:
[0025][0026]
为信号s
p
(t),p=1,2,

,p的s变换结果向量;
[0027]
为噪声向量;
[0028]
h(θ,fi)=[h(θ1,fi),h(θ2,fi),

,h(θ
p
,fi)]为m
×
p维阵列方向矩阵;
[0029]
阵列模型数据的导向矢量表示为:
[0030]
h(θ
p
,fi)=[1,exp(-j2πfiτ
1p
),

,exp(-j2πfiτ
(m-1)p
)]
t

[0031]
在本发明一实施例中,步骤4)中对s变换结果做相关运算,得到阵列信号的自相关谱协方差矩阵计算步骤为:
[0032]
根据经典多重信号分类算法原理,计算st(τ,fi)的协方差矩阵为:
[0033]ry
=e{st(τ,fi)
·
sth(τ,fi)}=h(θ,fi)r
x
(τ,fi)hh(θ,fi) σ
i2i[0034]rx
(τ,fi)为的协方差矩阵,为变换后的噪声方差,σi为矩阵奇异值;
[0035]
由于实际情况下接收数据是有限长的,则数据协方差矩阵的最大似然估计表示为:
[0036][0037]
在本发明一实施例中,步骤5)中根据时频域导向向量与阵列信号的自相关谱协方差矩阵构建噪声条件下的目标波达方向估计,步骤为:
[0038]
对于第n(n=1,2,,p)个信号源,定义矢量bn(f)满足
[0039][0040]
不考虑噪声项,存在:
[0041][0042]
其中
[0043]
在噪声条件下,目标波达方向估计即最小化函数表示为
[0044][0045]
其中d(f)需满足
[0046]
在本发明一实施例中,步骤6)中求解目标波达方向估计最小化函数,获得空间谱估计结果为:
[0047]
s变换取为时间连续段处理结果,将基于s变换的数据协方差结果代入,谱估计公式为:
[0048][0049]
相较于现有技术,本发明具有以下有益效果:
[0050]
本发明首先对语音信号做s变换获得多分辨的时频谱矩阵,从而建立一种与传统阵列模型形式具有一致性的时频域阵列信号模型,它克服了短时傅里叶变换不能调节分析窗口频率的缺点,而且引入多分辨分析,具有小波变换的自适应时频窗又脱离了小波变换容许性条件的限制等优点;然后根据频率段不同时刻的功率谱矩阵呈联合对角化结构特点,将模型应用于传统方法得到一种新的空间谱,该空间谱基于s变换结果,克服了传统music需要预设信号源个数的问题。
[0051]
本发明针对doa估计方法中计算复杂度高、计算量大、需要预估信号源个数等问题,提出了一种基于s变换的未知声源个数doa估计方法。首先对语音信号做s变换,建立一种与传统阵列模型形式具有一致性的时频域阵列信号模型,它引入多分辨分析,具有小波变换的自适应时频窗又脱离了小波变换容许性条件的限制等优点;然后根据频率段不同时刻的功率谱矩阵呈联合对角化结构特点,将模型应用于传统方法得到一种新的空间谱,该空间谱基于s变换结果,克服了传统music需要预设信号源个数的问题。该方法能提高doa估计分辨率,并且具有较好的估计精度,在语音信号声源定位的实际处理中有较强的实用性。
附图说明
[0052]
图1为本发明图1是本发明的定位方法的程序设计流程图。
[0053]
图2是本发明实例中的一维宽带信号doa估计定位结果。
[0054]
图3是本发明实例中的二维语音信号doa估计定位结果。
具体实施方式
[0055]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。如图1所示,本发明提供一种基于s变换的未知声源个数doa估计方法,包括以下步骤:
[0056]
1)在声场中,布置一个均匀线性排布的麦克风阵列,使用数据采集器同步采集一段语音信号,获得阵列接收信号;
[0057]
2)根据接收信号的有效频段设置s变换参数后对信号做s变换,获得s变换结果;具体步骤如下:
[0058]
首先定义阵列中第m个阵元的接收信号为:
[0059][0060]
p为信号源个数,s
p
(t)为p个宽带信号源的入射信号,τ
mp
是第p个信号到达第m个阵元产生的时延,nm(t)是第m个阵元的加性高斯白噪声;
[0061]
对信号xm(t)做s变换,变换结果stm可表示为:
[0062][0063]
τ为时间因子,fi(i=1,2,

,i)为频率分量,将上式写成傅里叶频谱形式为:
[0064][0065]
为信号分量,为噪声分量;
[0066]
3)根据步骤2)得到的s变换结果构建s变换下的时频阵列数据模型,得到时频域导向向量;
[0067]
假设s变换频窗中心频率和频宽满足窄带信号条件,m个阵元接收信号的时频阵列信号模型表示为:
[0068][0069]
为信号s
p
(t),p=1,2,

,p的s变换结果向量;
[0070]
为噪声向量;
[0071]
h(θ,fi)=[h(θ1,fi),h(θ2,fi),

,h(θ
p
,fi)]为m
×
p维阵列方向矩阵;
[0072]
阵列模型数据的导向矢量表示为:
[0073]
h(θ
p
,fi)=[1,exp(-j2πfiτ
1p
),

,exp(-j2πfiτ
(m-1)p
)]
t
[0074]
4)对s变换结果计算得到阵列信号的自相关谱协方差矩阵;
[0075]
根据经典多重信号分类算法原理,计算st(τ,fi)的协方差矩阵为:
[0076]ry
=e{st(τ,fi)
·
sth(τ,fi)}=h(θ,fi)r
x
(τ,fi)hh(θ,fi) σ
i2i[0077]rx
(τ,fi)为的协方差矩阵,为变换后的噪声方差,σi为矩阵奇异值;
[0078]
由于实际情况下接收数据是有限长的,则数据协方差矩阵的最大似然估计表示为:
[0079][0080]
5)构建噪声条件下的目标波达方向估计;
[0081]
对于第n(n=1,2,,p)个信号源,定义矢量bn(f)满足
[0082][0083]
不考虑噪声项,存在:
[0084][0085]
其中
[0086]
在噪声条件下,目标波达方向估计即最小化函数表示为
[0087][0088]
其中d(f)需满足
[0089]
6)求解目标波达方向估计最小化函数,获得空间谱估计结果;
[0090]
s变换取为时间连续段处理结果,将基于s变换的数据协方差结果代入,谱估计公式为:
[0091][0092]
7)设置搜索范围和搜索步进,通过谱搜索获得所有谱峰所在的位置,得到doa的最大估计值。
[0093]
在本实施例中,构建如下实验条件:采用16元均匀线性阵列,构建信噪比为0db、频率范围为165hz到300hz的两不相干线性调频信号,设置信号入射角度分别为-20
°
和20
°
,采样频率为4khz,信号总长度为1024个数据点。
[0094]
如图2所示,在双峰值处可获得精确的doa估计结果。
[0095]
同等条件下,采用真实语音信号进行二维声源定位验证,不考虑混响情况,设置两个语音声源的方位角和俯仰角分别为40
°
和40
°
、40
°
和-20
°

[0096]
由图3可知,该方法在二维定位中也能得到准确的定位结果。
[0097]
以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在
阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献