一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种双迭代非正交联合块对角化卷积盲源分离方法与流程

2021-11-03 14:33:00 来源:中国专利 TAG:


1.本发明属于信号处理技术领域,具体涉及一种双迭代非正交联合块对角化卷积盲源分离方法,用于混叠方式为卷积混叠时的盲源信号分离,可应用于雷达信号处理、语音信号处理、生物医学信号处理、无线通信处理等领域。


背景技术:

2.在无线电通信、医学成像等众多领域都要通过接收到的观测信号来分析源信号的各种性能特征,如何在混叠系统中分离或者说恢复出未知的源信号已逐渐成为信号处理技术领域的研究热点,比如在对雷达信号进行处理时,并不知道发射信号与传输信道,但希望利用接收天线接收到的观测数据信号来提取出原发射信号,采用盲信号处理技术可以最大程度地解决源信号的提取问题。盲源分离是盲信号处理的一个应用方面,具体是指在未知源信号和传输信道参数的情况下,根据输入源信号的统计特性,仅利用观测信号就能分离出各个统计独立的源信号的过程。
3.盲源分离问题通常使用多输入多输出系统来建立数学模型,其早期研究主要集中于瞬时混叠的情景,瞬时混叠的数学模型相对来说比较简单。但是在信号传播过程存在多径、时延等情况下,卷积混叠模型与该情况更加匹配。卷积混叠盲源分离算法应用非常广泛,存在混响的音视频会议室,存在多径反射的低仰角相控阵雷达站等都有卷积混叠盲源分离算法的“身影”。近年来,麦克风阵列在智能人机交互领域发挥出越来越重要的作用,成为了信号处理领域的研究热点之一。该技术的典型应用场景有音视频会议系统、人工智能音箱以及车载人机交互系统等等。语音增强技术研究早期,一般采用单麦克风传感器接收信号进行语音增强。为提高信号增益和空间分辨率,目前语音增强技术研究已由单通道转变为多通道语音增强技术。相比于单麦克风,麦克风阵列具备一定的空间分辨能力及丰富的谱信息,其性能得到了显著提升。
4.这类问题通常建模为有限阶冲激响应滤波器,通过估计滤波器系数实现卷积混叠盲源分离。目前卷积混叠盲源分离算法多为频域算法,主要是利用卷积混叠变换为瞬时混叠的思想。通过短时傅里叶变换将时域卷积混叠分解为子频带上的瞬时混叠,再利用瞬时混叠盲源分离算法进行源信号的分离。然而,这种方法存在严重的排列模糊问题,且运算复杂,时间复杂度高。


技术实现要素:

5.为了解决现有技术中存在的上述问题,本发明提供了一种双迭代非正交联合块对角化卷积盲源分离方法。本发明要解决的技术问题通过以下技术方案实现:
6.本发明的一个方面提供了一种双迭代非正交联合块对角化卷积盲源分离方法,包括:
7.s1:从m个传感器接收并记录源信号的观测信号:
8.x(t)=[x1(t),x2(t),

,x
m
(t)],
[0009]
其中,t是时间序列,第m个传感器接收的观测信号取窗长为q 1的滑窗窗口,窗口内的采样点数据构成列矢量:
[0010]
x
m
(t)=[x
m
(t),x
m
(t

1),

,x
m
(t

q)],m=1,2,

,m,
[0011]
其中,q表示窗口长度;
[0012]
s2:获得观测信号x(t)在指定时延τ
l
下的二阶时延相关矩阵组:
[0013][0014]
其中,l=1,2,

,l,l为指定时延的总个数,[]
h
表示共轭转置,e{*}表示取期望,表示延时重组后源信号的二阶τ
l
延时相关矩阵,r
nn

l
)表示噪声信号n(t)的二阶τ
l
延时相关矩阵,是p阶fir滤波器的系数矩阵组,其维度为m*np;
[0015]
s3:根据所述二阶时延相关矩阵组构造卷积对称拟合代价函数;
[0016]
s4:利用双迭代算法求解所述卷积对称拟合代价函数,获得源信号的估计值。
[0017]
在本发明的一个实施例中,所述s2包括:
[0018]
s21:利用p阶fir滤波器组成的卷积混叠模型描述观测信号:
[0019][0020]
其中,s(t)=[s1(t),s2(t),

,s
n
(t)]
t
为n维源信号加窗矢量,p为滤波器阶数,s
n
(t)=[s1(t),s2(t

1),

,s
n
(t

q)]为第n个源信号加窗矢量,n(t)为加性噪声矢量,a(p)为p阶fir滤波器的参数,是维数为m*n的矩阵,由a
mn
(p)组成,a
mn
(p)为矩阵a(p)中的元素;
[0021]
s22:将所述卷积混叠模型表示为:
[0022][0023]
其中,为p阶fir滤波器的系数矩阵组,维度为m*np,为源信号s(t)的滑窗延时重组信号,n(t)为均值为零、方差为δ2的加性白噪声矢量;
[0024]
s23:获得观测信号x(t)的二阶τ
l
延时相关矩阵:
[0025][0026]
其中,l=1,2,

,l,l为时延的总个数,[]
h
表示共轭转置,e{*}表示取期望,表示延时重组后源信号的二阶τ
l
延时相关矩阵,r
nn

l
)表示噪声信号n(t)的二阶τ
l
延时相关矩阵。
[0027]
在本发明的一个实施例中,所述s3包括:
[0028]
s31:利用广义置换矩阵将观测信号做变换,获得等效模型:
[0029]
[0030][0031]
其中,
[0032]
s32:利用所述等效模型,获得τ
l
时延下的二阶相关矩阵:
[0033][0034]
其中,表示进行广义置换后的源信号的二阶τ
l
延时相关矩阵;
[0035]
s33:将步骤s32所述的二阶相关矩阵简化为对角矩阵形式:
[0036][0037]
其中,为块间toeplitz矩阵,λ(l)为块内对角化矩阵:
[0038]
其中,λ
l,n
为τ
l
延时情况下,广义置换后的第n通道源信号的自相关系数;
[0039]
s34:令构造卷积对称拟合代价函数j
csff

[0040][0041]
其中,h=[h1,h2,

,h
np
],
[0042]
在本发明的一个实施例中,所述s4包括:
[0043]
s41:利用所述卷积对称拟合代价函数估计所述块内对角化矩阵;
[0044]
s42:利用所述卷积对称拟合代价函数估计混叠矩阵;
[0045]
s43:根据所述混叠矩阵得到源信号的估计值。
[0046]
在本发明的一个实施例中,所述s41包括:
[0047]
利用所述卷积对称拟合代价函数j
csff
对求导:
[0048][0049]
其中,c1为λ
τ,n
所在中的位置坐标的集合;为遍历c1中每一个坐标,取出行坐标作为取出列坐标作为
[0050]
令共轭导数为零,则存在:
[0051]
[0052]
其中,c1为λ
τ,n
所在中的位置坐标的集合;为遍历c1中每一个坐标,取出行坐标作为取出列坐标作为c2为中每一个λ的位置坐标的集合;为遍历c2中每一个坐标,取出行坐标作为m,取出列坐标作为mod(m,n)为m对n取余的余数;
[0053]
获得所述块内对角化矩阵λ(l):
[0054][0055]
其中,
[0056]
在本发明的一个实施例中,所述s42包括:
[0057]
将所述卷积对称拟合代价函数j
csff
展开为:
[0058][0059]
求解函数j
csff
关于混叠矩阵h的共轭导数并令导数为零,得到混叠矩阵h的迭代式:
[0060][0061]
交换矩阵h和的位置,得到混叠矩阵的迭代式:
[0062][0063]
在本发明的一个实施例中,所述s43包括:
[0064]
利用s41中求得的块内对角化矩阵计算混叠矩阵h和通过求解混叠矩阵h的广义逆矩阵,利用所述广义逆矩阵与滑窗重排的观测信号做乘积运算,得到源信号的估计值。
[0065]
本发明的另一方面提供了一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序用于执行上述实施例中任一项所述双迭代非正交联合块对角化卷积盲源分离方法的步骤。
[0066]
本发明的又一方面提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上述实施例中任一项所述双迭代非正交联合块对角化卷积盲源分离方法的步骤。
[0067]
与现有技术相比,本发明的有益效果在于:
[0068]
1、本发明的双迭代非正交联合块对角化卷积盲源分离方法直接在时域内迭代求
解混叠矩阵和对角矩阵组,避免了频域算法存在比较严重的排列不定性问题,避免陷入局部最优解,能够有效提高语音分离后语音识别精准率。同时推导双迭代算法,用于卷积对称拟合代价函数的优化求解,双迭代算法在优化过程中更容易收敛到全局最优点,且所需要的迭代收敛步骤更少。
[0069]
2、该双迭代非正交联合块对角化卷积盲源分离方法收敛稳定且能做到快速收敛,同时算法的时间复杂度较低,表现出良好的性能。
[0070]
以下将结合附图及实施例对本发明做进一步详细说明。
附图说明
[0071]
图1是本发明实施例提供的一种双迭代非正交联合块对角化卷积盲源分离方法的流程图;
[0072]
图2是本发明实施例提供的一种卷积混叠盲源分离的信号混叠和分离模型;
[0073]
图3是50次独立实验后,本发明实施例的方法与现有zjbd、tia

jbd方法的grl数值分布图;
[0074]
图4是100次独立实验后,本发明实施例的方法与现有zjbd、tia

jbd方法迭代次数随ner的变化曲线图;
[0075]
图5是100次独立实验后,本发明实施例的方法与现有zjbd、tia

jbd方法grl随ner的变化曲线图;
[0076]
图6是采集的源声音信号的波形图;
[0077]
图7是源信号经过卷积混叠后得到的6路观测信号波形图;
[0078]
图8是利用本发明实施例的方法处理后得到的分离信号波形图。
具体实施方式
[0079]
为了进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及具体实施方式,对依据本发明提出的双迭代非正交联合块对角化卷积盲源分离方法进行详细说明。
[0080]
有关本发明的前述及其他技术内容、特点及功效,在以下配合附图的具体实施方式详细说明中即可清楚地呈现。通过具体实施方式的说明,可对本发明为达成预定目的所采取的技术手段及功效进行更加深入且具体地了解,然而所附附图仅是提供参考与说明之用,并非用来对本发明的技术方案加以限制。
[0081]
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。
[0082]
请参照图1,图1是本发明实施例提供的一种双迭代非正交联合块对角化卷积盲源分离方法的流程图。所述方法包括:
[0083]
s1:从m个传感器接收并记录源信号的观测信号。
[0084]
具体地,在实际的声学房间环境中,由于反射、混响的原因,声音源信号以不同的时间延迟被传感器阵列接收,得到观测信号,这种情景被称为多径或混响问题。需要说明的是,因为语音信号是宽带信号且是非平稳的,一般假设语音信号满足短时平稳特性。因此,对于语音信号,通常采用加窗的形式进行处理。对m个传感器组成的传感器阵列中第m个传感器接收的观测信号取窗长为q 1的滑窗窗口,窗口内的采样点数据构成列矢量:
[0085]
x
m
(t)=[x
m
(t),x
m
(t

1),

,x
m
(t

q)],m=1,2,

,m
ꢀꢀꢀ
(1)
[0086]
将各传感器观测的信号数据排列在一起,定义观测信号:
[0087]
x(t)=[x1(t),x2(t),

,x
m
(t)]
ꢀꢀꢀ
(2)
[0088]
s2:获得观测信号x(t)在指定时延τ
l
下的二阶时延相关矩阵组。
[0089]
具体地,请参见图2,图2是本发明实施例提供的一种卷积混叠盲源分离的信号混叠和分离模型。如图2所示,观测信号x(t)可以用p阶fir(finite impulse response,有限长单位冲激响应)滤波器组成的卷积混叠模型来描述:
[0090][0091]
其中,t是时间序列;s(t)=[s1(t),s2(t),

,s
n
(t)]
t
是n维源信号加窗矢量,s
n
(t)=[s1(t),s2(t

1),

,s
n
(t

q)]为第n个源信号加窗矢量;n(t)为加性噪声矢量;a(p)为p阶fir滤波器的参数,是维数为m*n的矩阵,由a
mn
(p)组成,a
mn
(p)为矩阵a(p)中的元素。
[0092]
式(3)也可表示为:
[0093][0094]
其中,为p阶fir滤波器的系数矩阵组,维度为m*np,为源信号s(t)的滑窗延时重组信号,n(t)为均值为零、方差为δ2的加性白噪声矢量。
[0095]
需要说明的是,这里对源信号和混叠矩阵作如下假设:
[0096]
(1)源信号s(t)中各个分量信号之间互不相关;
[0097]
(2)源信号s(t)中各个分量信号为零均值的平稳信号;
[0098]
(3)噪声信号为零均值、具有相同方差的白信号;
[0099]
(4)混叠矩阵a为非奇异或者列满秩的。
[0100]
随后,观测信号x(t)的二阶τ
l
延时相关矩阵可以用下式描述:
[0101][0102]
其中,l=1,2,

,l,l为时延的总个数,[]
h
表示共轭转置,e{*}表示取期望,表示延时重组后源信号的二阶τ
l
延时相关矩阵,r
nn

l
)表示噪声信号n(t)的二阶τ
l
延时相关矩阵。
[0103]
内部可以展开为:
[0104][0105]
其中,r
s

l
)表示真实源信号s(t)的二阶τ
l
延时相关矩阵。
[0106]
进一步地,构造矩阵r(τ
l
)=r
xx

l
)

r
nn

l
),显然,矩阵组具有如下的可联合块对角化结构:
[0107][0108]
可以看出,该联合块对角化结构式为块间toeplitz化,块内对角化结构。在实际应用中,需要采用滑窗方式构造观测信号的相关矩阵,因此矩阵组不可避免的存在一定的估计误差。一般地,当选取参数恰当时,该误差可忽略不计。
[0109]
s3:根据所述二阶时延相关矩阵组构造卷积对称拟合代价函数。
[0110]
如果直接优化求解式(7):其代价函数为:
[0111][0112]
显然,该代价函数是关于的四次函数。实验证明,对于四次函数的优化容易陷入周期解,即不能稳定收敛至全局最优解,随着迭代次数波动的解。通常情况下,周期解不为全局最优解。因此,本实施例通过广义置换矩阵变换方法将代价函数变换为三个待估计量二次函数的形式,具体如下。
[0113]
根据盲源分离问题存在的排列不定性和尺度不定性,利用广义置换矩阵将观测信号做变换,经过广义置换矩阵变换后对可联合块对角化结构不会产生影响,此时的矩阵的尺寸与卷积混叠矩阵的尺寸相匹配。同样地,在不考虑加性噪声情况下,取观测信号x(t)=[x1(t),x2(t),

,x
m
(t)]
t
,并将其转换为如下的等效模型:
[0114][0115][0116]
其中,根据式(9)和式(10),给
出τ
l
时延下的二阶相关矩阵:
[0117][0118]
其中,表示进行广义置换后的源信号的二阶τ
l
延时相关矩阵。
[0119]
接着,将式(11)中的二阶相关矩阵简化为对角矩阵形式:
[0120][0121]
其中,为块间toeplitz矩阵,λ(l)为块内对角化矩阵。
[0122]
将式(12)具备的可联合块对角化结构,令构造为如下的卷积对称拟合代价函数:
[0123][0124]
其中,h=[h1,h2,

,h
np
];
[0125][0126]
其中,块内对角化矩阵λ(l)可表示为:
[0127][0128]
λ
l,n
为τ
l
延时情况下,广义置换后的第n通道源信号的自相关系数。
[0129]
显然,该卷积对称拟合代价函数j
csff
不要求目标矩阵为对称矩阵,不要求混叠矩阵为酉正交矩阵。可以通过对混叠矩阵的每一列矢量做归一化约束,来减少算法因混叠矩阵列矢量忽大忽小而出现发散不收敛的情况。由于因此该卷积对称拟合代价函数j
csff
是两因子h和的二次函数。
[0130]
s4:利用双迭代算法求解所述卷积对称拟合代价函数,获得源信号的估计值。
[0131]
本发明实施例提出的方法的主要思路是根据所述卷积对称拟合代价函数,利用基本的梯度下降原理对j
csff
进行搜索最小点。通过交替迭代左右混叠矩阵η、以及对角化矩阵组实现盲源分离参数的估计。
[0132]
具体地,所述s4包括:
[0133]
s41:利用所述卷积对称拟合代价函数估计所述块内对角化矩阵。
[0134]
卷积对称拟合代价函数j
csff
的每个子函数不仅是λ(l)的函数,还是λ(l
p),p=

l 1,

l 2,

,l

1的函数,因此j
csff
关于对角矩阵组λ(l)的最小值需要联合求解。因此代价函数j
csff
直接对求导公式为:
[0135][0136]
显然,当矩阵时有:
[0137][0138]
其中,表示求f范数的平方和。
[0139]
因此,
[0140][0141]
其中,tr(*)表示求*矩阵的迹,h
n
表示h矩阵的第n行向量,表示h矩阵的第行向量,c1为λ
τ,n
所在中的位置坐标的集合;为遍历c1中每一个坐标,取出行坐标作为n,取出列坐标作为
[0142]
令共轭导数为零,则有:
[0143]
[0144]
其中,c2为中每一个λ的位置坐标的集合;为遍历c2中每一个坐标,取出行坐标作为m,取出列坐标作为mod(m,n)为m对n取余的余数。h
m
表示h矩阵的第m行向量,表示h矩阵的第行向量。
[0145]
则整理式(19)可得:
[0146][0147]
其中,
[0148][0149][0150]
显然,对角矩阵λ(l)可整理为下式:
[0151][0152]
s42:利用所述卷积对称拟合代价函数估计混叠矩阵。
[0153]
将所述卷积对称拟合代价函数j
csff
展开为:
[0154][0155]
求解函数j
csff
关于矩阵h的共轭导数并令导数为零,得到混叠矩阵h的迭代式:
[0156][0157]
接着,考虑函数j
csff
的对称性,直接交换矩阵h和的位置,便得到混叠矩阵的迭代式:
[0158][0159]
s43:根据所述混叠矩阵得到源信号的估计值。
[0160]
具体地,利用s41中求得的块内对角化矩阵计算混叠矩阵h和通过求解混叠矩阵h的广义逆矩阵,利用所述广义逆矩阵与滑窗重排的观测信号做乘积运算,得到源信号的估计值。
[0161]
接着,进行了时间复杂度分析,时间复杂度往往决定了该方法的应用与推广能力。低时间复杂度方法对硬件性能依赖更低,具备易部署、低成本的特点。在此详细分析了本发明实施例所提双迭代非正交联合块对角化卷积盲源分离方法的时间复杂度,为运算效率这
一重要指标提供理论支持。本发明实施例所提方法复杂度分析如表1所示:
[0162]
表1.本发明方法的时间复杂度分析
[0163][0164]
其中,n为源信号数目;p为阶fir滤波器的阶数,即卷积混叠的阶数,一般情况下p数值较小。l为相关矩阵的个数。舍去时间复杂度低阶项,本发明实施例的方法每次迭代过程的时间复杂度为o(ln3p3)。表2对比了本发明方法和常见基于非正交联合块对角化的卷积盲源分离方法的计算复杂度。
[0165]
表2.本发明方法和现有非正交联合块对角化卷积盲源分离方法的计算复杂度比较
[0166][0167]
jajbd(jacobi

based joint block

diagonalization algorithm):基于jacobi旋转的联合块对角化算法;
[0168]
zjbd(non

orthogonal joint block

diagonalization algorithm):非正交的联合块对角化算法;
[0169]
qjbd(quadratic joint block

diagonalization algorithm):二次优化的联合块对角化算法;
[0170]
tia

jbd(tri

iterativejoint block

diagonalization algorithm):三迭代联合块对角化算法
[0171]
通过对比可以看出,本发明方法的复杂度为o(ln3p3),远小于zjbd和qjbd。因为jajbd的时间复杂度系数较大,因此tia

nojbd和本发明方法的时间复杂度要小于jajbd。而tia

nojbd和本发明方法时间复杂度基本一致。因此,本发明方法在非正交联合对角化卷积盲源分离方法中时间复杂度较低,实时性更好。
[0172]
接着,通过以下性能指标,对本发明实施例的双迭代非正交联合块对角化卷积盲
源分离方法的性能进行进一步分析。
[0173]
(1)噪声扰动(noise expectation ratio,ner):定义对角化矩阵组和误差矩阵的f

范数的平方比为ner,描述为下式:
[0174][0175]
其中,δr(l)为扰动误差矩阵项。可以看出,ner指标可以衡量加入目标矩阵组的干扰的大小。ner越小,说明加入的扰动越多;反之,说明加入的扰动更少。
[0176]
(2)迭代次数:迭代过程中,如果grl(全局拒噪水平)变化微小或者不变化时,视为优化过程已完成。实验中采用两次迭代的grl之差小于0.0001来判断优化完成,然后停止优化并记录此刻迭代次数。因此,迭代次数反映了该方法优化过程所需的收敛时间,可以用来衡量方法的时间复杂度。
[0177]
(3)全局拒噪水平(global rejection level,grl):定义矩阵为全局传输矩阵,则grl可表示为:
[0178][0179]
显然,当全局传输矩阵为广义置换矩阵时,grl=0。因此,不考虑尺度不确定性和排列不确定性问题下,当grl趋于0时,混叠矩阵的估计值h越接近于真实的混叠矩阵。grl衡量混叠矩阵估计值h与真实的混叠矩阵的相似度。grl越小,说明混叠矩阵越接近真实值,方法收敛性能越好;反之,说明方法收敛性能较差。
[0180]
实验一:设置ner=10db,产生扰动矩阵组r(l)=hλ(l)h
h
δr(l),l=1,2,

,l。然后进行50次独立实验,分别记录zjbd、tia

jbd以及本文提出方法(记为dbia

jbd)的三种方法实验中的grl值,根据grl值分布分析方法的稳定收敛特性。请参见图3,图3是50次独立实验后,本发明实施例的方法与现有zjbd、tia

jbd方法的grl数值分布图。可以看出,zjbd方法在ner=10db的情况下收敛效果不是很理想,约20次独立实验优化过程没有收敛,导致数值很高。而对比tia

jbd和本发明方法可以发现,两者的稳定收敛性能差异不大,均达到了稳定收敛的效果
[0181]
实验二:对比zjbd、tia

jbd以及本发明方法(记为dbia

jbd)三种方法的盲源分离性能。通过变化ner来改变扰动矩阵组中扰动项的大小进行两组不同的试验:(1)对比zjbd、tia

jbd以及本发明方法三种方法,100次独立实验后,迭代次数随ner变化曲线;(2)对比zjbd、tia

jbd以及本发明方法三种方法,100次独立实验后,grl随ner变化曲线。分析对比三种方法的收敛速度及盲源分离性能。从图4何图5中可以看出,zjbd方法迭代次数在低扰动情况下表现明显好于高扰动情景,其grl值随ner的增大而减小,但是整体上grl值处于较高水平。tia

jbd和本发明方法相比较:在高ner,即低扰动情况下,tia

jbd的迭代次数与本发明方法差异较小,但是其grl值比本发明方法更低,表现更优秀。反之,在低ner,即高扰动情况下,不管是在迭代次数指标上还是grl指标上,本发明方法均占据优势,表现出色。实验
验证了在高扰动的情况下,本发明的方法保证快速收敛的同时,盲源分离性能有一定的提升。
[0182]
实验三:采集三段语音信号,设置p=5,产生一个卷积混叠矩阵。然后让语音信号经过卷积混叠矩阵后,由6个麦克风传感器接收,得到观测信号。这里我们取l=26,即26个目标矩阵进行本次实验。考虑加性噪声的影响,在观测信号中添加加性噪声。通过仿真实验验证方法在语音分离任务上的有效性。请参见图6和图8,图6是采集的源声音信号的波形图;图7是源信号经过卷积混叠后得到的6路观测信号波形图;图8是利用本发明实施例的方法处理后得到的分离信号波形图。从图中可以直观的看出,本发明提出的方法可以有效的进行卷积混叠语音信号的盲分离。如果使用音频播放设备将分离后的语音播放出来,利用同一个语音识别系统进行语音转文字。实验显示,在语音识别系统中,分离后的语音识别率大大改善。相比于语音分离前,语音分离后语音识别精准率指标提高了63%的性能。
[0183]
本发明的双迭代非正交联合块对角化卷积盲源分离方法直接在时域内迭代求解混叠矩阵和对角矩阵组,避免了频域算法存在比较严重的排列不定性问题,避免陷入局部最优解,能够有效提高语音分离后语音识别精准率。同时推导双迭代算法,用于卷积对称拟合代价函数的优化求解,双迭代算法在优化过程中更容易收敛到全局最优点,且所需要的迭代收敛步骤更少。另外,该双迭代非正交联合块对角化卷积盲源分离方法收敛稳定且能做到快速收敛,同时算法的时间复杂度较低,表现出良好的性能。
[0184]
本发明的又一实施例提供了一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序用于执行上述实施例中所述双迭代非正交联合块对角化卷积盲源分离方法的步骤。本发明的再一方面提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上述实施例所述双迭代非正交联合块对角化卷积盲源分离方法的步骤。具体地,上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read

only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0185]
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献