一种语音分离方法与流程

2021-10-09 14:51:00 来源：中国专利 TAG：语音分离方法

1.本发明属于语音处理领域，具体涉及一种分离语音的方法。

背景技术：

2.在噪声环境下语音的提取，以及在多声源的及环境下的语音提取是一项关键技术。在使用多麦克风的场景下，独立分量分析(ica)是一项成熟的方法。美国专利no.5706402中最早讨论了ica。假设各路麦克风信号是多路独立语音信号的混合，独立分量分析迭代去混(un
‑
mixing)矩阵,去混矩阵乘以混合信号，从而产生分离的信号。独立分量分析迭代的目标是这些信号的相关熵最大，从而将信息冗余度最小化。ica不需要各信号源的信息，也是盲源分离法(bss)的一种。
3.但是ica算法不能完全分离麦克风所记录的信号。ica算法的每一路输出信号即包括期望目标对象的信号外也包括较小幅度的其它路的非期望语音的信号能量。由于人的听力系统是极高灵敏度的系统，非期望语音的信号能量即使被大幅度抑制，其依然可以被人清晰可听见。ica的输出信号进行降噪等后处理后，可以进一步减少非期望语音的信号能量，但是这通常带来期望信号的损伤。
4.专利号为200380109681.5的发明专利公开了一种用于将音频信号的混合物分离成期望音频信号和噪音信号的系统和方法。该方法设置麦克风使其接收混合音频信号，并且独立分量分析ica使用稳定性约束，处理声音混合物。ica过程使用期望语音信号的预定特征，识别和分离目标声音信号。用学习规则来使滤波器系数适应，并稳定滤波器权重更新动态，从而协助收敛到稳定的分离ica信号结果。使用后处理和预处理技术和信息，对分离的信号进行辅助处理，以进一步降低噪音影响。
5.专利号为201110117022.2的发明专利公开了一种卷积语音信号的频域盲分离排序算法。对于卷积混叠语音信号，首先由时序转换到频域，在每个频带上使用频域ica算法进行盲分离，然后通过排序算法进行排序。排序方法是：首先选取基准频带进行对准，然后根据已经排序好的基准频带对剩余频带进行排序，标记可能出现排序错误的频带，利用基于分离矩阵的doa估计进行补充性对准。
6.专利号为201610866508.9的发明专利公开了一种盲音分离方法、结构及语音控制系统和电器总成。该方法对实际工作环境，做出线性瞬间系统假设，针对线性瞬时混合系统，提出基于ica的盲源分离技术，达到语音信号降噪的效果。盲音分离方法包括：对检测的语音信号进行降噪预处理，语音信号为同时间多个信号源语音信息的线性叠加信号；以非高斯度量，对预处理后的语音信号构建目标函数；通过迭代算法估计所述目标函数期望最大的分离矩阵。

技术实现要素：

7.本发明的目的就是针对现有盲源分离法的特点，提供一种具有更高性能的语音分离方法，减少不期望信号的残留。
8.本发明方法首先将n个通道的语音信号通过盲源分离模块处理后，得到n路分离后的语音信号，分离后的语音信号包含其它通道残留的语音信号，n≥2；然后通过残留选择模块处理后，得到n路残留输出信号；残留输出信号通过残留抑制模块滤波处理得到期望残留信号，盲源分离模块输出的包含其它通道残留的语音信号与期望残留信号相减作为残差信号，第n路残差信号即为最终的第n路输出语音信号，n＝1,2,
…
,n
′
，1≤n
′
≤n。
9.n个通道的语音信号输入盲源分离模块，盲源分离模块输出n路语音输出信号，n为大于1的自然数；盲源分离模块采用包括ica在内的盲源分离算法，对n路输入语音信号进行分离，输出n路包含其它通道信号残留的语音信号。
10.残留选择模块内包含n
′
路选择处理通道，第n路选择处理通道将盲源分离模块输出的n路全部分离后的语音信号作为输入，并以第n路分离后的语音信号作为主信号，第n路选择处理通道计算每一时刻主信号是目标语音信号的概率：概率大于等于设定阈值时，该时刻输出幅度为0的语音信号；概率小于设定阈值时，输出当前时刻的主信号，作为残留选择模块的第n路残留输出信号；n
′
路选择处理通道输出n
′
路残留输出信号；计算目标语音的概率采用相位比较或信号幅度比较方法。
11.残留抑制模块内包含n
′
路抑制处理通道，第n路抑制处理通道将盲源分离模块输出的第n路语音输出信号和残留选择模块输出的第n路残留输出信号作为输入，进行残留抑制，输出语音信号作为最终第n路输出语音信号。
12.残留抑制模块内的第n路抑制处理通道包括一个自适应滤波器，自适应滤波器对输入的对应的残留输出信号进行滤波，得到期望残留信号；盲源分离模块第n路语音输出信号与期望残留信号相减作为残差信号，自适应滤波器利用残差信号，采用迭代算法更新滤波器系数；当残留抑制模块接收的残留输出信号为0时，自适应滤波器不更新滤波器系数。第n路残差信号即为最终的第n路输出语音信号。
13.现有后处理算法关注减少盲源分离算法的残留的噪声信号，对于盲源分离算法的残留的其他通道的人声残留不做处理。本方法通过自适应滤波器减少盲源分离算法的残留的其他通道的人声残留的信号，减少了人声残留被人听见的能量，而且不带来期望信号的损伤，提高了语音分离质量。
具体实施方式
14.以下以三路语音信号为例，说明本发明的语音分离方法。
15.三个通道的语音信号输入盲源分离模块，盲源分离模块采用ica算法进行语音信号分离，输出三路分离后的语音信号b1、b2和b3，每路分离后的语音信号包含其它通道残留的语音信号，其中第一路语音信号b1包含b2和b3的残留，第二路语音信号b2包含b1和b3的残留，第三路语音信号b3包含b1和b2的残留。
16.残留选择模块内包含三路选择处理通道，每一路选择处理通道都是将语音信号b1、b2和b3作为输入，并分别以第1、2、3路分离后的语音信号b1、b2、b3作为主信号，每一路选择处理通道计算每一时刻主信号是目标语音信号的概率，概率通过幅度差计算：对于第一路选择处理通道，对语音信号b1、b2、b3做傅里叶变换，其中语音信号b1作为主信号，在每个时频点上比较语音信号b1与语音信号b2的幅度差异，以及语音信号b1与语音信号b3的幅度差，如果两个幅度差都大于等于幅度差阈值d1(设为0)，则该时刻输出的语音信号的幅度
为0；如果两个幅度差不都大于等于幅度差阈值d1，则输出当前时刻的主信号。
17.残留抑制模块内包含三路抑制处理通道。以第一路为例，第一路抑制处理通道将盲源分离模块输出的第一路语音输出信号b1和残留选择模块的第一路残留输出信号作为输入，进行残留抑制，输出一路语音信号作为最终第一路输出语音信号。
18.残留抑制模块内的第一路抑制处理通道包括一个长度为k(k为自然数)的自适应滤波器，自适应滤波器对输入的对应的残留输出信号进行滤波，得到期望残留信号；盲源分离模块第一路语音输出信号b1与期望残留信号相减作为残差信号s1，自适应滤波器利用残差信号s1，采用迭代算法(如lms算法)更新滤波器系数；当残留抑制模块接收的残留输出信号为0时，自适应滤波器不更新滤波器系数。第一路残差信号s1即为最终的第一路输出语音信号。
19.可选的，如果只希望分离出一路或两路语音信号，那么残留选择模块可以只包括一个或两个选择处理通道，对应的，残留抑制模块也只包括一个或两个抑制处理通道。
20.应该理解的是上述实例只是对本发明的说明，而不是对本发明的限制，任何不超出本发明实质精神范围内的发明创造，均落入本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种充分利用视觉与语音联系的视听语音增强方法及系统与流程

一种语音分离方法与流程

相关文章

最热文献