一种基于最小体积约束的多通道盲声源分离方法与流程

2021-08-10 16:37:00 来源：中国专利 TAG：声源分离通道语音识别方法

技术特征：

1.一种基于最小体积约束的多通道盲声源分离方法，其特征在于，包括以下步骤：

步骤1：多通道盲声源分离问题公式化表示；

假设多通道混合声源的短时傅立叶变换stft为其中i＝1,…，i，j＝1,…,j和m＝1,…,m分别表示频点、时间帧和麦克风，i表示频点数量，j表示时间帧数量，m表示麦克风数量，t表示转置；

声源表示为n是声源的数量，n＝1,…,n是声源的索引；

假设每个声源都是点源，混合声源与每个声源具有以下联系：

xij＝aisij(1)

其中ai是在第i个频点的混合矩阵；

待求解分离信号yij表示为：

yij＝wixij(2)

其中wi为(ai)^-1的估计，表示为wi＝[wi,1,…,wi,m]^h，h表示埃尔米特转置；

步骤2：通过xij＝xijxij^h对声源功率谱进行建模，并使用非负矩阵分解xij：

其中k是基向量的数量，vik,n是频谱基础矩阵的第n个声源的元素，tkj,n是时间激活矩阵的第n个声源的元素，是空间协方差第n个声源的第i个频段；

将所有声源在全部频带上的频段ri,n完整表示为一个张量xij在全部时频箱的完整表示作为一个张量

步骤3：最小体积多通道声源分离；

采用基于最小体积的多通道非负矩阵分解，定义目标函数为：

其中1是一个全1向量，vol(vn)表示最小体积正则化：

其中，δ为正常数，ik是k维的单位矩阵，是近似损失；

步骤4：以式(4)作为目标函数进行训练，求得wi，最终得到分离信号yij，实现多通道盲声源的分离。

2.根据权利要求1所述的一种基于最小体积约束的多通道盲声源分离方法，其特征在于，所述δ＝0.5。

技术总结
本发明公开了一种基于最小体积约束的多通道盲声源分离方法，首先将接受到的多通道混合信号通过解混合矩阵，得到声源的近似估计，再通过短时傅里叶变换得到估计的每个通道时频图矩阵，然后通过最小体积约束的独立低秩矩阵分析，最终更新解混合矩阵。本发明显著提高了混响环境中估计的声源信号失真比，保证了混和声源信号在重构过程中的鲁棒性和可识别性。

技术研发人员：张晓雷;王建宇;王杰
受保护的技术使用者：西北工业大学;西北工业大学深圳研究院
技术研发日：2021.04.21
技术公布日：2021.08.10

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：热词召回及更新方法、装置、存储介质和热词系统与流程

一种基于最小体积约束的多通道盲声源分离方法与流程

相关文章

最热文献