一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于最小体积约束的多通道盲声源分离方法与流程

2021-08-10 16:37:00 来源:中国专利 TAG:声源 分离 通道 语音识别 方法

技术特征:

1.一种基于最小体积约束的多通道盲声源分离方法,其特征在于,包括以下步骤:

步骤1:多通道盲声源分离问题公式化表示;

假设多通道混合声源的短时傅立叶变换stft为其中i=1,…,i,j=1,…,j和m=1,…,m分别表示频点、时间帧和麦克风,i表示频点数量,j表示时间帧数量,m表示麦克风数量,t表示转置;

声源表示为n是声源的数量,n=1,…,n是声源的索引;

假设每个声源都是点源,混合声源与每个声源具有以下联系:

xij=aisij(1)

其中ai是在第i个频点的混合矩阵;

待求解分离信号yij表示为:

yij=wixij(2)

其中wi为(ai)-1的估计,表示为wi=[wi,1,…,wi,m]h,h表示埃尔米特转置;

步骤2:通过xij=xijxijh对声源功率谱进行建模,并使用非负矩阵分解xij:

其中k是基向量的数量,vik,n是频谱基础矩阵的第n个声源的元素,tkj,n是时间激活矩阵的第n个声源的元素,是空间协方差第n个声源的第i个频段;

将所有声源在全部频带上的频段ri,n完整表示为一个张量xij在全部时频箱的完整表示作为一个张量

步骤3:最小体积多通道声源分离;

采用基于最小体积的多通道非负矩阵分解,定义目标函数为:

其中1是一个全1向量,vol(vn)表示最小体积正则化:

其中,δ为正常数,ik是k维的单位矩阵,是近似损失;

步骤4:以式(4)作为目标函数进行训练,求得wi,最终得到分离信号yij,实现多通道盲声源的分离。

2.根据权利要求1所述的一种基于最小体积约束的多通道盲声源分离方法,其特征在于,所述δ=0.5。


技术总结
本发明公开了一种基于最小体积约束的多通道盲声源分离方法,首先将接受到的多通道混合信号通过解混合矩阵,得到声源的近似估计,再通过短时傅里叶变换得到估计的每个通道时频图矩阵,然后通过最小体积约束的独立低秩矩阵分析,最终更新解混合矩阵。本发明显著提高了混响环境中估计的声源信号失真比,保证了混和声源信号在重构过程中的鲁棒性和可识别性。

技术研发人员:张晓雷;王建宇;王杰
受保护的技术使用者:西北工业大学;西北工业大学深圳研究院
技术研发日:2021.04.21
技术公布日:2021.08.10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜