一种用于端到端时域声源分离系统的参数化听觉滤波器组的制作方法

2021-09-14 22:05:00 来源：中国专利 TAG：声源分离时域滤波器听觉

技术特征：
1.一种用于端到端时域声源分离系统的参数化听觉滤波器组，其特征在于：采用gammatone滤波器，滤波器的数量n不小于32；滤波器时域脉冲响应由gamma分布调制的纯音：g(t)＝at
p
‑1e
‑
2πbt
cos(2πf
c
t φ)其中p为阶数，f
c
为中心频率，b为带宽，φ为相位，a为幅度，通过阶数p与带宽b确定。2.根据权利要求1所述一种用于端到端时域声源分离系统的参数化听觉滤波器组，其特征在于：幅度取值为3.利用权利要求1所述参数化听觉滤波器组构建端到端时域声源分离系统的方法，其特征在于：包括以下步骤：步骤1：依据编码器
‑
分离器
‑
解码器的框架创建时域分离网络；其中编码器通过一维卷积层实现，其滤波器组采用所述参数化听觉滤波器组；分离器用于估计声源的掩模；解码器为一维反卷积层；来自分离器的每个声源的掩模估计值与来自编码器的混合声的二维表达相乘，之后能够通过解码器合成分离声源的时域信号；步骤2：根据人耳听觉系统的先验知识对各个滤波器的参数集进行初始化，参数化听觉滤波器组中的参数集在网络训练过程中可变：(1)各滤波器的阶数p
i
都初始化设定为4，对应人耳听觉系统中滤波器阶数的平均拟合值；(2)各滤波器的中心频率初始化均匀分布在等效矩形带宽erb尺度上，其中从线性频率到erb尺度的映射为(3)各滤波器的初始化带宽b
i
由和阶数p
i
决定(4)各滤波器的初始化相位φ
i
设定为以对齐音调的峰值与gamma包络的峰值；步骤3：根据分离任务选择不同声源创建数据集，并利用数据集训练时域分离网络，获得端到端时域声源分离系统。4.根据权利要求3所述一种构建端到端时域声源分离系统的方法，其特征在于：所述分离器采用基于深度卷积的网络结构，包含多个具有不同扩张因子的带洞卷积模块，每个带洞卷积模块中又包含卷积层、整流层、归一化层、深度卷积层以及留数和跳跃结构。5.根据权利要求3所述一种构建端到端时域声源分离系统的方法，其特征在于：训练时域分离网络时，以最小化真实声源和估计声源之间的尺度不变信号失真比作为训练目标，通过adam优化器训练网络，直到分离性能不再提高，获得端到端时域声源分离系统。6.一种端到端时域声源分离系统，其特征在于：利用权利要求3所述方法构建得到。

技术总结
本发明提出了一种用于端到端时域声源分离系统的参数化听觉滤波器组；在端到端时域分离系统中引入了参数化听觉滤波器组，建立了更具听觉合理性的分离模型，提高了网络的分离性能。相比于固定式滤波器组，参数化听觉滤波器组的参数是通过网络训练得到的，具有更好的灵活性，能够根据网络和数据的特性进行自发的调整，以获得更优的分离性能。而相比于自由式滤波器组，参数化听觉滤波器组通过给定Gammatone滤波器的形式，提供给网络听觉系统的先验信息，使得网络能够更好的模拟人耳听觉系统以提高实际场景中网络的分离能力，也使得网络具有更好的可解释性。此外，每个滤波器只有4个参数需要训练，相比所有参数都需要训练的自由式滤波器，其显著降低了网络的参数数量。量。量。

技术研发人员：陈克安李晗
受保护的技术使用者：西北工业大学
技术研发日：2021.05.25
技术公布日：2021/9/13

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种同侧进出气式消音器及使用其的氧氮分离装置的制作方法

一种用于端到端时域声源分离系统的参数化听觉滤波器组的制作方法

相关文章

最热文献