技术总结
本发明提出了一种基于声纹嵌入的低信噪比条件下的语音增强方法。本发明将干净中文语音数据集、中文语音噪声数据集通过sox混合干净语音和随机噪声,得到带噪语音数据集;提取中文语音数据集的梅尔倒谱系数;构建优化通用高斯混合背景模型;根据干净中文语音的梅尔倒谱系数、优化高斯混合背景概率密度模型,提取干净中文语音数据集的声纹特征;提取带噪语音数据集的幅度谱和相位谱;生成带噪语音中说话用户的相关频谱特征;构建增强神经网络;波形重构得到增强后的带噪语音。本发明将用户语音的声纹特征进行嵌入,提升低信噪比条件下语音增强系统的性能,改善智能语音设备在嘈杂环境下的性能表现。下的性能表现。下的性能表现。
技术研发人员:高戈 曾邦 陈怡 杨玉红 尹文兵 王霄
受保护的技术使用者:武汉大学
技术研发日:2021.03.01
技术公布日:2021/6/24
本发明提出了一种基于声纹嵌入的低信噪比条件下的语音增强方法。本发明将干净中文语音数据集、中文语音噪声数据集通过sox混合干净语音和随机噪声,得到带噪语音数据集;提取中文语音数据集的梅尔倒谱系数;构建优化通用高斯混合背景模型;根据干净中文语音的梅尔倒谱系数、优化高斯混合背景概率密度模型,提取干净中文语音数据集的声纹特征;提取带噪语音数据集的幅度谱和相位谱;生成带噪语音中说话用户的相关频谱特征;构建增强神经网络;波形重构得到增强后的带噪语音。本发明将用户语音的声纹特征进行嵌入,提升低信噪比条件下语音增强系统的性能,改善智能语音设备在嘈杂环境下的性能表现。下的性能表现。下的性能表现。
技术研发人员:高戈 曾邦 陈怡 杨玉红 尹文兵 王霄
受保护的技术使用者:武汉大学
技术研发日:2021.03.01
技术公布日:2021/6/24
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。