语音降噪器训练方法、装置、计算机设备和存储介质与流程

2021-06-18 20:18:00 来源：中国专利 TAG：语音降噪装置训练计算机

技术特征：

1.一种语音降噪器训练方法，其特征在于，所述方法包括：

构建形态语音数据库，其中，所述形态语音数据库中包括多个根据噪声生成算法得到的噪声语音和本体语音组合的形态语音数据；

根据待训练的降噪器计算所述形态语音数据的语音输出，并利用预设的语音损失函数计算所述语音输出和所述形态语音数据库中形态语音数据的语音差异；

根据所述语音差异对所述待训练的降噪器进行降噪训练，当语音差异满足预设差异值时，将本轮降噪训练得到的降噪器作为训练后的降噪器。

2.根据权利要求1所述的方法，其特征在于，所述形态语音数据包括第一形态语音数据和第二形态语音数据，所述根据待训练的降噪器计算所述形态语音数据的语音输出，并利用预设的语音损失函数计算所述语音输出和所述形态语音数据库中形态语音数据的语音差异，包括：

将第一形态语音数据输入到待训练的降噪器中，得到第一语音输出；

对比所述第一语音输出与所述第二形态语音数据的语音差异，得到第一语音差异；

根据所述第一语音差异调整待训练的降噪器的网络权重，得到第一状态降噪器；

更新所述第一形态语音数据和所述第二形态语音数据；

将更新后的第一形态语音数据输入到待训练的降噪器中，得到更新后的第一语音输出；

对比更新后的第一语音输出与更新后的第二形态语音数据的语音差异，得到更新后的第一语音差异。

3.根据权利要求2所述的方法，其特征在于，所述对比所述第一语音输出与所述第二形态语音数据的语音差异，得到第一语音差异，包括：

将所述第一语音输出与所述第二形态语音数据相减，得到第一语音输出与所述第二形态语音数据之间的第一语音差异。

4.根据权利要求3所述的方法，其特征在于，所述语音差异包括第二语音差异，所述第一状态降噪器包括第一网络权重，所述根据所述语音差异对所述待训练的降噪器进行降噪训练，包括：

根据更新后的第一语音差异调整所述第一状态降噪器的网络权重，得到第二状态降噪器和第二网络权重；

基于所述第一网络权重和所述第二网络权重，通过语音损失函数计算得到所述第一状态降噪器和所述第二状态降噪器输出的第二语音差异；

当所述第二语音差异小于预设差异阈值时，将所述第二状态降噪器作为训练好的降噪器。

5.根据权利要求4所述的方法，其特征在于，所述更新所述第一形态语音数据和所述第二形态语音数据，包括：

从所述形态语音数据库中任选两个包括不同噪声数据的形态语音数据，其中，选择的形态语音数据与更新前的第一形态语音数据和第二形态语音数据至少有一个不同；

将两个所述形态语音数据分别更新为第一形态语音数据和第二形态语音数据。

6.根据权利要求4所述的方法，其特征在于，所述更新所述第一形态语音数据和所述第二形态语音数据，包括：

对所述形态语音数据库中的形态语音数据进行分先后的随机组合，得到包括两个形态语音数据的语音数据组；

去除先后顺序、形态语音数据都相同的一组语音数据组，得到多个先后顺序、形态语音数据中至少有一个不同的语音数据组，其中，所述语音数据组中包括第一形态语音数据和第二形态语音数据。

7.根据权利要求1所述的方法，其特征在于，所述构建形态语音数据库，包括：

获取噪声数据库，其中，所述噪声数据库中包括多个不同环境下的噪声语音；

生成本体语音；

将所述本体语音与所述噪声数据组合得到多个包括不同噪声语音的形态语音数据。

8.一种语音降噪器训练装置，其特征在于，包括：

构建模块，用于构建形态语音数据库，其中，所述形态语音数据库中包括多个根据噪声生成算法得到的噪声语音和本体语音组合的形态语音数据；

计算模块，用于根据待训练的降噪器计算所述形态语音数据的语音输出，并利用预设的语音损失函数计算所述语音输出和所述形态语音数据库中形态语音数据的语音差异；

训练模块，用于根据所述语音差异对所述待训练的降噪器进行降噪训练，当语音差异满足预设差异值时，将本轮降噪训练得到的降噪器作为训练后的降噪器。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机可读指令，其特征在于，所述计算机可读指令被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

技术总结
本申请实施例属于语音处理领域，应用于智慧城市领域中，涉及一种语音降噪器训练方法，包括构建形态语音数据库；根据所述形态语音数据和语音损失函数对待训练的降噪器进行多轮降噪训练，得到训练后的降噪器，其中，所述降噪训练为根据待训练的降噪器计算所述形态语音数据的语音输出，并根据所述语音输出和所述语音损失函数计算所述语音差异，并根据所述语音差异对所述待训练的降噪器进行降噪训练，若本轮降噪训练中的语音差异是否满足预设差异值，将本轮降噪训练得到的降噪器作为训练后的降噪器。此外，本申请还涉及区块链技术，所述语音数据还存储于区块链中。采用本方法解决了现有技术中网络收敛速度慢，适应性和鲁棒性不好的技术问题。

技术研发人员：陈昊
受保护的技术使用者：平安科技(深圳)有限公司
技术研发日：2021.02.26
技术公布日：2021.06.18

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：语音音频的检测方法及装置、存储介质及电子装置与流程

语音降噪器训练方法、装置、计算机设备和存储介质与流程

相关文章

最热文献