基于生成对抗网络的语音处理方法及系统与流程

2021-07-09 12:38:00 来源：中国专利 TAG：语音对抗生成方法系统

技术特征：
1.一种基于生成对抗网络的语音处理方法，其特征在于，包括：获取源语音，并输入至编码器对源语音进行编码；将编码后的语音信号输入至生成对抗网络模型，最后输出与源语音相匹配的恢复的语音；其中，生成对抗网络模型包括生成器和鉴别器，训练集由编码前的源语音和编码后质量下降的语音构成；生成器用于恢复编码后质量下降的语音；鉴别器用于比对恢复后的语音与编码前的源语音以区分真信号与假信号，再由鉴别器将区分结果反馈给生成器，以指导生成器学习源语音的真实分布的输出。2.如权利要求1所述的基于生成对抗网络的语音处理方法，其特征在于，所述生成器包括编码和解码两部分结构，编码结构用于提取输入至生成器的语音的特征，解码结构用于输出恢复的语音。3.如权利要求2所述的基于生成对抗网络的语音处理方法，其特征在于，所述编码结构为若干个二维卷积层。4.如权利要求1所述的基于生成对抗网络的语音处理方法，其特征在于，所述鉴别器为若干个二维卷积层。5.如权利要求1所述的基于生成对抗网络的语音处理方法，其特征在于，在训练生成对抗网络模型的过程中，鉴别器使用加设权值的wav类语音作为真实数据，进行鉴别器初始化阶段时输出真的概率，表示为真数据；鉴别器输入生成器生成的语音作为假数据，鉴别器将进行初始化阶段的操作输出0的概率，表示为假数据。6.如权利要求1所述的基于生成对抗网络的语音处理方法，其特征在于，在训练生成对抗网络模型的过程中，根据生成器的loss值更新生成器初始化中的卷积与反卷积的卷积核的各个数值的权重。7.如权利要求1所述的基于生成对抗网络的语音处理方法，其特征在于，根据鉴别器的loss值更新并保存到本地鉴别器初始化中的卷积核数值的权重及虚拟批量标准化中鉴别器相关参数值。8.一种基于生成对抗网络的语音处理系统，其特征在于，包括：源语音编码模块，其用于获取源语音，并输入至编码器对源语音进行编码；语音恢复模块，其用于将编码后的语音信号输入至生成对抗网络模型，最后输出与源语音相匹配的恢复的语音；其中，生成对抗网络模型包括生成器和鉴别器，训练集由编码前的源语音和编码后质量下降的语音构成；生成器用于恢复编码后质量下降的语音；鉴别器用于比对恢复后的语音与编码前的源语音以区分真信号与假信号，再由鉴别器将区分结果反馈给生成器，以指导生成器学习源语音的真实分布的输出。9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1
‑
7中任一项所述的基于生成对抗网络的语音处理方法中的步骤。10.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1
‑
7中任一项所述的基于生成对抗网络的语音处理方法中的步骤。

再多了解一些

2/3 首页上一页 1 2 3 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

基于生成对抗网络的语音处理方法及系统与流程

相关文章

最热文献