声码器的降噪方法及其声码器、电子设备和存储介质与流程

2022-04-09 10:16:04 来源：中国专利 TAG：

技术特征：
1.一种声码器的降噪方法，其特征在于，包括：声码器获取待合成声学特征和噪声标签，其中，所述噪声标签与所述待合成声学特征的降噪程度相关；所述声码器基于所述待合成声学特征和噪声标签进行音频合成，得到干净的合成音频数据；所述声码器以加噪训练音频的声学特征和噪声训练标签作为输入，干净训练音频作为输出，训练得到；其中，所述加噪训练音频由所述干净训练音频和噪声训练音频合成得到，所述噪声训练标签对应所述噪声训练音频的噪声程度。2.根据权利要求1所述的降噪方法，其特征在于，所述声码器包括自降噪编解码器和降噪通用声码器，所述声码器以加噪训练音频的声学特征和噪声训练标签作为输入，干净训练音频作为输出，训练得到，包括：所述自降噪编解码器以加噪训练音频的声学特征作为输入，所述干净训练音频的声学特征作为输出，所述降噪通用声码器将所述噪声训练标签和所述自降噪编解码器输出的中间声学特征作为输入，所述干净训练音频作为输出，进行联合训练，以得到所述声码器。3.根据权利要求1所述的降噪方法，其特征在于，所述声码器包括自回归降噪通用声码器时，所述声码器以加噪训练音频的声学特征和噪声训练标签作为输入，干净训练音频作为输出，训练得到，包括：基线声码器以所述干净训练音频的声学特征作为输入和所述干净训练音频作为输出，训练得到；所述基线声码器基于干净训练音频的声学特征进行音频合成，得到干净合成音频；所述自回归降噪通用声码器以加噪训练音频的声学特征和噪声训练标签作为输入，所述干净合成音频作为输出，训练得到。4.根据权利要求3所述的降噪方法，其特征在于，所述自回归降噪通用声码器以加噪训练音频的声学特征和噪声训练标签作为输入，所述干净合成音频作为输出，训练得到，包括：所述自回归降噪通用声码器与所述基线声码器在声码器内部进行至少一次损失计算。5.根据权利要求3所述的降噪方法，其特征在于，所述基线声码器和所述自回归降噪通用声码器的模型结构相同。6.根据权利要求1所述的降噪方法，其特征在于，所述声码器以加噪训练音频的声学特征和噪声训练标签作为输入，干净训练音频作为输出，训练得到，包括：所述声码器以干净训练音频的声学特征作为输入，所述干净训练音频作为输出，训练得到预训练模型；所述声码器加载所述预训练模型，并以加噪训练音频的声学特征和噪声训练标签作为输入，干净训练音频作为输出，进行训练得到。7.根据权利要求1所述的降噪方法，其特征在于，所述加噪训练音频的获取方法包括：获取所述干净训练音频和所述噪声训练音频；按照随机选取的方式，将所述噪声训练音频对所述干净训练音频进行加噪，得到所述
加噪训练音频；和/或，按照预设加噪强度，将所述噪声训练音频对所述干净训练音频进行加噪，得到所述加噪训练音频。8.根据权利要求1所述的降噪方法，其特征在于，所述噪声训练标签的获取方法包括：按照所述加噪训练音频的加噪强度，生成对应的所述噪声训练标签。9.根据权利要求1所述的降噪方法，其特征在于，所述声码器基于所述待合成声学特征和噪声标签进行音频合成，得到干净的合成音频数据，包括：所述声码器将所述噪声标签转换成噪声特征；将所述噪声特征与所述待合成声学特征进行融合处理；基于融合后的特征进行音频合成，得到干净的合成音频数据。10.根据权利要求9所述的降噪方法，其特征在于，所述声码器包括自降噪编解码器，所述将所述噪声特征与所述待合成声学特征进行融合处理之前，还包括：所述自降噪编解码器将所述待合成声学特征进行编码处理，得到中间声学特征；所述将所述噪声特征与所述待合成声学特征进行融合处理，包括：将所述噪声特征与所述中间声学特征进行融合处理。11.根据权利要求9所述的降噪方法，其特征在于，所述声码器还包括说话人编码器，所述方法还包括：所述说话人编码器用于对参考音频数据进行处理，得到目标特征，所述参考音频数据为对目标采集得到；所述基于融合后的特征进行音频合成，得到干净的合成音频数据，包括：基于融合后的特征和所述目标特征进行音频合成，得到干净的合成音频数据。12.一种声码器，其特征在于，包括：获取模块，用于获取待合成声学特征和噪声标签，其中，所述噪声标签与所述待合成声学特征的降噪程度相关；降噪合成模块，用于基于所述待合成声学特征和噪声标签进行音频合成，得到干净的合成音频数据；所述声码器以加噪训练音频的声学特征和噪声训练标签作为输入，干净训练音频作为输出，训练得到；其中，所述加噪训练音频由所述干净训练音频和噪声训练音频合成得到，所述噪声训练标签对应所述噪声训练音频的噪声程度。13.一种电子设备，其特征在于，所述电子设备包括相互耦接的存储器和处理器，所述存储器用于存储程序数据，所述处理器用于执行所述程序数据以实现如权利要求1-11任一项所述的方法。14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有程序数据，所述程序数据在被处理器执行时，用以实现如权利要求1-11任一项所述的方法。

技术总结
本申请公开了一种声码器的降噪方法及其声码器、电子设备和存储介质，其中，该方法包括：声码器获取待合成声学特征和噪声标签，其中，噪声标签与待合成声学特征的降噪程度相关；声码器基于待合成声学特征和噪声标签进行音频合成，得到干净的合成音频数据；声码器以加噪训练音频的声学特征和噪声训练标签作为输入，干净训练音频作为输出，训练得到；其中，加噪训练音频由干净训练音频和噪声训练音频合成得到，噪声训练标签对应噪声训练音频的噪声程度。通过上述方式，本申请能够控制待合成声学特征的降噪程度。声学特征的降噪程度。声学特征的降噪程度。

技术研发人员：倪嘉禾
受保护的技术使用者：西安讯飞超脑信息科技有限公司
技术研发日：2021.12.08
技术公布日：2022/4/8

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：视频处理方法、系统、装置及存储介质与流程

声码器的降噪方法及其声码器、电子设备和存储介质与流程

相关文献

最热文献