技术总结
本发明公开了一种基于生成式对抗网络的音频风格统一的方法,包括步骤1:获取初始数据集和噪声数据集;步骤2:将初始数据集和噪声数据集进行预处理,生成噪声混合音频和风格模板音频并确定与其相关的训练数据集和测试数据集;步骤3:搭建生成网络模型,训练生成器网络G用于音频风格统一,输入为噪声混合音频和风格模板音频,输出为目标风格的音频和目标风格的频谱;步骤4:搭建判别网络模型,训练判别器网络D用以衡量生成器输出的目标风格的频谱和风格模板频谱的相似程度;步骤5:构建损失函数模型并训练生成式对抗网络;本方案一种基于生成对抗网络的音频风格统一的方法,可以按照用户选定的音频风格去调整其他输入音频的风格。选定的音频风格去调整其他输入音频的风格。选定的音频风格去调整其他输入音频的风格。
技术研发人员:欧阳童洁 杨志军 谢晖泷 胡天林
受保护的技术使用者:厦门大学
技术研发日:2021.03.31
技术公布日:2021/7/8
本发明公开了一种基于生成式对抗网络的音频风格统一的方法,包括步骤1:获取初始数据集和噪声数据集;步骤2:将初始数据集和噪声数据集进行预处理,生成噪声混合音频和风格模板音频并确定与其相关的训练数据集和测试数据集;步骤3:搭建生成网络模型,训练生成器网络G用于音频风格统一,输入为噪声混合音频和风格模板音频,输出为目标风格的音频和目标风格的频谱;步骤4:搭建判别网络模型,训练判别器网络D用以衡量生成器输出的目标风格的频谱和风格模板频谱的相似程度;步骤5:构建损失函数模型并训练生成式对抗网络;本方案一种基于生成对抗网络的音频风格统一的方法,可以按照用户选定的音频风格去调整其他输入音频的风格。选定的音频风格去调整其他输入音频的风格。选定的音频风格去调整其他输入音频的风格。
技术研发人员:欧阳童洁 杨志军 谢晖泷 胡天林
受保护的技术使用者:厦门大学
技术研发日:2021.03.31
技术公布日:2021/7/8
再多了解一些
本文用于企业家、创业者技术爱好者查询,结果仅供参考。