一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种音频处理方法、装置、电子设备及可读存储介质与流程

2021-10-09 15:59:00 来源:中国专利 TAG:数据处理 电子设备 音频处理 装置 可读

技术特征:
1.一种音频处理方法,其特征在于,所述方法包括:获取目标音频的第一音频帧集合和参考音频的第二音频帧集合;按照所述第二音频帧集合中的语义特征对所述第一音频帧集合中的语义特征执行时域维度上的对齐处理,得到所述第一音频帧集合对应的目标音频帧集合;确定所述目标音频帧集合对应的第一音高集合,以及,确定所述第二音频帧集合对应的第二音高集合;基于所述第一音高集合和所述第二音高集合确定调整策略;利用所述调整策略对所述目标音频的音高进行调整。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一音高集合和所述第二音高集合确定调整策略,包括:确定所述第一音高集合对应的第一均值,以及,所述第二音高集合对应的第二均值;将所述第一均值与所述第二均值的差值绝对值,作为音高差异值;基于所述音高差异值和所述第二音高集合确定所述调整策略。3.根据权利要求2所述的方法,其特征在于,所述基于所述音高差异值和所述第二音高集合确定所述调整策略,包括:判断所述音高差异值是否大于预设音高阈值;若所述音高差异值大于所述预设音高阈值,获取目标参数,并基于所述第二音高集合和所述目标参数确定第一目标音高集合,所述第一目标音高集合用于对所述目标音频的音高进行调整;若所述音高差异值小于或等于所述预设音高阈值,将所述第二音高集合作为所述第一目标音高集合。4.根据权利要求3所述的方法,其特征在于,所述基于所述第二音高集合和所述目标参数确定第一目标音高集合,包括:在所述第一均值大于所述第二均值的情况下,针对所述第二音高集合中的每个第二音高,将所述第二音高与所述目标参数的和作为第一目标音高,得到所述第一目标音高集合;在所述第一均值小于所述第二均值的情况下,针对所述第二音高集合中的每个第二音高,将所述第二音高减去所述目标参数得到的差值作为所述第一目标音高,得到所述第一目标音高集合。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:在接收到对象输入调整值的情况下,将所述调整值和预设参数的乘积结果作为所述目标参数;在未接收到对象输入调整值的情况下,将所述预设参数作为所述目标参数。6.根据权利要求2所述的方法,其特征在于,所述基于所述音高差异值和所述第二音高集合确定所述调整策略,包括:在所述第一均值大于所述第二均值的情况下,针对所述第二音高集合中的每个第二音高,将所述第二音高与所述音高差异值的和作为第二目标音高,得到第二目标音高集合,所述第二目标音高集合用于对所述目标音频的音高进行调整;在所述第一均值小于所述第二均值的情况下,针对所述第二音高集合中的每个第二音高,将所述第二音高减去所述音高差异值得到的差值作为所述第二目标音高,得到所述第
二目标音高集合。7.根据权利要求1所述的方法,其特征在于,所述按照所述第二音频帧集合中的语义特征对所述第一音频帧集合中的语义特征执行时域维度上的对齐处理,得到所述第一音频帧集合对应的目标音频帧集合,包括:从所述第一音频帧集合中提取第一语义特征,并从所述第二音频帧集合中提取第二语义特征;将所述第一语义特征和所述第二语义特征输入至序列匹配模型,以使所述序列匹配模型输出对齐结果;将所述对齐结果和所述第一音频帧集合输入至时域调整模型,以使所述时域调整模型输出所述目标音频帧集合。8.一种音频处理装置,其特征在于,所述装置包括:获取模块,用于获取目标音频的第一音频帧集合和参考音频的第二音频帧集合;对齐模块,用于按照所述第二音频帧集合中的语义特征对所述第一音频帧集合中的语义特征执行时域维度上的对齐处理,得到所述第一音频帧集合对应的目标音频帧集合;第一确定模块,用于确定所述目标音频帧集合对应的第一音高集合,以及,确定所述第二音频帧集合对应的第二音高集合;第二确定模块,用于基于所述第一音高集合和所述第二音高集合确定调整策略;调整模块,用于利用所述调整策略对所述目标音频的音高进行调整。9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现权利要求1

7任一所述的方法步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1

7任一所述的方法步骤。

技术总结
本申请提供了一种音频处理方法、装置、电子设备及可读存储介质,属于数据处理技术领域。本申请通过获取目标音频的第一音频帧集合和参考音频的第二音频帧集合;按照所述第二音频帧集合中的语义特征对所述第一音频帧集合中的语义特征执行时域维度上的对齐处理,得到所述第一音频帧集合对应的目标音频帧集合;确定所述目标音频帧集合对应的第一音高集合,以及,确定所述第二音频帧集合对应的第二音高集合;基于所述第一音高集合和所述第二音高集合确定调整策略;利用所述调整策略对所述目标音频的音高进行调整。以避免由于没有考虑用户自身的音高造成失真的情况。身的音高造成失真的情况。身的音高造成失真的情况。


技术研发人员:周勇
受保护的技术使用者:北京奇艺世纪科技有限公司
技术研发日:2021.09.03
技术公布日:2021/10/8
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜