技术特征:
1.一种音频帧的调整方法,其特征在于,所述方法包括:
获取待调整的音频帧;
对所述音频帧进行音高提取,得到所述音频帧的音高特征;
基于所述音高特征,确定对所述音频帧的谐波进行幅值调整的谐波修改系数;所述音频帧的谐波包括基波和高次谐波,所述基波为一次谐波;
根据所述谐波修改系数对所述音频帧中的谐波进行幅值调整,得到调整后的音频帧。
2.根据权利要求1所述的方法,其特征在于,
当待降低所述音频帧的张力时,所述基波对应的谐波修改系数用于增大所述基波的幅值,所述高次谐波对应的谐波修改系数用于降低所述高次谐波的幅值;
当待增强所述音频帧的张力时,所述基波对应的谐波修改系数用于降低所述基波的幅值,所述高次谐波对应的谐波修改系数用于增强或维持所述高次谐波的幅值。
3.根据权利要求2所述的方法,其特征在于,所述高次谐波对应的谐波修改系数用于增强或维持所述高次谐波的幅值,包括:
所述高次谐波中的二次谐波对应的谐波修改系数用于维持所述二次谐波的幅值,所述高次谐波中的其他高次谐波对应的谐波修改系数用于增强相应谐波的幅值。
4.根据权利要求1所述的方法,其特征在于,所述基于所述音高特征,确定对所述音频帧的谐波进行幅值调整的谐波修改系数,包括:
基于所述音高特征,确定所述音频帧中包含的谐波数量;
基于所述谐波的波形频率和所述谐波数量,确定对所述目标音频帧中的谐波进行调整的谐波修改系数。
5.根据权利要求4所述的方法,其特征在于,所述基于所述谐波的波形频率和所述谐波数量,确定对所述目标音频帧中的谐波进行调整的谐波修改系数,包括:
以第一调整方向确定对所述基波的幅值进行调整的谐波修改系数,并以第二调整方向确定对所述高次谐波的幅值进行调整的谐波修改系数,其中所述高次谐波的谐波修改系数是基于所述波形频率和所述谐波数量确定的;
所述第一调整方向和所述第二调整方向为不同的调整方向,所述调整方向包括所述幅值的增强调整方向、降低调整方向和维持调整方向中的至少一种。
6.根据权利要求5所述的方法,其特征在于,所述音频帧的调整目标为降低音频帧张力;
所述以第一调整方向确定对所述基波的幅值进行调整的谐波修改系数,并以第二调整方向确定对所述高次谐波的幅值进行调整的谐波修改系数,包括:
以所述增强调整方向确定对所述基波的幅值进行调整的谐波修改系数;
基于所述高次谐波的波形频率和所述谐波数量,以所述降低调整方向确定对所述高次谐波的幅值进行调整的谐波修改系数。
7.根据权利要求6所述的方法,其特征在于,所述以所述增强调整方向确定对所述基波的幅值进行调整的谐波修改系数,包括:
将第一预设取值确定为所述基波的第一谐波修改系数,所述基波的第一谐波修改系数取值大于1,所述基波的第一谐波修改系数用于对所述基波的幅值进行调整;
所述基于所述高次谐波的波形频率和所述谐波数量,以所述降低调整方向确定对所述高次谐波的幅值进行调整的谐波修改系数,包括:
基于所述高次谐波的波形频率和所述谐波数量,确定所述高次谐波的第一谐波修改系数,所述高次谐波的第一谐波修改系数用于对所述高次谐波的幅值进行调整。
8.根据权利要求5所述的方法,其特征在于,所述音频帧的调整目标为增大音频帧张力;
所述以第一调整方向确定对所述基波的幅值进行调整的谐波修改系数,并以第二调整方向确定对所述高次谐波的幅值进行调整的谐波修改系数,包括:
以所述降低调整方向确定对所述基波的幅值进行调整的谐波修改系数;
以所述维持调整方向确定对二次谐波的幅值幅行调整的谐波修改系数;
基于其他高次谐波的波形频率和所述谐波数量,以所述增强调整方向确定对其他高次谐波的幅值进行调整的谐波修改系数,所述其他高次谐波是指除所述二次谐波以外的高次谐波。
9.根据权利要求8所述的方法,其特征在于,所述以所述降低调整方向确定对所述基波的幅值进行调整的谐波修改系数,包括:
将第二预设取值确定为所述基波的第二谐波修改系数,所述基波的第二谐波修改系数取值小于1,所述基波的第二谐波修改系数用于对所述基波的幅值进行调整;
所述以所述维持调整方向确定对二次谐波的幅值进行调整的谐波修改系数,包括:
将第三预设取值1确定为所述二次谐波的第二谐波修改系数;
所述基于其他高次谐波的波形频率和所述谐波数量,以所述增强调整方向确定对其他高次谐波的幅值进行调整的谐波修改系数,包括:
基于其他高次谐波的波形频率和所述谐波数量,确定其他高次谐波的第二谐波修改系数,所述其他高次谐波的第二谐波修改系数用于对其他高次谐波的幅值进行调整。
10.一种音频帧的调整装置,其特征在于,所述装置包括:
获取模块,用于获取待调整的音频帧;
提取模块,对所述音频帧进行音高提取,得到所述音频帧的音高特征;
确定模块,用于基于所述音高特征,确定对所述音频帧的谐波进行幅值调整的谐波修改系数;所述音频帧的谐波包括基波和高次谐波,所述基波为一次谐波;
调整模块,用于根据所述谐波修改系数对所述音频帧中的谐波进行幅值调整,得到调整后的音频帧。
11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至9任一所述的音频帧的调整方法。
12.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至9任一所述的音频帧的调整方法。
技术总结
本申请公开了一种音频帧的调整方法、装置、设备及可读存储介质,涉及音频处理领域。该方法包括:获取待调整的音频帧;对音频帧进行音高提取,得到音频帧的音高特征;基于音高特征,确定对音频帧的谐波进行幅值调整的谐波修改系数;根据谐波修改系数对音频帧中的谐波进行幅值调整,得到调整后的音频帧。从而实现对音频帧中的周期分量进行修改,而不对声音辨识度对应的非周期分量进行修改,从而达到修改声音张力而保留原本辨识度的效果,提高了声音张力的调整准确率。
技术研发人员:关迪聆;劳振锋;陈传艺;孙洪文
受保护的技术使用者:广州酷狗计算机科技有限公司
技术研发日:2021.03.15
技术公布日:2021.07.02
本文用于企业家、创业者技术爱好者查询,结果仅供参考。