技术特征:
1.一种用于执行长期预测ltp的计算机实现的方法,包括:
对于至少预定数量的帧,确定输入音频信号的基音增益和基音周期;
对于至少所述预定数量的帧,确定所述输入音频信号的所述基音增益已经超过预定阈值,并且确定所述输入音频信号的所述基音周期的变化已经在预定范围内;以及
对于至少所述预定数量的帧,响应于确定所述输入音频信号的基音增益已经超过所述预定阈值,并且确定所述基音周期的所述变化已经在所述预定范围内,为所述输入音频信号的当前帧设置基音增益,以改善封装丢包隐藏plc。
2.根据权利要求1所述的计算机实现的方法,还包括:
接收包括多个第一样本的所述输入音频信号,所述多个第一样本以第一采样率生成;
对所述多个第一样本进行下采样,以按第二采样率生成多个第二样本,其中,所述第二采样率低于所述第一采样率;
基于以所述第二采样率生成的所述多个第二样本来确定多个候选基音;以及
基于所述多个候选基音确定第一基音周期。
3.根据权利要求2所述的计算机实现的方法,其中,基于所述多个候选基音来确定所述第一基音周期包括:通过最大化与第一窗口的归一化互相关或与第二窗口的自相关来确定所述第一基音周期,其中,所述第二窗口大于所述第一窗口。
4.根据权利要求2所述的计算机实现的方法,还包括:
基于所述确定的第一基音周期来确定第一搜索范围;
在所述第一搜索范围内确定第一波峰位置和第二波峰位置;以及
基于所述第一波峰位置和所述第二波峰位置确定第二基音周期。
5.根据权利要求4所述的计算机实现的方法,还包括:
基于所述第二基音周期确定第二搜索范围;
以第三采样率在所述第二搜索范围内确定第三基音周期,其中,所述第三采样率高于所述第二采样率;以及
将所述输入音频信号的所述基音周期确定为所述第三基音周期。
6.根据权利要求5所述的计算机实现的方法,其中,以所述第三采样率在所述第二搜索范围内确定所述第三基音周期包括:使用归一化互相关方法以所述第三采样率在所述第二搜索范围内确定所述第三基音周期。
7.根据权利要求1所述的计算机实现的方法,还包括:
对于至少所述预定数量的帧,响应于确定所述输入音频信号的所述基音增益低于所述预定阈值或确定所述基音周期的所述变化尚未在所述预定范围内中的至少一个,将所述输入音频信号的所述当前帧的基音增益设置为零,以改善plc。
8.根据权利要求1所述的计算机实现的方法,还包括:
对于至少所述预定数量的帧,响应于确定所述输入音频信号的所述基音增益连续高于所述预定阈值或确定所述基音周期的所述变化已经在所述预定范围内中的至少一个,人为地将所述输入音频信号的所述当前帧的基音增益重置为零,以改善plc。
9.一种电子设备,包括:
非瞬时性存储器,包括指令;以及
一个或多个与所述存储器通信的硬件处理器,其中,所述一个或多个硬件处理器执行所述指令以:
对于至少预定数量的帧,确定输入音频信号的基音增益和基音周期;
对于至少所述预定数量的帧,确定所述输入音频信号的所述基音增益已经超过预定阈值,并且确定所述输入音频信号的所述基音周期的变化已经在预定范围内;以及
对于至少所述预定数量的帧,响应于确定所述输入音频信号的基音增益已经超过所述预定阈值,并且确定所述基音周期的所述变化已经在所述预定范围内,为所述输入音频信号的当前帧设置基音增益,以改善封装丢包隐藏plc。
10.根据权利要求9所述的电子设备,其中,所述一个或多个硬件处理器还执行所述指令以:
接收包括多个第一样本的所述输入音频信号,所述多个第一样本以第一采样率生成;
对所述多个第一样本进行下采样,以按第二采样率生成多个第二样本,其中,所述第二采样率低于所述第一采样率;
基于以所述第二采样率生成的所述多个第二样本来确定多个候选基音;以及
基于所述多个候选基音确定第一基音周期。
11.根据权利要求10所述的电子设备,其中,基于所述多个候选基音来确定所述第一基音周期包括:通过最大化与第一窗口的归一化互相关或与第二窗口的自相关来确定所述第一基音周期,其中,所述第二窗口大于所述第一窗口。
12.根据权利要求10所述的电子设备,其中,所述一个或多个硬件处理器还执行所述指令以:
基于所述确定的第一基音周期来确定第一搜索范围;
在所述第一搜索范围内确定第一波峰位置和第二波峰位置;以及
基于所述第一波峰位置和所述第二波峰位置确定第二基音周期。
13.根据权利要求12所述的电子设备,其中,所述一个或多个硬件处理器还执行所述指令以:
基于所述第二基音周期确定第二搜索范围;
以第三采样率在所述第二搜索范围内确定第三基音周期,其中,所述第三采样率高于所述第二采样率;以及
将所述输入音频信号的所述基音周期确定为所述第三基音周期。
14.根据权利要求13所述的电子设备,其中,以所述第三采样率在所述第二搜索范围内确定所述第三基音周期包括:使用归一化互相关方法以所述第三采样率在所述第二搜索范围内确定所述第三基音周期。
15.根据权利要求9所述的电子设备,其中,所述一个或多个硬件处理器还执行所述指令以:
对于至少所述预定数量的帧,响应于确定所述输入音频信号的所述基音增益低于所述预定阈值或确定所述基音周期的所述变化尚未在所述预定范围内中的至少一个,将所述输入音频信号的所述当前帧的基音增益设置为零,以改善plc。
16.根据权利要求9所述的电子设备,还包括:
对于至少所述预定数量的帧,响应于确定所述输入音频信号的所述基音增益连续高于所述预定阈值或确定所述基音周期的所述变化已经在所述预定范围内中的至少一个,人为地将所述输入音频信号的所述当前帧的基音增益重置为零,以改善plc。
17.一种非瞬时性计算机可读介质,存储用于执行长期预测ltp的计算机指令,所述指令在由一个或多个硬件处理器执行时,使所述一个或多个硬件处理器执行包括以下的操作:
对于至少预定数量的帧,确定输入音频信号的基音增益和基音周期;
对于至少所述预定数量的帧,确定所述输入音频信号的所述基音增益已经超过预定阈值,并且确定所述输入音频信号的所述基音周期的变化已经在预定范围内;以及
对于至少所述预定数量的帧,响应于确定所述输入音频信号的基音增益已经超过所述预定阈值,并且确定所述基音周期的所述变化已经在所述预定范围内,为所述输入音频信号的当前帧设置基音增益,以改善封装丢包隐藏plc。
18.根据权利要求17所述的非瞬时性计算机可读介质,其中,所述操作还包括:
接收包括多个第一样本的所述输入音频信号,所述多个第一样本以第一采样率生成;
对所述多个第一样本进行下采样,以按第二采样率生成多个第二样本,其中,所述第二采样率低于所述第一采样率;
基于以所述第二采样率生成的所述多个第二样本来确定多个候选基音;以及
基于所述多个候选基音确定第一基音周期。
19.根据权利要求18所述的非瞬时性计算机可读介质,其中,基于所述多个候选基音来确定所述第一基音周期包括:通过最大化与第一窗口的归一化互相关或与第二窗口的自相关来确定所述第一基音周期,其中,所述第二窗口大于所述第一窗口。
20.根据权利要求18所述的非瞬时性计算机可读介质,其中,所述操作还包括:
基于所述确定的第一基音周期来确定第一搜索范围;
在所述第一搜索范围内确定第一波峰位置和第二波峰位置;以及
基于所述第一波峰位置和所述第二波峰位置确定第二基音周期。
技术总结
描述了用于执行长期预测(LTP)的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。所述方法的一个示例包括:对于至少预定数量的帧,确定输入音频信号的基音增益和基音周期。对于至少所述预定数量的帧,确定所述输入音频信号的所述基音增益已经超过预定阈值,并且确定,所述输入音频信号的所述基音周期的变化已经在预定范围内。对于至少所述预定数量的帧,响应于确定所述输入音频信号的基音增益已经超过所述预定阈值,并且确定所述第三基音周期的所述变化已经在所述预定范围内,为所述输入音频信号的当前帧设置基音增益。
技术研发人员:高扬
受保护的技术使用者:华为技术有限公司
技术研发日:2020.01.13
技术公布日:2021.08.24
本文用于企业家、创业者技术爱好者查询,结果仅供参考。