技术特征:
1.一种语音信号的自动增益控制方法,其特征在于,所述语音信号的自动增益控制方法包括:
获取到语音信号的当前帧;
基于所述当前帧的帧信号确定所述当前帧的多个参数;
利用多级策略基于所述多个参数得到所述当前帧的语音增益值;
利用所述语音增益值对所述当前帧进行语音增益处理。
2.根据权利要求1所述的自动增益控制方法,其特征在于,所述利用多级策略基于所述多个参数得到所述当前帧的语音增益值的步骤,包括:
基于各个所述参数按照所述多级策略得到所述当前帧对应的多个子语音增益值,并利用所述多个子语音增益值确定所述语音增益值。
3.根据权利要求2所述的自动增益控制方法,其特征在于,所述基于各个所述参数按照所述多级策略得到所述当前帧对应的多个子语音增益值,并利用所述多个子语音增益值确定所述语音增益值的步骤,包括:
基于所述当前帧的第一参数确定第一子语音增益值;
基于所述第一子语音增益值以及第二参数确定第二子语音增益值;
基于所述第二子语音增益值以及第三参数确定第三子语音增益值;
基于所述第三子语音增益值、前一帧的第三子语音增益值以及第四参数确定所述语音增益值。
4.根据权利要求3所述的自动增益控制方法,其特征在于,所述基于所述当前帧的第一参数确定第一子语音增益值的步骤,包括:
响应于所述第一参数小于第一门限值,将所述第一门限值的绝对值确定为所述第一子语音增益值;
响应于所述第一参数大于所述第一门限值且小于第二门限值,将所述第二门限值与所述第一参数的差值确定为所述第一子语音增益值;
响应于所述第一参数大于所述第二门限值且小于第三门限值,将所述第三门限值与所述第一参数的差值确定为所述第一子语音增益值;
响应于所述第一参数大于所述第三门限值,将固定值确定为所述第一子语音增益值;
其中,所述第一门限值小于所述第二门限值小于所述第三门限值。
5.根据权利要求3所述的自动增益控制方法,其特征在于,所述基于所述第一子语音增益值以及第二参数确定第二子语音增益值的步骤,包括:
获取所述第二参数与第二阈值的差值;
响应于所述差值大于所述第一子语音增益值,将所述差值确定为所述第二子语音增益值;
响应于所述差值小于所述第一子语音增益值,将所述第一子语音增益值确定为所述第二子语音增益值。
6.根据权利要求3所述的自动增益控制方法,其特征在于,所述基于所述第二子语音增益值以及第三参数确定第三子语音增益值的步骤,包括:
获取所述第三参数与第三阈值的差值;
响应于所述差值大于所述第二子语音增益值,将所述差值确定为所述第三子语音增益值;
响应于所述差值小于所述第二子语音增益值,将所述第二子语音增益值确定为所述第三子语音增益值。
7.根据权利要求3所述的自动增益控制方法,其特征在于,所述基于所述第三子语音增益值、前一帧的第三子语音增益值以及第四参数确定所述语音增益值的步骤,包括:
获取所述第三子语音增益值与所述前一帧的第三子语音增益值的差值;
基于所述差值以及所述第四参数确定所述语音增益值。
8.根据权利要求7所述的所述的自动增益控制方法,其特征在于,所述基于所述差值以及所述第四参数确定所述语音增益值的步骤,包括:
若基于所述第四参数确定所述当前帧和所述前一帧为语音帧,则判断所述差值是否在预设阈值内;
若在,则将所述差值确定为所述语音增益值;
若不在,则判断所述差值与零的大小;
若所述差值小于零,则将所述预设阈值内的最小值确定为所述语音增益值;
若所述差值大于零,则将所述预设阈值内的最大值确定为所述语音增益值;
若基于所述第四参数确定所述当前帧和/或所述前一帧为非语音帧,则判断所述差值与零的大小;
若所述差值大于零,则将所述差值确定为所述语音增益值;
若所述差值小于零,则将零确定为所述语音增益值。
9.根据权利要求1-8任一项所述的自动增益控制方法,其特征在于,所述第一参数为语音总幅度值,第二参数为噪声幅度值,第三参数为限幅包络值,第四参数为语音概率。
10.根据权利要求1所述的自动增益控制方法,其特征在于,所述获取到语音信号的当前帧的步骤,包括:
对输入的所述语音信号进行无重叠分帧处理,得到所述当前帧。
11.一种语音信号的自动增益控制装置,其特征在于,所述自动增益控制装置包括:
分帧模块,用于获取语音信号的当前帧;
计算模块,与所述分帧模块耦接,用于基于所述当前帧的帧信号确定所述当前帧的多个参数;
获取模块,与所述计算模块耦接,用于利用多级策略基于所述多个参数得到所述当前帧的语音增益值;
限幅拉伸模块,与所述获取模块耦接,利用所述语音增益值对所述当前帧进行语音增益处理。
12.一种终端,其特征在于,所述终端包括相互耦接的处理器和存储器,所述存储器用于存储有程序指令,所述处理器用于执行存储器存储的程序指令以实现上述权利要求1~10任一项所述的自动增益控制方法。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,用于实现权利要求1~10任一项所述的自动增益控制方法。
技术总结
本申请公开了一种语音信号的自动增益控制方法及其相关装置,其中,语音信号的自动增益控制方法包括:获取到语音信号的当前帧;基于当前帧的帧信号确定当前帧的多个参数;利用多级策略基于多个参数得到当前帧的语音增益值;利用语音增益值对当前帧进行语音增益处理。通过上述方法,提高了语音整体的听感,提升了语音增益值的鲁棒性。
技术研发人员:陈庭威;黄景标;林聚财;殷俊;
受保护的技术使用者:浙江大华技术股份有限公司;
技术研发日:2021.07.08
技术公布日:2021.10.01
本文用于企业家、创业者技术爱好者查询,结果仅供参考。