技术特征:
1.一种激活音检测vad判决中信噪比门限的调整方法,包括:
获得当前帧的子带信号及频谱幅值;
根据子带信号计算得到当前帧的谱重心特征参数;
通过前一帧的平均长时激活音信号能量和平均长时背景噪声能量的比值,计算得到长时信噪比lt_snr;
根据所述谱重心特征参数、所述长时信噪比lt_snr、前面连续激活音帧的个数continuous_speech_num和前面连续噪声帧的个数continuous_noise_num来调整vad判决的信噪比门限。
2.如权利要求1所述的方法,其特征在于,所述谱重心特征参数是所有或部分子带的信号能量的加权累加值和未加权累加值的比值,或对该比值进行平滑滤波得到的值。
3.如权利要求1所述的方法,其特征在于,所述调整vad判决的信噪比门限的步骤包括:
设置信噪比门限snr_thr的初始值;
根据所述谱重心特征参数调整所述信噪比门限snr_thr的值;
根据所述前面连续激活音帧的个数continuous_speech_num、所述前面连续噪声帧的个数continuous_noise_num、平均全带信噪比snr2_lt_ave和所述长时信噪比lt_snr进一步调整snr_thr的值;
根据所述长时信噪比lt_snr的值再对所述信噪比门限snr_thr进行修正,得到当前帧的信噪比门限snr_thr。
4.如权利要求3所述的方法,其特征在于,计算最近多个帧的全带信噪比snr2的平均值,得到平均全带信噪比snr2_lt_ave。
5.一种激活音检测vad判决中信噪比门限的调整装置,其特征在于,包括:
特征参数获取单元,用于根据子带信号计算得到当前帧的谱重心特征参数;
长时信噪比计算单元,用于通过前一帧的平均长时激活音信号能量和平均长时背景噪声能量的比值,计算得到长时信噪比lt_snr;
信噪比门限调整单元,用于根据所述谱重心特征参数、所述长时信噪比lt_snr、前面连续激活音帧个数continuous_speech_num和前面连续噪声帧个数continuous_noise_num调整vad判决的信噪比门限。
6.如权利要求5所述的调整装置,其特征在于,所述特征参数获取单元根据所有或部分子带的信号能量的加权累加值和未加权累加值的比值计算得到所述谱重心特征参数,或者对该比值进行平滑滤波得到所述谱重心特征参数。
7.如权利要求5所述的调整装置,其特征在于,所述信噪比门限调整单元调整信噪比门限时,设置信噪比门限snr_thr的初始值;
根据所述谱重心特征参数调整所述信噪比门限snr_thr的值;根据所述前面连续激活音帧的个数continuous_speech_num、所述前面连续噪声帧的个数continuous_noise_num、平均全带信噪比snr2_lt_ave和所述长时信噪比lt_snr进一步调整snr_thr的值;
根据所述长时信噪比lt_snr的值再对所述信噪比门限snr_thr进行调整,得到当前帧的信噪比门限snr_thr。
技术总结
本发明提供一种激活音检测VAD判决中信噪比门限的调整方法,包括:获得当前帧的子带信号及频谱幅值;根据子带信号计算得到当前帧的谱重心特征参数;通过前一帧的平均长时激活音信号能量和平均长时背景噪声能量的比值,计算得到长时信噪比lt_snr;根据所述谱重心特征参数、所述长时信噪比lt_snr、前面连续激活音帧的个数continuous_speech_num和前面连续噪声帧的个数continuous_noise_num来调整VAD判决的信噪比门限。
技术研发人员:袁浩;江东平;朱长宝
受保护的技术使用者:中兴通讯股份有限公司
技术研发日:2012.12.25
技术公布日:2021.06.18
本文用于企业家、创业者技术爱好者查询,结果仅供参考。