一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音检测方法、装置、介质及电子设备与流程

2021-10-09 14:50:00 来源:中国专利 TAG:语音 实施 公开 方式 电子设备

技术特征:
1.一种语音检测方法,其特征在于,包括:获取待检测信号,确定所述待检测信号对应的全频谱值;根据所述全频谱值确定所述待检测信号的偏值平坦度,根据所述偏值平坦度确定所述待检测信号的第一语音检测结果;对所述待检测信号进行语音活动检测,得到第二语音活动性检测结果;根据所述第一语音活动性检测结果与所述第二语音活动性检测结果确定所述待检测信号的目标语音检测结果。2.根据权利要求1所述的方法,其特征在于,所述根据所述全频谱值确定所述待检测信号的偏值平坦度,包括:确定所述待检测信号包含的帧信号以及帧信号数量;对所述帧信号进行频谱转换处理,得到对应的帧信号频谱;根据所述全频谱值、所述帧信号频谱与所述帧信号数量确定所述偏值平坦度。3.根据权利要求1所述的方法,其特征在于,所述偏值平坦度包括所述待检测信号中所有帧信号对应的偏值平坦度;所述根据所述偏值平坦度确定所述待检测信号的第一语音活动性检测结果,包括:获取平坦度阈值,将所述偏值平坦度与所述平坦度阈值进行对比;所述偏值平坦度基于所述待检测信号中各所述帧信号的帧信号频谱确定;确定目标帧信号,如果所述目标帧信号的偏值平坦度大于等于所述平坦度阈值,则将所述第一语音活动性检测结果确定为所述目标帧信号是非语音信号;如果所述目标帧信号的偏值平坦度小于所述平坦度阈值,则将所述第一语音活动性检测结果确定为所述目标帧信号是语音信号。4.根据权利要求1所述的方法,其特征在于,所述对所述待检测信号进行语音活动检测,得到第二语音活动性检测结果,包括:获取所述待检测信号的帧信号数量,根据所述帧信号数量确定所述待检测信号对应的检测周期时长;获取所述待检测信号的帧信号频谱,根据所述帧信号频谱确定所述待检测信号的帧信号能量;根据所述帧信号能量与所述检测周期时长对所述待检测信号进行帧级语音活动检测,得到第二语音活动性检测结果。5.根据权利要求4所述的方法,其特征在于,所述根据所述帧信号能量与所述检测周期时长对所述待检测信号进行帧级语音活动检测,得到第二语音活动性检测结果,包括:根据所述检测周期时长确定所述帧级语音活动检测对应的多个检测周期;确定各所述检测周期对应的最小能量值;将各所述检测周期内的所述帧信号能量分别与所述最小能量值进行对比,以根据所述能量对比结果确定所述第二语音活动性检测结果。6.根据权利要求5所述的方法,其特征在于,所述将各所述检测周期内的所述帧信号能量分别与所述最小能量值进行对比,以根据所述能量对比结果确定所述第二语音活动性检测结果,包括:获取预先设定的系数因子,根据所述系数因子与所述最小能量值确定能量阈值;
将各所述帧信号能量分别与所述能量阈值对比;确定目标帧信号,如果所述帧信号能量小于所述能量阈值,则确定所述第二语音活动性检测结果为所述目标帧信号是非语音信号;如果所述帧信号能量大于等于所述能量阈值,则确定所述第二语音活动性检测结果为所述目标帧信号是语音信号。7.根据权利要求1所述的方法,其特征在于,所述根据所述第一语音活动性检测结果与所述第二语音活动性检测结果确定所述待检测信号的目标语音检测结果,包括:如果所述第一语音活动性检测结果为语音信号且所述第二语音活动性检测结果为语音信号,则所述目标语音检测结果为所述目标帧信号是语音信号;如果所述第一语音活动性检测结果为语音信号且所述第二语音活动性检测结果为非语音信号,则所述目标语音检测结果为所述目标帧信号是语音信号;如果所述第一语音活动性检测结果为非语音信号且所述第二语音活动性检测结果为语音信号,则根据当前检测帧的当前检测帧信号能量确定所述目标语音检测结果;如果所述第一语音活动性检测结果为非语音信号且所述第二语音活动性检测结果为非语音信号,则所述目标语音检测结果为所述目标帧信号是非语音信号。8.一种语音检测装置,其特征在于,包括:信号获取模块,用于获取待检测信号,确定所述待检测信号对应的全频谱值;第一结果确定模块,用于根据所述全频谱值确定所述待检测信号的偏值平坦度,根据所述偏值平坦度确定所述待检测信号的第一语音活动性检测结果;第二结果确定模块,用于对所述待检测信号进行语音活动检测,得到第二语音活动性检测结果;目标结果确定模块,用于根据所述第一语音活动性检测结果与所述第二语音活动性检测结果确定所述待检测信号的目标语音检测结果。9.一种电子设备,其特征在于,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至7中任意一项所述的语音检测方法。10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的语音检测方法。

技术总结
本公开的实施方式提供了一种语音检测方法、装置、介质及电子设备,涉及语音识别技术领域。该方法包括:获取待检测信号,确定待检测信号对应的全频谱值;根据全频谱值确定待检测信号的偏值平坦度,根据偏值平坦度确定待检测信号的第一语音活动性检测结果;对待检测信号进行语音活动检测,得到第二语音活动性检测结果;根据第一语音活动性检测结果与第二语音活动性检测结果确定待检测信号的目标语音检测结果。本公开可以检测出待检测信号中是否包含语音,可以有效提高语音活动性检测过程中语音命中率和非语音命中率。命中率和非语音命中率。命中率和非语音命中率。


技术研发人员:王志强 阮良 陈功 陈丽
受保护的技术使用者:杭州网易智企科技有限公司
技术研发日:2021.08.23
技术公布日:2021/10/8
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜