一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于噪声抑制的语音检测方法、装置、存储介质以及终端与流程

2021-10-22 21:58:00 来源:中国专利 TAG:语音 终端 噪声 抑制 检测方法

技术特征:
1.一种基于噪声抑制的语音检测方法,其特征在于,所述方法包括:获取语音信号,提取所述语音信号中的短时能频值序列;判断所述语音信号中的背景噪声是否发生改变,若所述背景噪声发生改变,则重新计算背景噪声;其中,所述重新计算背景噪声包括:对所述语音信号进行建模,并获取所述语音信号的语音噪声概率;根据所述语音噪声概率得到所述语音信号的噪声估计值;对所述噪声估计值基于最小均方误差准则进行最优估计,并输出噪声抑制信号;根据所述噪声抑制信号更新短时能频值序列,以及输出语音端点检测结果。2.根据权利要求1所述的方法,其特征在于,所述对所述语音信号进行建模,并获取所述语音信号的语音噪声概率,包括:针对所述语音信号建立高斯模型,并根据所述高斯模型得到所述语音噪声概率,所述语音噪声概率满足以下关系:p(h
k,m
)=p(h|y
k
(m),{f})αp(y
k
(m)|h,{f})q
k,m
(h|{f})p({f});其中,所述语音信号的语音状态为h
k,m
=h
1k,m
,噪声状态为噪声输入频谱系数为y
k
(m),语音信号的特征数据为{f},语音帧为m,语音频率为k。3.根据权利要求2所述的方法,其特征在于,所述根据语音噪声概率得到所述语音信号的噪声估计值,包括:根据所述语音噪声概率执行所述语音信号的噪声估计更新,所述噪声估计值以及所述噪声估计更新满足以下关系:其中,是帧/时间为m,频率槽为k时对噪声频谱量级的估计,参数γ
n
为控制噪声更新的平滑度。4.根据权利要求3所述的方法,其特征在于,所述对所述噪声估计值基于最小均方误差准则进行最优估计,并输出噪声抑制信号,包括:将所述噪声估计值输入标准维纳滤波器进行最优估计,其中所述标准维纳滤波器满足以下关系:其中是所述噪声估计更新得出的噪声频谱系数;获取所述标准维纳滤波器输出最优估计值,所述最优估计是满足以下关系:使用反向dft将所述最优估计值转换成时域,得到所述语音信号经过所述标准维纳滤波抑制后最优估计得到的语音信号,所述最优估计得到的语音信号满足以下关系:输出所述最优估计得到的语音信号。
5.根据权利要求1所述的方法,其特征在于,所述获取语音信号,提取所述语音信号中的短时能频值序列之前,还包括:获取语音信号,以及解析音频文件并提取数字采样值,得到音频采样序列;对获取到的所述音频采样序列进行带通滤波。6.根据权利要求5所述的方法,其特征在于,所述对获取到的所述音频采样序列进行带通滤波之后,还包括:将所述音频采样序列分成预定长度的帧,并形成一个帧序列;针对所述帧序列中的每一帧数据提取短时能量、短时过零率和短时信息熵三个音频特征参数。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:根据所述音频特征参数计算所述帧序列中的每一帧数据的短时能频值,并形成一个短时能频值序列;从所述帧序列中的第一帧数据开始,分析所述短时能频值序列,得到一对语音起点和终点。8.一种基于噪声抑制的语音检测装置,其特征在于,所述装置包括:短时能频值序列获取模块,用于获取语音信号,提取所述语音信号中的短时能频值序列;噪声抑制模块,用于判断所述语音信号中的背景噪声是否发生改变,若所述背景噪声发生改变,则重新计算背景噪声;其中,所述重新计算背景噪声包括:对所述语音信号进行建模,并获取所述语音信号的语音噪声概率;根据所述语音噪声概率得到所述语音信号的噪声估计值;对所述噪声估计值基于最小均方误差准则进行最优估计,并输出噪声抑制信号;检测结果输出模块,用于根据噪声抑制信号更新短时能频值序列,以及输出语音端点检测结果。9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行如权利要求1~7任意一项的所述方法的步骤。10.一种终端,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1~7任一项所述方法的步骤。

技术总结
本申请公开了一种基于噪声抑制的语音检测方法、装置、存储介质以及终端,涉及语音检测领域。获取语音信号,提取语音信号中的短时能频值序列;判断语音信号中的背景噪声是否发生改变,若背景噪声发生改变,则重新计算背景噪声;其中,重新计算背景噪声包括:对语音信号进行建模,并获取语音信号的语音噪声概率;根据语音噪声概率得到语音信号的噪声估计值;对噪声估计值基于最小均方误差准则进行最优估计,并输出噪声抑制信号;根据噪声抑制信号更新短时能频值序列,以及输出语音端点检测结果。当检测到语音信号中的背景噪声发生改变后,可以通过语音信号进行相关处理,输出噪声抑制信号,有效提高了检测语音端点的精确率。有效提高了检测语音端点的精确率。有效提高了检测语音端点的精确率。


技术研发人员:汤志淼
受保护的技术使用者:宇龙计算机通信科技(深圳)有限公司
技术研发日:2020.04.10
技术公布日:2021/10/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜