一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音识别方法、装置、设备和存储介质与流程

2021-12-12 23:55:00 来源:中国专利 TAG:

技术特征:
1.一种语音识别方法,其特征在于,包括:利用麦克风阵列获取来自至少一个位置的唤醒语音信号;对所述唤醒语音信号进行声源定位,确定唤醒语音的位置;采用停止收音的方式对其他位置的音频信号进行抑制,以得到待识别信号;所述其他位置为所述唤醒语音的位置之外的位置;对所述待识别信号进行语音识别。2.根据权利要求1所述的方法,其特征在于,对所述多路唤醒语音信号进行声源定位,确定唤醒语音的位置,包括:利用所述多路唤醒语音信号的信号能量进行声源定位,将信号能量最大的一路唤醒语音信号对应的位置确定为唤醒语音的位置。3.根据权利要求1所述的方法,其特征在于,还包括:利用波束成形的方式调整麦克风阵列的角度,以使得所述麦克风阵列朝向所述唤醒语音的位置。4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述唤醒语音的位置的麦克风接收到所述唤醒语音的位置的第一语音信号,以及其他位置的第二语音信号的情况下,还包括:利用数字信号处理器从所述第一语音信号中消除各所述第二语音信号,以得到待识别信号。5.根据权利要求1至3中任一项所述的方法,其特征在于,所述采用停止收音的方式对其他位置的音频信号进行抑制,以得到待识别信号,包括:控制所述其他位置的麦克风停止收音;接收所述唤醒语音的位置的麦克风的待识别信号。6.一种语音识别装置,其特征在于,包括:获取单元,用于利用麦克风阵列获取来自至少一个位置的多路唤醒语音信号;声源定位单元,用于对所述多路唤醒语音信号进行声源定位,确定唤醒语音的位置;抑制单元,用于采用停止收音的方式对其他位置的音频信号进行抑制,以得到待识别信号;所述其他位置为所述唤醒语音的位置之外的位置;识别单元,用于对所述待识别信号进行语音识别。7.根据权利要求6所述的装置,其特征在于,所述声源定位单元还用于利用所述多路唤醒语音信号的信号能量进行声源定位,将信号能量最大的一路唤醒语音信号对应的位置确定为唤醒语音的位置。8.根据权利要求6所述的装置,其特征在于,还包括:波束成形单元,用于利用波束成形的方式调整麦克风阵列的角度,以使得所述麦克风阵列朝向所述唤醒语音的位置。9.根据权利要求6至8中任一项所述的装置,其特征在于,在所述唤醒语音的位置的麦克风接收到所述唤醒语音的位置的第一语音信号,以及其他位置的第二语音信号的情况下,所述抑制单元包括:消除子单元,用于利用数字信号处理器从所述第一语音信号中消除各所述第二语音信号,以得到待识别信号。
10.根据权利要求6至8中任一项所述的装置,其特征在于,所述抑制单元包括:停止控制单元,用于控制所述其他位置的麦克风停止收音;第二接收子单元,用于接收所述唤醒语音的位置的麦克风的待识别信号。11.一种语音识别设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至5中任一项所述的方法。12.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5中任一项所述的方法。

技术总结
本发明实施例提出一种语音识别方法、装置、设备和存储介质。其中,所述语音识别方法可以包括:获取来自多个位置的多路唤醒语音信号;对所述多路唤醒语音信号进行声源定位,确定唤醒语音位置;对所述唤醒语音位置之外的其他位置的音频信号进行抑制,以得到待识别信号;对所述待识别信号进行语音识别。通过先确定出唤醒语音位置,可以对其他位置的音频信号进行抑制,从而保持唤醒语音位置的语音的有效性,减少其他位置的噪声信号对语音识别的影响,减少对唤醒语音位置的干扰。减少对唤醒语音位置的干扰。减少对唤醒语音位置的干扰。


技术研发人员:陈建哲 张腾飞 向伟
受保护的技术使用者:百度国际科技(深圳)有限公司
技术研发日:2019.03.11
技术公布日:2021/12/11
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献