一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音唤醒方法、电子设备和存储介质与流程

2022-03-09 06:54:20 来源:中国专利 TAG:

技术特征:
1.一种语音唤醒方法,包括:持续缓存用户音频流,判断所述用户音频流是否能够触发唤醒;响应于所述用户音频流触发唤醒,将自触发唤醒的时间点回退第一预设时间间隔后得到的回退音频流发送给语音活性检测模块进行语音活性检测,其中,所述语音活性检测模块在检测到第二预设时间间隔的非人声后结束检测;在所述语音活性检测模块检测的同时实时将所述回退音频流发送至服务器端进行识别得到第一识别结果;判断所述第一识别结果中是否包含除唤醒词之外的其他人声;若所述第一识别结果中包含除唤醒词之外的其他人声,进入oneshot模式,其中,所述oneshot模式为响应唤醒词和命令词一起连说的模式。2.根据权利要求1所述的方法,其中,在所述判断所述第一识别结果中是否包含除唤醒词之外的其他人声之后,所述方法还包括:若所述第一识别结果中不包含除唤醒词之外的其他人声,进入非oneshot模式。3.根据权利要求1所述的方法,其中,所述服务器端返回的所述第一识别结果中不包含唤醒词,所述判断所述第一识别结果中是否包含除唤醒词之外的其他人声包括:判断所述第一识别结果是否为空。4.根据权利要求3所述的方法,其中,所述若所述第一识别结果中包含除唤醒词之外的其他人声,进入oneshot模式包括:若所述第一识别结果不为空,进入oneshot模式。5.根据权利要求3所述的方法,其中,在所述判断所述第一识别结果是否为空之后,所述方法还包括:若所述第一识别结果为空,进入非oneshot模式。6.根据权利要求1-3中任一项所述的方法,其中,在所述若所述第一识别结果中包含除唤醒词之外的其他人声,进入oneshot模式之后,所述方法还包括:获取当前的oneshot交互模式,其中,所述oneshot交互模式包括继续监听和播报欢迎语。7.根据权利要求6所述的方法,其中,在所述获取当前的oneshot交互模式之后,所述方法还包括:若所述oneshot交互模式为继续监听,则将所述用户音频流中未进行语音活性检测的后续音频流继续发送至所述语音活性检测模块进行检测,并同时将所述后续音频流发送至所述服务器进行识别得到第二识别结果;基于所述第二识别结果对所述用户音频流进行响应。8.根据权利要求6所述的方法,其中,在所述获取当前的oneshot交互模式之后,所述方法还包括:若所述oneshot交互模式为播放欢迎语,则播放欢迎语。9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。

技术总结
本发明公开语音唤醒方法、电子设备和存储介质,其中,一种语音唤醒方法,包括:持续缓存用户音频流,判断所述用户音频流是否能够触发唤醒;响应于用户音频流触发唤醒,将自触发唤醒的时间点回退第一预设时间间隔后得到的回退音频流发送给语音活性检测模块进行语音活性检测;在语音活性检测模块检测的同时实时将回退音频流发送至服务器端进行识别得到第一识别结果;判断第一识别结果中是否包含除唤醒词之外的其他人声;若第一识别结果中包含除唤醒词之外的其他人声,进入oneshot模式。通过在语音活性检测模块检测的同时实时将回退音频流发送至服务器端进行识别得到第一识别结果,从而可以实现精准的判断是否进入oneshot模式。式。式。


技术研发人员:邓建凯 陈家欢 甘津瑞 俞凯
受保护的技术使用者:思必驰科技股份有限公司
技术研发日:2021.12.21
技术公布日:2022/3/8
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献