语音交互方法、装置及语音芯片模组与流程

2021-11-24 20:57:00 来源：中国专利 TAG：

技术特征：
1.一种语音交互方法，包括：接收音频输入；获取所述音频输入的文本识别信息；判断未获取到新识别的文本识别信息的时间是否大于第一时长；若未获取到新识别的文本识别信息的时间大于第一时长，则判定语音输入结束。2.根据权利要求1所述的方法，还包括：检测接收到的音频输入中是否存在语音；判断未检测到语音的时间是否大于第二时长；若未检测到语音的时间大于第二时长，则判定语音输入结束。3.根据权利要求1所述的方法，还包括：判断未接收到新的音频输入的时间是否大于第三时长；若未接收到新的音频输入的时间大于第三时长，则判定语音输入结束。4.根据权利要求1所述的方法，其中，获取所述音频输入的文本识别信息的步骤包括：将所述音频输入上传至服务器；接收服务器返回的文本识别信息，其中，所述文本识别信息是由所述服务器对所述音频输入进行语义识别得到的。5.根据权利要求1所述的方法，还包括：在判定语音输入结束的情况下，执行与所述文本识别信息对应的操作指令。6.根据权利要求1所述的方法，还包括：判断所述音频输入是否为高噪音场景中采集得到的音频数据；在判定所述音频输入是高噪音场景中采集得到的情况下，通过判断未获取到新识别的文本识别信息的时间是否大于第一时长，判定语音输入是否结束。7.根据权利要求6所述的方法，其中，判断所述音频输入是否为高噪音场景中采集得到的音频数据的步骤包括：基于预设的高噪音场景音频数据，判断所述音频输入是否为高噪音场景中采集得到的音频数据。8.一种应用于跑步机的语音交互方法，包括：采集跑步机处于运行状态中的音频输入；将所述音频输入上传至服务器；接收服务器返回的所述音频输入的文本识别信息；判断未获取到新识别的文本识别信息的时间是否大于第一时长；若未获取到新识别的文本识别信息的时间大于第一时长，则判定语音输入结束。9.一种应用于集成灶的语音交互方法，包括：采集集成灶处于运行状态中的音频输入；将所述音频输入上传至服务器；接收服务器返回的所述音频输入的文本识别信息；判断未获取到新识别的文本识别信息的时间是否大于第一时长；若未获取到新识别的文本识别信息的时间大于第一时长，则判定语音输入结束。10.一种适于部署在设备中的语音芯片模组，包括：
通信模块，用于将所述设备的麦克风检测到的音频输入上传至服务器，并接收所述服务器返回的文本识别信息，所述文本识别信息是由所述服务器对所述音频输入进行语义识别得到的；语音活动结束判断模块，用于判断未获取到新识别的文本识别信息的时间是否大于第一时长，若未获取到新识别的文本识别信息的时间大于第一时长，则判定语音输入结束。11.根据权利要求10所述的语音芯片模组，还包括：语音活动检测模块，用于检测所述音频输入中是否存在语音，若所述语音活动检测模块未检测到语音，则所述语音活动判断模块判定语音输入结束，若所述语音活动检测模块检测到语音，且所述通信模块超过第一时长未获取到新的文本识别信息，则所述语音活动判断模块判定语音输入结束。12.根据权利要求10所述的语音芯片模组，还包括：指令模块，用于在判定语音输入结束的情况下，指令所述设备执行与所述文本识别信息对应的操作指令。13.一种语音交互装置，包括：接收模块，用于接收音频输入；获取模块，用于获取所述音频输入的文本识别信息；判断模块，用于判断未获取到新识别的文本识别信息的时间是否大于第一时长，若未获取到新识别的文本识别信息的时间大于第一时长，则判定语音输入结束。14.一种计算设备，包括：处理器；以及存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如权利要求1至9中任何一项所述的方法。15.一种非暂时性机器可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求1至9中任何一项所述的方法。

技术总结
公开了一种语音交互方法、装置及语音芯片模组。接收音频输入；获取所述音频输入的文本识别信息；判断未获取到新识别的文本识别信息的时间是否大于第一时长；若未获取到新识别的文本识别信息的时间大于第一时长，则判定语音输入结束。由此，可以在不显著增加设备性能消耗的同时实现高噪音环境下的语音活动结束的判定。判定。判定。

技术研发人员：林云峰郭万永
受保护的技术使用者：阿里巴巴集团控股有限公司
技术研发日：2020.05.18
技术公布日：2021/11/23

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于DCT变换无次级路径建模有源噪声控制方法与流程

语音交互方法、装置及语音芯片模组与流程

相关文献

最热文献