一种语音识别方法及装置与流程

2021-06-11 21:44:00 来源：中国专利 TAG：语音识别装置方法

技术特征：

1.一种语音识别方法，其特征在于，应用于智能音箱，所述方法包括：

获取用户输入的待处理语句，所述待处理语句包括唤醒语句和指令语句；

基于预先构建的酒店知识注意力模型对所述唤醒语句进行处理，得到所述唤醒语句的语义向量，所述酒店知识注意力模型是利用历史唤醒语句训练基于注意力机制的长短期记忆lstm网络得到的；

基于预先构建的客需服务注意力模型对所述指令语句进行处理，得到所述指令语句的语义向量，所述客需服务注意力模型是利用历史指令语句训练基于注意力机制的长短期记忆lstm网络得到的；

将所述唤醒语句的语义向量和所述指令语句的语义向量输入误唤醒识别模型，基于所述误唤醒识别模型对所述唤醒语句的语义向量和所述指令语句的语义向量进行处理，输出所述待处理语句对应的误唤醒数值，所述误唤醒识别模型是利用历史唤醒语句和历史指令语句训练lstm网络得到的；

在确定所述误唤醒数值大于预设的误唤醒限值时，确定所述待处理语句有误唤醒语句。

2.根据权利要求1所述的方法，其特征在于，在所述基于预先构建的酒店知识注意力模型对所述唤醒语句进行处理，得到所述唤醒语句的语义向量之前，还包括：

对所述唤醒语句进行分词处理，并将所述唤醒语句的分词转换成所述唤醒语句对应的词向量，其中，每一唤醒语句存在至少一个分词；

对所述指令语句进行分词处理，并将所述指令语句的分词转换成所述指令语句对应的词向量，其中，每一指令语句存在多个分词。

3.根据权利要求2所述的方法，其特征在于，所述基于预先构建的酒店知识注意力模型对所述唤醒语句进行处理，得到所述唤醒语句的语义向量，包括：

所述预先构建的酒店知识注意力模型对所述醒语句对应的词向量进行编码；

根据所述编码后的唤醒语句的词向量和酒店知识库向量，确定每一所述词向量的权重，所述酒店知识库向量是利用历史酒店业务数据对应的知识库进行处理得到的；

基于所述每一所述词向量的权重和所述编码后的唤醒语句的词向量，确定所述唤醒语句的语义向量。

4.根据权利要求2所述的方法，其特征在于，所述基于预先构建的客需服务注意力模型对所述指令语句进行处理，得到所述指令语句的语义向量，包括：

所述预先构建的客需服务注意力模型对所述指令语句对应的词向量进行编码；

根据所述编码后的指令语句的词向量和客需服务数据向量，确定每一所述词向量的权重，所述客需服务数据向量是利用历史客需服务数据进行处理得到的；

基于所述每一所述词向量的权重和所述编码后的指令语句的词向量，确定所述指令语句的语义向量。

5.根据权利要求1所述的方法，其特征在于，所述将所述唤醒语句的语义向量和所述指令语句的语义向量输入误唤醒识别模型，基于所述误唤醒识别模型对所述唤醒语句的语义向量和所述指令语句的语义向量进行处理，输出所述待处理语句对应的误唤醒数值，包括：

将所述唤醒语句的语义向量和所述指令语句的语义向量进行拼接，并将拼接后的所述唤醒语句的语义向量和所述指令语句的语义向量输入误唤醒识别模型；

所述误唤醒识别模型对所述拼接后的所述唤醒语句的语义向量和所述指令语句的语义向量进行分类处理，输出所述待处理语句对应的误唤醒数值。

6.一种语音识别装置，其特征在于，应用于智能音箱，所述装置包括：

获取模块，用于获取用户输入的待处理语句，所述待处理语句包括唤醒语句和指令语句；

酒店知识注意力模型，用于基于预先构建的酒店知识注意力模型对所述唤醒语句进行处理，得到所述唤醒语句的语义向量，所述酒店知识注意力模型是利用历史唤醒语句训练基于注意力机制的长短期记忆lstm网络得到的；

客需服务注意力模型，用于基于预先构建的客需服务注意力模型对所述指令语句进行处理，得到所述指令语句的语义向量，所述酒店知识注意力模型是利用历史指令语句训练基于注意力机制的长短期记忆lstm网络得到的；

误唤醒识别模型，用于将所述唤醒语句的语义向量和所述指令语句的语义向量输入误唤醒识别模型，基于所述误唤醒识别模型对所述唤醒语句的语义向量和所述指令语句的语义向量进行处理，输出所述待处理语句对应的误唤醒数值，所述误唤醒识别模型是利用历史唤醒语句和历史指令语句训练lstm网络得到的；

确定模块，用于在确定所述误唤醒数值大于预设的误唤醒限值时，确定所述待处理语句有误唤醒语句。

7.根据权利要求6所述的装置，其特征在于，还包括：

分词向量模块，用于在所述基于预先构建的酒店知识注意力模型对所述唤醒语句进行处理，得到所述唤醒语句的语义向量之前，对所述唤醒语句进行分词处理，并将所述唤醒语句的分词转换成所述唤醒语句对应的词向量，其中，每一唤醒语句存在至少一个分词；对所述指令语句进行分词处理，并将所述指令语句的分词转换成所述指令语句对应的词向量，其中，每一指令语句存在多个分词。

8.根据权利要求7所述的装置，其特征在于，所述酒店知识注意力模型具体用于：对所述醒语句对应的词向量进行编码；根据所述编码后的唤醒语句的词向量和酒店知识库向量，确定每一所述词向量的权重，所述酒店知识库向量是利用历史酒店业务数据对应的知识库进行处理得到的；基于所述每一所述词向量的权重和所述编码后的唤醒语句的词向量，确定所述唤醒语句的语义向量。

9.根据权利要求7所述的装置，其特征在于，所述客需服务注意力模型具体用于：对所述指令语句对应的词向量进行编码；根据所述编码后的指令语句的词向量和客需服务数据向量，确定每一所述词向量的权重，所述客需服务数据向量是利用历史客需服务数据进行处理得到的；基于所述每一所述词向量的权重和所述编码后的指令语句的词向量，确定所述指令语句的语义向量。

10.根据权利要求6所述的装置，其特征在于，所述误唤醒识别模型具体用于：将所述唤醒语句的语义向量和所述指令语句的语义向量进行拼接，并将拼接后的所述唤醒语句的语义向量和所述指令语句的语义向量输入误唤醒识别模型；所述误唤醒识别模型对所述拼接后的所述唤醒语句的语义向量和所述指令语句的语义向量进行分类处理，输出所述待处理语句对应的误唤醒数值。

技术总结
本发明提供一种语音识别方法及装置，应用于智能音箱，包括获取用户输入的待处理语句；基于预先构建的酒店知识注意力模型对唤醒语句进行处理，得到唤醒语句的语义向量；基于预先构建的客需服务注意力模型对指令语句进行处理，得到指令语句的语义向量；基于误唤醒识别模型对唤醒语句的语义向量和指令语句的语义向量进行处理，输出待处理语句对应的误唤醒数值；在误唤醒数值大于预设的误唤醒限值时，确定待处理语句为误唤醒语句。本方案通过酒店知识注意力模型、客需服务注意力模型和误唤醒识别模型，确定待处理语句存在误唤醒的概率。能够避免智能音箱出现误唤醒的情况，从而提高用户的的住宿体验。

技术研发人员：郭俊廷;张献涛;暴筱;林小俊;支涛
受保护的技术使用者：北京云迹科技有限公司
技术研发日：2021.01.27
技术公布日：2021.06.11

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：端到端的在线语音检测与识别方法、系统及设备与流程

一种语音识别方法及装置与流程

相关文章

最热文献