语音识别方法及装置、电子设备、计算机可读存储介质与流程

2021-12-01 00:42:00 来源：中国专利 TAG：

技术特征：
1.一种语音识别方法，其特征在于，包括：生成目标唤醒词对应的唤醒词声学词典和唤醒词语言字典，其中，所述目标唤醒词包含自定义唤醒词；基于所述唤醒词声学词典和所述唤醒词语言字典生成解码图；利用所述解码图对目标语音进行逐帧解码，得到语音识别结果。2.根据权利要求1所述的方法，其特征在于，在生成目标唤醒词对应的唤醒词声学词典和唤醒词语言字典之前，所述方法还包括：生成第一映射表，所述第一映射表包含汉字与该汉字的至少一个拼音之间的映射关系；其中，生成所述第一映射表，包括：使用第一分词工具对预定文本进行分词处理，得到分词结果；利用拼音生成工具为所述分词结果进行拼音标注，得到第二映射表，所述第二映射表包含词语与该词语的至少一个拼音之间的映射关系；对所述第二映射表进行解析，得到第三映射表，所述第三映射表包含所述词语中每一个字与该每一个字的至少一个拼音之间的映射关系；按照预定组合方式对所述第三映射表进行组合，得到所述第一映射表。3.根据权利要求2所述的方法，其特征在于，生成目标唤醒词对应的唤醒词声学词典，包括：获取所述目标唤醒词；利用第二分词工具对所述目标唤醒词进行分词处理，得到多个子词；对所述多个子词按照所述第一映射表进行处理，得到第四映射表，所述第四映射表包含所述多个子词中每一个子词与该每一个子词的至少一个拼音之间的映射关系；将所述第四映射表与所述第一映射表进行融合，得到所述唤醒词声学词典。4.根据权利要求2所述的方法，其特征在于，生成目标唤醒词对应的唤醒词语言字典，包括：对所述第二映射表中的汉字进行去重处理，得到汉字字典；对目标唤醒词进行分词处理，得到多个子词，并对所述多个子词进行去重处理，得到剩余子词；将所述剩余子词与所述汉字字典进行组合，得到所述唤醒词语言字典。5.根据权利要求1所述的方法，其特征在于，基于所述唤醒词声学词典和所述唤醒词语言字典生成解码图，包括：将所述唤醒词声学词典与预置词典进行融合，得到融合后的声学词典；将所述唤醒词语言字典与预置语言字典进行融合，得到融合后的语言字典；将所述融合后的声学词典和所述融合后的语言字典输入至解码图生成工具，利用所述解码图生成工具对所述融合后的声学词典和所述融合后的语言字典进行处理，得到所述解码图。6.根据权利要求1至5中任一项所述的方法，其特征在于，利用所述解码图对目标语音进行逐帧解码，得到语音识别结果，包括：获取所述目标语音对应的音频流；对所述音频流进行特征提取，得到目标声学特征；
基于声学模型确定与所述目标声学特征对应的音素信息序列，其中，所述声学模型为基于声学特征进行音素识别的模型；利用所述解码图对所述音素信息序列进行处理，得到所述语音识别结果。7.根据权利要求6所述的方法，其特征在于，在利用所述解码图对目标语音进行逐帧解码，得到语音识别结果之后，所述方法还包括：在确定所述语音识别结果中存在所述目标唤醒词时，唤醒所述目标唤醒词对应的设备。8.一种语音识别装置，其特征在于，包括：第一生成模块，用于生成目标唤醒词对应的唤醒词声学词典和唤醒词语言字典，其中，所述目标唤醒词包含自定义唤醒词；第二生成模块，用于基于所述唤醒词声学词典和所述唤醒词语言字典生成解码图；解码模块，用于利用所述解码图对目标语音进行逐帧解码，得到语音识别结果。9.一种电子设备，其特征在于，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任意一项所述的语音识别方法。10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的语音识别方法。

技术总结
本发明公开了一种语音识别方法及装置、电子设备、计算机可读存储介质。其中，该方法包括：生成目标唤醒词对应的唤醒词声学词典和唤醒词语言字典，其中，目标唤醒词为自定义唤醒词；基于唤醒词声学词典和唤醒词语言字典生成解码图；利用解码图对目标语音进行逐帧解码，得到语音识别结果。本发明解决了相关技术中进行语音识别的方式可靠性较低的技术问题。行语音识别的方式可靠性较低的技术问题。行语音识别的方式可靠性较低的技术问题。

技术研发人员：李泽轩
受保护的技术使用者：广东优碧胜科技有限公司
技术研发日：2021.10.19
技术公布日：2021/11/30

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：信息处理装置、信息处理方法和程序与流程

语音识别方法及装置、电子设备、计算机可读存储介质与流程

相关文献

最热文献