语音识别方法、装置、电子设备和存储介质与流程

2021-07-13 16:21:00 来源：中国专利 TAG：电子设备语音装置语音识别方法

技术特征：

1.一种语音识别方法，其特征在于，包括：

确定用户的待识别语音；

基于预设状态转移路径，对所述待识别语音进行语音识别解码，得到语音识别结果；所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。

2.根据权利要求1所述的语音识别方法，所述基于预设状态转移路径，对所述待识别语音进行语音识别解码，包括：

确定所述待识别语音对应的音素序列；

基于上一解码位置对应的预设状态转移路径，对当前解码位置处的音素序列进行解码，得到当前解码位置处的解码结果。

3.根据权利要求1所述的语音识别方法，所述预设状态转移路径是基于如下步骤扩充的：

确定与所述用户的地域信息相关联的地域名词；

基于各地域名词扩充解码网络中地名对应的预设状态转移路径。

4.根据权利要求2所述的语音识别方法，所述预设状态转移路径是基于如下步骤扩充的：

基于所述用户的历史输入信息，确定当前解码位置处的音素序列对应的相似热词；

基于所述相似热词，扩展上一解码位置对应的预设状态转移路径。

5.根据权利要求4所述的语音识别方法，所述基于所述用户的历史输入信息，确定当前解码位置处的音素序列对应的相似热词，包括：

基于当前解码位置处的音素序列以及预先构建的发音相似矩阵，确定当前解码位置处的音素序列对应的相似音素序列；

基于所述用户的各个热词，确定与当前解码位置处的音素序列和/或所述相似音素序列对应的相似热词；所述热词是基于所述历史输入信息确定的。

6.根据权利要求1至5任一项所述的语音识别方法，其特征在于，所述基于预设状态转移路径，对所述待识别语音进行语音识别解码，包括：

基于语言模型，结合所述预设状态转移路径，对所述待识别语音进行语音识别解码；

其中，所述语言模型与所述用户当前使用的设备类型对应；任一设备类型对应的语言模型是基于所述任一设备类型的应用场景文本训练得到的。

7.根据权利要求1至5任一项所述的语音识别方法，其特征在于，所述基于预设状态转移路径，对所述待识别语音进行语音识别解码，包括：

确定所述用户的声纹特征；

基于所述预设状态转移路径，结合所述待识别语音的音频特征和所述用户的声纹特征，对所述待识别语音进行语音识别解码。

8.一种语音识别装置，其特征在于，包括：

语音数据确定单元，用于确定用户的待识别语音；

语音识别解码单元，用于基于预设状态转移路径，对所述待识别语音进行语音识别解码，得到语音识别结果；所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述语音识别方法的步骤。

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述语音识别方法的步骤。

技术总结
本发明提供一种语音识别方法、装置、电子设备和存储介质，其中方法包括：确定用户的待识别语音；基于预设状态转移路径，对所述待识别语音进行语音识别解码，得到语音识别结果；所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。本发明提供的语音识别方法、装置、电子设备和存储介质，基于当前用户的地域信息和/或历史输入信息动态扩充解码网络中的预设状态转移路径，从而基于扩充后的预设状态转移路径对该用户的待识别语音进行语音识别解码，利用该用户的个性化信息，提升了个性化语音识别的准确性，且动态扩充预设状态转移路径的方式，增强了实用性。

技术研发人员：方昕;刘俊华;潘志兵;周传福
受保护的技术使用者：科大讯飞股份有限公司
技术研发日：2021.04.29
技术公布日：2021.07.13

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种音频处理方法、设备及可读存储介质与流程

语音识别方法、装置、电子设备和存储介质与流程

相关文章

最热文献