一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音识别和更新方法、装置、设备和存储介质与流程

2022-02-24 13:16:39 来源:中国专利 TAG:

技术特征:
1.一种语音识别方法,包括:将语音信号输入声学模型进行处理,以输出所述语音信号的第一发音单元;将所述第一发音单元输入语言模型进行处理,以输出所述语音信号的第一识别文本;若所述第一识别文本为错误文本,将所述第一发音单元和所述语音信号的正确文本作为所述语言模型的训练样本,所述训练样本用以更新所述语言模型。2.根据权利要求1所述的方法,还包括:若再次接收到所述语音信号,将所述输入所述声学模型进行处理,以输出所述语音信号的第二发音单元;基于所述第二发音单元和更新后的语言模型,获取所述语音信号的第二识别文本。3.根据权利要求2所述的方法,其中,所述基于所述第二发音单元和更新后的语言模型,获取所述语音信号的第二识别文本,包括:将所述第二发音单元输入所述更新后的语言模型进行处理,以获取所述更新后的语言模型输出的所述第二识别文本。4.根据权利要求2所述的方法,其中,更新所述语言模型时还确定文本间的映射关系,所述基于所述第二发音单元和更新后的语言模型,获取所述语音信号的第二识别文本,包括:将所述第二发音单元输入所述更新后的语言模型进行处理,以获取所述更新后的语言模型的输出文本;基于所述文本间的映射关系,将所述输出文本映射为所述第二识别文本。5.一种更新方法,包括:基于训练样本,获取更新后的语言模型,所述训练样本包括语音信号的发音单元以及正确文本,所述语音信号为语音识别错误的语音信号;对所述更新后的语言模型进行测试处理,以获取测试输出文本;基于所述测试输出文本,确定更新后的信息,所述更新后的信息包括:所述更新后的语言模型。6.根据权利要求5所述的方法,其中,所述测试处理的输入为测试语音信号,所述基于所述测试输出文本,确定更新后的信息,包括:若所述测试输出文本是所述测试语音信号的正确文本,将所述更新后的语言模型作为所述更新后的信息;或者,若所述测试输出文本不是所述测试语音信号的正确文本,建立所述测试输出文本与所述测试语音信号的正确文本之间的文本映射关系,将所述更新后的语言模型和所述文本映射关系作为所述更新后的信息。7.一种语音识别装置,包括:第一处理模块,用于将语音信号输入声学模型进行处理,以输出所述语音信号的第一发音单元;第二处理模块,用于将所述第一发音单元输入语言模型进行处理,以输出所述语音信号的第一识别文本;确定模块,用于若所述第一识别文本为错误文本,将所述第一发音单元和所述语音信号的正确文本作为所述语言模型的训练样本,所述训练样本用以更新所述语言模型。
8.根据权利要求7所述的装置,还包括:第三处理模块,用于若再次接收到所述语音信号,将所述语音信号输入所述声学模型进行处理,以输出所述语音信号的第二发音单元;获取模块,用于基于所述第二发音单元和更新后的语言模型,获取所述语音信号的第二识别文本。9.根据权利要求8所述的装置,其中,所述获取模块具体用于:将所述第二发音单元输入所述更新后的语言模型进行处理,以获取所述更新后的语言模型输出的所述第二识别文本。10.根据权利要求8所述的装置,其中,更新所述语言模型时还确定文本间的映射关系,所述获取模块具体用于:将所述第二发音单元输入所述更新后的语言模型进行处理,以获取所述更新后的语言模型的输出文本;基于所述文本间的映射关系,将所述输出文本映射为所述第二识别文本。11.一种更新装置,包括:训练模块,用于基于训练样本,获取更新后的语言模型,所述训练样本包括语音信号的发音单元以及正确文本,所述语音信号为语音识别错误的语音信号;测试模块,用于对所述更新后的语言模型进行测试处理,以获取测试输出文本;确定模块,用于基于所述测试输出文本,确定更新后的信息,所述更新后的信息包括:所述更新后的语言模型。12.根据权利要求11所述的装置,其中,所述测试处理的输入为测试语音信号,所述确定模块具体用于:若所述测试输出文本是所述测试语音信号的正确文本,将所述更新后的语言模型作为所述更新后的信息;或者,若所述测试输出文本不是所述测试语音信号的正确文本,建立所述测试输出文本与所述测试语音信号的正确文本之间的文本映射关系,将所述更新后的语言模型和所述文本映射关系作为所述更新后的信息。13.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。14.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。

技术总结
本公开提供了一种语音识别和更新方法、装置、设备和存储介质,涉及计算机技术领域,具体涉及语音识别、深度学习等人工智能领域。语音识别方法包括:将语音信号输入声学模型进行处理,以输出所述语音信号的第一发音单元;将所述第一发音单元输入语言模型进行处理,以输出所述语音信号的第一识别文本;若所述第一识别文本为错误文本,将所述第一发音单元和所述语音信号的正确文本作为所述语言模型的训练样本,所述训练样本用以更新所述语言模型。本公开可以提高语音识别纠错的速度。开可以提高语音识别纠错的速度。开可以提高语音识别纠错的速度。


技术研发人员:王常刚 蒋正翔
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2021.11.08
技术公布日:2022/2/23
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献