一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音识别方法、装置、电子设备及存储介质与流程

2022-12-31 16:13:54 来源:中国专利 TAG:

技术特征:
1.一种语音识别方法,其特征在于,包括:获取待识别音频;将所述待识别音频输入第一语音识别模型中确定识别结果,所述第一语音识别模型是基于目标语言的伪标签数据训练得到的,所述第一语音识别模型所支持的识别语言包括所述目标语言,所述伪标签数据是通过所述目标语言的第二语音识别模型对所述目标语言的无标注数据预测得到的。2.根据权利要求1所述的方法,其特征在于,所述第一语音识别模型的确定方式包括:获取所述目标语言的伪标签数据以及所述目标语言的标注数据;基于所述目标语言的伪标签数据对第一预设语音识别模型进行训练,确定第一预训练模型;基于所述目标语言的标注数据对所述第一预训练模型的参数进行调整,以确定所述第一语音识别模型。3.根据权利要求2所述的方法,其特征在于,所述第一语音识别模型的确定方式还包括:获取其他语言的标签数据,所述标签数据包括所述其他语言的伪标签数据和/或所述其他语言的标注数据;基于所述其他语言的标签数据训练所述第一预设语音识别模型,以确定所述第一语音识别模型。4.根据权利要求2所述的方法,其特征在于,所述获取所述目标语言的伪标签数据,包括:获取伪标签数据的存储位置,所述存储位置中存储有至少一种语言的伪标签数据,所述至少一种语言的伪标签数据是通过与所述至少一种语言一一对应的第二语音识别模型预测得到的;基于所述目标语言的标识,从所述存储位置中提取所述目标语言的伪标签数据。5.根据权利要求4所述的方法,其特征在于,所述目标语言的伪标签数据的确定方式包括:获取所述目标语言的第二语音识别模型,所述第二语音识别模型包括声学模型以及语言模型;将所述目标语言的无标注数据输入所述第二语音识别模型中,以利用所述声学模型以及语言模型进行解码,确定所述目标语言的伪标签数据。6.根据权利要求5所述的方法,其特征在于,所述声学模型的确定方式包括:获取所述目标语言的无标注样本数据以及样本标注数据;基于所述无标注样本数据对预设声学模型进行预训练,得到第二预训练模型;基于所述样本标注数据对所述第二预训练模型的参数进行调整,确定所述声学模型。7.根据权利要求5所述的方法,其特征在于,所述语言模型是基于所述目标语言的文本数据训练得到的。8.一种语音识别装置,其特征在于,包括:获取模块,用于获取待识别音频;识别模块,用于将所述待识别音频输入第一语音识别模型中确定识别结果,所述第一
语音识别模型是基于目标语言的伪标签数据训练得到的,所述第一语音识别模型所支持的识别语言包括所述目标语言,所述伪标签数据是通过所述目标语言的第二语音识别模型对所述目标语言的无标注数据预测得到的。9.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-7中任一项所述的语音识别方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使计算机执行权利要求1-7中任一项所述的语音识别方法。

技术总结
本公开涉及计算机处理技术领域,具体涉及语音识别方法、装置、电子设备及存储介质,该方法包括获取待识别音频;将所述待识别音频输入第一语音识别模型中确定识别结果,所述第一语音识别模型是基于目标语言的伪标签数据训练得到的,所述第一语音识别模型所支持的识别语言包括所述目标语言,所述伪标签数据是通过所述目标语言的第二语音识别模型对所述目标语言的无标注数据预测得到的。由于伪标签数据是事先利用第二语音识别模型得到的,通过该伪标签数据能够实现第二语音识别模型与第一语音识别模型之间的迁移,达到继承效果。同时,伪标签数据能够解决目标语言的标注数据有限的问题,使得训练得到的第一语音识别模型具有较高的识别准确性。的识别准确性。的识别准确性。


技术研发人员:陈智鹏 叶圣泽 孙健 何怡 马泽君
受保护的技术使用者:北京有竹居网络技术有限公司
技术研发日:2022.10.13
技术公布日:2022/12/30
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献