模型的训练方法、语音识别方法、装置、介质及设备与流程

2021-09-07 23:22:00 来源：中国专利 TAG：方法介质装置模型语音识别

技术特征：
1.一种语音识别模型的训练方法，所述语音识别模型包括编码器、预测子模型、语言解码器以及符号解码器，其特征在于，所述方法包括：根据所述编码器和所述预测子模型，获得训练语音数据对应的字符声学向量，其中，每一所述字符声学向量对应于所述训练语音数据的一个预测字符；根据所述字符声学向量和所述语音解码器，获得所述预测字符对应的输出文本和语言特征向量；根据所述字符声学向量、所述语言特征向量和所述符号解码器，确定所述预测字符对应的符号概率分布；根据所述符号概率分布和所述训练语音数据中所述预测字符对应的目标符号特征，确定目标损失；在满足更新条件的情况下，根据所述目标损失对所述语音识别模型的模型参数进行更新。2.根据权利要求1所述的方法，其特征在于，所述目标符号特征为独热编码特征，所述根据所述符号概率分布和所述训练语音数据中所述预测字符对应的目标符号特征，确定目标损失，包括：根据所述符号概率分布和所述预测字符对应的目标符号特征，确定交叉熵损失；将确定出的所述交叉熵损失作为所述目标损失。3.根据权利要求2所述的方法，其特征在于，所述根据所述目标损失对所述语音识别模型的模型参数进行更新，包括：根据所述目标损失对所述语音识别模型中、所述符号解码器的模型参数进行更新。4.根据权利要求1所述的方法，其特征在于，所述目标符号特征为独热编码特征，所述根据所述符号概率分布和所述训练语音数据中所述预测字符对应的目标符号特征，确定目标损失，包括：根据所述符号概率分布和所述预测字符对应的目标符号特征，确定第一交叉熵损失；根据所述预测字符对应的目标文本与所述输出文本，确定所述语言解码器对应的第二交叉熵损失；根据所述第一交叉熵损失和所述第二交叉熵损失确定所述目标损失。5.根据权利要求1
‑
4中任一项所述的方法，其特征在于，通过以下方式确定所述训练语音数据对应的文本中每一字符对应的符号特征：获取所述训练语音数据对应的包含标点符号的文本数据；针对所述文本数据中的每一字符，若该字符后相邻存在标点符号，则将该标点符号作为该字符对应的标注符号；若该字符后相邻未存在标点符号，则将预设符号作为该字符对应的标注符号；针对所述文本数据中的每一字符，根据该字符对应的标注符号与符号空间，生成该字符对应的符号特征。6.一种语音识别方法，其特征在于，所述方法包括：接收待识别的语音数据；根据所述语音数据和语音识别模型，确定所述语音数据对应的待添加的符号和识别文本，其中，所述语音识别模型是基于权利要求1
‑
5中任一项所述的语音识别模型的训练方法
进行训练获得的；在所述待添加的符号为目标符号的情况下，根据所述待添加的符号和所述识别文本生成所述待识别的语音数据对应的文本结果。7.一种语音识别模型的训练装置，所述语音识别模型包括编码器、预测子模型、语言解码器以及符号解码器，其特征在于，所述装置包括：第一处理模块，用于根据所述编码器和所述预测子模型，获得训练语音数据对应的字符声学向量，其中，每一所述字符声学向量对应于所述训练语音数据的一个预测字符；第二处理模块，用于根据所述字符声学向量和所述语音解码器，获得所述预测字符对应的输出文本和语言特征向量；第一确定模块，用于根据所述字符声学向量、所述语言特征向量和所述符号解码器，确定所述预测字符对应的符号概率分布；第二确定模块，用于根据所述符号概率分布和所述训练语音数据中所述预测字符对应的目标符号特征，确定目标损失；更新模块，用于在满足更新条件的情况下，根据所述目标损失对所述语音识别模型的模型参数进行更新。8.一种语音识别装置，其特征在于，所述装置包括：接收模块，用于接收待识别的语音数据；第三确定模块，用于根据所述语音数据和语音识别模型，确定所述语音数据对应的待添加的符号和识别文本，其中，所述语音识别模型是基于权利要求1
‑
5中任一项所述的语音识别模型的训练方法进行训练获得的；生成模块，用于在所述待添加的符号为目标符号的情况下，根据所述待添加的符号和所述识别文本生成所述待识别的语音数据对应的文本结果。9.一种计算机可读介质，其上存储有计算机程序，其特征在于，该程序被处理装置执行时实现权利要求1
‑
6中任一项所述方法的步骤。10.一种电子设备，其特征在于，包括：存储装置，其上存储有计算机程序；处理装置，用于执行所述存储装置中的所述计算机程序，以实现权利要求1
‑
6中任一项所述方法的步骤。

技术总结
本公开涉及一种模型的训练方法、语音识别方法、装置、介质及设备，所述语音识别模型包括编码器、预测子模型、语言解码器以及符号解码器，所述方法包括：根据所述编码器和所述预测子模型，获得训练语音数据对应的字符声学向量；根据所述字符声学向量和所述语音解码器，获得所述预测字符对应的输出文本和语言特征向量；根据所述字符声学向量、所述语言特征向量和所述符号解码器，确定所述预测字符对应的符号概率分布；根据所述符号概率分布和所述训练语音数据中所述预测字符对应的目标符号特征，确定目标损失；在满足更新条件的情况下，根据所述目标损失对所述语音识别模型的模型参数进行更新。由此可以提高语音识别和符号识别的准确性和实时性。的准确性和实时性。的准确性和实时性。

技术研发人员：董林昊梁镇麟蔡猛马泽君
受保护的技术使用者：北京有竹居网络技术有限公司
技术研发日：2021.06.30
技术公布日：2021/9/6

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

模型的训练方法、语音识别方法、装置、介质及设备与流程

相关文章

最热文献