一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

语音识别模型的训练方法、语音识别方法、装置和设备与流程

2021-07-16 16:15:00 来源:中国专利 TAG:例数 语音识别 方法 终端设备 装置

技术特征:
1.一种语音识别模型的训练方法,其特征在于,所述方法包括:根据目标对象的音频数据,确定语音训练样本,所述语音训练样本包括语义信息和音频特征信息;将所述语义信息和所述音频特征信息输入到语音识别模型中,对所述语音识别模型进行迭代训练,直至满足预设训练条件,得到训练后的目标语音识别模型。2.根据权利要求1所述的方法,其特征在于,所述将所述语义信息和所述音频特征信息输入到语音识别模型中,对所述语音识别模型进行迭代训练,直至满足预设训练条件,得到训练后的目标语音识别模型,包括:针对每个语音训练样本分别执行以下步骤:将所述语义信息和所述音频特征信息输入到语音识别模型中,得到所述语义信息与所述音频特征信息的相似度预测结果;根据每个所述相似度预测结果对所述语音识别模型进行调整;根据所述语音训练样本对调整后的语音识别模型进行迭代训练,直至满足预设训练条件,得到训练后的目标语音识别模型。3.根据权利要求2所述的方法,其特征在于,所述语音识别模型包括转录网络模型;所述根据目标对象的音频数据,确定语音训练样本,包括:将所述音频数据的音频特征向量输入到所述转录网络模型中,得到所述语义信息;其中,所述语音信息用于确定所述音频数据对应的文本数据。4.根据权利要求2所述的方法,其特征在于,所述语音识别模型包括预测网络模型;所述根据目标对象的音频数据,确定语音训练样本,包括:在对所述语音识别模型进行第一次训练的情况下,将预设相似度预测结果输入到所述预测网络模型中,得到所述音频特征信息;在对所述语音识别模型进行第n次训练之后的情况下,将从第n-1次训练输出的相似度预测结果输入到所述预测网络模型中,得到第n次的音频特征信息;其中,n为大于1的整数,所述音频特征信息用于确定所述目标对象的身份信息。5.根据权利要求4所述的方法,其特征在于,所述语音识别模型还包括联合网络模型;将所述语义信息和所述音频特征信息输入到语音识别模型中,得到所述语义信息与所述音频特征信息的相似度预测结果,包括:将所述语义信息和所述音频特征信息输入到所述联合网络模型中,得到包括所述音频数据的文本信息和所述目标对象的身份信息的隐藏数据;将所述隐藏数据输入到分类模型中,得到所述文本信息与所述身份信息的相似度预测结果。6.根据权利要求3所述的方法,其特征在于,所述方法还包括:根据所述目标对象的音频数据通过梅尔频率倒谱系数mfcc,确定所述音频特征向量。7.根据权利要求6所述的方法,其特征在于,所述根据所述目标对象的音频数据通过梅尔频率倒谱系数mfcc,确定所述音频特征向量,包括:获取所述目标对象的音频数据;对所述音频数据的波形图进行分帧处理,得到至少一个帧片段;对所述至少一个帧片段中的每个帧片段进行离散傅里叶变化dft,确定所述每个帧片段的功率谱;
将所述功率谱进行数据转化,得到所述音频特征向量。8.一种利用目标语音识别模型的语音识别方法,所述目标语音识别模型通过权利要求1-6任一项所述的方法而训练,其特征在于,所述方法包括:获取目标音频数据;将所述目标音频数据输入到所述目标语音识别模型中,得到对话信息;其中,所述对话信息包括:与所述目标音频数据对应的文本数据,所述文本数据携带有目标对象的身份标识。9.根据权利要求8所述的方法,其特征在于,所述获取目标音频数据,包括:对接收的音频数据进行预处理,得到所述目标音频数据;其中,所述预处理包括数据清洗和/或降噪。10.一种语音识别模型的训练装置,其特征在于,所述装置包括:处理模块,用于根据目标对象的音频数据,确定语音训练样本,所述语音训练样本包括语义信息和音频特征信息;生成模块,将所述语义信息和所述音频特征信息输入到语音识别模型中,对所述语音识别模型进行迭代训练,直至满足预设训练条件,得到训练后的目标语音识别模型。11.一种利用目标语音识别模型的语音识别装置,所述目标语音识别模型通过权利要求1所述的方法而训练,其特征在于,所述装置包括:获取模块,用于获取目标音频数据;处理模块,用于将所述目标音频数据输入到所述目标语音识别模型中,得到对话信息;其中,所述对话信息包括:与所述目标音频数据对应的文本数据,所述文本数据携带有目标对象的身份标识。12.一种终端设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7任一项所述的语音识别模型的训练方法,或者,如权利要求8-9任一项所述的利用目标语音识别模型的语音识别方法。13.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,若计算机程序在计算机中执行,则令计算机执行如权利要求1-7任一项所述的语音识别模型的训练方法,或者,如权利要求8-9任一项所述的利用语音识别模型的语音识别方法。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜