一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种语音识别方法、装置和用于语音识别的装置与流程

2021-06-29 19:42:00 来源:中国专利 TAG:装置 语音识别 用于 计算机 方法

技术特征:
1.一种语音识别方法,其特征在于,所述方法包括:获取待识别语音;根据已训练的语音识别模型,确定所述待识别语音对应的语音识别结果;其中,所述语音识别模型根据符合预设语流规则的语音样本训练得到,所述语流规则至少包括如下任意一种:失爆、连读、加音、同化、省音、弱读、浊化。2.根据权利要求1所述的方法,其特征在于,所述根据已训练的语音识别模型,确定所述待识别语音对应的语音识别结果之前,所述方法还包括:收集历史语音;对所述历史语音对应的识别文本按照音素展开,得到所述历史语音对应的音素序列;在所述历史语音中,确定语音样本,所述语音样本对应的音素序列符合所述预设语流规则;根据所述语音样本,训练得到语音识别模型。3.根据权利要求2所述的方法,其特征在于,所述在所述历史语音中,确定语音样本,包括:对所述历史语音中的每一条语音对应的音素序列进行解析,确定音素序列符合所述预设语流规则的目标语音;对所述目标语音进行口语评测,确定所述目标语音对应的音素序列中目标音素对应的声学后验概率;其中,所述目标音素为符合所述预设语流规则的音素;确定目标音素对应的声学后验概率小于预设概率阈值的目标语音为语音样本。4.根据权利要求3所述的方法,其特征在于,所述确定所述目标语音对应的音素序列中目标音素对应的声学后验概率之后,所述方法还包括:确定目标音素对应的声学后验概率大于或等于所述预设概率阈值的目标语音为待处理语音;对所述待处理语音进行音频处理,得到处理后语音,所述处理后语音中所述目标音素的发音符合所述预设语流规则;将所述处理后语音作为用于训练所述语音识别模型的语音样本。5.根据权利要求4所述的方法,其特征在于,所述对所述待处理语音进行音频处理,得到处理后语音,包括:将所述待处理语音中所述目标音素对应的语音片段替换为目标语音片段,得到处理后语音;其中,所述目标语音片段为对所述目标音素按照所述目标音素对应的预设语流规则进行发音得到的语音片段。6.根据权利要求5所述的方法,其特征在于,所述预设语流规则包括失爆的语流规则;所述目标语音片段为预设长度的静音片段;其中,所述预设长度为将所述待处理语音中目标音素对应的语音片段的时间长度缩短至一定比例的长度。7.根据权利要求2所述的方法,其特征在于,所述在所述历史语音中,确定语音样本,包括:在所述历史语音中,确定对应的音素序列符合失爆的语流规则的历史语音为语音样本,所述失爆的语流规则包括失去爆破的语流规则和/或不完全爆破的语流规则;所述根据所述语音样本,训练得到语音识别模型,包括:
根据对应的音素序列符合所述失去爆破的语流规则的第一语音样本和/或对应的音素序列符合所述不完全爆破的语流规则的第二语音样本,训练得到语音识别模型。8.一种语音识别装置,其特征在于,所述装置包括:语音获取模块,用于获取待识别语音;语音识别模块,用于根据已训练的语音识别模型,确定所述待识别语音对应的语音识别结果;其中,所述语音识别模型根据符合预设语流规则的语音样本训练得到,所述语流规则至少包括如下任意一种:失爆、连读、加音、同化、省音、弱读、浊化。9.一种用于语音识别的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取待识别语音;根据已训练的语音识别模型,确定所述待识别语音对应的语音识别结果;其中,所述语音识别模型根据符合预设语流规则的语音样本训练得到,所述语流规则至少包括如下任意一种:失爆、连读、加音、同化、省音、弱读、浊化。10.一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至7中一个或多个所述的语音识别方法。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文章

  • 日榜
  • 周榜
  • 月榜