一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种语音识别方法、装置、电子设备及存储介质与流程

2023-01-05 22:01:10 来源:中国专利 TAG:

技术特征:
1.一种语音识别方法,其特征在于,包括:从待识别的发言语音中提取声纹特征;根据所述声纹特征,判断所述发言语音对应的第一发言人是否具有语音转写权限;如果所述发言语音对应的第一发言人具有语音转写权限,则对所述发言语音进行语音识别处理,得到所述第一发言人的发言文本。2.根据权利要求1所述的方法,其特征在于,所述根据所述声纹特征,判断所述发言语音对应的第一发言人是否具有语音转写权限,包括:根据所述声纹特征,从声纹库中确定所述第一发言人的身份信息;根据预设的语音转写权限表和所述第一发言人的身份信息,判断所述第一发言人是否具有语音转写权限;其中,所述预设的语音转写权限表记录有多个发言人的语音转写权限。3.根据权利要求2所述的方法,其特征在于,所述声纹库通过以下方式获得:获取预设的多个发言人语音样本信息;分别提取所述多个发言人的语音样本信息中的声纹特征;基于所述语音样本信息中的声纹特征与所述多个发言人的身份信息之间的对应关系,构建所述声纹库。4.根据权利要求1所述的方法,其特征在于,还包括:确定所述第一发言人的文本查阅标识信息,所述文本查阅标识信息包括其他人查阅所述第一发言人的发言文本的权限信息;基于所述第一发言人的文本查阅标识信息,设置所述第一发言人的发言文本的查阅权限。5.根据权利要求4所述的方法,其特征在于,还包括:获得第二发言人的发言文本,其中,所述第一发言人和所述第二发言人的发言文本的查阅权限相同;确定所述第一发言人的发言文本与所述第二发言人的发言文本之间的文本相似度;在所述文本相似度大于预设的相似度阈值的情况下,将所述第一发言人的发言文本和所述第二发言人的发言文本进行合并,获得合并后的发言文本。6.根据权利要求1所述的方法,其特征在于,所述对所述发言语音进行语音识别处理,得到所述第一发言人的发言文本,包括:根据所述第一发言人的声纹特征,从预设的个性化转写资源库中检索对应所述第一发言人的个性化转写模型;所述个性化转写模型通过对具有特定语音特点的语音进行识别训练得到,所述第一发言人的发言语音具有所述特定语音特点;如果从预设的个性化转写资源库中检索到对应所述第一发言人的个性化转写模型,则通过所述个性化转写模型对所述第一发言人的发言语音进行语音识别处理,得到所述第一发言人的发言文本。7.根据权利要求6所述的方法,其特征在于,对应所述第一发言人的个性化转写模型通过对所述第一发言人的发言语音进行语音识别训练得到。8.根据权利要求1所述的方法,其特征在于,还包括:判断是否获得针对所述第一发言人的语音转写权限的调整指令;其中,如果获得针对所述第一发言人的语音转写权限的调整指令,则根据所述调整指
令,调整所述第一发言人的语音转写权限。9.一种语音识别装置,其特征在于,包括:提取单元,用于从待识别的发言语音中提取声纹特征;判断单元,用于根据所述声纹特征,判断所述发言语音对应的第一发言人是否具有语音转写权限;识别单元,用于如果所述发言语音对应的第一发言人具有语音转写权限,则对所述发言语音进行语音识别处理,得到所述第一发言人的发言文本。10.一种电子设备,其特征在于,包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于通过运行所述存储器中的指令,执行上述权利要求1-8任意一项所述的语音识别方法。11.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器运行时,执行上述权利要求1-8中任意一项所述的语音识别方法。

技术总结
本申请提供一种语音识别方法、装置、电子设备及存储介质,其中,所述语音识别方法,包括:从待识别的发言语音中提取声纹特征;根据所述声纹特征,判断所述发言语音对应的第一发言人是否具有语音转写权限;如果所述发言语音对应的第一发言人具有语音转写权限,则对所述发言语音进行语音识别处理,得到所述第一发言人的发言文本。该方案能够灵活决策是否对发言人的发言语音进行语音识别处理,从而提高了语音识别的灵活度,有利于缓解语音识别资源紧张和识别资源浪费的问题。和识别资源浪费的问题。和识别资源浪费的问题。


技术研发人员:朱菊霞 万根顺 孔常青 熊世富 潘嘉 刘聪
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:2022.09.13
技术公布日:2022/11/29
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献