一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种语音识别方法、语音识别装置、电子设备及存储介质与流程

2022-02-21 04:09:12 来源:中国专利 TAG:

技术特征:
1.一种语音识别方法,其特征在于,所述方法包括:获取当前语音识别场景下的多个语音数据;所述多个语音数据包括多个语音采集器采集的所述当前语音识别场景下的多个对象的语音数据;所述多个语音采集器位于所述当前语音识别场景中的不同位置;基于所述多个语音数据,生成与多个对象中的每一对象关联的目标语音数据;所述每一对象关联的目标语音数据来源于所述多个语音数据中的至少两个语音数据;基于多个所述目标语音数据生成语音识别结果,并输出所述语音识别结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个语音数据,生成与多个对象中的每一对象关联的目标语音数据,包括:将所述多个语音数据中的每一语音数据进行分割,得到所述每一语音数据分割后的每一子语音数据集合;所述每一子语音数据集合包括多段语音数据;获取所述每一子语音数据集合关联的多个声纹特征;基于所述每一子语音数据集合和所述每一子语音数据集合关联的多个声纹特征,生成所述每一对象关联的目标语音数据。3.根据权利要求2所述的方法,其特征在于,所述基于所述每一子语音数据集合和所述每一子语音数据集合关联的多个声纹特征,生成所述每一对象关联的目标语音数据,包括:确定多个所述子语音数据集合中具有同一声纹特征且具有同一时间戳的多个子语音数据;从所述多个子语音数据中确定目标子语音数据,得到同一声纹特征关联的多个目标子语音数据;基于所述多个目标子语音数据以及所述多个目标子语音数据对应的时间戳,生成所述每一对象关联的目标语音数据。4.根据权利要求3所述的方法,其特征在于,所述目标子语音数据为所述多个子语音数据中具有最大振幅的语音数据。5.根据权利要求1至3中任一项所述的方法,其特征在于,所述基于所述目标语音数据生成语音识别结果之前,所述方法还包括:获取所述多个语音采集器在所述当前语音识别场景中的第一位置信息;相应的,所述基于多个所述目标语音数据生成语音识别结果,还包括:基于所述第一位置信息和多个所述目标语音数据,确定所述多个对象中每一对象在所述当前语音识别场景中的第二位置信息;基于多个所述第二位置信息和多个所述目标语音数据,生成语音识别结果。6.根据权利要求5所述的方法,其特征在于,所述基于多个所述第二位置信息和多个所述目标语音数据,生成语音识别结果,包括:对多个所述目标语音数据进行语音情感识别,得到多个第一识别结果;获取多个所述目标语音数据关联的多个目标文本数据;对多个所述目标文本数据进行语义识别,得到多个第二识别结果;基于多个所述第一识别结果、多个所述第二识别结果、多个所述目标文本数据和多个所述第二位置信息,生成所述语音识别结果。7.根据权利要求6所述的方法,其特征在于,所述基于多个所述第一识别结果、多个所
述第二识别结果、多个所述目标文本数据和多个所述第二位置信息,生成所述语音识别结果,包括:基于每一对象关联的所述第一识别结果和每一对象关联的所述第二识别结果,提取每一对象关联的所述目标文本数据的特征信息;基于每一对象关联的特征信息和每一对象关联的所述第二位置信息,生成方位语音图;所述语音识别结果包括所述方位语音图。8.一种语音识别装置,其特征在于,所述装置包括:获取单元,用于获取当前语音识别场景下的多个语音数据;所述多个语音数据包括多个语音采集器采集的所述当前语音识别场景下的多个对象的语音数据;所述多个语音采集器位于所述当前语音识别场景中的不同位置;第一处理单元,用于基于所述多个语音数据,生成与多个对象中的每一对象关联的目标语音数据;所述每一对象关联的目标语音数据来源于所述多个语音数据中的至少两个语音数据;第二处理单元,用于基于多个所述目标语音数据生成语音识别结果,并输出所述语音识别结果。9.一种电子设备,其特征在于,所述电子设备包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令,实现如权利要求1至7中任一项所述的语音识别方法。10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至7中任一项所述的语音识别方法。

技术总结
本申请公开了一种语音识别方法、语音识别装置,电子设备及存储介质,所述方法包括:获取当前语音识别场景下的多个语音数据;多个语音数据包括多个语音采集器采集的当前语音识别场景下的多个对象的语音数据;多个语音采集器位于当前语音识别场景中的不同位置;基于多个语音数据,生成与多个对象中的每一对象关联的目标语音数据;每一对象关联的目标语音数据来源于多个语音数据中的至少两个语音数据;基于多个目标语音数据生成语音识别结果,并输出语音识别结果;如此,无需人为的分析语音数据,减少了语音数据的计算量,保证了语音分析结果的准确度。准确度。准确度。


技术研发人员:姜雪婷
受保护的技术使用者:中国移动通信集团有限公司
技术研发日:2020.07.20
技术公布日:2022/1/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献