一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据处理方法、装置、电子设备及介质与流程

2022-03-16 16:27:44 来源:中国专利 TAG:

技术特征:
1.一种数据处理方法,包括:确定与第一对象相关联的多个语音数据,其中,所述多个语音数据中的每一个语音数据具有用于标识所述第一对象的标签;以及针对所述多个语音数据中的任意一个语音数据,基于该语音数据与所述多个语音数据中的其它语音数据的相似度值,确定该语音数据是否为所述第一对象的合格语音数据。2.根据权利要求1所述的方法,其中,所述基于该语音数据与所述多个语音数据中的其它语音数据的相似度值,确定该语音数据是否为所述第一对象的合格语音数据包括:确定所述其它语音数据中与该语音数据的相似度值高于预设阈值的语音数据的数量;以及基于所述数量确定该语音数据是否为所述第一对象的合格语音数据。3.根据权利要求1或2所述的方法,其中,所述相似度值包括音色相似度值。4.根据权利要求1至3中任意一项所述的方法,其中,所述第一对象为有声文本中的一个角色。5.根据权利要求4所述的方法,其中,所述有声文本至少包括多段对白音频,所述方法还包括:确定所述多段对白音频中的每一段对白音频的角色标签,并且其中,所述确定与第一对象相关联的多个语音数据包括:针对所述多段对白音频中的每一段对白音频,响应于该对白音频的角色标签为第一对象,将该对白音频确定为与第一对象相关联的语音数据。6.根据权利要求5所述的方法,其中,所述有声文本还包括分别对应于所述多段对白音频的多个对白文本,并且其中,所述确定所述多段对白音频中的每一段对白音频的角色标签包括:针对所述多个对白文本中的每一个对白文本,对所述有声文本中该对白文本所在的文本段落执行文字识别,以得到对该对白文本的识别结果;以及基于所述多个对白文本中的每一个对白文本的识别结果,确定该对白文本所对应的对白音频的角色标签。7.根据权利要求5所述的方法,其中,所述确定所述多段对白音频中的每一段对白音频的角色标签包括:通过经过训练的语音识别模型,确定所述多段对白音频中的每一段对白音频的角色标签。8.一种数据处理装置,包括:第一确定单元,被配置用于确定与第一对象相关联的多个语音数据,其中,所述多个语音数据中的每一个语音数据具有用于标识所述第一对象的标签;以及第二确定单元,被配置用于针对所述多个语音数据中的任意一个语音数据,基于该语音数据与所述多个语音数据中的其它语音数据的相似度值,确定该语音数据是否为所述第一对象的合格语音数据。9.根据权利要求8所述的装置,其中,所述第二确定单元包括:用于确定所述其它语音数据中与该语音数据的相似度值高于预设阈值的语音数据的数量的子单元;以及用于基于所述数量确定该语音数据是否为所述第一对象的合格语音数据的子单元。
10.根据权利要求8或9所述的装置,其中,所述相似度值包括音色相似度值。11.根据权利要求8至10中任意一项所述的装置,其中,所述第一对象为有声文本中的一个角色。12.根据权利要求11所述的装置,其中,所述有声文本至少包括多段对白音频,所述装置还包括:第三确定单元,被配用用于确定所述多段对白音频中的每一段对白音频的角色标签,并且其中,所述第一确定单元还包括:用于针对所述多段对白音频中的每一段对白音频,响应于该对白音频的角色标签为第一对象,将该对白音频确定为与第一对象相关联的语音数据的子单元。13.根据权利要求12所述的装置,其中,所述有声文本还包括分别对应于所述多段对白音频的多个对白文本,并且其中,所述第三确定单元包括:用于针对所述多个对白文本中的每一个对白文本,对所述有声文本中该对白文本所在的文本段落执行文字识别,以得到对该对白文本的识别结果的子单元;以及用于基于所述多个对白文本中的每一个对白文本的识别结果,确定该对白文本所对应的对白音频的角色标签的子单元。14.根据权利要求12所述的装置,其中,所述第三确定单元包括:用于通过经过训练的语音识别模型,确定所述多段对白音频中的每一段对白音频的角色标签的子单元。15.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。17.一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现权利要求1-7中任一项所述的方法。

技术总结
本公开提供了一种数据处理方法、装置、电子设备及介质,涉及人工智能领域,尤其涉及语音技术领域。实现方案为:确定与第一对象相关联的多个语音数据,其中,多个语音数据中的每一个语音数据具有用于标识第一对象的标签;以及针对多个语音数据中的任意一个语音数据,基于该语音数据与多个语音数据中的其它语音数据的相似度值,确定该语音数据是否为第一对象的合格语音数据。的合格语音数据。的合格语音数据。


技术研发人员:李超
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2021.12.08
技术公布日:2022/3/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献