一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

角色分离方法、电子设备及计算机存储介质与流程

2022-04-16 14:05:29 来源:中国专利 TAG:

技术特征:
1.一种角色分离方法,其包括:获取目标语音数据的声源信息及声纹特征;根据所述声源信息确定与声源位置对应的至少一个候选位置;计算所述候选位置对应的角色的声纹特征与所述目标语音数据的声纹特征的相似度;根据相似度确定所述目标语音数据对应的目标角色。2.根据权利要求1所述的方法,其中,根据相似度确定所述目标语音数据对应的目标角色,包括:将所述候选位置对应的角色中,声纹特征的相似度最大的角色确定为所述目标角色。3.根据权利要求1所述的方法,其中,所述根据所述声源信息确定与声源位置对应的至少一个候选位置,包括:当所述目标语音数据的帧数大于预设帧数时,确定所述目标语音数据是否为第一个语音数据;如果所述目标语音数据不是第一个语音数据,则根据所述声源信息确定与声源位置对应的至少一个候选位置;否则,根据所述目标语音数据的声源信息生成新的位置作为候选位置。4.根据权利要求3所述的方法,其中,所述如果所述目标语音数据不是第一个语音数据,则根据所述声源信息确定与声源位置对应的至少一个候选位置,包括:如果所述目标语音数据不是第一个语音数据,根据所述声源信息计算所述目标语音数据相对于方位最接近的位置的方位变化差值;如果所述方位变化差值大于预设变化差值,则将已经存在的位置确定为候选位置;否则,将方位最接近的位置确定为所述候选位置。5.根据权利要求3所述的方法,其中,所述根据相似度确定所述目标语音数据对应的目标角色,包括:如果所述目标语音数据不是第一个语音数据,根据所述声源信息计算所述目标语音数据相对于方位最接近的位置的方位变化差值;如果所述方位变化差值小于等于预设变化差值,且所述相似度大于预设相似度,将所述相似度对应的角色确定为所述目标角色;如果所述方位变化差值小于等于所述预设变化差值,且所述相似度小于等于预设相似度,则计算所述候选位置所在区域内的其他位置对应的声纹特征与所述目标语音数据的声纹特征的相似度,将相似度大于所述预设相似度的声纹特征对应的角色确定为所述目标角色。6.根据权利要求5所述的方法,其中,所述方法还包括:如果对于所述候选位置所在区域内的其他位置,声纹特征的相似度均小于等于所述预设相似度,则计算其他区域内的位置对应的声纹特征与所述目标语音数据的声纹特征的相似度,将相似度大于所述预设相似度的声纹特征对应的角色确定为所述目标角色;如果其他区域内的位置对应的声纹特征的相似度均小于等于所述预设相似度,则为所述目标语音数据生成新的角色作为所述目标角色。7.根据权利要求3所述的方法,其中,所述方法还包括:当所述目标语音数据的帧数小于等于所述预设帧数时,根据所述声源信息的历史语音
数据确定与所述目标语音数据方位最接近的候选语音数据;计算所述目标语音数据与所述候选语音数据之间的方位差,如果所述方位差小于预设阈值,则将所述候选语音数据对应的角色确定为所述目标角色。8.根据权利要求1所述的方法,其中,所述方法还包括:记录所述目标角色与相似度最高的声纹特征的候选位置的对应关系;根据所述对应关系,判断所述目标角色对应的多个目标语音数据中的候选位置是否发生了变化;若发生了变化,则根据所述变化确定所述目标角色的位置变化信息。9.一种角色分离方法,其包括:获取目标语音数据的声源信息及声纹特征;确定所述声源信息所指示的声源位置所属的空间分区,并确定所述空间分区中与所述声源位置对应的至少一个候选位置;其中,所述空间分区为所述目标语音数据对应的发言人所处物理空间被按照预设角度进行空间划分后形成的多个空间区域中的一个;计算所述候选位置对应的角色的声纹特征与所述目标语音数据的声纹特征的相似度;根据相似度确定所述目标语音数据对应的目标角色。10.根据权利要求9所述的方法,其中,所述确定所述空间分区中与所述声源位置对应的至少一个候选位置,包括:判断所述空间分区中是否具有与所述声源位置对应的候选位置;若具有,则将所述候选位置确定为所述空间分区中与所述声源位置对应的候选位置;若不具有,则根据所述声源位置,在所述空间分区中建立候选位置。11.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-10中任一项所述的角色分离方法对应的操作。12.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-10中任一所述的角色分离方法。

技术总结
本申请实施例提供了一种角色分离方法、电子设备及计算机存储介质,其中,角色分离方法包括:获取目标语音数据的声源信息及声纹特征;根据所述声源信息确定与声源位置对应的至少一个候选位置;计算所述候选位置对应的角色的声纹特征与所述目标语音数据的声纹特征的相似度;根据相似度确定所述目标语音数据对应的目标角色。通过本申请实施例,提高了角色分离的准确性。离的准确性。离的准确性。


技术研发人员:琚炜
受保护的技术使用者:阿里巴巴达摩院(杭州)科技有限公司
技术研发日:2022.01.10
技术公布日:2022/4/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献