技术特征:
1.一种基于增强型声纹库的语音身份确定方法,其特征在于,所述语音身份确定方法,包括:
获取待查询语音;
从所述待查询语音中提取待鉴定用户的第一声纹特征向量、第一关键字特征向量以及第一主题特征向量;
分别将所述第一声纹特征向量、所述第一关键字特征向量以及所述第一主题特征向量与增强型声纹库中每个候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量进行比对,确定所述待鉴定用户与每个候选用户之间的语音相似度;
将语音相似度位于前预设位的候选用户,确定为目标用户;
按照所述目标用户的唯一身份标识对应的原始语音存储地址,获取所述目标用户的原始语音,并将所述原始语音发送给鉴定人员,以供所述鉴定人员基于所述原始语音确定所述待鉴定用户的身份信息。
2.根据权利要求1所述的语音身份确定方法,其特征在于,通过以下步骤构建增强型声纹库:
获取多个候选用户的至少一条原始语音;
针对于每个候选用户,从该候选用户的至少一条原始语音中提取出该候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量;
通过该候选用户的唯一身份标识绑定该候选用户的第二声纹特征向量、第二关键字特征向量、第二主题特征向量以及该候选用户的原始语音存储地址;
基于每个候选用户的第二声纹特征向量、第二关键字特征向量、第二主题特征向量、原始语音存储地址以及唯一身份标识,构建增强型声纹库。
3.根据权利要求2所述的语音身份确定方法,其特征在于,通过以下步骤提取每个候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量:
针对于每个候选用户,利用预先训练好的声纹特征提取模型,对该候选用户的至少一条原始语音进行声纹特征提取,确定出至少一个候选声纹特征向量,对确定出的至少一个候选声纹特征向量进行均值处理,将进行均值处理后得到的声纹特征向量作为该候选用户的第二声纹特征向量;
利用预先训练好的语音内容识别模型,对该候选用户的至少一条原始语音进行文本识别提取,得到至少一个文本内容,利用预先建立好的关键字词库对至少一个文本内容进行关键字提取,确定出至少一个候选关键字特征向量,并求取确定出的至少一个候选关键字特征向量的并集,将求取完并集得到的关键字特征向量作为该候选用户的第二关键字特征向量;
基于确定出的至少一个文本内容,利用预先训练好的主题抽取模型,对确定出的至少一个文本内容进行主题抽取,确定出至少一个候选主题特征向量,并求取确定出的至少一个候选主题特征向量的并集,将求取完并集得到的主题特征向量作为该候选用户的第二主题特征向量。
4.根据权利要求1所述的语音身份确定方法,其特征在于,所述分别将所述第一声纹特征向量、所述第一关键字特征向量以及所述第一主题特征向量与增强型声纹库中每个候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量进行比对,确定所述待鉴定用户与每个候选用户之间的语音相似度,包括:
针对于每个候选用户,基于所述第一声纹特征向量和该候选用户的第二声纹特征向量,计算所述待鉴定用户与该候选用户之间的声纹相似度;
基于所述第一关键字特征向量和该候选用户的第二关键字特征向量,计算所述待鉴定用户与该候选用户之间的关键字相似度;
基于所述第一主题特征向量和该候选用户的第二主题特征向量,计算所述待鉴定用户与该候选用户之间的主题相似度;
基于所述声纹相似度、预设声纹权重、所述关键字相似度、预设关键字权重、所述主题相似度以及预设主题权重,计算所述待鉴定用户与该候选用户之间的语音相似度。
5.根据权利要求4所述的语音身份确定方法,其特征在于,通过以下公式计算所述待鉴定用户与每个候选用户之间的语音相似度:
其中,pi为待鉴定用户与第i个候选用户的语音相似度,s函数为余弦相似度计算函数;
当k为0时,w0为预设声纹权重,
当k为1时,w1为预设关键字权重,
当k为2时,w2为预设主题权重,
6.根据权利要求1所述的语音身份确定方法,其特征在于,所述将语音相似度位于前预设位的候选用户,确定为目标用户,包括:
将确定出的所述待鉴定用户与每个候选用户之间的语音相似度,按照降序排列,得到语音相似度序列;
将所述语音相似度序列中语音相似度位于前预设位的候选用户,确定为目标用户。
7.一种基于增强型声纹库的语音身份确定系统,其特征在于,所述语音身份确定系统,包括:
获取模块,用于获取待查询语音;
特征提取模块,用于从所述待查询语音中提取待鉴定用户的第一声纹特征向量、第一关键字特征向量以及第一主题特征向量;
语音相似度确定模块,用于分别将所述第一声纹特征向量、所述第一关键字特征向量以及所述第一主题特征向量与增强型声纹库中每个候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量进行比对,确定所述待鉴定用户与每个候选用户之间的语音相似度;
目标用户确定模块,用于将语音相似度位于前预设位的候选用户,确定为目标用户;
身份确定模块,用于按照所述目标用户的唯一身份标识对应的原始语音存储地址,获取所述目标用户的原始语音,并将所述原始语音发送给鉴定人员,以供所述鉴定人员基于所述原始语音确定所述待鉴定用户的身份信息。
8.根据权利要求7所述的语音身份确定系统,其特征在于,所述语音身份确定系统还包括声纹库构建模块,所述声纹库构建模块用于:
获取多个候选用户的至少一条原始语音;
针对于每个候选用户,从该候选用户的至少一条原始语音中提取出该候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量;
通过该候选用户的唯一身份标识绑定该候选用户的第二声纹特征向量、第二关键字特征向量、第二主题特征向量以及该候选用户的原始语音存储地址;
基于每个候选用户的第二声纹特征向量、第二关键字特征向量、第二主题特征向量、原始语音存储地址以及唯一身份标识,构建增强型声纹库。
9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7任一所述基于增强型声纹库的语音身份确定方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述基于增强型声纹库的语音身份确定方法的步骤。
技术总结
本申请提供了一种基于增强型声纹库的语音身份确定方法及系统。获取待查询语音;分别将待查询语音的第一声纹特征向量、第一关键字特征向量以及第一主题特征向量与增强型声纹库中每个候选用户的第二声纹特征向量、第二关键字特征向量以及第二主题特征向量进行比对,确定待鉴定用户与每个候选用户之间的语音相似度;将语音相似度位于前预设位的候选用户,确定为目标用户;并将目标用户的原始语音发送给鉴定人员,以供所述鉴定人员基于原始语音确定待鉴定用户的身份信息。这样,本申请在对待查询语音进行身份确定时,充分使用了语音数据中的声纹特征、关键字特征以及主题特征进行语音特征比对,从而可以提高查询比对的命中率以及识别效率。
技术研发人员:白世杰;吴富章;赵宇航;王秋明
受保护的技术使用者:北京远鉴信息技术有限公司
技术研发日:2021.05.08
技术公布日:2021.06.18
本文用于企业家、创业者技术爱好者查询,结果仅供参考。