一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

声纹识别方法、装置以及电子设备与流程

2022-04-27 13:20:10 来源:中国专利 TAG:

技术特征:
1.一种声纹识别方法,其特征在于,所述方法包括:获取待识别语音;通过声纹模型获取所述待识别语音对应的第一声纹特征;通过识别模型获取所述第一声纹特征对应的第二声纹特征,其中,所述识别模型为基于指定训练数据进行训练得到,所述指定训练数据至少包括基于源域声纹特征以及目标域的声纹特征所得到的自适应声纹特征,其中,所述自适应声纹特征所属域为所述目标域,所述目标域与所述待识别语音所属域相同或相似;将所述第二声纹特征与注册声纹特征进行比对,以进行身份匹配识别,其中,所述注册声纹特征为预先通过所述识别模型得到。2.根据权利要求1所述的方法,其特征在于,所述获取待识别语音之前,还包括:获取所述源域声纹特征和所述目标域的声纹特征,其中,所述源域声纹特征对应的域与所述目标域不同;基于所述源域声纹特征和所述目标域的声纹特征,得到自适应声纹特征;基于所述自适应声纹特征对待训练分类模型进行训练,以得到所述识别模型。3.根据权利要求2所述的方法,其特征在于,所述基于所述源域声纹特征和所述目标域的声纹特征,得到自适应声纹特征,包括:基于所述目标域的声纹特征,获取目标域的主要声纹特征;基于所述目标域的主要声纹特征将所述源域声纹特征转换为所述自适应声纹特征。4.根据权利要求3所述的方法,其特征在于,所述基于所述目标域的声纹特征,获取目标域的主要声纹特征,包括:基于所述目标域的声纹特征,获取目标域协方差矩阵;对所述目标域协方差矩阵进行特征值分解,以得到目标域特征值对角矩阵;基于所述目标域特征值对角矩阵,获取所述目标域的主要声纹特征。5.根据权利要求4所述的方法,其特征在于,所述目标域的声纹特征对应有多个维度,所述基于所述目标域特征值对角矩阵,获取所述目标域的主要声纹特征,包括:基于所述目标域特征值对角矩阵,得到所述目标域的声纹特征对应的多个维度的特征值;对所述多个维度的特征值进行规范化处理,得到多个规范化特征值;将所述多个规范化特征值中的非关键规范化特征值替换为第一阈值,以得到目标域的主要声纹特征,其中,非关键规范化特征值小于所述第一阈值。6.根据权利要求5所述的方法,其特征在于,所述对所述多个维度的特征值进行规范化处理,得到多个规范化特征值,包括:通过零-均值规范化对所述多个维度的特征值进行规范化处理,得到多个规范化特征值。7.根据权利要求3所述的方法,其特征在于,所述基于所述目标域的主要声纹特征将所述源域声纹特征转换为自适应声纹特征,包括:基于所述目标域的主要声纹特征生成目标域正则协方差矩阵;基于所述源域声纹特征生成源域正则协方差矩阵;基于所述源域正则协方差矩阵与所述源域声纹特征,得到白化源域声纹特征;
基于所述目标域正则协方差矩阵与所述白化源域声纹特征,得到所述自适应声纹特征。8.根据权利要求2所述的方法,其特征在于,所述获取源域声纹特征和目标域的声纹特征,包括:获取源域音频数据和目标域音频数据;将所述源域音频数据输入所述声纹模型,以得到所述源域声纹特征;将所述目标域音频数据输入所述声纹模型,以得到所述目标域的声纹特征。9.一种声纹识别装置,其特征在于,所述装置包括:语音获取单元,用于获取待识别语音;第一声纹特征获取单元,用于通过声纹模型获取所述待识别语音对应的第一声纹特征;第二声纹特征获取单元,用于通过识别模型获取所述第一声纹特征对应的第二声纹特征,其中,所述识别模型为基于指定训练数据进行训练得到,所述指定训练数据至少包括基于源域声纹特征以及目标域的声纹特征所得到的自适应声纹特征,其中,所述目标域与所述待识别语音所属域相同或相似;声纹比对单元,用于将所述第二声纹特征与注册声纹特征进行比对,以进行身份匹配识别,其中,所述注册声纹特征为预先通过所述识别模型得到。10.一种电子设备,其特征在于,包括一个或多个处理器以及存储器;一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行权利要求1-8任一所述的方法。11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码运行时执行权利要求1-8任一所述的方法。

技术总结
本申请实施例公开了一种声纹识别方法、装置以及电子设备。该方法包括:获取待识别语音;通过声纹模型获取待识别语音对应的第一声纹特征;通过识别模型获取第一声纹特征对应的第二声纹特征,其中,识别模型为基于指定训练数据进行训练得到,指定训练数据至少包括基于源域声纹特征以及目标域的声纹特征所得到的自适应声纹特征,其中,目标域与待识别语音所属域相同或相似;将第二声纹特征与预先通过识别模型得到的注册声纹特征进行比对,以进行身份匹配识别。通过上述方式使得,可以基于源域声纹特征以及目标域的声纹特征所得到的的自适应声纹特征对识别模型进行训练,从而可以提高识别模型的准确率。识别模型的准确率。识别模型的准确率。


技术研发人员:李亚桐 黎荣晋
受保护的技术使用者:深圳市声扬科技有限公司
技术研发日:2022.03.10
技术公布日:2022/4/26
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献