一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于双曲线空间的声纹识别方法及系统与流程

2022-05-11 14:59:49 来源:中国专利 TAG:

技术特征:
1.一种基于双曲线空间的声纹识别方法,其特征在于,所述方法包括:获取待识别的声纹信息进行预处理,得到第一声纹信息;提取所述第一声纹信息的特征,得到第一特征;将所述第一特征与预设的协方差矩阵相乘,得到目标特征;根据预设的双曲线空间模型,计算所述目标特征和预设的声纹识别特征之间的相似度;根据所述目标特征和预设的声纹识别特征之间的相似度输出声纹识别结果。2.根据权利要求1所述的一种基于双曲线空间的声纹识别方法,其特征在于,获取待识别的声纹信息进行预处理,得到第一声纹信息,包括:获取时域的语音信号作为待识别的声纹信息,对所述待识别的声纹信息进行预加重处理,得到第一预处理声纹信息;对所述第一预处理声纹信息进行分帧处理,得到第二预处理声纹信息;对所述第二预处理声纹信息的每帧语音信号进行加窗,得到第三预处理声纹信息;对所述第三预处理声纹信息进行快速傅里叶变换,得到第一声纹信息。3.根据权利要求2所述的一种基于双曲线空间的声纹识别方法,其特征在于,提取所述第一声纹信息的特征,得到第一特征,包括:使用mel滤波器对所述第一声纹信息进行滤波,得到mel域频谱;所述mel滤波器为高斯滤波器;对mel域频谱取log对数,然后进行离散余弦变换,得到第一特征。4.根据权利要求1所述的一种基于双曲线空间的声纹识别方法,其特征在于,在将所述第一特征与预设的协方差矩阵相乘,得到目标特征之前,所述方法还包括:获取多个待训练的声纹信息进行预处理,得到第二声纹信息;提取所述第二声纹信息的特征,作为声纹识别特征;针对每一声纹识别特征,计算该声纹识别特征的协方差矩阵。5.根据权利要求4所述的一种基于双曲线空间的声纹识别方法,其特征在于,所述双曲线空间模型为庞加莱球型模型{x∈r
n
| ||x||<1},其中r
n
表示n维欧式空间,||x||表示欧氏距离;根据预设的双曲线空间模型,计算所述目标特征和预设的声纹识别特征之间的相似度,包括:获取所述目标特征和预设的声纹识别特征在欧式空间的坐标;根据所述庞加莱球型模型的空间距离公式计算所述目标特征和预设的声纹识别特征之间的相似度;所述庞加莱球型模型的空间距离公式为其中u和v分别表示所述目标特征和预设的声纹识别特征在欧式空间的坐标。6.一种基于双曲线空间的声纹识别系统,其特征在于,包括第一预处理模块、声纹特征提取模块、sof模块、双曲线空间模型和结果输出模块;所述第一预处理模块,用于获取待识别的声纹信息并进行预处理,得到第一声纹信息;
所述声纹特征提取模块,用于提取所述第一声纹信息的特征,得到第一特征;所述sof模块,用于将所述第一特征与预设的协方差矩阵相乘,得到目标特征;所述双曲线空间模型,用于根据预设的双曲线空间模型,计算所述目标特征和预设的声纹识别特征之间的相似度;所述结果输出模块,用于根据所述目标特征和预设的声纹识别特征之间的相似度输出声纹识别结果。7.根据权利要求6所述的一种基于双曲线空间的声纹识别系统,其特征在于,所述第一预处理模块包括:预加重子模块,用于获取时域的语音信号作为待识别的声纹信息,对所述待识别的声纹信息进行预加重处理,得到第一预处理声纹信息;分帧子模块,用于对所述第一预处理声纹信息进行分帧处理,得到第二预处理声纹信息;加窗子模块,用于对所述第二预处理声纹信息的每帧语音信号进行加窗,得到第三预处理声纹信息;快速傅里叶子模块,用于对所述第三预处理声纹信息进行快速傅里叶变换,得到第一声纹信息。8.根据权利要求7所述的一种基于双曲线空间的声纹识别系统,其特征在于,所述声纹特征提取模块包括:频谱转换子模块,用于使用mel滤波器对所述第一声纹信息进行滤波,得到mel域频谱;所述mel滤波器为高斯滤波器;特征提取子模块,用于对mel域频谱取log对数,然后进行离散余弦变换,得到第一特征。9.根据权利要求6所述的一种基于双曲线空间的声纹识别系统,其特征在于,所述第一预处理模块,还用于获取多个待训练的声纹信息进行预处理,得到第二声纹信息;所述声纹特征提取模块,还用于提取所述第二声纹信息的特征,作为声纹识别特征;所述sof模块,还用于针对每一声纹识别特征,计算该声纹识别特征的协方差矩阵。10.根据权利要求9所述的一种基于双曲线空间的声纹识别系统,其特征在于,所述双曲线空间模型为庞加莱球型模型{x∈r
n
| ||x||<1},其中r
n
表示n维欧式空间,||x||表示欧氏距离;所述双曲线空间模型包括:欧式空间子模块,用于获取所述目标特征和预设的声纹识别特征在欧式空间的坐标;相似度计算子模块,用于根据所述庞加莱球型模型的空间距离公式计算所述目标特征和预设的声纹识别特征之间的相似度;所述庞加莱球型模型的空间距离公式为其中u和v分别表示所述目标特征和预设的声纹识别特征在欧式空间的坐标。

技术总结
本发明公开了基于双曲线空间的声纹识别方法及系统,涉及声纹识别技术领域。获取待识别的声纹信息进行预处理,得到第一声纹信息;提取第一声纹信息的特征,得到第一特征;将第一特征与预设的协方差矩阵相乘,得到目标特征;根据预设的双曲线空间模型,计算目标特征和预设的声纹识别特征之间的相似度;根据相似度输出声纹识别结果。通过将目标特征映射到双曲线空间模型,可以放大特征之间的区别,进行更小维度的声纹识别,且目标特征为第一特征与预设的协方差矩阵相乘而得,目标特征相较于第一特征更加平滑,因此使用目标特征进行声纹识别更加精准。别更加精准。别更加精准。


技术研发人员:陈亮
受保护的技术使用者:广州科慧健远医疗科技有限公司
技术研发日:2022.02.25
技术公布日:2022/5/10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献