一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种多状态声纹特征识别方法及装置与流程

2022-03-19 21:07:30 来源:中国专利 TAG:

技术特征:
1.一种多状态声纹特征识别方法,其特征在于:包括以下步骤,s1,获取音频信号,将所述音频信号进行预处理,得到语音特征集;s2,将语音特征集输入至声纹识别网络模型中,得到多个声纹特征状态,其中所述声纹特征状态包括当前声纹特征状态和历史声纹特征状态;s3,根据所述语音特征集的多个声纹特征状态,对所述声纹特征状态进行相似度计算,并对当前声纹特征状态进行更新;s4,根据所述声纹特征状态对所述声纹识别网络模型的参数进行迭代更新,直至所述声纹识别网络模型收敛。2.根据权利要求1所述的多状态声纹特征识别方法,其特征在于:所述s1中将所述音频信号进行预处理具体为,获取音频信号后,将所述音频信号依次进行预加重处理、分帧处理、加窗处理、快速傅里叶变换处理、三角带通滤波器以及对数运算和动态差分参数运算后,得到所述语音特征集。3.根据权利要求1所述的多状态声纹特征识别方法,其特征在于:所述s1还包括:将所述语音特征集中语音特征选取固定长度后,输入至所述声纹识别网络模型。4.根据权利要求1所述的多状态声纹特征识别方法,其特征在于:在所述s1之前还包括:对所述音频信号进行降噪处理和去混响处理。5.根据权利要求1所述的多状态声纹特征识别方法,其特征在于:所述s3中对所述声纹特征状态进行相似度计算,并对当前声纹特征状态进行更新具体为:将当前声纹特征状态和历史声纹特征状态进行相似度计算;若当前声纹特征状态的数量小于n且当前声纹特征状态与历史声纹特征状态的距离大于第一阈值,则增加新的声纹特征状态;若当前声纹特征状态的数量小于n而当前声纹特征状态与历史声纹特征状态的距离小于第一阈值,则将历史声纹特征状态与当前声纹特征状态进行合并状态并计数;若当前声纹特征状态的数量等于n且当前声纹特征状态与历史声纹特征状态的距离大于第一阈值,则对所述离群声纹特征状态或新增声纹特征状态进行类间距离计算,如果所述离群声纹特征状态或新增声纹特征状态与历史纹特征状态相似度高,则删除所述离群声纹特征状态或新增声纹特征状态;如果所述离群声纹特征状态或新增声纹特征状态与历史纹特征状态相似度低,则更新n个声纹特征状态之间的距离并将声纹特征状态间距离最小的两个声纹特征状态合并。6.根据权利要求1所述的多状态声纹特征识别方法,其特征在于:所述s4具体为:用所述语音特征集对所述声纹识别网络模型进行多次迭代训练,根据所述声纹特征状态数量或者声纹特征状态均值进行aam-softmax计算,当所述标准差abs=(r2

x2)小于第二阈值时,判断所述初步训练的声纹识别网络模型已经收敛,其中r为声纹特征状态分类概率,x为初始期望目标参数。7.根据权利要求2所述的多状态声纹特征识别方法,其特征在于:所述声纹识别网络模型包括:输入层、特征提取层以及输出层,所述输入层为时延神经网络结构,其用于对所述语音特征集进行预输入处理;所述特征提取层包括se残差网络层和特征融合层,所述语音特征集通过输入层进行预输入处理后,将输入的语音特征利用所述se残差网络层进行特征降维以及维度回升处理
后,得到语音特征矢量,将所述语音特征矢量通过所述特征融合层进行多层特征计算得到声纹特征向量;所述输出层包括注意力统计池化层和aam-softmax层,所述声纹特征向量通过所述注意力统计池化层对声纹分类概率进行池化,所述aam-softmax层用于根据声纹分类概率对所述音频信号进行声纹分类。8.一种多状态声纹特征识别装置,其特征在于,包括存储器和处理器,所述存储器存储有至少一段程序,所述至少一段程序由所述处理器执行以实现如权利要求1至7任一所述的多状态声纹特征识别方法。9.一种计算机可读存储介质,其特征在于:包括存储器,所述存储器内存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1至7任一项所述的多状态声纹特征识别方法。

技术总结
本发明涉及一种多状态声纹特征识别方法及装置。其方法包括,获取音频信号,将所述音频信号进行预处理,得到语音特征集后将语音特征集输入至声纹识别网络模型中,得到多个声纹特征状态,根据所述语音特征集的多个声纹特征状态,对所述声纹特征状态进行相似度计算,并对当前声纹特征状态进行更新,根据所述声纹特征状态对所述声纹识别网络模型的参数进行迭代更新,直至所述声纹识别网络模型收敛。本发明通过对音频信号多状态声纹特征的相似度计算,通过损失函数对网络参数的更新,同时保证网络参数更新过程中,声纹特征状态转变的连续性,从而对于相似或者相同的音频信号的不同状态进行关联,并可以准确识别。并可以准确识别。并可以准确识别。


技术研发人员:张广学 肖龙源 李稀敏 叶志坚
受保护的技术使用者:厦门快商通科技股份有限公司
技术研发日:2021.12.01
技术公布日:2022/3/18
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献