一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

说话人验证方法及系统与流程

2022-03-09 07:42:42 来源:中国专利 TAG:

技术特征:
1.一种说话人验证方法,包括:将待验证语音转化为音频序列;将所述音频序列输入至基于transformer的固定窗口大小的自注意力块,使所述待验证语音中各帧的自注意力的可视范围限制在所述各帧语音的相邻帧,得到局部自注意力的说话人特征;将所述局部自注意力的说话人特征输入至前馈网络,得到说话人验证结果。2.根据权利要求1所述的方法,其中,所述将所述音频序列输入至基于transformer的固定窗口大小的自注意力块包括:通过所述自注意力块生成说话人特征的偏差矩阵;利用高斯分布优化所述偏差矩阵中每帧语音的权重,得到增强局部的高斯自注意力的说话人特征。3.根据权利要求1所述的方法,其中,所述自注意力块包括:多个一维卷积层,用于强化对局部上下文的建模能力。4.根据权利要求3所述的方法,其中,所述方法还包括:利用线性整流函数激活的双层卷积一维网络替代所述前馈网络的全连接层,以确定待验证语音的卷积自注意力的说话人特征。5.一种说话人验证系统,包括:音频序列转化程序模块,用于将待验证语音转化为音频序列;特征限制程序模块,用于将所述音频序列输入至基于transformer的固定窗口大小的自注意力块,使所述待验证语音中各帧的自注意力的可视范围限制在所述各帧语音的相邻帧,得到局部自注意力的说话人特征;说话人验证程序模块,用于将所述局部自注意力的说话人特征输入至前馈网络,得到说话人验证结果。6.根据权利要求5所述的系统,其中,所述限制程序模块用于:通过所述自注意力块生成说话人特征的偏差矩阵;利用高斯分布优化所述偏差矩阵中每帧语音的权重,得到增强局部的高斯自注意力的说话人特征。7.根据权利要求5所述的系统,其中,所述自注意力块包括:多个一维卷积层,用于强化对局部上下文的建模能力。8.根据权利要求7所述的系统,其中,所述限制程序模块用于:利用线性整流函数激活的双层卷积一维网络替代所述前馈网络的全连接层,以确定待验证语音的卷积自注意力的说话人特征。9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述方法的步骤。10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。

技术总结
本发明实施例提供一种说话人验证方法。该方法包括:将待验证语音转化为音频序列;将音频序列输入至基于transformer的固定窗口大小的自注意力块,使待验证语音中各帧的自注意力的可视范围限制在各帧语音的相邻帧,得到局部自注意力的说话人特征;将局部自注意力的说话人特征输入至前馈网络,得到说话人验证结果。本发明实施例还提供一种说话人验证系统。本发明实施例提出了三种改进的自我注意方法,包括局部自注意力、高斯自注意力和卷积自注意力。前两种方法通过限制注意的大小来实现目标,后一种方法通过结合卷积来获得性能增益,总的提升说话人验证效果。升说话人验证效果。升说话人验证效果。


技术研发人员:钱彦旻 韩冰 陈正阳
受保护的技术使用者:思必驰科技股份有限公司
技术研发日:2021.12.23
技术公布日:2022/3/8
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献