说话人验证方法及系统与流程

2022-03-09 07:42:42 来源：中国专利 TAG：

技术特征：
1.一种说话人验证方法，包括：将待验证语音转化为音频序列；将所述音频序列输入至基于transformer的固定窗口大小的自注意力块，使所述待验证语音中各帧的自注意力的可视范围限制在所述各帧语音的相邻帧，得到局部自注意力的说话人特征；将所述局部自注意力的说话人特征输入至前馈网络，得到说话人验证结果。2.根据权利要求1所述的方法，其中，所述将所述音频序列输入至基于transformer的固定窗口大小的自注意力块包括：通过所述自注意力块生成说话人特征的偏差矩阵；利用高斯分布优化所述偏差矩阵中每帧语音的权重，得到增强局部的高斯自注意力的说话人特征。3.根据权利要求1所述的方法，其中，所述自注意力块包括：多个一维卷积层，用于强化对局部上下文的建模能力。4.根据权利要求3所述的方法，其中，所述方法还包括：利用线性整流函数激活的双层卷积一维网络替代所述前馈网络的全连接层，以确定待验证语音的卷积自注意力的说话人特征。5.一种说话人验证系统，包括：音频序列转化程序模块，用于将待验证语音转化为音频序列；特征限制程序模块，用于将所述音频序列输入至基于transformer的固定窗口大小的自注意力块，使所述待验证语音中各帧的自注意力的可视范围限制在所述各帧语音的相邻帧，得到局部自注意力的说话人特征；说话人验证程序模块，用于将所述局部自注意力的说话人特征输入至前馈网络，得到说话人验证结果。6.根据权利要求5所述的系统，其中，所述限制程序模块用于：通过所述自注意力块生成说话人特征的偏差矩阵；利用高斯分布优化所述偏差矩阵中每帧语音的权重，得到增强局部的高斯自注意力的说话人特征。7.根据权利要求5所述的系统，其中，所述自注意力块包括：多个一维卷积层，用于强化对局部上下文的建模能力。8.根据权利要求7所述的系统，其中，所述限制程序模块用于：利用线性整流函数激活的双层卷积一维网络替代所述前馈网络的全连接层，以确定待验证语音的卷积自注意力的说话人特征。9.一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-4中任一项所述方法的步骤。10.一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。

技术总结
本发明实施例提供一种说话人验证方法。该方法包括：将待验证语音转化为音频序列；将音频序列输入至基于transformer的固定窗口大小的自注意力块，使待验证语音中各帧的自注意力的可视范围限制在各帧语音的相邻帧，得到局部自注意力的说话人特征；将局部自注意力的说话人特征输入至前馈网络，得到说话人验证结果。本发明实施例还提供一种说话人验证系统。本发明实施例提出了三种改进的自我注意方法，包括局部自注意力、高斯自注意力和卷积自注意力。前两种方法通过限制注意的大小来实现目标，后一种方法通过结合卷积来获得性能增益，总的提升说话人验证效果。升说话人验证效果。升说话人验证效果。

技术研发人员：钱彦旻韩冰陈正阳
受保护的技术使用者：思必驰科技股份有限公司
技术研发日：2021.12.23
技术公布日：2022/3/8

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种人工智能检测系统、方法和计算机程序与流程

说话人验证方法及系统与流程

相关文献

最热文献