声纹识别模型训练方法、声纹识别方法及相关设备与流程

2022-02-19 11:43:03 来源：中国专利 TAG：

技术特征：
1.一种声纹识别模型训练方法，其特征在于，包括：将声纹数据依次输入至待训练模型进行多次迭代训练，得到声纹识别模型；其中，所述待训练模型包括l层网络层，l为大于1的整数；在第n次的迭代训练的过程中，包括以下步骤：将所述声纹数据依次经过l层所述网络层进行特征映射，输出声纹向量；在所述声纹向量对应的输出值满足预设条件的情况下，将经过第n次的迭代训练之后的待训练模型确定为声纹识别模型，n为正整数。2.根据权利要求1所述的方法，其特征在于，所述l层网络层包括：依次连接的第一网络层、第二网络层、第三网络层和第四网络层；所述将所述声纹数据依次经过l层所述网络层进行特征映射，输出声纹向量，包括：将所述声纹数据输入至所述第一网络层中进行特征映射，输出第一特征向量；将所述第一特征向量输入至所述第二网络层中进行特征映射，输出第二特征向量；将所述第二特征向量输入至所述第三网络层中进行特征映射，输出第三特征向量；将所述第三特征向量输入至所述第四网络层中进行特征映射，输出所述声纹向量；其中，所述第一特征向量、所述第二特征向量、所述第三特征向量和所述声纹向量的维度依次递增。3.根据权利要求2所述的方法，其特征在于，所述第一网络层、所述第二网络层、所述第三网络层和所述第四网络层均包括相互连接的线性层和block块。4.根据权利要求3所述的方法，其特征在于，所述第一网络层、所述第二网络层、所述第三网络层和所述第四网络层包括的block块的数量均为多个。5.根据权利要求2所述的方法，其特征在于，所述l层网络层还包括：融入层，所述融入层与所述第一网络层连接；所述将所述声纹数据输入至所述第一网络层中进行特征映射，输出第一特征向量之前，所述方法还包括：将预先获取的待训练特征输入至所述融入层进行特征提取，得到所述声纹数据，其中，所述待训练特征的维度大于所述声纹数据的维度。6.根据权利要求1所述的方法，其特征在于，所述预设条件包括：声纹向量对应的输出值与声纹数据对应的实际值的差值位于预设范围内。7.根据权利要求1至6中任一项所述的方法，其特征在于，所述声纹数据为fbank80特征。8.一种声纹识别方法，其特征在于，所述方法包括：获取待识别用户的目标声纹数据；将所述目标声纹数据输入至声纹识别模型包括的l层网络层进行特征映射，输出目标声纹向量，所述l为大于1的整数；根据所述目标声纹向量进行声纹识别。9.根据权利要求8所述的方法，其特征在于，所述l层网络层包括：依次连接的第一网络层、第二网络层、第三网络层和第四网络层；所述将所述目标声纹数据输入至声纹识别模型包括的l层网络层进行特征映射，输出目标声纹向量，包括：将所述目标声纹数据输入至所述第一网络层中进行特征映射，输出第一特征向量；
将所述第一特征向量输入至所述第二网络层中进行特征映射，输出第二特征向量；将所述第二特征向量输入至所述第三网络层中进行特征映射，输出第三特征向量；将所述第三特征向量输入至所述第四网络层中进行特征映射，输出目标声纹向量；其中，所述第一特征向量、所述第二特征向量、所述第三特征向量和所述目标声纹向量的维度依次递增。10.一种声纹识别模型训练装置，其特征在于，包括：训练模块，用于将声纹数据依次输入至待训练模型进行多次迭代训练，得到声纹识别模型；其中，所述待训练模型包括l层网络层，l为大于1的整数；在第n次的迭代训练的过程中，包括以下步骤：将所述声纹数据依次经过l层所述网络层进行特征映射，输出声纹向量；在所述声纹向量对应的输出值满足预设条件的情况下，将经过第n次的迭代训练之后的待训练模型确定为声纹识别模型，其中，n为正整数。11.一种声纹识别装置，其特征在于，包括：获取模块，用于获取待识别用户的目标声纹数据；输出模块，用于将所述目标声纹数据输入至声纹识别模型包括的l层网络层进行特征映射，输出目标声纹向量，所述l为大于1的整数；声纹识别模块，用于根据所述目标声纹向量进行声纹识别。12.一种电子设备，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的声纹识别模型训练方法中的步骤，或者，所述处理器执行所述计算机程序时实现如权利要求8或9所述的纹识别方法中的步骤。13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的声纹识别模型训练方法中的步骤，或者，所述计算机程序被处理器执行时实现如权利要求8或9所述的声纹识别方法中的步骤。

技术总结
本申请提供一种声纹识别模型训练方法、声纹识别方法及相关设备，声纹识别模型训练方法，包括：将声纹数据依次输入至待训练模型进行多次迭代训练，得到声纹识别模型；其中，所述待训练模型包括L层网络层，L为大于1的整数；在第N次的迭代训练的过程中，包括以下步骤：将所述声纹数据依次经过L层所述网络层进行特征映射，输出声纹向量；在所述声纹向量对应的输出值满足预设条件的情况下，将经过第N次的迭代训练之后的待训练模型确定为声纹识别模型，其中，N为正整数。这样，提高了对样本的利用率，且提高了训练得到的声纹识别模型的准确度。提高了训练得到的声纹识别模型的准确度。提高了训练得到的声纹识别模型的准确度。

技术研发人员：孟庆林蒋宁吴海英王洪斌刘敏陈燕丽
受保护的技术使用者：马上消费金融股份有限公司
技术研发日：2021.09.29
技术公布日：2022/1/4

再多了解一些

2/2 首页上一页 1 2

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于语音识别的输电线路防鸟平台的制作方法

声纹识别模型训练方法、声纹识别方法及相关设备与流程

相关文献

最热文献