技术特征:
1.一种语种特征提取模型训练方法,其特征在于,所述方法包括:
在预设语种特征提取模型的降维层对语音样本的特征向量进行降维处理,得到降维特征向量;
将所述降维特征向量输入时序模型,获取上文特征和下文特征;
合并所述上文特征和所述下文特征,得到上下文特征;
重新定义语音样本的正例和反例,根据所述上下文特征预测每个所述语音样本为正例或反例,其中,正例的特征向量为与所述语音样本的语种相同的所有语音样本的特征向量的平均值,反例的特征向量为与所述语音样本的语种不同的所有语音样本的特征向量的平均值;
通过预设的特征提取模型的损失函数,确定预测的正例和反例的误差,根据所述误差更新语种特征提取模型的模型参数。
2.根据权利要求1所述的语种特征提取模型训练方法,其特征在于,所述预设语种特征提取模型包括特征编码器,所述在预设语种特征提取模型的降维层对语音样本的特征向量进行降维处理,得到降维特征向量,包括:
将所述语音样本输入所述特征编码器,获得每帧语音样本各自对应的所述特征向量;
通过所述降维层对各所述特征向量分别进行降维处理,得到每帧语音样本各自对应的所述降维特征向量。
3.根据权利要求1或2所述的语种特征提取模型训练方法,其特征在于,所述时序模型包括自回归模型和反向的自回归模型;所述将所述降维特征向量输入时序模型,获取上文特征和下文特征,包括:
将前t帧语音样本对应的降维特征向量输入自回归模型,获取上文特征;
将最后一帧到第t 1帧语音样本对应的降维特征向量输入反向的自回归模型,获取下文特征。
4.根据权利要求3所述的语种特征提取模型训练方法,其特征在于,所述重新定义语音样本的正例和反例,包括:
确定语音样本的目标语种;
将每一批量的语音样本中,语种与所述目标语种相同的语音样本定义为正例;
将每一批量的语音样本中,语种与所述目标语种不相同的语音样本定义为反例。
5.根据权利要求4所述的语种特征提取模型训练方法,其特征在于,所述根据所述上下文特征预测每个所述语音样本包括的正例和反例,包括:
计算所述上下文特征与每帧语音样本的降维特征向量的内积;
根据计算得到的内积结果和预设相关度,预测每帧语音样本为正例或反例。
6.根据权利要求5所述的语种特征提取模型训练方法,其特征在于,所述预设特征提取模型的损失函数包括对抗噪声损失函数,所述通过所述预设特征提取模型的损失函数,确定预测的正例和反例的误差,包括:
通过所述对抗噪声损失函数,将预测的正例和反例与实际的正例和反例进行拟合,通过拟合结果确定预测的正例和反例的误差。
7.根据权利要求5或6所述的语种特征提取模型训练方法,其特征在于,所述根据所述误差更新所述预设语种特征提取模型的模型参数,包括:
根据所述误差通过反向传播更新所述预设语种特征提取模型的模型参数。
8.一种语种特征提取模型训练装置,其特征在于,包括:
处理模块,用于在预设语种特征提取模型的降维层对语音样本的特征向量进行降维处理,得到降维特征向量;
获取模块,用于将所述降维特征向量输入时序模型,获取上文特征和下文特征;
得到模块,用于合并所述上文特征和所述下文特征,得到上下文特征;
预测模块,用于重新定义语音样本的正例和反例,根据所述上下文特征预测每个所述语音样本为正例或反例,其中,正例的特征向量为与所述语音样本的语种相同的所有语音样本的特征向量的平均值,反例的特征向量为与所述语音样本的语种不同的所有语音样本的特征向量的平均值;
更新模块,用于通过预设的特征提取模型的损失函数,确定预测的正例和反例的误差,根据所述误差更新语种特征提取模型的模型参数。
9.一种语种特征提取模型训练设备,其特征在于,包括:
存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的语种特征提取模型训练方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的语种特征提取模型训练方法的步骤。
技术总结
本申请涉及人工智能技术领域,并公开了一种语种特征提取模型训练方法、装置、设备及存储介质,所述方法包括:在降维层对语音样本的特征向量进行降维处理,得到降维特征向量;根据降维特征向量确定上下文特征;重新定义语音样本的正例和反例,根据所述上下文特征预测每个所述语音样本包括的正例和反例;通过预设的特征提取模型的损失函数,对正例和反例的预测结果计算误差;根据所述误差更新语种特征提取模型的模型参数。实现了将上下文对比预测编码用于语种特征的提取,且用语音样本的特征向量均值表征语种特征,稀释掉了和语种无关的特征,提高语种特征提取模型训练的效率及准确性。
技术研发人员:秦冲;魏韬;马骏;王少军
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2021.04.28
技术公布日:2021.07.23
本文用于企业家、创业者技术爱好者查询,结果仅供参考。