一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

机器翻译模型的训练方法、装置、电子设备及存储介质与流程

2023-01-15 07:19:14 来源:中国专利 TAG:

技术特征:
1.一种机器翻译模型的训练方法,其特征在于,所述机器翻译模型包括:编码器模块、解码器模块以及对抗生成模块;所述机器翻译模型的训练方法,包括:获取训练样本集,并确定与所述训练样本集对应的第一训练样本集以及第二训练样本集;所述训练样本集中包括多个源文本序列,以及与各所述源文本序列对应的目标文本序列;依次将所述训练样本集输入至所述编码器模块以及所述解码器模块,得到参考编码器权重参数以及参考解码器权重参数;依次将所述第一训练样本集以及所述第二训练样本集输入至所述编码器模块以及所述对抗生成模块,得到目标编码器权重参数;根据所述目标编码器权重参数对所述参考解码器权重参数进行更新,并在满足训练停止条件时,得到目标机器翻译模型。2.根据权利要求1所述的方法,其特征在于,所述确定与所述训练样本集对应的第一训练样本集以及第二训练样本集,包括:对所述训练样本集中的各所述源文本序列以及与各所述源文本序列对应的目标文本序列的对应关系进行打分,并根据分数结果确定所述第一训练样本集以及所述第二训练样本集。3.根据权利要求1所述的方法,其特征在于,所述依次将所述训练样本集输入至所述编码器模块以及所述解码器模块,得到参考编码器权重参数以及参考解码器权重参数,包括:依次将所述训练样本集输入至所述编码器模块以及所述解码器模块中进行迭代训练,通过梯度下降法对初始编码器权重参数以及初始解码器权重参数进行更新;当满足迭代停止条件时,得到所述参考编码器权重参数以及所述参考解码器权重参数。4.根据权利要求1所述的方法,其特征在于,所述依次将所述第一训练样本集以及所述第二训练样本集输入至所述编码器模块以及所述对抗生成模块,得到目标编码器权重参数,包括:将所述第一训练样本集以及所述第二训练样本集输入至所述编码器模块,得到至少两个编码结果;将各所述编码结果输入至所述对抗生成模块,得到所述目标编码器权重参数。5.根据权利要求4所述的方法,其特征在于,所述将各所述编码结果输入至所述对抗生成模块,得到所述目标编码器权重参数,包括:将各所述编码结果输入至所述对抗生成模块,得到目标损失函数;根据所述目标损失函数对所述参考编码器权重参数进行微调,得到所述目标编码器权重参数。6.根据权利要求1所述的方法,其特征在于,所述根据所述目标编码器权重参数对所述参考解码器权重参数进行更新,包括:继续将所述训练样本集输入至所述编码器模块以及所述解码器模块中进行迭代训练,保持所述目标编码器权重参数不变,通过梯度下降法对参考解码器权重参数进行更新,得到目标解码器权重参数。7.根据权利要求6所述的方法,其特征在于,所述在满足训练停止条件时,得到目标机
器翻译模型,包括:在迭代次数达到设定迭代次数阈值,和/或输出准确率达到准确率阈值时,获取最终的目标编码器参数以及最终的目标解码器权重参数,得到目标机器翻译模型;其中,所述目标机器翻译模型用于将任一源文本序列翻译成与所述源文本序列对应的目标文本序列。8.一种机器翻译模型的训练装置,其特征在于,所述机器翻译模型包括:编码器模块、解码器模块以及对抗生成模块;所述机器翻译模型的训练装置,包括:训练样本集获取模块,用于获取训练样本集,并确定与所述训练样本集对应的第一训练样本集以及第二训练样本集;所述训练样本集中包括多个源文本序列,以及与各所述源文本序列对应的目标文本序列;第一训练模块,用于依次将所述训练样本集输入至所述编码器模块以及所述解码器模块,得到参考编码器权重参数以及参考解码器权重参数;第二训练模块,用于依次将所述第一训练样本集以及所述第二训练样本集输入至所述编码器模块以及所述对抗生成模块,得到目标编码器权重参数;机器翻译模型确定模块,用于根据所述目标编码器权重参数对所述参考解码器权重参数进行更新,并在满足训练停止条件时,得到目标机器翻译模型。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的机器翻译模型的训练方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的机器翻译模型的训练方法。

技术总结
本发明实施例公开了一种机器翻译模型的训练方法、装置、电子设备及存储介质。其中,机器翻译模型包括:编码器模块、解码器模块以及对抗生成模块;方法包括:获取训练样本集,并确定与训练样本集对应的第一训练样本集以及第二训练样本集;依次将训练样本集输入至编码器模块以及解码器模块,得到参考编码器权重参数以及参考解码器权重参数;依次将第一训练样本集以及第二训练样本集输入至编码器模块以及对抗生成模块,得到目标编码器权重参数;根据目标编码器权重参数对参考解码器权重参数进行更新,并在满足训练停止条件时,得到目标机器翻译模型。本发明实施例的方案,可以得到翻译准确率较高的机器翻译模型,为提升机器翻译的质量提供依据。的质量提供依据。的质量提供依据。


技术研发人员:马骏
受保护的技术使用者:中国农业银行股份有限公司
技术研发日:2022.10.20
技术公布日:2023/1/13
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献