一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于后编辑译文的多任务机器翻译质量估计方法和系统与流程

2022-11-12 12:50:41 来源:中国专利 TAG:

技术特征:
1.一种基于后编辑译文的多任务机器翻译质量估计方法,其特征在于,包括:使用跨语言预训练mbart模型作为基础框架,执行包括句子级翻译质量估计任务和基于后编辑译文任务的多任务联合训练,得到总体损失函数收敛的mbart模型;将原文和机器译文分别输入至所述总体损失函数收敛的mbart模型的编码器和解码器,预测得到所述机器译文的hter分数。2.根据权利要求1所述的多任务机器翻译质量估计方法,其特征在于,所述使用跨语言预训练mbart模型作为基础框架,执行包括句子级翻译质量估计任务和基于后编辑译文任务的多任务联合训练的步骤,包括:将原文输入至所述mbart模型的编码器,将机器译文输入至所述mbart模型的解码器,得到句子级翻译质量估计任务对应的第一隐向量;使用所述第一隐向量训练所述mbart模型,得到句子级翻译质量估计任务对应的第一损失子函数;以及,将原文输入至所述mbart模型的编码器,将右移一位的后编辑译文输入至所述mbart模型的解码器,得到基于后编辑译文任务对应的第二隐向量;使用第二隐向量训练所述mbart模型,得到基于后编辑译文任务对应的第二损失子函数;对所述第一损失子函数和所述第二损失子函数进行加权计算,得到所述总体损失函数;以所述总体损失函数收敛为目标,训练所述mbart模型。3.根据权利要求2所述的多任务机器翻译质量估计方法,其特征在于,所述使用所述第一隐向量训练所述mbart模型,得到句子级翻译质量估计任务对应的第一损失子函数的步骤,包括:将所述第一隐向量输入至所述mbart模型的全连接层,提取得到机器译文特征;根据所述机器译文特征获取hter分数预测值,将所述hter分数预测值和hter分数真实值输入至均方误差函数,得到所述第一损失子函数。4.根据权利要求3所述的多任务机器翻译质量估计方法,其特征在于,所述根据所述机器译文特征获取hter分数预测值,将所述hter分数预测值和hter分数真实值输入至均方误差函数的步骤,包括:使用sigmoid函数作为所述mbart模型的激活函数,将所述机器译文特征输入至所述mbart模型的激活函数,得到hter分数预测值;将所述hter分数预测值和hter分数真实值输入至所述均方误差函数,得到所述第一损失子函数。5.根据权利要求2所述的多任务机器翻译质量估计方法,其特征在于,所述将原文输入至所述mbart模型的编码器,将右移一位的后编辑译文输入至所述mbart模型的解码器,得到基于后编辑译文任务对应的第二隐向量的步骤,包括:将所述原文输入至所述mbart模型的编码器;将所述右移一位的后编辑译文输入至所述mbart模型的解码器;在所述解码器中,使用所述后编辑译文的前n项词预测第n 1项词,得到完整的后编辑
译文;从所述解码器的隐状态中分别获取所述完整的后编辑译文中每个词对应的第二隐向量。6.根据权利要求2或5所述的多任务机器翻译质量估计方法,其特征在于,所述使用第二隐向量训练所述mbart模型,得到基于后编辑译文任务对应的第二损失子函数的步骤,包括:将所述第二隐向量输入至所述mbart模型的全连接层,提取得到后编辑译文特征;使用softmax分类器对所述后编辑译文特征进行分类,得到所述后编辑译文中每个词分别对应的词表维度向量;将所述每个词分别对应的词表维度向量输入至交叉熵损失函数,使用所述交叉熵损失函数计算所述后编辑译文任务对应的第二损失子函数。7.根据权利要求1所述的多任务机器翻译质量估计方法,其特征在于,所述将原文和机器译文分别输入至所述总体损失函数收敛的mbart模型的编码器和解码器,预测得到所述机器译文的hter分数的步骤,包括:将所述原文输入至所述mbart模型的编码器,将所述机器译文输入至所述mbart模型的解码器,得到预测用隐向量;将所述预测用隐向量输入至所述mbart模型的全连接层,提取得到所述预测用隐向量对应的机器译文特征;将所述机器译文特征输入至所述mbart模型的激活函数,得到所述机器译文的hter分数。8.一种基于后编辑译文的多任务机器翻译质量估计系统,其特征在于,包括:联合训练执行模块,用于使用跨语言预训练mbart模型作为基础框架,执行包括句子级翻译质量估计任务和基于后编辑译文任务的多任务联合训练,得到总体损失函数收敛的mbart模型;翻译质量预测模块,用于将原文和机器译文分别输入至所述总体损失函数收敛的mbart模型的编码器和解码器,预测得到所述机器译文的hter分数。9.根据权利要求8所述的多任务机器翻译质量估计系统,其特征在于,所述联合训练执行模块,包括:第一隐向量输出子模块,用于将原文输入至所述mbart模型的编码器,将机器译文输入至所述mbart模型的解码器,输出得到句子级翻译质量估计任务对应的第一隐向量;第一损失子函数计算子模块,用于使用所述第一隐向量训练所述mbart模型,得到句子级翻译质量估计任务对应的第一损失子函数;以及,第二隐向量输出子模块,用于将原文输入至所述mbart模型的编码器,将右移一位的后编辑译文输入至所述mbart模型的解码器,输出得到基于后编辑译文任务对应的第二隐向量;第二损失子函数计算子模块,用于使用第二隐向量训练所述mbart模型,得到基于后编辑译文任务对应的第二损失子函数;总体损失函数计算子模块,用于对所述第一损失子函数和所述第二损失子函数进行加
权计算,得到所述总体损失函数;模型训练子模块,用于以所述总体损失函数收敛为目标,训练所述mbart模型。10.根据权利要求8所述的多任务机器翻译质量估计系统,其特征在于,所述翻译质量预测模块,包括:预测用隐向量输出子模块,用于将所述原文输入至所述mbart模型的编码器,将所述机器译文输入至所述mbart模型的解码器,输出得到预测用隐向量;机器译文特征提取子模块,用于将所述预测用隐向量输入至所述mbart模型的全连接层,提取得到所述预测用隐向量对应的机器译文特征;分数计算子模块,用于将所述机器译文特征输入至所述mbart模型的激活函数,得到所述机器译文的hter分数。

技术总结
本发明公开基于后编辑译文的多任务机器翻译质量估计方法和系统,其中,基于后编辑译文的多任务机器翻译质量估计方法包括:使用跨语言预训练mBART模型作为基础框架,执行包括句子级翻译质量估计任务和基于后编辑译文任务的多任务联合训练,得到总体损失函数收敛的mBART模型;将原文和机器译文分别输入至总体损失函数收敛的mBART模型的编码器和解码器,预测得到机器译文的HTER分数。本发明的技术方案能解决现有技术中句子级别任务和词级别任务联合训练的多任务联合训练方法,需要对机器译文和后编辑译文之间词汇进行翻译质量标记,造成词汇级翻译质量估计样本的构造成本过高,词汇级翻译质量估计数据的处理量过大,机器翻译质量估计的性能较低的问题。译质量估计的性能较低的问题。译质量估计的性能较低的问题。


技术研发人员:李欣杰 施艳蕊
受保护的技术使用者:中译语通科技股份有限公司
技术研发日:2022.09.13
技术公布日:2022/11/11
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献