一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

机器翻译方法、装置、计算机设备和存储介质与流程

2022-09-04 04:58:39 来源:中国专利 TAG:

技术特征:
1.一种机器翻译方法,其特征在于,所述方法包括:获取待翻译源语言数据;对所述待翻译源语言数据进行正向最大匹配,确定所述待翻译源语言数据中的领域专有名词;将所述领域专有名词输入目标机器翻译模型进行翻译,得到专有名词翻译结果,并将所述待翻译源语言数据输入所述目标机器翻译模型进行翻译,得到翻译目标语言数据,所述目标机器翻译模型通过对样本数据训练得到;将所述专有名词翻译结果替换所述翻译目标语言数据中对应的翻译结果,得到机器翻译结果。2.根据权利要求1所述的方法,其特征在于,所述对所述待翻译源语言数据中单词进行正向最大匹配,确定所述待翻译源语言数据中的领域专有名词包括:将所述待翻译源语言数据中单词作为待匹配单词;对所述待匹配单词进行正向最大匹配,得到与所述待匹配单词对应的领域专有名词;根据所述与所述待匹配单词对应的领域专有名词,确定所述待翻译源语言数据中的领域专有名词。3.根据权利要求2所述的方法,其特征在于,所述对所述待匹配单词进行正向最大匹配,得到与所述待匹配单词对应的领域专有名词包括:当预设专有名词词典中存在与所述待匹配单词对应的匹配单词时,获取所述待翻译源语言数据中所述待匹配单词对应的下一单词;联合所述待匹配单词和所述待匹配单词对应的下一单词,得到待匹配词组;当所述预设专有名词词典中存在与待匹配词组对应的匹配单词时,获取所述待翻译源语言数据中待匹配词组对应的下一单词;联合待匹配词组和待匹配词组对应的下一单词,得到新的待匹配词组,返回所述当所述预设专有名词词典中存在与待匹配词组对应的匹配单词时,获取所述待翻译源语言数据中待匹配词组对应的下一单词的步骤;直到所述预设专有名词词典中不存在与最新的待匹配词组对应的匹配单词为止,从最新的待匹配词组中删除最新的待匹配词组对应的下一单词,得到与所述待匹配单词对应的领域专有名词。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取样本翻译句子对集合以及初始机器翻译模型;计算所述样本翻译句子对集合中样本翻译句子对的单词数比值,所述单词数比值为所述样本翻译句子对中源语言单词数与目标语言单词数的比值;根据所述单词数比值对所述样本翻译句子对集合进行过滤,得到过滤后样本翻译句子对集合;根据所述过滤后样本翻译句子对集合,对所述初始机器翻译模型进行训练,得到目标翻译机器模型。5.根据权利要求4所述的方法,其特征在于,所述获取样本翻译句子对集合包括:获取原始翻译句子对集合,所述原始翻译句子对集合包括原始翻译句子对;对所述原始翻译句子对中原始源语言数据进行分词,得到分词结果,并统计所述原始
翻译句子对中原始目标语言数据中每个目标语言单词的字符长度;根据所述分词结果和所述字符长度,对所述原始翻译句子对集合进行过滤;将过滤后的原始翻译句子对集合,作为样本翻译句子对集合。6.根据权利要求4所述的方法,其特征在于,所述根据所述单词数比值对所述样本翻译句子对集合进行过滤,得到过滤后样本翻译句子对集合包括:根据所述单词数比值进行统计,得到与所述单词数比值对应的数据分布;根据所述数据分布,对所述样本翻译句子对集合进行过滤,得到过滤后样本翻译句子对集合。7.根据权利要求4所述的方法,其特征在于,所述根据所述过滤后样本翻译句子对集合,对所述初始机器翻译模型进行训练,得到目标翻译机器模型包括:根据所述过滤后样本翻译句子对集合,对所述初始机器翻译模型进行训练,得到待优化机器翻译模型;获取翻译评估源语言数据集,通过所述待优化机器翻译模型对所述翻译评估源语言数据集中翻译评估源语言进行翻译,得到翻译评估目标语言数据集;根据所述翻译评估源语言数据集和所述翻译评估目标语言数据集,得到翻译评估翻译句子对集合;根据所述过滤后样本翻译句子对集合和所述翻译评估翻译句子对集合,对所述待优化机器翻译模型进行训练,得到目标机器翻译模型。8.一种机器翻译装置,其特征在于,所述装置包括:获取模块,用于获取待翻译源语言数据;匹配模块,用于对所述待翻译源语言数据进行正向最大匹配,确定所述待翻译源语言数据中的领域专有名词;翻译模块,用于将所述领域专有名词输入目标机器翻译模型进行翻译,得到专有名词翻译结果,并将所述待翻译源语言数据输入所述目标机器翻译模型进行翻译,得到翻译目标语言数据,所述目标机器翻译模型通过对样本数据训练得到;替换模块,用于将所述专有名词翻译结果替换所述翻译目标语言数据中对应的翻译结果,得到机器翻译结果。9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。

技术总结
本申请涉及人工智能技术领域,提供了一种机器翻译方法、装置、计算机设备和存储介质。所述方法包括:获取待翻译源语言数据;对待翻译源语言数据进行正向最大匹配,确定待翻译源语言数据中的领域专有名词;将领域专有名词输入目标机器翻译模型进行翻译,得到专有名词翻译结果,并将待翻译源语言数据输入目标机器翻译模型进行翻译,得到翻译目标语言数据,目标机器翻译模型通过对样本数据训练得到;将专有名词翻译结果替换翻译目标语言数据中对应的翻译结果,得到机器翻译结果。采用本方法能够提高目标机器翻译模型对领域专有名词翻译的准确性,得到翻译准确的机器翻译结果。得到翻译准确的机器翻译结果。得到翻译准确的机器翻译结果。


技术研发人员:贺傲飞
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2022.06.14
技术公布日:2022/9/2
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献