一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

双语词典推断方法、装置及存储介质与流程

2022-02-22 17:07:49 来源:中国专利 TAG:

技术特征:
1.一种双语词典推断方法,其特征在于,所述方法包括:从平行语料中提取目标词典;根据提取出的所述目标词典和预配置的初始词典,训练得到目标双语词典推断模型,所述目标双语词典推断模型是具有将源端单词翻译为目标端单词的神经网络模型;其中,所述目标词典和所述初始词典均包括多个对齐词对,所述对齐词对包括源端单词和目标端单词。2.根据权利要求1所述的方法,其特征在于,所述从平行语料中提取目标词典,包括:根据预配置的单语词向量和所述初始词典训练得到初始双语词典推断模型;根据所述初始双语词典推断模型和所述词对齐模型,从所述平行语料中提取所述目标词典。3.根据权利要求2所述的方法,其特征在于,所述根据所述初始双语词典推断模型和所述词对齐模型,从所述平行语料中提取所述目标词典,包括:根据所述初始双语词典推断模型得到所述词对齐模型的第一初始化概率;根据所述词对齐模型的所述第一初始化概率,在所述平行语料上进行词对齐的学习得到第一词对齐概率;根据所述第一词对齐概率确定所述目标词典。4.根据权利要求3所述的方法,其特征在于,所述根据所述初始双语词典推断模型得到所述词对齐模型的第一初始化概率,包括:根据所述初始双语词典推断模型,通过如下公式得到所述词对齐模型的第一初始化概率p
ini
(y|x):其中,所述x为所述源端单词,所述y为所述目标端单词,所述e
src
(x)为所述初始双语词典推断模型中所述源端单词的词向量,所述e
tgt
(y)为所述初始双语词典推断模型中所述目标端单词的词向量,所述y(x)表示所述词对齐模型的翻译表中所述x的翻译目标,所述τ用于指示初始化分布的尖锐程度,所述y

为所述词对齐模型的翻译表中所述x的所述翻译目标中的任意一个。5.根据权利要求3所述的方法,其特征在于,所述根据所述第一词对齐概率确定所述目标词典,包括:根据所述初始双语词典推断模型得到所述词对齐模型的第二初始化概率,所述第二初始化概率不同于所述第一初始化概率;根据所述词对齐模型的所述第二初始化概率,在所述平行语料上进行词对齐的学习得到第二词对齐概率;根据所述第一词对齐概率和所述第二词对齐概率进行双向过滤得到所述目标词典。6.根据权利要求1至5任一所述的方法,其特征在于,所述方法还包括:根据所述目标双语词典推断模型和所述词对齐模型,从所述平行语料中提取更新后的目标词典;
根据所述更新后的目标词典和所述初始词典,训练得到更新后的目标双语词典推断模型。7.根据权利要求1至5任一所述的方法,其特征在于,所述方法还包括:获取输入的源端单词;根据所述源端单词,调用训练得到的所述目标双语词典推断模型,输出得到所述目标端单词。8.一种双语词典推断装置,其特征在于,所述装置包括:提取模块,用于从平行语料中提取目标词典;训练模块,用于根据提取出的所述目标词典和预配置的初始词典,训练得到目标双语词典推断模型,所述目标双语词典推断模型是具有将源端单词翻译为目标端单词的神经网络模型;其中,所述目标词典和所述初始词典均包括多个对齐词对,所述对齐词对包括源端单词和目标端单词。9.一种计算机设备,其特征在于,所述计算机设备包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:从平行语料中提取目标词典;根据提取出的所述目标词典和预配置的初始词典,训练得到目标双语词典推断模型,所述目标双语词典推断模型是具有将源端单词翻译为目标端单词的神经网络模型;其中,所述目标词典和所述初始词典均包括多个对齐词对,所述对齐词对包括源端单词和目标端单词。10.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。

技术总结
本公开涉及计算机技术领域,尤其涉及一种双语词典推断方法、装置及存储介质。所述方法包括:从平行语料中提取目标词典;根据提取出的所述目标词典和预配置的初始词典,训练得到目标双语词典推断模型,所述目标双语词典推断模型是具有将源端单词翻译为目标端单词的神经网络模型;其中,所述目标词典和所述初始词典均包括多个对齐词对,所述对齐词对包括源端单词和目标端单词。本公开实施例通过在初始字典的基础上引入平行语料,利用从平行语料中提取的目标词典来丰富目标双语词典推断模型的训练信息,提高了后续的双语词典推断效果。提高了后续的双语词典推断效果。提高了后续的双语词典推断效果。


技术研发人员:黄书剑 周志浩 何亮 戴新宇 张建兵 陈家骏
受保护的技术使用者:南京大学
技术研发日:2020.07.15
技术公布日:2022/2/7
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献