一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种融合句法信息的翻译质量自动评估方法与流程

2021-10-20 01:01:00 来源:中国专利 TAG:翻译 句法 融合 评估 质量

技术特征:
1.一种融合句法信息的翻译质量自动评估方法,其特征在于包括以下步骤:1)获取输入文本的双语文本表示向;2)将双语输入的文本分别构建句法依赖树,形成句法图;3)利用图神经网络编码相关节点关系特征后拼接,上层接一个简单的sigmoid层输出质量分数;4)模型的输出和数据标签的均方根误差误差作为损失,通过反向传播算法更新质量预测模型参数。2.如权利要求1所述一种融合句法信息的翻译质量自动评估方法,其特征在于在步骤1)中,所述获取输入文本的双语文本表示向的具体方法为以下之一:(1)采用双语预训练模型来获取输入文本的双语文本表示向;所述双语预训练模型包括xlm

r或mbert;在模型训练过程中可进行参数微调;(2)使用word2vec的方法;(3)使用用开源工具包transformers获得已训练好的模型来搭建字向量表示层。3.如权利要求1所述一种融合句法信息的翻译质量自动评估方法,其特征在于在步骤2)中,所述将双语输入的文本分别构建句法依赖树,形成句法图的具体方法为:利用自建的句法依赖算法或者开源工具包,抽取双语输入的句法依赖关系;句子成分间的依赖关系使用有向图来表示;依赖关系图包含节点和节点之间的关系种类,用三元组表示,如:节点a,关系r,节点b;如此便将整个句子的句法依赖关系编码成三元组列表,[三元组1,三元组2,三元组3,

,三元组n];然后使用邻接矩阵将三元组列表转换为矩阵形式;邻接矩阵是个v*v的二维数组,其中v是图中的节点数量;设adj[][]是邻接矩阵,那么:其中,(vi,vj)表示节点i到节点j的边;若(vi,vj)不存在,则adj[i][j]赋值为0;若(vi,vj)存在或者i=j,则adj[i][j]赋值为1。4.如权利要求1所述一种融合句法信息的翻译质量自动评估方法,其特征在于在步骤3)中,所述利用图神经网络编码相关节点关系特征是使用图神经网络将深度学习应用到图结构中,句法图的节点关系通过图神经网络进行编码,将双语输入分别编码成隐含向量hs和ht;所述图神经网络包括gnn、图卷积神经网络gcn、gat。5.如权利要求1所述一种融合句法信息的翻译质量自动评估方法,其特征在于在步骤3)中,所述上层接一个简单的sigmoid层输出质量分数,是将经过图神经网络编码后的双语表示hs和ht拼接后获得向量h=[hs:ht];此后连接一个全连接层作为输出层,输出层的激活函数为sigmoid获得输出out,即:out=sigmoid(wh b)其中,w是线性转换参数,b是偏置项。6.如权利要求5所述一种融合句法信息的翻译质量自动评估方法,其特征在于所述输出层的神经元的个数根据任务的具体情况而定;若是句子级的qe,则神经元个数为1;若是单词级的qe,则神经元个数为单词的个数。

技术总结
一种融合句法信息的翻译质量自动评估方法,涉及翻译技术领域。包括以下步骤:获取输入文本的双语文本表示向;将双语输入的文本分别构建句法依赖树,形成句法图;利用图神经网络编码相关节点关系特征后拼接,上层接一个简单的sigmoid层输出质量分数;模型的输出和数据标签的均方根误差误差作为损失,通过反向传播算法更新质量预测模型参数。利用图神经网络巧妙地解决了在翻译质量自动评估中缺乏句法信息的引入问题,在翻译质量自动评估领域,尚未看到此类方法。在预训练模型的基础上,加入图神经网络编码句法信息,使得模型能够同时表达语义和句法信息,比单独使用预训练模型能够在皮尔逊相关系数上普遍提升约19%的效果。皮尔逊相关系数上普遍提升约19%的效果。皮尔逊相关系数上普遍提升约19%的效果。


技术研发人员:陆晓蕾 倪斌 韩潮 张培欣 管新潮 李力 陈晨
受保护的技术使用者:厦门大学
技术研发日:2021.07.14
技术公布日:2021/10/19
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜