一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于关系导向的实体关系联合抽取方法及系统与流程

2022-02-20 00:08:59 来源:中国专利 TAG:

技术特征:
1.一种基于关系导向的实体关系联合抽取方法,其特征在于,包含如下内容:对目标文本中句子进行编码,获取目标文本中句子向量表示;针对句子向量表示,利用关系抽取模块抽取目标文本中所包含的关系类型;将抽取的关系类型作为先验知识与目标文本句子中词向量表示进行融合,利用实体识别模块来识别目标文本中与抽取的关系类型对应的实体。2.根据权利要求1所述的基于关系导向的实体关系联合抽取方法,其特征在于,采用预训练的bert模型对目标文本中句子进行编码,获取目标文本中各单词嵌入词向量,并通过捕捉句子特征生成句子上下文的向量表示。3.根据权利要求2所述的基于关系导向的实体关系联合抽取方法,其特征在于,在目标文本中句子句首添加分类标识符,将添加分类标识符的句子作为bert模型输入,通过bert模型进行编码,获取输出的句子向量表示。4.根据权利要求1所述的基于关系导向的实体关系联合抽取方法,其特征在于,关系抽取模块中,通过采用sigmoid函数将关系抽取建模为多标签二元分类任务,来识别并输出句子向量表示中的多种关系类型。5.根据权利要求4所述的基于关系导向的实体关系联合抽取方法,其特征在于,多标签二元分类任务表示为:p
r
=σ(w
r
·
h
cls
b
r
),其中,p
r
为输出的关系类型标签,w
r
∈r
n
×
d
,n为总关系类型数量,d为句子向量表示维度大小,b
r
为偏置向量,σ表示sigmoid函数,h
cls
为句子向量。6.根据权利要求5所述的基于关系导向的实体关系联合抽取方法,其特征在于,关系抽取模块损失函数采用二分类交叉熵函数,该二分类交叉熵函数表示为:其中,y
i
为真实关系类型标签。7.根据权利要求1或4或5或6所述的基于关系导向的实体关系联合抽取方法,其特征在于,针对抽取的多种关系类型(r1,r2,...,r
m
),m为抽取的关系数量,根据索引利用查表法进行编码,获取关系类型编码向量,将句子中词向量表示和关系类型编码向量叠加融合,以利用实体识别模块输出与抽取的关系类型对应的实体。8.根据权利要求1所述的基于关系导向的实体关系联合抽取方法,其特征在于,将抽取的关系类型和目标文本句子中词向量表示叠加融合,作为实体识别模块输入向量,基于抽取的关系类型分别采用二进制指针标记关系类型对应的实体位置,依据实体位置获取关系类型对应的实体三元组(头实体,关系,尾实体)。9.根据权利要求8所述的基于关系导向的实体关系联合抽取方法,其特征在于,标记实体位置中,采用两个相同二元分类器对头实体和尾实体进行解码,其中一个分类器标记实体开始位置,另一个分类器标记实体结束位置,对输入向量每个单词分配一个二进制标签并检测单词作为实体开始和结束位置的概率,并依据就近原则,选取与开始位置最近距离的结束位置来生成关系类型对应的实体。10.一种基于关系导向的实体关系联合抽取系统,其特征在于,包含:句子编码模块、关系抽取模块及实体识别模块,其中,句子编码模块,用于对目标文本中句子进行编码,获取目标文本中句子向量表示;
关系抽取模块,用于针对句子向量表示,利用关系抽取模块抽取目标文本中所包含的关系类型;实体识别模块,用于将抽取的关系类型作为先验知识与目标文本句子中词向量表示进行融合,利用实体识别模块来识别目标文本中与抽取的关系类型对应的实体。

技术总结
本发明属于自然语言处理技术领域,特别涉及一种基于关系导向的实体关系联合抽取方法及系统,对目标文本中句子进行编码,获取目标文本中句子向量表示;针对句子向量表示,利用关系抽取模块抽取目标文本中所包含的关系类型;将抽取的关系类型作为先验知识与目标文本句子中词向量表示进行融合,利用实体识别模块来识别目标文本中与抽取的关系类型对应的实体。本发明能够减少对无关实体的关注,避免抽取冗余实体,进而对识别出的多个关系类型分别识别其对应的实体对,解决实体重叠问题,最终抽取出句子中所包含的全部实体关系三元组,提升实体关系识别准确度,便于实际场景应用。便于实际场景应用。便于实际场景应用。


技术研发人员:尹美娟 胡红卫 刘晓楠 伍润民 刘威 罗向阳 颜志豪
受保护的技术使用者:中国人民解放军战略支援部队信息工程大学
技术研发日:2021.10.22
技术公布日:2022/1/4
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献