一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于力引导图的关系抽取方法与流程

2021-12-07 21:44:00 来源:中国专利 TAG:

技术特征:
1.一种基于力引导图的关系抽取方法,其特征在于,所述方法包括:s1、接收句包和目标实体对(e
h
,e
t
);s2、对语句中单词通过词嵌入构建词向量,为语句构建词向量序列;s3、通过部分卷积神经网络从词向量序列中提取语句特征,然后利用分段最大池化,构建句向量;s4、通过选择注意力机制的方法,构建句包向量;s5、利用关系表示矩阵h与句包向量,通过分类器预测所述实体对在所述句包中所涉及的关系集合。2.根据权利要求1所述的方法,其特征在于,所述步骤s2中,词向量包括词嵌入、相对头实体的位置信息和相对尾实体的位置信息。3.根据权利要求1所述的方法,其特征在于,所述步骤s3中抽取句子级别的特征表示的步骤包括:s31、采用n
l
个卷积核对进行填充过后的词向量序列进行卷积得到n
l
个特征向量,拼接得到c
i
={c1,c2,...,c
nl
}。其中n
l
代表句子长度;s32、根据头尾实体e
h
,e
t
的位置,将c
i
分割为三部分{c

i1
,c

i2
,c

i3
};s33、对三部分{c

i1
,c

i2
,c

i3
}分别利用最大池化,得到最终的句子级别的表示:s
i
=[c
i1
;c
i2
;c
i3
] 。4.根据权利要求1所述的方法,其特征在于,所述步骤s4中,句包向量由公式得到,其中表示语句和目标关系的耦合系数。5.根据权利要求1所述的方法,其特征在于,所述步骤s5中,关系表示矩阵h的获取方法包括:通过数据集获取关系图;通过关系表示模型获取关系表示矩阵h。6.根据权利要求5所述的方法,其特征在于,所述关系表示模型包括引力表示模块和图神经网络,其中,引力表示模块:对于所述关系图中概率性同现的关系,用矩阵m通过频率统计来生成矩阵p表示:其中,n
i
表示关系i出现的次数,矩阵m表示关系图,优选的,设置阈值θ,并定义矩阵当p
i,j
<θ时,图神经网络,用于取得关系嵌入之间的信息传播以及生成关系表示矩阵h:其中表示第l层的关系表示,d表示的是关系嵌入的维度,是权重矩阵,f(*)代表的是非线性函数,所述图神经网络的最终输出为关系表示矩阵h。
7.根据权利要求5所述的方法,其特征在于,所述关系表示模型还包括斥力表示模块,在斥力表示模块中定义矩阵u:定义相似度值ξ
i,j
来表示关系i和j之间的相似关系,计算全部关系间的斥力。8.根据权利要求7所述的方法,其特征在于,所述相似度ξ
i,j
的计算方法为:所述斥力ω通过下式计算得出:ω=sum(hh
t
*u)其中,*运算指的是元素间的相乘运算;优选的,ω被缩小为:将ω作为目标损失函数的惩罚项。9.根据权利要求5所述的方法,其特征在于,所述词嵌入、部分卷积神经网络、关系表示模型、分类器共同训练,目标损失函数根据斥力定义为:其中,λ是调和因子,调和前一项和后一项,ω即为斥力惩罚项;r
i
表示句包中预测出来的关系;θ表示所述词嵌入、部分卷积神经网络、关系表示模型的所有参数。p(r
i
|b,θ)为分类器预测出的概率值。10.根据权利要求1所述的方法,其特征在于,所述步骤s5中,关系预测的步骤包括:计算关系表示矩阵h与句包向量的点积:o=b
t
h分类器采用softmax方法,计算句包针对每一个关系的概率,然后选择概率大于阈值的关系作为句包涉及的关系,计算公式为:

技术总结
本发明提出一种基于力引导图的关系抽取方法,包括:接收到句包和实体对;构建出包含语义信息的句向量,并将各个句向量通过注意力机制将其组成句包向量;通过构建关系图,并运用物理学中引力斥力的概念,计算出关系表示矩阵;将关系表示矩阵和句包向量做运算,并将结果用softmax方法进行预测,得到句包中包含各种关系的概率。本发明提供的关系抽取方法及系统能够有效处理全局级别的关系关联,并将其用引力和斥力的概念加以模拟和表示,能够显著减少关系预测时的潜在搜索空间,并提升关系抽取的效率和准确率。的效率和准确率。的效率和准确率。


技术研发人员:尚煜茗 黄河燕 孙新 葛世奇
受保护的技术使用者:北京理工大学
技术研发日:2021.08.23
技术公布日:2021/12/6
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献