一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于BERT孪生注意力网络与融合图嵌入特征的关系选择方法与流程

2022-03-26 04:29:28 来源:中国专利 TAG:

一种基于bert孪生注意力网络与融合图嵌入特征的关系选择方法
技术领域
1.本发明涉及知识图谱领域,特别涉及一种基于bert孪生注意力网络与融合图嵌入特征的关系选择方法。


背景技术:

2.近年来,随着知识图谱技术的发展,基于知识图谱的智能问答成为自动问答中一项重要且充满挑战的研究工作。其核心是识别问题中的实体和属性,在知识图谱上检索实体属性对应的属性值,然后将它们作为答案返回给用户。由于知识图谱可以从结构化、半结构化信息和文本中自动构建,因此可大大减少答案配置的时间。
3.目前对基于知识图谱的问答系统的研究主要包括:

通过语法解析将问题转换为知识图谱相应的查询语句,实现基于知识图谱的问答。其优点在于不用配置答案且具有很高的回答准确率,但其缺点为他们通过规则将用户问题转换为图谱查询语句,因此问答效果又受限于规则的质量和数量。

通过深度神经网络模型进行属性选择来实现知识图谱的问答。其优点是,即使问题呈现多样性,深度神经网络也可以识别,且不会受到规则的限制,但其缺点是,在复杂问题的情况下模型的性能仍有待提高。
4.综上所述,由于语法解析方法的劣势与限制,目前的研究热点和主流方法都是基于深度神经网络模型进行关系选择的方法实现知识图谱问答。在采用目前主流的基于深度神经网络进行关系选择的方法实现基于知识图谱的问答中,目前算法模型在其工作流程中的关系排序选择这一环节的性能有待提高,关系选择的难点在于问题中关系描述可能与知识图谱中的关系名称存在较大的差异,从属性集合a中挑选一个当前问题涉及的关系称为关系选择。因此,如何设计一个模型有效地将问题与属性进行匹配是本发明的研究重点之一。


技术实现要素:

5.本发明的主要目的在于提供一种基于bert孪生注意力网络与融合图嵌入特征的关系选择方法,针对这一问题,设计了孪生注意力网络,网络借鉴了人脸识别中两张人脸相似度的计算的siamese网络的思想,通过两个共享权重的bert网络分别对问题q和关系p进行编码,在对问题q和关系p进行编码时,我们通过注意力机制将知识图谱嵌入向量进行融合,编码后得到问题和关系的语义向量sq和s
p
,随后该模型计算问题q与所有候选关系p∈a的余弦相似度评分,最后排序得到评分最高的关系,即为最终关系。
6.为实现上述目的,本发明采取的技术方案为:
7.一种基于bert孪生注意力网络与融合图嵌入特征的关系选择方法,包括以下步骤,
8.步骤一,主题实体获取:运用命名实体识别技术从用户的问题中获取命名实体,将命名实体运用实体链接技术链接到知识图谱中的主题实体;
9.步骤二,生成候选关系:在知识图谱上查询与实体连接的3跳内关系,
10.得到候选关系集合;
11.步骤三,关系排序选择:根据问题从候选关系集合中挑选关系,对问题和一个关系通过网络编码后得到两个向量,计算两个向量的余弦相似度作为语义相似得分,选择得分最高的关系;
12.步骤四,生成答案:在知识图谱上查询三元组《主题实体,得分最高关系,
13.属性值》,返回三元组包含的属性值作为问题的答案。
14.本发明的进一步改进在于,所述步骤三中在进行编码时,通过注意力机制将知识图谱嵌入向量中进行融合,编码后获得问题和关系的语义向量sq和s
p

15.本发明的进一步改进在于,所述步骤三关系选择模型的工作步骤如下,首先进行关系编码,获得关系的编码向量s
p
,然后进行问题编码,获得问题的编码向量sq,最后进行相似度评分计算排序得到评分最高的关系,为最终关系。
16.本发明的进一步改进在于,所述关系属性编码包括以下步骤,首先选择主题实体e的3跳内关系集合作为候选关系,p表示主题实体 e到候选关系的路径,然后将文本送入bert模型得到关系p的文本语义特征,最后通过多头注意力机制将文本语义特征与图谱特征进行融合得到关系的编码向量。
17.本发明的进一步改进在于,所述问题编码包括以下步骤,问题文本bert特征提取器得到问题中每个词的向量表示q1到qm,通过多头注意力机制将文本语义特征与图谱特征进行融合得到关系问题的编码向量。
18.本发明的进一步改进在于,所述相似度评分计算包括以下步骤,首先将编码后得到的问题的表示向量和关系的表示向量进行拼接并且输入到一个前馈网络,然后计算最终相似得分,其次该模型计算问题q与所有候选关系的相似度评分,最后排序得到评分最高的关系,即为最终关系。
19.本发明的进一步改进在于,在关系选择模型的训练阶段,采用合页损失函数,公式如下:
[0020][0021]
其中,s(sq,s
p
),表示问题和正例关系、问题和负例关系分别计算的得分,超参数γ是一个正的实数值,表示正例和负例之间的间隔。
[0022]
与现有技术相比,本发明针对在复杂问题情况下,基于知识图谱自动问答的关系选择子任务效果不佳的问题,提出了一种基于孪生 bert注意力网络与融合图谱嵌入特征的关系选择方法,旨在提升关系选择子任务的效果,从而提升基于知识图谱自动问答的效果。一方面,采用目前先进的bert预训练模型作为问题和关系文本的特征抽取器,bert预训练模型利用自监督学习在大量无标注文本中学习到了语义信息;另一方面,将知识图谱运用图谱表示学习模型训练得到知识图谱中实体和关系的图嵌入表示向量,然后利用多头注意力机制将图嵌入表示向量与文本语义进行融合,得到问题与关系的语义知识表示向量,增强了表示向量的表达能力,有助于提升关系选择效果。
附图说明
[0023]
为了更清楚地说明本发明的技术方案,下面将对本发明技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0024]
图1为本发明一种基于bert孪生注意力网络与融合图嵌入特征的关系选择方法的整体结构示意图。
[0025]
图2为本发明一种基于bert孪生注意力网络与融合图嵌入特征的关系选择方法的知识图谱示例图。
[0026]
图3为本发明一种基于bert孪生注意力网络与融合图嵌入特征的关系选择方法的基于知识图谱的自动问答流程。
具体实施方式
[0027]
下面结合具体实施方式对本发明作进一步的说明,其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制,为了更好地说明本发明的具体实施方式,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸,对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的,基于本发明中的具体实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他具体实施方式,都属于本发明保护的范围。
[0028]
实施例1
[0029]
如图1所示,一种基于bert孪生注意力网络与融合图嵌入特征的关系选择方法,包括以下步骤,
[0030]
步骤一,主题实体获取:运用命名实体识别技术从用户的问题中获取命名实体,将命名实体运用实体链接技术链接到知识图谱中的主题实体e;
[0031]
步骤二,生成候选关系:在知识图谱上查询与实体e连接的3跳内关系,得到候选关系集合a;
[0032]
步骤三,关系排序选择:根据问题q和一个关系p∈a从候选关系集合中挑选关系,对问题和一个关系通过网络编码后得到两个向量,计算两个向量的余弦相似度作为语义相似得分,选择得分最高的关系 p
max

[0033]
步骤四,生成答案:在知识图谱上查询三元组《e,p
max
,v》,返回三元组包含的属性值v作为问题的答案。
[0034]
在本实施例中,步骤三中在进行编码时,通过注意力机制将知识图谱嵌入向量中进行融合,编码后获得问题和关系的语义向量sq和s
p

[0035]
在本实施例中,步骤三关系选择模型的工作步骤如下,首先进行关系编码,获得关系的编码向量s
p
,然后进行问题编码,获得问题的编码向量sq,最后进行相似度评分计算排序得到评分最高的关系,为最终关系。
[0036]
在本实施例中,关系(属性)编码包括以下步骤,首先选择主题实体e的3跳内关系集合作为候选关系,p表示主题实体e到候选关系的路径,若路径为e

r1→
e1→
r2,p的文本表达为实体、实体类型与关系首尾拼接得到,然后将文本送入bert模型得到关系p的文本语
义特征,图1中的p1到pn表示词的表示向量,e
p
表示主题实体e到候选关系的路径所有关系的图嵌入表示向量加和平均的表示向量,而单个关系的图嵌入向量是运用图谱表示学习模型从知识图谱中学习得到;最后通过多头注意力机制将文本语义特征(p1到pn)与图谱特征(e
p
)进行融合得到关系的编码向量s
p

[0037]
在本实施例中,问题编码包括以下步骤,问题文本bert特征提取器得到问题中每个词的向量表示q1到qm,eq表示从问题q中识别的主题实体e的图谱嵌入表示向量,通过多头注意力机制将文本语义特征(q1到qm)与图谱特征(eq)进行融合得到关系问题的编码向量sq。
[0038]
在本实施例中,相似度评分计算包括以下步骤,首先将编码后得到的问题的表示向量和关系的表示向量进行拼接并且输入到一个前馈网络,然后计算最终相似得分,其次该模型计算问题q与所有候选关系的相似度评分,最后排序得到评分最高的关系,即为最终关系。
[0039]
在本实施例中,在关系选择模型的训练阶段,采用合页损失函数,公式如下:
[0040][0041]
其中,s(sq,s
p
),表示问题和正例关系、问题和负例关系分别计算的得分,超参数是一个正的实数值,γ表示正例和负例之间的间隔。
[0042]
实施例2
[0043]
通常情况下,知识图谱是一个《实体,关系,实体》的三元组集合。在本发明中的意识形态领域知识图谱中,将属性也视为“关系”,因此意识形态领域知识图谱中的大量实体节点对应着属性值,如图2所示一个三元组《深圳,常住人口,1756万》作为知识图谱示例。采用基于知识图谱的自动问答流程如图3所示,对深圳的常住人口有多少进行知识图谱检索。
[0044]
步骤一,主题实体获取:运用命名实体识别技术从用户的问题中获取命名实体,将命名实体运用实体链接技术链接到知识图谱中的主题实体,本实施例中的主题实体为深圳;
[0045]
步骤二,生成候选关系:在知识图谱上查询与实体连接的3跳内关系,
[0046]
得到候选关系集合,可以获得gdp总量、人口数量和公司数量的候选关系合集;
[0047]
步骤三,关系排序选择:根据问题从候选关系集合中挑选关系,对问题和一个关系通过网络编码后得到两个向量,计算两个向量的余弦相似度作为语义相似得分,选择得分最高的关系,通过siamese模型进行计算排序,得到人口数量的语义相似度为0.95,gdp总量的语义相似度为0.02,公司数量的语义相似度为0.01,排列顺序为人口数量、gdp数量、公司数量;
[0048]
步骤四,生成答案:在知识图谱上查询三元组《主题实体,得分最高关系,
[0049]
属性值》,返回三元组包含的属性值作为问题的答案,由于人口数量的顺序处于第一位,因此深圳的常住人口有多少的答案为1756万。
[0050]
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其
等效物界定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献