一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

双曲空间中区分数据类型的知识图谱表示学习方法与流程

2021-11-22 17:39:00 来源:中国专利 TAG:

技术特征:
1.一种双曲空间中区分数据类型的知识图谱表示学习方法,包括以下步骤:步骤一、建立区分数据类型的知识图谱表示学习模型,包括:1

1)向知识图谱表示学习模型中输入知识图谱节点特征;将欧氏空间中的节点特征映射进双曲空间;1

2)在双曲空间中,首先,对所述节点特征进行预处理;然后,对尾实体为属性的节点特征进行关系感知的转换;再将所有节点特征映射进切线空间;1

3)对知识图谱中的属性的数据类型进行划分,数据类型包括:整数型、浮点型、布尔型、时间型和文本型属性;在切线空间中对上述五种不同的数据类型分别使用不同的方法进行特征学习;1

4)将切线空间中得到的节点特征映射回双曲空间,输出节点的特征;至此得到区分数据类型的知识图谱表示学习模型;步骤二、基于欧氏、球形和双曲空间,利用上述的区分数据类型的知识图谱表示学习模型对节点特征进行学习,从而构造一个连续曲率空间。2.如权利要求1所述的双曲空间中区分数据类型的知识图谱表示学习方法,其特征在于,步骤1

1)具体过程包括:将知识图谱表示为其中,n、r和t分别表示节点、边和三元组的集合;应用指数投影函数将输入的节点特征映射进双曲空间,其中,其中tanh表示激活函数,c为曲率,x为节点特征,0为原点。3.如权利要求1所述的双曲空间中区分数据类型的知识图谱表示学习方法,其特征在于,步骤1

2)中,对节点特征进行预处理,包括:引入一个非线性转换函数,将节点初始化并转换为更高级别的特征h,获得更多可学习的表示并捕获更复杂的潜在非线性信息;预处理后的节点特征定义为:式(1)中,tanh表示激活函数,w表示权重矩阵,b表示偏置向量,表示莫比乌斯加法,表示莫比乌斯矩阵

向量乘。4.如权利要求2所述的双曲空间中区分数据类型的知识图谱表示学习方法,其特征在于,步骤1

2)中,对尾实体为属性的节点特征进行关系感知的转换,包括:若步骤1

1)中所述的三元组的集合t={(h,r,t)|h∈e,r∈r,t∈n}中三元组(h,r,t)中的尾实体为属性,则对该三元组的头实体进行关系感知的转换,利用transe中对于三元组的限制条件h r≈t,使用关系和属性构造并得到关系感知的实体表示其中r
i
、t
i
分别为关系和属性的特征表示。5.如权利要求1所述的双曲空间中区分数据类型的知识图谱表示学习方法,其特征在于,步骤1

2)中,将所有节点特征映射进切线空间,包括:应用对数变换函数将节点映射到切线空间中,其中arctanh表示激活函数,c为曲率,x为节点特征,0为原点,若三元组(h,r,t)中的尾实体不为
属性,则跳过关系感知转换操作,直接应用对数变换函数将节点映射到切线空间。6.如权利要求1所述的双曲空间中区分数据类型的知识图谱表示学习方法,其特征在于,步骤1

3)中,对知识图谱中的属性的数据类型进行划分,包括:xml schema中定义了47种数据类型,将这些数据类型进行特征分类并精化,得到数据类型的属性分别为所述的整数型、浮点型、布尔型、时间型和文本型。7.如权利要求1所述的双曲空间中区分数据类型的知识图谱表示学习方法,其特征在于,步骤1

3)中,在切线空间中对五种不同属性的数据类型分别对应使用如下方法进行特征学习,包括:1)整数型属性的数据类型包括:nonnegativeinteger,nonpositiveinteger,negativeinteger,positiveinteger,short,integer,int,long和byte;若数据类型为整数型,则直接将关系感知转换中获得到的节点特征作为整数型属性的表示;2)浮点型属性的数据类型包括:double和float;若数据类型为浮点型,则使用双曲空间中的注意力机制来确定浮点型属性对节点特征的贡献;将实体h
i
及其通过关系感知转换得到的结果进行并置和线性变换,得到关系感知向量c
ij
;然后,通过权重矩阵对关系感知向量c
ij
执行线性变换,使用leakyrelu函数进行激活操作,得到注意力系数e
ij
;使用softmax函数来对注意力系数e
ij
进行归一化,计算出注意力值α
ij
;通过对注意力值α
ij
与关系感知向量c
ij
进行加权求和,并使用可以聚合更多关于邻域信息的多头注意力机制,得到浮点型属性的表示;带有m头注意力的表示定义为:式(2)中,m表示注意力头的数量,取值为1

m,||表示并置操作,表示实体h
i
的邻居属性,σ
c
表示莫比乌斯激活函数;3)布尔型属性的数据类型为boolean;若数据类型为布尔型,则使用双曲空间中的门控循环单元(gru)来得到布尔型属性的特征;通过权重矩阵对当前步输入的特征x
t
与上一步的隐藏状态h
t
‑1进行变换,然后使用sigmoid函数来进行激活,得到更新门z
t
;重置门r
t
的计算方法与更新门类似,区别在于权重矩阵的不同;使用重置门来存储过去的信息,并确定要保留或忘记的先前信息,以此得到所述当前步的新隐藏状态使用更新门来确定在上一步需要收集的信息,保存当前单元的信息并传递给下一个单元;所述当前步的最终表示定义为:式(3)中,diag(r
t
)表示重置门r
t
的对角矩阵;4)文本型属性的数据类型包括:string和anyuri;若数据类型为文本型,则使用双曲空间中的双向门控循环单元层来得到文本型属性的特征;双向门控循环单元定义为两个门控循环单元的组合,分别对正和反两个方向的输入进行处理,命名为前向门控循环单元和后向门控循环单元;从前向和后向两个方向生成字符串的特征,并将其拼接起来,最终得到高质量的表示;
双曲空间中的门控循环单元得到的表示定义为:式(4)中,w
f
表示权重矩阵,表示前向gru的输出,表示后向gru的输出;5)时间型属性的数据类型包括:time、date、datetime、gyearmonth、gyear、gday、gmonthday、gmonth和datetimestamp;将时间层次结构定义为世纪、十年、年、季度、月、周、日、小时、分钟和秒,共包括10个时间层级,上述10个时间层级的大小分别为100、10、10、4、3、5、7、24、60和60;使用具有不固定层数的多层的前馈神经网络来表示时间层次结构,将最大层数设置为10,并为每一层定义一个权重矩阵;时间型属性具有的时间层级数量决定前馈神经网络经过的层数,从而获得时间型属性的表示。8.如权利要求1所述的双曲空间中区分数据类型的知识图谱表示学习方法,其特征在于,步骤1

4)的具体过程包括:应用指数投影函数将得到的五种类型的属性表示映射进双曲空间,得到并输出最终的节点特征,其中tanh表示激活函数,c为曲率,x为节点特征,0为原点。9.如权利要求1所述的双曲空间中区分数据类型的知识图谱表示学习方法,其特征在于,步骤二的具体过程包括:在欧氏空间、球形空间和双曲空间基础上,通过流形内积,定义一个连续曲率空间,利用步骤一建立的所述的区分数据类型的知识图谱表示学习模型再次对节点特征进行学习,实现从双曲空间到统一空间的跨越;其中,基于流形内积的连续曲率空间定义为:式(5)中,表示流形序列,α、β和γ分别表示欧氏、球形和双曲空间中流形的数量,且α、β、γ之和必须能够被空间维度所整除。

技术总结
本发明公开了一种双曲空间中区分数据类型的知识图谱表示学习方法,包括:将欧氏空间中的节点特征映射进双曲空间;在双曲空间中,对节点特征进行预处理,并对部分节点特征进行关系感知的转换,再将所有节点特征映射进切线空间;对属性的数据类型进行划分,在切线空间中对五种不同的数据类型使用不同的策略分别进行特征学习;将切线空间中得到的节点特征映射回双曲空间,得到最终表示;基于欧氏、球形和双曲空间,构造一个连续曲率空间。本发明能够充分利用属性的数据类型这一本体语义,并且可以在连续曲率空间中灵活地调整空间构成,有效地捕捉知识图谱中的层次结构信息,在知识图谱链接预测和节点分类等任务中实现了更高的准确率。确率。确率。


技术研发人员:王鑫 申雨鑫
受保护的技术使用者:天津大学
技术研发日:2021.08.19
技术公布日:2021/11/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献