一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于特征融合的深层异质图嵌入模型

2022-06-02 15:51:08 来源:中国专利 TAG:


1.本发明涉及图嵌入技术领域,特别是涉及基于特征融合的深层异质图嵌入模型以及基于该特征融合的深层异质图嵌入模型的深层异质图嵌入方法。


背景技术:

2.现实世界中存在大量复杂信息网络,如商业网络、社交网络、引文网络、生物网络等,它们中蕴藏了很多有价值的信息。例如,在由海量的电商数据构成的商业网络中,包含丰富的商品信息、交易信息、用户行为信息等,这些信息中蕴含了很高的商业价值。对商业网络中的这些信息进行数据挖掘,既能够实现用户意图推荐带来巨大的商业利益,又能够识别套现用户检测等违规交易以防范化解金融风险。因此,对这些复杂信息网络进行数据建模并学习其中的潜在特征至关重要。图网络数据建模主要有邻接矩阵和稀疏编码两种方式。邻接矩阵建模是将半结构化的图数据建模成结构化的矩阵,算力设备通常提供了专门的矩阵运算功能。但图网络是具有高稀疏性的非欧几里得数据,邻接矩阵的建模形式会造成较大的计算资源浪费。
3.此外,矩阵运算往往具有较高的时空复杂度,训练时还需要设计额外的计算加速算法。因此,现有图模型主要以coo稀疏编码的形式建模图数据,然后利用深度学习技术构建神经网络模型,端到端地学习图网络中的特征。稀疏编码不仅能够大幅减少冗余信息的处理,还有利于归纳式学习。
4.异质图模型是研究包含不同类型实体和关系的复杂信息网络的重要方法。现有异质图嵌入模型主要分为浅层模型和深层模型。浅层模型的优点是能够以并行的方式高效的进行节点序列的采样,并根据序列上下文学习嵌入表示;缺点是缺乏非线性表示能力,并且不易描述属性信息和结构信息的关系,在同时建模二者时较为困难。深层模型的优点是能够更好的捕捉非线性关系,并且支持融合属性信息和结构信息的复杂建模,拥有更强的表示能力;缺点是容易拟合噪声并且具有较高的时空复杂度。从浅层模型和深层模型的优缺点比较可以看出,深层模型具有更强的表示学习能力,也更有利于研究当前信息爆炸式增长的复杂信息网络。
5.这些模型采用分层处理异质图数据的方式,首先学习相同类型信息的节点数据,然后对不同类型的语义信息进行融合。在学习同类型的节点表示时,既可以嵌入有向图,也可以嵌入无向图。但因为关系语义的指向通常是单向的,所以一般都将本层设计为有向图表示学习。在对不同类型的语义信息进行融合时,首先利用融合函数来分配不同语义信息的权重,然后加权融合不同语义下的特征得到最终的嵌入表示。虽然这些现有的异质图模型利用了深度学习技术,但在捕捉深层的特征时,忽略了对不同层次特征的充分利用。因为网络中不同节点的表示,需要获取不同范围的感受野。而现有的异质图模型缺乏对深层结构的精心设计,没有充分表达不同层次的特征。


技术实现要素:

6.本发明的目的是针对现有技术中存在的技术缺陷,而提供一种基于特征融合的深层异质图嵌入模型的深层异质图嵌入方法,充分利用不同层次卷积学习到的节点嵌入,它能够有效地融合不同层次学习到的特征,让节点自适应地选择有价值的信息。
7.为实现本发明的目的所采用的技术方案是:
8.一种基于特征融合的深层异质图嵌入方法,使用基于特征融合的深层异质图嵌入模型(interlayer feature fusion based heterogeneous graph neural network,fhgn)进行异质图表示学习,嵌入方法包括以下过程:
9.步骤一:元路径子图抽取
10.输入的异质图中包含类型异构的实体和关系,将其建模成图数据中不同类型的节点和边;同时,输入的异质图中包含预设的蕴含语义结构信息的元路径;模型在本步骤根据预设的多个元路径抽取异质图中的元路径子图;
11.步骤二:残差图注意力节点嵌入
12.模型首先利用图注意力机制进行节点间消息传播,聚合邻域节点信息,并更新中心节点的嵌入表示;然后使用多头注意力增强特征学习,抑制图数据的高方差,利用残差连接增强模型对局部信息的捕捉能力;
13.步骤三:层间特征融合
14.根据网络的层数和数据集的特征选择层间融合策略;利用跳跃连接聚合各层残差图注意力卷积学习到的节点嵌入,使用不同层间融合策略自适应选择有利于下游任务的特征;
15.步骤四:语义特征融合
16.对步骤一抽取到的不同的元路径子图,进行了残差图注意力节点嵌入和层间特征融合,学习了单个维度表示节点信息的嵌入向量;使用融合函数聚合不同语义学习到的节点嵌入信息,获取最终的节点嵌入;
17.步骤五:节点类别预测
18.模型在节点类别预测时,使用全连接层将学习到的节点嵌入投影到标签类别空间;然后使用损失函数来衡量预测与真实值的损失,并优化参数更新梯度,直至模型收敛。
19.其中,步骤一中,如果元路径的首尾节点类型相同,则抽取到的元路径子图为同质图。
20.其中,步骤三中,所述层间融合策略包括最大池化层间特征融合策略和拼接层间特征融合策略。
21.本发明充分利用不同层次卷积学习到的节点嵌入,它能够有效地融合不同层次学习到的特征,让节点自适应地选择有价值的信息。
22.本发明提出的基于特征融合的深层异质图嵌入方法,基于特征融合的深层异质图嵌入模型,能够对异质图网络中的实体节点进行表示学习,并应用于分类预测等分析任务,对分析复杂网络中的实体信息提供了重要的技术手段。
附图说明
23.图1是本发明的基于特征融合的深层异质图嵌入模型结构图。
24.图2是本发明的带跳跃知识网络的图注意力卷积结构图。
具体实施方式
25.以下结合附图和具体实施例对本发明作进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
26.本发明是一种基于特征融合的深层异质图嵌入模型的图嵌入方法,模型的整体结构如图1所示,模型的图嵌入处理过程包括元路径子图抽取、残差图注意力节点嵌入、层间特征融合、语义特征融合和节点类别预测。
27.首先,本发明使用三个真实数据构建的异构图网络进行实施,分别是引文网络acm、引文网络dblp和商业网络imdb,数据集具体信息如表1所示。
[0028][0029]
表1
[0030]
其中,acm数据集包含了论文、作者和主题三种类型的实体,并通过自然语言处理将论文文本信息嵌入为低维向量;dblp包含了论文、期刊、关键词和作者四种类型的实体,并将作者的文本信息嵌入为低维向量;imdb是从影视媒体数据中构建的异质图网络,包含了导演、演员和电影三类实体节点,并将电影的文本信息嵌入为低维向量。
[0031]
本发明在这三个数据集上根据预设的元路径预处理实验数据,并实施实体节点类别预测。训练过程中,三个数据集的训练集、验证机和测试集的划分如表2所示。
[0032][0033]
表2
[0034]
一、元路径子图抽取
[0035]
元路径(meta-path)是复杂信息网络中表达子结构信息最常用的元结构之一。模型首先利用元路径抽取输入的异质图数据中的元路径子图。首先,设定元路径的首尾端点为与任务相关的同类型节点,将元路径视为异质图中的一种复合边;然后,根据元路径从异
质图中抽取出节点和关系类型相同的有向元路径子图。
[0036]
上述的关系类型为基于元路径的复合关系,如引文网络中的“论文-作者-论文”、媒体网络中的“电影-导演-电影”等。如果图数据为邻接矩阵形式,那么在本步骤中会将子图邻接矩阵转换为处理效率更高的coo稀疏编码数据。
[0037]
二、残差图注意力节点嵌入
[0038]
抽取得到元路径子图后,模型利用残差图注意力卷积学习元路径子图中的节点嵌入。残差图注意力机卷积利用图注意力机制作为消息传递函数,聚合邻域节点信息,然后利用聚合的信息更新中心节点嵌入;同时残差图注意力卷积利用残差结构保持输入信息的向后传递。
[0039]
首先,图注意力机制利用可学习的参数矩阵将首尾节点投影到同一个线性空间,并将得到的两个投影向量拼接起来。其次,使用注意力向量以内积的方式计算两个邻域节点之间的相关度。然后,为提升对复杂函数关系的映射能力,引入leaky relu函数作为激活函数,leaky relu利用负输入调整负值零梯度,使用负输入能够有效的解决dead relu问题。
[0040]
为避免随着神经网络逐渐加深导致的信息过度压缩,模型为每层图注意力卷积(gatconv)添加了残差连接。残差连接能够有效地保留节点原始信息,弥补深层网络中的信息损失。
[0041]
此外,残差能过够避免过大的参数权重,获得一个更好的梯度状态。为抑制图数据高方差的影响,模型在训练时加入k组各自独立的图注意力,实现多头注意力机制。残差图注意力学习的节点嵌入见公式如下:
[0042][0043]
其中,表示在元路径下学习到的从源节点到目标节点的注意力,φ表示元路经子图,hi表示目标节点,hj表示源节点,w表示将源节点和目标节点投影到同一维度空间的线性变换矩阵,表示基于元路径子图φ的转置注意力向量,激活函数使用leaky relu函数。
[0044][0045]
其中,表示目标节点hi对不同源节点hj学习到的注意力权重,softmaxj函数表示对不同源节点hj注意力进行归一化的函数。
[0046][0047]
其中,表示目标节点hi对其邻域集合进行加权融合得到的节点嵌入,表示在元路径子图φ中目标节点hi的邻域集合σ(
·
)表示训练时输入的激活函数。
[0048][0049]
其中,表示融合多头注意力的节点嵌入,k表示多头注意力的头数。
[0050]
三、层间特征融合
[0051]
本发明的模型利用跳跃知识网络对不同网络层次学习到的节点嵌入进行层间特征融合,带跳跃知识网络的图注意力卷积如图2所示。层间特征融合的作用是向不同的节点提供不同感受野范围学习到的特征。因为这类复杂信息网络具有较短的平均路径长度和较高的聚集系数,其中大部分节点所需的信息往往局限在较小范围。
[0052]
本发明的模型利用两种策略的跳跃知识网络实现层间特征融合。
[0053]
当网络深度较浅时,模型使用基于元素的最大池化(max-pooling)策略的跳跃知识网络以获得更好的性能。该策略不会引入额外的参数,并为节点选择信息最大的节点特征。本发明在元路径子图下使用最大池化策略实现层间特征融合,学习到的节点嵌入表示如下:
[0054][0055]
其中,表示节点v从元路径子图φ中学习到的节点嵌入,则表示其在第l层学习到的节点嵌入,max(
·
)表示层间特征融合的最大池化函数。
[0056]
当网络深度较深时,模型使用拼接(concat)策略的跳跃知识网络以获得更好的性能。拼接策略能够最大程度保证各层原始输出特征向下传递,随着网络的加深能逐渐积累更多的信息量。本发明在元路径子图下使用拼接策略实现层间特征融合,学习到的节点嵌入表示如下:
[0057][0058]
其中,表示节点v从元路径子图φ中学习到的节点嵌入,则表示其在第l层学习到的节点嵌入,[
·
]表示拼接层间特征向量的操作。
[0059]
四、语义特征融合
[0060]
语义特征融合是对不同元路径学习到的节点嵌入进行特征融合。单个的元路径子图仅包含一个维度的语义信息,反映了异质图结构语义的一方面。
[0061]
本发明的模型融合不同元路径子图下的节点嵌入,获得多个维度的语义信息。融合函数使用语义级别注意力机制(semantic attetion),它学习不同元路径的注意力值。首先,模型通过一个线性层对节点嵌入做线性变换,然后使用非线性激活函数引入非线性因素。再然后,利用可学习的语义相似度嵌入向量计算向量相似度,注意力值的计算如下:
[0062]
[0063]
其中,表示第p个元路径子图φ的的权重表示元路径子图φ中的节点数量,q
t
表示语义级别的注意力向量,tanh(
·
)表示激活函数,w表示线性变换矩阵,表示第p个元路径子图φ中目标节点hi的节点嵌入,b表示偏置项向量。
[0064]
对学习到的注意力值进行归一化,归一化函数使用softmax函数。得到的注意力系数如下式所示:
[0065][0066]
其中,表示元路径子图φ
p
的注意力,softmax(
·
)归一化函数,表示上述学习到的语义级别权重。
[0067]
模型以归一化得到的注意力系数表示在语义特征融合时元路径所具备的影响力。它会为更重要的元路径语义信息分配更高的权重系数。学习到每个元路径的注意力系数后,带权融合不同元路径子图下的节点嵌入获得最终的节点嵌入如下式所示:
[0068][0069]
其中,z表示语义特征融合后学习到的最终节点嵌入,表示元路径子图φ
p
的注意力权重,表示第p个元路径子图φ中学习到的节点嵌入。
[0070]
五、节点类别预测
[0071]
模型利用全连接神经网络(fully connected)预测学习到的节点嵌入标签。
[0072]
在训练过程中,将学习到的分布式特征表示映射到样本标记空间。首先将节点嵌入的全局信息转换到隐层空间,然后投影到输出空间预测节点标签。使用全连接层映射全局信息能够保证投影结果不受特征位置的影响,不会引入归纳偏置,能够逼近搜索空间中的任意可测函数。节点类别预测分类器表达式如下式所示:
[0073][0074]
其中,表示模型预测所有节点标签的预测值向量,w
pre
表示节点类别预测时的线性变换矩阵,z表示所有节点学习到的最终节点嵌入,b
pre
表示节点类别预测时的偏置项向量。
[0075]
模型以交叉熵损失函数作为目标函数,根据节点标签的预测值和真实值之间的损失。评估函数使用兼顾分类精确率和召回率的f1-score。
[0076]
其中,macro-f1平等对待每个类别的数据,适用于衡量数据样本分布均衡的数据集;micro-f1考虑每个类别的数量,适用于衡量数据样本分布不均衡的数据集。在模型的迭代训练过程中,使用能计算每个参数的自适应学习率的adam优化器,优化模型中的参数。adam优化器利用较少的内存实现高效的计算,解决了大规模数据和参数的优化问题。
[0077]
在具体实施的三个数据集上,本发明提出的模型取得了非常先进的结果,具体如
表3所示。在对引文网络中的论文和作者实体节点分类时,本发明的方法获得了和基准相比更好的结果。在对影视媒体网络中的电影实体节点分类时,同样达到了先进的性能表现。
[0078][0079]
表3
[0080]
本发明所提出的基于特征融合的深层异质图嵌入方法及所构建的深度学习模型具有很强的通用性,学习到的异质图节点嵌入,不仅能够应用于上述的实体节点类别预测任务,还能够方便的用于节点聚类等复杂网络分析任务。
[0081]
尽管上面结合附图对本模型的具体实施方案进行了详细描述,但本发明并不局限于上面描述的具体功能和工作流程。以上描述仅仅是示意性的,而并非限制性的。本领域的普通技术人员,在基于不脱离本发明原理的前提下,还能够继续做出若干改进和润饰,这些改进和润饰均属于本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献