一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多通道图卷积网络的社交网络节点分类方法与系统

2022-07-16 13:07:10 来源:中国专利 TAG:


1.本发明属于社交网络信息分析领域,涉及一种基于多通道图卷积网络的社交网络节点分类方法与系统。


背景技术:

2.社交网络的迅猛发展促进信息系统、医疗健康等领域的相关研究。分类问题是社交网络数据挖掘的基本问题,社交网络中节点分类一直是研究的热点方向。在众多分类技术中,图神经网络凭借其出色的表现力获取了极大的关注。图神经网络的核心思想主要是是聚集自身及其邻居节点的特征向量迭代更新每个节点的嵌入。图卷积网络作为图神经网络的一种有效变体,同样也遵循领域聚合方式。图卷积网络的特征聚合体现在每一个节点在每一卷积层中聚合来自其拓扑邻居的特征信息,也就是说特征信息通过图的拓扑结构得到节点嵌入用于分类任务。图卷积网络在图数据处理上表现的十分出色,图卷积网络是在神经网络的基础上提出的,不同于我们熟知的卷积神经网络,图卷积网络随着网络层数的不断加深,整个网络模型的表达能力在不断的变弱,出现过拟合问题。
3.随着社会的快速发展,社交网络图数据中节点间的关系越来越复杂。在本发明作出之前,对社交网络图数据的处理方式大都是使用传统的数据降维方法,对社交网络图数据的学习不够完全。利用图卷积网络对社交网络图数据进行处理时,如何能够把周围节点的信息聚合到当前节点中,更有效地提取节点的特征信息,进而提高社交网络节点分类的准确性是本发明所要研究的问题。


技术实现要素:

4.发明目的:本发明的目的在于提供一种社交网络节点分类方法与系统,采用图卷积网络分别对图的拓扑结构、节点特征以及两者组合进行特征提取,充分提取社交网络节点信息,提高节点分类的准确性。
5.技术方案:为实现上述发明目的,本发明采用如下技术方案:
6.一种基于多通道图卷积网络的社交网络节点分类方法,包括如下步骤:
7.(1)获取社交网络图数据集,社交网络图为无向图,节点表示用户,用户具有不同属性,经处理后数据集中包含有标签数据以及无标签数据;
8.(2)根据社交网络图数据集中的节点属性构造属性矩阵和邻接矩阵,将社交网络图的属性矩阵x以及邻接矩阵a作为图卷积网络的输入来提取社交网络图本身的结构信息,通过图卷积网络n1得到对应的节点嵌入表示z
t
;使用knn算法构造社交网络图的k-近邻图,利用构造的k-近邻图的邻接矩阵ak和属性矩阵x来获取节点的特征关系,通过图卷积网络n2得到对应的节点嵌入表示zk;
9.(3)使用参数共享的图卷积网络c来提取不同属性矩阵和邻接矩阵作为输入的公共信息,并且使用度量函数来衡量不同节点嵌入表示之间的差异获取公共节点嵌入zc;
10.(4)使用个性化注意力机制来自动化学习节点嵌入的权重,获取相对应的权重之
后,利用权重对之前操作得到的节点嵌入z
t
,zk,zc进行结合得到最终的节点嵌入z;
11.(5)对节点嵌入分别进行一致性约束和差异性约束,并使用交叉熵损失函数作为损失函数;将前期的约束条件和节点分类的损失函数相结合,得到最终的目标函数进行优化;将最终节点嵌入z输入softmax分类器中,输出节点的类别预测。
12.进一步地,所述社交网络图的属性矩阵表示为x=[x1,x2,...,xn],其中xi表示节点属性向量,n表示社交网络图包含的节点数量。
[0013]
进一步地,所述步骤(2)中使用社交网络原始图作为图卷积网络n1的输入来获取原始社交网络图结构方面的特征信息;图卷积网络n1采用去除非线性激活函数后的简化图卷积网络sgc,经过l层图神经网络n1后得到节点嵌入表示为
[0014][0015]
其中,邻接矩阵a
t
=a,对a
t
进行归一化处理进行归一化处理为自连接矩阵a
t
i的度矩阵,i为单位矩阵,w
t
为可训练的参数矩阵,将最终的所有节点嵌入表示为z
t

[0016]
进一步地,所述步骤(2)中使用构造的k-近邻图的邻接矩阵ak以及属性矩阵x作为图卷积网络n2的输入,图卷积网络n2采用去除非线性激活函数后的简化图卷积网络sgc,经过l层图卷积网络n2后得到的节点嵌入表示为
[0017][0018]
将邻接矩阵ak进行归一化处理后记为进行归一化处理后记为为自连接矩阵ak i的度矩阵,wk为可训练的参数矩阵,将最终的所有节点嵌入表示为zk。
[0019]
进一步地,所述步骤(3)中使用参数共享的图卷积网络c提取社交网络原始图以及k-近邻图的公共信息,经过l层图卷积网络c后,得到第l层的节点嵌入分别表示为:
[0020][0021][0022]
其中,wc是可训练的参数矩阵,层间共享,用来从不同的输入中过滤出可共享的信息;根据不同的输入图,得到两个最终的节点嵌入输出为z
ct
和z
ck
,对获取的节点嵌入进行平均操作,得到两个空间的共同嵌入zc。
[0023]
进一步地,所述步骤(4)中具体为:使用个性化注意力机制att(z
t
,zc,zk)学习相应的权重α
t
,αc,αk:
[0024]

t
,αc,αk)=att(z
t
,zc,zk)
[0025]
其中分别代表节点嵌入z
t
,zc,zk中n个节点的权重值;
[0026]
首先,根据节点嵌入z
t
,zc,zk,获得任意节点i的节点特征向量h表示经图卷积之后的节点特征维度,然后获取注意力值
[0027][0028]
[0029][0030]
为共享注意力向量,用于获取注意力值,h

表示向量维度,是可训练的权重矩阵,是偏置向量;
[0031]
对得到的注意力值使用softmax函数进行归一化得到最终的权重对应所有的n个节点,得到学习的权重将学习到的权重进行对角化处理理利用学习到的权重将这三种嵌入结合起来,得到最终的节点嵌入z:
[0032]
z=α
t
·zt
αc·
zc αk·
zk。
[0033]
进一步地,所述步骤(5)中目标函数的构造具体为:
[0034]
使用l2正则化对原始图以及构造的k-近邻图输入参数共享的图卷积网络分别得到的节点嵌入z
ct
和z
ck
进行归一化,得到的归一化矩阵用来获取节点间的相似度;
[0035][0036][0037]
其中,并且使用f范数||
·
||f进行一致性约束:
[0038][0039]
使用hsic准则得到差异性约束
[0040][0041]
将前期的约束条件和节点分类的损失函数相结合,γ、β分别为一致性约束和差异性约束的参数,得到最终的目标函数:
[0042][0043]
进一步地,所述步骤(5)中在得到最终节点嵌入z之后,运用线性变换和softmax分类器获取节点的类别预测。
[0044]
基于相同的发明构思,本发明提供一种基于多通道图卷积网络的社交网络节点分类系统,包括:
[0045]
数据处理模块,用于获取社交网络图数据集,社交网络图为无向图,节点表示用户,用户具有不同属性,经处理后数据集中包含有标签数据以及无标签数据;
[0046]
拓扑与特征空间节点嵌入模块,用于根据社交网络图数据集中的节点属性构造属性矩阵和邻接矩阵,将社交网络图的属性矩阵x以及邻接矩阵a作为图卷积网络的输入来提取社交网络图本身的结构信息,通过图卷积网络n1得到对应的节点嵌入表示z
t
;使用knn算法构造社交网络图的k-近邻图,利用构造的k-近邻图的邻接矩阵ak和属性矩阵x来获取节点的特征关系,通过图卷积网络n2得到对应的节点嵌入表示zk;
[0047]
公共节点嵌入模块,用于使用参数共享的图卷积网络c来提取不同属性矩阵和邻接矩阵作为输入的公共信息,并且使用度量函数来衡量不同节点嵌入表示之间的差异获取公共节点嵌入zc;
[0048]
节点嵌入融合模块,用于使用个性化注意力机制来自动化学习节点嵌入的权重,获取相对应的权重之后,利用权重对之前操作得到的节点嵌入z
t
,zk,zc进行结合得到最终的节点嵌入z;
[0049]
以及预测模块,用于对节点嵌入分别进行一致性约束和差异性约束,并使用交叉熵损失函数作为损失函数;将前期的约束条件和节点分类的损失函数相结合,得到最终的目标函数进行优化;将最终节点嵌入z输入softmax分类器中,输出节点的类别预测。
[0050]
基于相同的发明构思,本发明提供一种计算机系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的基于多通道图卷积网络的社交网络节点分类方法。
[0051]
有益效果:与现有技术相比,本发明的优点和效果在于克服图卷积网络不能很好融合拓扑结构和节点特征的缺陷,体现在基于两个独立的图卷积网络通道和参数共享的图卷积网络通道,获取拓扑结构和节点特征信息的同时,也能够同时提取两者间的公共信息。具体表现为:
[0052]
(1)将原始社交网络图的邻接矩阵以及特征矩阵作为拓扑空间的输入来提取图本身的结构信息,通过图卷积网络的特征传播之后得到最终的节点嵌入表示。使用knn算法构造k-近邻图,将k-近邻图对应的邻接矩阵和特征矩阵作为特征空间的输入来获取节点的特征关系。
[0053]
(2)使用参数共享的简化图卷积网络来提取两个空间的公共信息,并将得到的两个节点嵌入使用度量函数来得到公共嵌入。
[0054]
本发明在使用图卷积网络模型之后,同时使用个性化注意力机制来获取节点嵌入的权重,并且利用权重对之前操作得到的三个节点嵌入进行结合得到最终的节点嵌入表示。将一致性约束、差异性约束和交叉熵损失函数结合作为目标函数,不断对整个模型进行优化,增强了节点分类的准确性。
附图说明
[0055]
图1为本发明的方法总体流程示意图。
[0056]
图2为本发明的算法详细结构示意图。
具体实施方式
[0057]
下面结合附图和具体实施例对本发明做进一步说明。
[0058]
本发明的主要技术思路是:本发明采用基于多通道图卷积网络进行社交网络节点分类,采用多个图卷积网络分别对图的拓扑结构、节点特征以及两者组合进行特征提取,充分提取节点标签的相关信息,提高节点分类的准确性。本发明中间过程采用注意力机制去学习节点嵌入的权重,有助于保留重要信息。同时本发明的参数优化过程充分考虑到不同模块间节点嵌入的关联以及相同输入产生的节点嵌入的差异性,有助于探究数据之间的深层联系,进一步提高分类准确率。
[0059]
本发明实施例提供的基于多通道图卷积网络的社交网络节点分类方法,主要步骤如下:
[0060]
一、独立的图神经网络通道获取节点嵌入,这个步骤包括两个部分:
[0061]
1、将社交网络原始图的邻接矩阵以及特征矩阵作为拓扑空间的输入来提取图本身的结构信息,通过图神经网络得到最终的节点嵌入表示。
[0062]
2、使用knn算法构造k-近邻图,将k-近邻图对应的邻接矩阵和特征矩阵作为特征空间的输入来获取节点的特征关系。同样地,利用图神经网络得到对应的节点嵌入。
[0063]
二、通用图神经网络通道获取节点嵌入
[0064]
使用参数共享的图卷积网络来提取两个空间的公共信息,并将得到的两个节点嵌入利用度量函数得到公共嵌入。经典的图卷积网络模型在获取节点嵌入的过程中,不能很好的融合节点特征和拓扑信息。为了更好的获取节点信息,我们使用参数共享的简化图卷积来对节点特征和拓扑信息进行提取融合。
[0065]
三、使用个性化注意力机制来获取节点嵌入权重
[0066]
在获取相应的节点嵌入之后,因为不同节点嵌入对节点的标签信息的重要程度并不相同,使用注意力机制来自动化学习节点嵌入的权重,获取相对应的权重之后,利用权重对之前操作得到的三个节点嵌入进行结合得到最终的节点嵌入。
[0067]
四、构造目标函数优化模型
[0068]
对节点嵌入进行差异化约束和共性约束,并使用交叉熵损失函数作为损失函数。将前期的约束条件和节点分类的损失函数相结合,得到最终的目标函数。通过不断地调整参数设置,使目标函数最小化来获取模型的最优状态。
[0069]
五、应用训练好的网络模型对测试数据进行分类
[0070]
最后阶段,我们使用训练好的网络模型验证测试数据集,利用在最后一层的softmax函数作为分类器。
[0071]
下面结合图1和图2,对本发明实施例公开的基于多通道图神经网络的社交网络节点分类方法的步骤进行详细说明。具体步骤如下:
[0072]
(1)获取社交网络图数据集,社交网络图为无向图,节点表示用户,且用户具有年龄、职业、爱好等不同属性,经处理后数据集中包含有标签数据以及无标签数据;
[0073]
(2)根据社交网络数据集中的节点属性构造属性矩阵和邻接矩阵分别输入到图卷积网络n1,n2中:
[0074]
(2-1)将社交网络图的属性矩阵x以及邻接矩阵a作为图卷积网络的输入来提取社交网络图本身的结构信息,通过图神经网络n1之后得到对应的节点嵌入表示z
t

[0075]
(2-2)通过节点属性向量计算节点间余弦相似度,为每个节点选择前k个相似节点来构造社交网络图的k-近邻图,将构造的k-近邻图的邻接矩阵ak和属性矩阵xk来获取节点的特征关系。同样地,通过图卷积网络n2得到对应的节点嵌入表示zk;
[0076]
(3)使用参数共享的图卷积网络c来提取不同属性矩阵和邻接矩阵作为输入的公共信息,并且使用度量函数来衡量不同节点嵌入表示之间的差异获取公共节点嵌入zc;
[0077]
(4)使用个性化注意力机制来自动化学习节点嵌入的权重,获取相对应的权重之后,利用权重对之前操作得到的节点嵌入z
t
,zk,zc进行结合得到最终的节点嵌入z;
[0078]
(5)对节点嵌入分别进行一致性约束和差异性约束,并使用交叉熵损失函数作为损失函数;将前期的约束条件和节点分类的损失函数相结合,得到最终的目标函数进行优化;将最终节点嵌入z输入softmax分类器中,输出节点的类别预测。
[0079]
步骤(1)中利用社交网络平台收集用户的原始数据,所述社交网络数据集中节点
代表不同用户,属性矩阵表示为x=[x1,x2,...,xn],其中xi表示节点属性向量,n表示社交网络图包含的节点数量。原始邻接矩阵a中,存在关联的节点具有连接性即a
ij
=1,反之a
ij
=0,ak为k-近邻图对应的邻接矩阵,knn算法为每个节点选择k个相似节点,目标节点与k个相似节点之间的a
ij
=1,与其他节点默认不连接即a
ij
=0。
[0080]
步骤(2-1)中我们使用社交网络原始图g=(a,x)作为图卷积网络n1的输入来获取原始社交网络图结构方面的特征信息。这里图卷积网络n1采用去除非线性激活函数后的简化图卷积网络sgc。为了对不同的节点嵌入进行区分,经过l层图神经网络n1后得到的节点嵌入表示为
[0081][0082]
其中,将邻接矩阵a
t
=a进行归一化处理=a进行归一化处理为自连接矩阵a
t
i的度矩阵,i为单位矩阵,w
t
为可训练的参数矩阵,将最终的所有节点嵌入表示为z
t

[0083]
步骤(2-2)中首先构造社交网络图的k-近邻图gk=(ak,x),其中ak是构造的k-近邻图对应的邻接矩阵。使用构造的k-近邻图的邻接矩阵ak以及属性矩阵x作为图卷积网络n2的输入,图卷积网络n2采用去除非线性激活函数后的简化图卷积网络sgc,经过l层图神经网络n2后得到第l层的节点嵌入表示为
[0084][0085]
将邻接矩阵ak进行归一化处理后记为进行归一化处理后记为为自连接矩阵ak i的度矩阵,wk为可训练的参数矩阵,将最后一层所有节点嵌入记为zk。
[0086]
步骤(3)中使用参数共享的图卷积网络c提取社交网络原始图以及k-近邻图的公共信息,具体为:对于参数共享的图卷积网络c,同样的,我们将社交网络原始图g=(a,x)以及构造的k-近邻图gk=(ak,x)分别输入到图卷积网络c中,经过l层图神经网络c后,得到第l层的节点嵌入分别表示为:
[0087][0088][0089]
其中wc是层间共享的权重矩阵,用来从不同的输入中过滤出可共享的信息。根据不同的输入图,我们得到两个最终的节点嵌入输出为z
ct
和z
ck
,我们对获取的节点嵌入进行平均操作,得到两个空间的共同嵌入zc:
[0090][0091]
其中,d(
·
)表示度量函数,当使用欧氏距离作为度量函数时,zc则可以表示为:
[0092][0093]

[0094]
zc=(z
ct
z
ck
)/2#(7)
[0095]
步骤(4)中使用个性化注意力机制自动化的去学习嵌入的相对应的权重。具体为:使用个性化注意力机制att(z
t
,zc,zk)去学习相应的权重α
t
,αc,αk:
[0096]

t
,αc,αk)=att(z
t
,zc,zk)#(8)
[0097]
其中分别代表节点嵌入z
t
,zc,zk中n个节点的权重值。首先,根据节点嵌入z
t
,我们可以获得任意节点i的节点特征向量然后获取注意力值
[0098][0099]
为共享注意力向量,用于获取注意力值,h

表示向量维度,是可训练的权重矩阵,是偏置向量。按照相同的方式,根据节点嵌入zc,zk我们可以得到注意力值
[0100][0101][0102]
最后对得到的注意力值使用soktmax函数进行归一化得到最终的权重
[0103][0104]
表示拓扑空间节点i的权重值,经过softmax归一化后得到最终权重对应所有的n个节点,我们可以得到学习的权重将学习到的权重进行对角化处理理利用学习到的权重将这三种嵌入结合起来,得到最终的节点嵌入z:
[0105]
z=α
t
·zt
αc·
zc αk·
zk#(13)
[0106]
步骤(5)中目标函数的构造,具体为:我们将原始图g=(a,x)以及构造的k-近邻图gk=(ak,x)输入参数共享的图卷积模块分别得到节点嵌入z
ct
和z
ck
,为了增加两者之间的共同性,首先使用l2正则化对节点嵌入z
ct
和z
ck
进行归一化,得到的归一化矩阵用来获取节点间的相似度。
[0107][0108][0109]
其中,并且使用f范数||
·
||f进行一致性约束:
[0110][0111]
对于节点嵌入z
t
和z
ct
是由相同的原始图在不同简化图卷积模块得到的,同样的,zk和z
ck
是相同特征图在不同模块得到的不同的节点嵌入。为了确保能够从不同的模块中获取的节点信息具有一定的差异性,我们使用hsic准则增强两者之间的差异。
[0112]
节点嵌入z
t
和z
ct
的hsic约束定义为:
[0113]
hsic(z
t
,z
ct
)=(n-1)-2
tr(rk
t
rk
ct
)#(17)
[0114]
其中,k
t
和k
ct
是格拉姆矩阵,是格拉姆矩阵,为中心化矩阵,in为n
×
n单位矩阵,e为全1n维列向量。
[0115]
同样的,节点嵌入zk和z
ck
的hsic约束定义为:
[0116]
hsic(zk,z
ck
)=(n-1)-2
tr(rkkrk
ct
)#(18)
[0117]
由此可以得到差异性约束
[0118][0119]
假设对于训练集是l,类别数为c,对于每一个i∈l,y
ij
指代节点i属于类别j的标签概率真实值,节点i属于类别j的标签预测值是那么所有训练节点的节点分类的交叉熵损失表示为
[0120][0121]
将前期的约束条件和节点分类的损失函数相结合,γ、β分别为一致性约束和差异性约束的参数,由此得到最终的目标函数:
[0122][0123]
步骤(5)中将最终的节点嵌入表示输入softmax分类器中,获取节点分类预测,最终得到社交网络数据集节点类别结果。对于节点分类任务,在得到最终节点嵌入z之后,运用线性变换和softmax分类器获取节点的类别预测。
[0124]
为证明本发明的效果,将本发明在blogcatalog社交网络数据集上的表现分别与现有方法进行了对比。
[0125]
如表1所示,表中展示了本发明(英文缩写为ms-gcn)在blogcatalog社交网络数据集上的分类结果,blogcatalog社交网络数据集总共5196个节点,所有节点分为六个类别,测试集使用了1000个节点,训练集按照不同标记率的数量也不相同,表中标签率是指每个类别中有标签的节点数量,20、40、60代表在节点分类中的每个类别有标签的节点数量分别为120、240、360。对于参数设置,初始学习率为0.05,dropout率为0.5,k值为7,γ设置为1e-3,β设置为1e-8。表格上面对比算法数据来自于相关作者文章,在blogcatalog社交网络数据集上的实验结果,所有实验结果均为运行10次取平均所得。表格中的对比算法都是比较经典的网络模型。从表格数据可以看出无论标签率怎么变化,本发明的节点分类效果都是最好的,由此可以看出本发明对节点分类任务的有效性。
[0126]
表1 6种算法在blogcatalog社交网络数据集上的分类效果
[0127][0128]
基于相同的发明构思,本发明实施例提供的一种基于多通道图卷积网络的社交网络节点分类系统,包括:数据处理模块,用于获取社交网络图数据集,社交网络图为无向图,节点表示用户,用户具有不同属性,经处理后数据集中包含有标签数据以及无标签数据;拓扑与特征空间节点嵌入模块,用于根据社交网络图数据集中的节点属性构造属性矩阵和邻
接矩阵,将社交网络图的属性矩阵x以及邻接矩阵a作为图卷积网络的输入来提取社交网络图本身的结构信息,通过图卷积网络n1得到对应的节点嵌入表示z
t
;使用knn算法构造社交网络图的k-近邻图,利用构造的k-近邻图的邻接矩阵ak和属性矩阵x来获取节点的特征关系,通过图卷积网络n2得到对应的节点嵌入表示zk;公共节点嵌入模块,用于使用参数共享的图卷积网络c来提取不同属性矩阵和邻接矩阵作为输入的公共信息,并且使用度量函数来衡量不同节点嵌入表示之间的差异获取公共节点嵌入zc;节点嵌入融合模块,用于使用个性化注意力机制来自动化学习节点嵌入的权重,获取相对应的权重之后,利用权重对之前操作得到的节点嵌入z
t
,zk,zc进行结合得到最终的节点嵌入z;以及预测模块,用于对节点嵌入分别进行一致性约束和差异性约束,并使用交叉熵损失函数作为损失函数;将前期的约束条件和节点分类的损失函数相结合,得到最终的目标函数进行优化;将最终节点嵌入z输入softmax分类器中,输出节点的类别预测。各模块具体实现细节参考上述方法实施例,此处不再赘述。
[0129]
基于相同的发明构思,本发明实施例提供的一种计算机系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该计算机程序被加载至处理器时实现所述的基于多通道图卷积网络的社交网络节点分类方法。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献