一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于时序网络社团检测的影响力最大化方法与流程

2021-11-06 00:03:00 来源:中国专利 TAG:


1.本发明属于互联网技术领域,特别是时序网络分析技术领域,具体涉及一种基于时序网络社团检测的影响力最大化方法。


背景技术:

2.近年来,随着互联网和社交媒体的高速发展,在线社交网络的规模越来越大,其传播规模和效率都远远超过传统社交网络。网络中少数节点可能对网络整体产生的影响也越来越大。因此,如何选择一个种子节点集,使得信息传播的范围最大引起了人们的广泛关注,这一问题就是影响力最大化。影响力最大化问题最早由广告营销领域提出,以解决病毒营销问题,他们关注于如何选择一群有影响力的人作为初始用户,使得公司的产品在用户群体中得到最大范围的推广。现在,影响力最大化也被广泛应用于推荐系统、信息扩散、时间探测、专家发现和链路预测等场景。
3.影响力最大化具体是指在给定网络中找到固定个数的初始活跃节点,经由特定的传播模型,使得最终活跃节点的数目达到最大。因此,在解决影响力最大化问题时我们需要关注网络结构和传播模型两个方面。目前关于影响力最大化的研究大部分是基于静态网络。然而,实际的网络并不是一成不变的,其拓扑结构是会随时间而变化的,静态网络忽略了这些变化和变化发生的时间顺序,这样就会丢失某些网络特征。为了考虑网络随时间的变化,我们的影响力最大化算法基于一种结构随时间变化的网络,即时序网络。
4.综上所述,大部分影响力最大化的解决方案也都是基于静态网络的,主要有三种:贪婪算法、启发式方法和社区划分方法。2003年,kempe等人首次将贪婪算法应用于解决影响力最大化问题,该算法由空的种子节点集开始,并迭代地添加相较于当前种子节点集具有最大边际收益的节点。该方法时间复杂度较高,无法处理规模较大的网络。研究人员又提出了一系列启发式方法,chen等人提出了度消减算法,该方法原理是对种子节点的邻居节点进行惩罚。此外,morone等人提出了一种通过考虑远距离节点的度选择种子节点的方法。然而,启发式方法对网络结构依赖程度较高,对于结构不同的网络其精确度相差较大,并且在大部分网络中启发式方法选择种子节点的精确度都大幅低于贪婪算法。为了尽可能保证精确度,wang等人提出了基于社区划分的cga算法来解决影响力最大化问题。


技术实现要素:

5.本发明的目的是提供一种基于时序网络社团检测的影响力最大化方法,解决现有影响力最大化种子节点选取方法对时序信息考虑不足,选择种子节点精确度不足,算法效率较低的缺点。
6.本发明方法具体是:
7.步骤(1)节点嵌入,包括微观动力学嵌入和宏观动力学嵌入:
8.对于一个给定的时序网络对于一个给定的时序网络和ε分别为节点集和边集,为时间序列,每个时序边(u
i
,u
j
,t)∈ε表示节点u
i
和节点u
j
在t时刻产生连边,ε为边的集合;时序网
络嵌入的目标为学习一个映射函数其中d为嵌入维度,且其中d为嵌入维度,且表示实数域;
9.所述的微观动力学嵌入,通过最小化以下目标函数来记录时序网络中的微观动态:
10.其中,p表示节点u
i
在t时刻之前的某个历史邻居,和分别是节点u
i
和u
j
在t时刻之前的历史邻居集;
11.所述的宏观动力学嵌入,通过最小化以下目标函数来记录时序网络中的宏观动态:
12.δe(t)=e(t)

e(t

1);e(t)为截至t时刻的累计边数,δe

(t)为t时刻产生的新连边数;
13.统一目标函数宏观动力学嵌入所占权重η∈[0,1];
[0014]
步骤(2)社区检测:采用一种不指定社区数量的聚类方法,将网络中的节点划分到不同社区;首先将网络进行嵌入,根据嵌入结果,计算每个节点对之间的相似性;然后将每个节点作为一个社区,如果两个节点之间的相似度是最大的,则将两个节点划分到同一个社区;将新创建的社区视为一个节点,继续上一个步骤,直到达到结束条件;
[0015]
步骤(3)生成候选种子节点:
[0016]
对于一个给定的时序网络和一个种子节点集的大小k,通过社区检测得到一组社区,即聚类结果c={c1,c2,

,c
r
},c
r
即为第r个社区,n
r
为社区c
r
中的节点数,则重要社区选择每个重要社区中节点度和相似度总和的前τ%的节点作为候选种子节点,τ=5~20,节点度为邻居节点的个数;
[0017]
步骤(4)种子节点选择:
[0018]
(4

1)种子节点分配:对于一个给定的时序网络和种子节点集的大小k,假设c
s
={c1′
,c2′
,

,c

r

},并且每个社区c

r

有n

r

个节点,则c

r

中分配的种子节点数r

=1,2,

,r


[0019]
(4

2)选择种子节点:使用位置分数和中枢度两个指标作为评价指标,使用优先级比较规则比较候选节点集中节点的优先级,确定最终的种子节点;
[0020]
位置分数位置分数表示任意;
[0021]
节点的中枢度sc为社区集c中已经选择了种子节点的社区集;
[0022]
对于给定的一个社区中的两个候选节点,按照优先级比较规则进行比较,通过收集每个重要社区quota(c
i

)个高优先级节点,获得种子节点集。
[0023]
本专利方法将静态网络中的影响力最大化问题扩展到时序网络中,提出了一种基于时序网络社团检测的影响力最大化算法。首先对时序网络进行嵌入,将网络中节点的用低维度向量表示,以捕捉到网络中的拓扑结构。然后通过节点嵌入向量计算节点间的相似性,根据相似性将节点划分为不同社区。最后在不同社区中选择种子节点,构成最终的种子节点集。
[0024]
本发明方法考虑到网络中的时序信息,并采用社区划分方法选择种子节点,此为技术方案的关键点。本发明方法在选取影响力最大的种子节点时,解决现有影响力最大化种子节点选取方法对时序信息考虑不足,选择种子节点精确度不足的缺点,丰富了基于时序网络选取影响力最大化种子节点集的方法。
具体实施方式
[0025]
下面通过具体实施例进一步说明本发明的技术方案:
[0026]
本发明提出一种基于时序网络社团检测的影响力最大化方法。考虑到网络中的时序信息,并采用社区划分方法选择种子节点,此为技术方案的关键点。本发明方法在选取影响力最大的种子节点时,解决现有影响力最大化种子节点选取方法对时序信息考虑不足,选择种子节点精确度不足的缺点,丰富了基于时序网络选取影响力最大化种子节点的方法。
[0027]
该方法具体是:
[0028]
步骤(1)节点嵌入:对于一个给定的时序网络步骤(1)节点嵌入:对于一个给定的时序网络和ε分别为节点集和边集,为时间序列,每个时序边(u
i
,u
j
,t)∈ε表示节点u
i
和u
j
在t时刻产生连边,ε为边的集合;时序网络嵌入的目标为学习一个映射函数其中d为嵌入维度,且其中d为嵌入维度,且表示实数域;函数f的目标是在时序网络微观和宏观两个维度上模拟网络的演化模式,包括微观动力学嵌入和宏观动力学嵌入。
[0029]
a.微观动力学嵌入:微观动力学描述了给定的时序网络的网络结构形成过程,边形成时间序列(u
i
,u
j
,t)表示节点u
i
和u
j
在t时刻建立边这一时序边,即时序事件,边形成的顺序序号m=1,2,

,|ε|。基于此,采用时序注意点过程记录时序网络的微观动力学;
[0030]
首先,对于一条时序边o=(u
i
,u
j
,t),即一个时序事件,通过网络嵌入得到嵌入矩阵阵为节点u
i
嵌入得到的向量,以此参数化事件发生的强度,基于节点自身的基础强度和邻居的历史影响,时序边o=(u
i
,u
j
,t)出现强度:
[0031]
其中,g(
·
)是度量两个节点相似度的函数,p表示节点u
i
在t时刻之前的某个历史邻居,t
p
表示历史邻居p建立连边的时刻;和分别为节点u
i
的历史邻居节
点u
p
和节点u
j
的历史邻居节点u
q
嵌入得到的向量;和分别是节点u
i
和u
j
在t时刻之前的历史邻居集;α和β为两个由分层时序注意力机制定义的注意力系数,时间衰减函数κ(t

t
p
)=exp(

δ
i
(t

t
p
)),δ
i
>0是与节点相关且可学习的衰减率。
[0032]
使用指数函数对出现的强度进行变换,得到均为正实数的出现强度
[0033]
确定来自邻居节点的局部影响:
[0034]
节点u
i
的历史邻居节点u
p
与节点u
j
之间的相似度u
p
对于时序事件o=(u
i
,u
j
,t)依赖于节点u
i
,并随着邻域结构的变化而变化,局部注意力系数
[0035]
其中间参数其中,为并置运算,注意向量w为局部权重矩阵,sigmoid函数σ(x)=exp(x)/(1 exp(x))。
[0036]
确定来自所有邻居的全局影响:
[0037]
节点u
i
与节点u
j
形成的连边的全局注意力系数其中,节点u
i
的注意力中间参数节点u
j
的注意力中间参数节点u
i
所有历史邻居的信息集合节点u
j
所有历史邻居的信息集合过去事件的平均衰减量s(
·
)为单层神经网络,通过邻居聚合信息获得聚合嵌入,并且以过去事件的平均时间衰减量作为输入;
[0038]
则,t时刻节点u
i
和u
j
之间建立一条连边的概率
[0039][0040]
通过最小化以下目标函数来记录时序网络中的微观动态:
[0041][0042]
b.宏观动力学嵌入:
[0043]
对于给定的时序网络宏观动力学是指网络规模的演化过程,用网络中边的数量来指代网络规模,则边数量时间序列e(t)是截至t时刻的累计边数;
[0044]
t时刻产生的新连边数其中,n(t)为截止到t时刻的累
计节点数。根据网络演化中的网络密度服从幂律分布,可以得到平均可达邻居数量为线性稀疏系数,γ为幂律稀疏指数;任意节点u
i
在t时刻连接其他节点的概率θ为时间衰减指数。
[0045]
r(t)不仅依赖于网络中的时序信息,也依赖于网络结构。首先,随着网络密度的增加,网络中边缘的数量也会增加,边缘的增加速度就会降低,也就是说连接速率会随网络时间步的增加而衰减。其次,边缘的建立促进了网络结构的演化,连接速率与网络结构相关联。因此,为了在网络嵌入中捕获这些时序和结构特征,因此使用了时间衰减函数t
θ
和节点嵌入来参数化连接概率。
[0046]
通过最小化以下目标函数来记录时序网络中的宏观动态:
[0047][0048]
由于宏观与微观动力学相互驱动时序网络的演化,进而交替影响网络嵌入学习,所以使用以下统一模型来捕捉网络的拓扑结构形成过程和网络规模的演化模式:统一目标函数宏观动力学嵌入所占权重η∈[0,1]。
[0049]
步骤(2)社区检测:采用一种不指定社区数量的聚类方法,将网络中的节点划分到不同社区。首先,将网络进行嵌入,根据嵌入结果,计算每个节点对之间的相似性。然后将每个节点作为一个社区,如果两个节点之间的相似度是最大的,则将两个节点划分到同一个社区。将新创建的社区视为一个节点,继续上一个步骤,直到达到结束条件。为了判断结束条件是什么,引入了模块化增益这一概念。具体是:
[0050]
(2

1)计算节点间相似度:对于每个都有一个d维向量来表示;则相邻两节点u
i
和u
j
的相似度
[0051]
(2

2)计算模块化增益:对于一个给定的时序网络假设其聚类结果c={c1,c2,

,c
r
},c
r
为网络中节点的第r个聚类,r=1,2,

,r,r聚类总数;则,模块化增益其中,c
r
中节点相似度的和c
r
中节点和网络中其他节点的相似度之和网络中任意两个节点的相似度之和
[0052]
对于网络给定两个不同的聚类结果c和c

,由c到c

的模块化增益δq
c

c

=q(c

)

q(c),假设上次迭代的聚类结果和这次迭代的聚类结果分别为c和c

。如果由c到c

的模块化增益为负,则聚类停止。
[0053]
步骤(3)生成候选节点:由于现实中的社交网络非常大,因此在选择一组影响力最大的种子节点集之前,如何缩小候选种子节点集也是一个重要问题。相较于简单的将节点数较多的大型社区作为重要社区,基于以下定义来区分重要社区。
[0054]
首先选择重要社区:对于一个给定的时序网络和一个种子节点集的大小k,通过社区检测得到一组社区,即聚类结果c={c1,c2,

,c
r
},c
r
即为第r个社区,n
r
为社区c
r
中的节点数,则重要社区
[0055]
基于选择出的重要社区,社区的中心节点似乎理所应当是候选种子节点,但连接多个社区的中枢节点也应该被考虑,因为中枢节点可以轻松将影响传到不同社区。因此,除了将社区中度大的节点作为候选节点外,还定义节点相似度总和较大的节点作为候选节点。最终,选择每个重要社区中节点度和相似度总和的前10%的节点作为候选种子节点,节点度为邻居节点的个数。
[0056]
步骤(4)种子节点选择:
[0057]
(4

1)种子节点分配:由于社区的大小是决定重要社区的重要因素,大社区往往可能比小社区将影响传播给更多节点。采用重要社区中的节点总数来决定分配给每个重要社区的种子节点的数量。对于一个给定的时序网络和种子节点集的大小k,假设c
s
={c1′
,c2′
,

,c

r

},并且每个社区c

r

有n

r

个节点,则c

r

中分配的种子节点数r

=1,2,

,r


[0058]
(4

2)选择种子节点:在确定了c
s
中每个重要社区的种子节点个数后,开始在重要社区中选择种子节点。在选择种子节点时,不仅要考虑中心节点也要考虑中枢节点。因此,使用位置分数和中枢度两个指标作为评价指标。最终,使用一个优先级比较函数来比较候选节点集中节点的优先级,确定最终的种子节点。
[0059]
位置分数:将节点的位置得分定义为u
i
连接社区的数量,位置分数连接社区的数量,位置分数表示任意;
[0060]
对于节点的中枢度sc为社区集c中已经选择了种子节点的社区集;
[0061]
对于给定的一个社区中的两个候选节点,优先级比较由以下规则进行比较:
[0062]
a.比较两个非中枢节点时,度越大的节点优先级越高;如果非两个中枢节点的度相同,则相似度之和越大的节点优先级越高;
[0063]
b.比较两个中枢节点时,位置分数越高的节点优先级越高;如果两个中枢节点的位置分数相同,则度越大的节点优先级越高;如果度也相同,则相似度之和越大的节点优先级越高。除此之外,中枢节点的中枢度必须大于中枢阈值,因为中枢阈值过低代表他覆盖的社区太多;
[0064]
c.比较中枢节点和非中枢节点时,度越大的节点优先级越高;如果两个节点的度相同,则相似度之和越大的节点优先级越高。如果度也相同,则中枢节点优先级较高。
[0065]
通过收集每个重要社区quota(c
i

)个高优先级节点,获得种子节点集。
[0066]
本实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献