一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种复杂网络中关键节点识别方法与流程

2022-02-21 03:59:53 来源:中国专利 TAG:


1.本发明属于复杂网络技术领域,涉及一种复杂网络中关键节点识别方法。


背景技术:

2.现实世界中很多的复杂系统都可以抽象为拥有简单结构的网络。简而言之,网络是由系统中真实存在的某种要素抽象而成的节点,和表示这种要素之间某种联系的连边构成。诸如金融网络、生物系统、社交系统、电力与运输系统等都能够在有限的加工处理后,抽象为网络的结构,并利用复杂网络的理论去研究解决实际问题。近十年来,复杂网络理论的飞速发展与应用为我们认识世界、研究世界提供了新的方法论支撑。
3.复杂网络中的关键节点指的是对网络的结构或功能发挥至关重要的作用的一小部分特殊节点。面对肆虐的传染病,应该制定什么样的接种免疫策略以阻止病毒的传播?食物链系统中哪些物种生存状态的变化可能对整个生态系统产生最大的影响?破坏复杂网络哪些节点会使得整个网络的功能瘫痪?复杂网络中关键节点识别方法为这些问题提供了一种可能的解决方案。
4.现有的技术中,识别复杂网络中的关键节点的可以利用度中心性(degree centrality),介数中心性(betweenness centrality),接近度中心性(closeness centrality)等度量。
5.度中心性方法认为度越大的节点能够直接影响的邻居越多,也就越关键,即该方法认为与节点相关联的边数越多的节点越关键。一个节点的介数中心性被定义为通过该节点的所有测地路径(最短路径)的权重之和,介数中心性描述了一个顶点在其它顶点之间路径上的分布程度。介数中心性方法认为介数越大的节点越关键。接近度中心性方法认为一个节点与网络中其它节点的平均距离越小,该节点越关键。
6.但是,这些现有的方法仅仅关注了复杂网络的局部结构或部分拓扑信息,而没有考虑网络的全局信息。


技术实现要素:

7.本发明提供一种复杂网络中关键节点识别方法,目的在于解决现有技术存在的不足。
8.为实现上述目的,本发明采取的技术方案是:
9.一种复杂网络中关键节点识别方法,包括以下步骤:
10.(1)根据网络g的拓扑信息,构造复杂网络对应的密度算子ρ(g);
11.(2)计算网络g的谱熵s
τ
(g);
12.(3)构造网络中每个节点生成的扰动网络g
x

13.(4)每个扰动网络的谱熵s
τ
(g
x
)的近似计算;
14.(5)最终得到每个节点的纠缠度e(x)。
15.进一步地,步骤(1)中所述根据网络g的拓扑信息,构造复杂网络对应的密度算子ρ
(g),包括以下步骤:
16.1)获取拓扑网络g(v,e)的结构数据,其中所述网络g包括无权网络或含权网络,所述v是网络中所有节点的集合,所述e表示网络中所有链接的集合;
17.2)计算网络g的邻接矩阵a,当且仅当链接(i,j)∈e时,所述邻接矩阵a中第(i,j)位置的元素的a
ij
不为0,如果网络中有n个节点,那么所述邻接矩阵a为n维方阵;
18.3)计算网络g的图拉普拉斯矩阵l,
19.l=d-a;
20.其中,d为对角矩阵且对角元为节点的度,即
[0021][0022]
其中,ki表示节点i的度数,即和节点i相关的链接数,n为网络的维数;
[0023]
4)计算网络g的密度算子ρ(g)
[0024]
网络g对应的密度算子ρ(g)可以表示为:
[0025][0026]
其中,配分函数z=tr(e-τl
),tr(
·
)为取迹函数。
[0027]
进一步地,步骤(2)中所述计算网络g的谱熵s
τ
(g),包括以下步骤:
[0028]
1)对图拉普拉斯矩阵l进行谱分解,即
[0029][0030]
其中,λi和vi分别为l的特征值和对应的特征向量,n表示网络的维数;
[0031]
2)利用谱分解定理可以简化谱熵的计算过程,通过化简可以得到谱熵s
τ
(g)的表达式为:
[0032][0033]
其中,配分函数
[0034]
进一步地,步骤(3)中所述构造每个节点生成的扰动网络g
x
,构造方式包括以下步骤:
[0035]
节点x及其邻居节点形成的子图变为概率完全图,网络中其它链接关系保持不变;所述概率完全图的链接概率对于无权网络得到链接概率的简化形式c
x
为节点x的聚类系数;
[0036]
对网络中的每个节点都执行相同的操作,得到n个扰动网络。
[0037]
进一步地,步骤(4)中所述每个扰动网络的谱熵s
τ
(g
x
)的近似计算,包括以下步骤:
[0038]
1)计算每个扰动网络g
x
的特征值
[0039]
对于大规模网络,注意到每个扰动网络g
x
的图拉普拉斯矩阵同原始网络g只会有很少的项发生微小的扰动,记所述扰动为δl(δl=l-l

),为了降低算法复杂度,使用近似
方法计算扰动网络的特征值和对应的谱熵,所述近似计算过程如下:
[0040]
扰动网络的图拉普拉斯矩阵的特征值λ
′i(l)的表达式为:
[0041]
λ
′i(l)=v
′itl
′v′i;
[0042]
其中,v
′i为λ
′i对应的特征向量,由于l

同l仅有少数项发生了变化,用vi近似地代替v
′i可以得到:
[0043][0044]
特别地,注意到δl只有少数的非退化项,故只需要对这些项进行计算;
[0045]
扰动网络g
x
对应的密度算子ρ的特征值可以近似地表示为:
[0046][0047]
其中,扰动网络的配分函数
[0048]
2)计算扰动网络g
x
的谱熵sτ(g
x
)
[0049]
将扰动网络的特征值代入谱熵的定义式可以得到
[0050][0051]
其中,扰动网络的配分函数
[0052]
进一步地,步骤(4)中所述最终得到每个节点的纠缠度e(x)包括:
[0053]
定义节点x的纠缠度为:
[0054]et
(x)=s
τ
(gx)-s
τ
(g);
[0055]
其中,传播时间τ为可选参数。当扰动网络的连通性尽可能不受参数τ的影响,参数τ的选取方式应该使得节点的纠缠度最小,在这种情形下,节点x的纠缠度e(x)可以表示为:
[0056][0057]
本发明与现有技术相比,具有以下优点和有益效果:
[0058]
本发明受量子信息论启发,创造性地提出了复杂网络中节点纠缠的概念,并利用节点纠缠识别复杂网络中的关键节点。该方法不仅考虑了复杂网络的局部结构和拓扑信息,而且也考虑了网络的全局信息,方法计算简单,应用范围广泛。
[0059]
本发明可以应用于网络的攻击,网络中少量纠缠性较强的节点受到攻击就可能导致整个网络的崩溃,即从网络中删除少量纠缠性较强的节点时,可以使得网络快速分解为若干个节点数较小的联通网络。本发明还可以用在网络营销、重点人群接种免疫、大规模电网性能分析等方面。
[0060]
特别地,本发明可以应用于识别自闭症患者的关键脑区,即自闭症患者的功能脑网络中关键节点的识别。并且,本发明提出的复杂网络中关键节点的识别方法可以应用于自闭症患者的行为预测,预测方法如下。首先,分别计算自闭症患者和对照组(即正常被试者)功能脑网络中所有节点的纠缠度,记为yi(i=1,2,

,n);接着,计算正常被试者的每个节点的纠缠度的均值,记为xi(i=1,2,

,n);然后,对点集(xi,y
i-xi)进行线性拟合得到斜率k。指标k可以反应被试者功能脑网络的拓扑异常情况,通过实验也发现自闭症患者和正
常被试者的k值存在显著差异(自闭症患者的k值显著低于正常被试者),并且指标k与自闭症患者的智商呈现较强的正相关性。
[0061]
本发明应用范围广泛,包括且不局限于上文列举的应用案例。
附图说明
[0062]
图1是本发明复杂网络中关键节点识别方法的流程图;
[0063]
图2是本发明扰动网络的构造示意图。
具体实施方式
[0064]
为了使本发明的目的、解决的技术问题以及技术方案更加清晰,下面结合附图和具体实施例对本发明做进一步的描述。
[0065]
一、方法步骤
[0066]
针对现有技术只利用了复杂网络局部或部分信息的缺陷,本发明提出一种考虑了网络结构全局信息的关键节点识别方法,如图1所示,其详细步骤如下:
[0067]
1.根据网络g的拓扑信息,构造复杂网络对应的密度算子ρ(g)(对应流程图步骤1-2)
[0068]
(1)获取拓扑网络g(v,e)的结构数据,其中所述网络g既可以是无权网络,也可以是含权网络,所述v是网络中所有节点的集合,所述e表示网络中所有链接的集合。
[0069]
(2)计算网络g的邻接矩阵a。当且仅当链接(i,j)∈e时,所述邻接矩阵a中第(i,j)位置的元素的a
ij
不为0。如果网络中有n个节点,那么所述邻接矩阵a为n维方阵。
[0070]
(3)计算网络g的图拉普拉斯矩阵l,计算方式如下:
[0071]
l=d-a;
[0072]
其中,d为对角矩阵且对角元为节点的度,即
[0073][0074]
其中,ki表示节点i的度数,即和节点i相关的链接数,n为网络的维数。
[0075]
(4)计算网络g的密度算子ρ(g)
[0076]
网络g对应的密度算子ρ(g)可以表示为:
[0077][0078]
其中,配分函数z=tr(e-τl
),tr(
·
)为取迹函数。
[0079]
2.计算网络g的谱熵s
τ
(g)(对应流程图步骤3-4)
[0080]
利用网络的密度算子ρ(g),可以定义网络谱熵为:
[0081]sτ
(g)=s
τ
(ρ)=-tr(ρlog2p);
[0082]
其中,参数τ在物理上表示网络的扩散时间。以往复杂网络的熵主要是基于网络的部分信息定义的,而忽略了其它信息;谱熵则从网络的全局视角看待复杂系统。
[0083]
利用定义直接计算谱熵s
τ
(g)较为复杂,本发明简化了网络g谱熵s
τ
(g)具体计算过程,详细步骤如下。
[0084]
(1)对图拉普拉斯矩阵l进行谱分解,即
[0085][0086]
其中,λi和vi分别为l的特征值和对应的特征向量,n表示网络的维数。
[0087]
(2)利用谱分解定理可以简化谱熵的计算过程,通过化简可以得到谱熵s
τ
(g的表达式为:
[0088][0089]
其中,配分函数
[0090]
3.构造网络中每个节点生成的扰动网络g
x
(对应流程图步骤5)
[0091]gx
表示在网络g中移除节点x后形成的网络,因此g
x
被称为“扰动网络”。一种最简单的构造方式就是直接从网络中删除节点x,并不进行其它调整,这会使得扰动网络的节点数n、链接数m、平均度《k》等网络的基本属性都发生变化。更为合理的方式则要求g
x
尽可能保持原网络g的结构特征。
[0092]
基于上述思想,本发明将不直接移除节点x,而是选择将节点x及其邻居节点形成的子图变成概率完全图,其它节点间的链接关系保持不变。
[0093]
所述概率完全图表示任意两个节点之间都存在概率链接的完全图,即任意两个节点之间链接的权重w满足0≤w≤1(无权网络),或w
min
≤w≤w
max
(含权网络,w
min
和w
max
分别表示含权网络中的最小和最大链接权重)。
[0094]
扰动网络g
x
的构造方式示意图如图2所示。
[0095]
本发明要求,节点x及其邻居节点形成的子图变为概率完全图,网络中其它链接关系保持不变;所述概率完全图的链接概率对于无权网络可以得到链接概率的简化形式c
x
为节点x的聚类系数。
[0096]
对网络中的每个节点都执行相同的操作,可以得到n个扰动网络。
[0097]
4.每个扰动网络的谱熵s
τ
(g
x
)的近似计算(对应流程图步骤6-7)
[0098]
(1)计算每个扰动网络g
x
的特征值
[0099]
对于大规模网络,注意到每个扰动网络g
x
的图拉普拉斯矩阵同原始网络g只会有很少的项发生微小的扰动,记所述扰动为δl(δl=l-l

)。为了降低算法复杂度,本发明使用近似方法计算扰动网络的特征值和对应的谱熵,所述近似计算过程如下。
[0100]
扰动网络的图拉普拉斯矩阵的特征值λ
′i(l)的表达式为:
[0101]
λ
′i(l)=v

it
l
′v′i;
[0102]
其中,v
′i为λ
′i对应的特征向量。由于l

同l仅有少数项发生了变化,用vi近似地代替v
′i可以得到:
[0103][0104]
特别地,注意到δl只有少数的非退化项(非0项),故只需要对这些项进行计算。
[0105]
扰动网络g
x
对应的密度算子ρ的特征值可以近似地表示为:
[0106][0107]
其中,扰动网络的配分函数
[0108]
(2)计算扰动网络g
x
的谱熵s
τ
(g
x
)
[0109]
将扰动网络的特征值代入谱熵的定义式可以得到:
[0110][0111]
其中,扰动网络的配分函数
[0112]
5.最终得到每个节点的纠缠度e(x)(对应流程图步骤8)
[0113]
定义节点x的纠缠度为:
[0114]eτ
(x)=s
τ
(gx)-s
τ
(g);
[0115]
其中,传播时间τ为可选参数。因为本发明从网络结构的角度出发识别网络中的关键节点,我们希望扰动网络的连通性尽可能不受参数τ的影响,故本发明推荐的一种参数τ的选取方式应该使得节点的纠缠度最小。在这种情形下,节点x的纠缠度e(x)可以表示为:
[0116][0117]
在计算第一个节点的纠缠度时可以通过优化算法得到参数τ
*
;在计算其它节点的纠缠度时则可以随机选择一个其它节点的τ
*
作为初值并进行优化。
[0118]
需要注意的是根据定义所有节点的纠缠度均为负,故纠缠度在数值上越小,表明其纠缠性更强。相应的,纠缠性更强的节点在网络中更关键;简而言之,e(x在数值上越小的节点在网络中越关键。
[0119]
二、讨论分析
[0120]
1.配分函数z的物理解释
[0121]
一方面,τ

∞时,c表示网络的联通分支数,说明z与网络的连通性相关。另一方面,配分函数z与任意节点能够在τ时间返回初始位置的平均概率成正比,较高的平均返回概率表明网络结构易于将信息流困在初始位置,随机游走者难以有效的探索网络的其余部分。此外,z也会因为网络中链接或节点的删除而增加。上述分析都表明较大的z值反应网络的连通性较差。
[0122]
2.对节点纠缠度e
τ
(x)的多尺度分析
[0123]
节点x的纠缠度e
τ
(x)受参数τ的影响,对于不同尺度的τ,节点纠缠度的形式不同:
[0124]
微观尺度上,即当τ

0时,
[0125]eτ
(x)=s
τ
(g
x
)-s
τ
(c)=0。
[0126]
宏观尺度上,即当τ

∞时,
[0127][0128]
其中,c表示原始网络的联通分支数,c
x
表示节点x的扰动网络的联通分支数。若初
始网络为联通网络,那么e
τ
(x)=log2c
x


∞)。
[0129]
中间尺度上,即τ=τm,0<τm<∞时,
[0130][0131]
其中,δz表示扰动网络的配分函数z
x
同原始网络的配分函数z的差值,即δz=z
x-z。
[0132]
传播时间τ的微观、宏观与中间尺度分析均表明网络中节点的纠缠度与网络的结构有密切的联系,可以从网络结构上衡量节点的重要性。
[0133]
3.最优化参数τ
*
的存在性证明
[0134]
根据步骤5,本发明选择的参数τ
*
应满足:
[0135][0136]
一个重要的问题是这样的τ
*
是否存在,下面将证明τ
*
的存在性。
[0137]

[0138][0139]
由于函数f连续,且f(0 )=1,令则存在τ>0使得f(τ)<γ。此时,
[0140]eτ
(x)=s
τ
(g
x
)-s
τ
(g)<0,
[0141]
上述不等式成立是因为对于图拉普拉斯矩阵l的任意特征值λi(l)都满足不等式
[0142]
又因为当τ

∞时,e
τ
(x)=log2c
x
≥0。故对于任意的节点x,e
τ
(x)在τ∈(0,γ区间一定存在最小值,即τ
*
存在。证毕。
[0143]
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献