一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于网络拓扑特征的图网络生成方法及系统与流程

2022-02-20 05:55:24 来源:中国专利 TAG:


1.本发明涉及网络拓扑特征、网络生成技术领域,具体涉及一种基于网络拓扑特征的图网络生成方法及系统。


背景技术:

2.随着网络科学的迅速发展,网络科学与现实场景的交融也越来越深,网络与图是描述现实世界对象之间联系的重要模型,而现实应用的网络往往庞大且复杂,研究网络拓扑结构和特征是研究和分析网络的功能和特性的重要手段。典型的网络拓扑特征有介数中心性、接近中心性和叶子节点百分比等。网络拓扑特征作为网络科学的重要部分,在网络科学中有着较为广泛的应用,如合著网络,社交网络,路由网络等。如介数中心性是基于最短路径的图中心性的一种度量,对于连通图中的每一对节点,在节点之间至少存在一条最短路径,使得路径通过的边数(对于未加权图)或者边权重的和(对于加权图)最小,节点的介数中心性是经过该节点的最短路径的数量,它代表节点之间相互独立的程度;例如在街道、交通网络中,介数中心性可以作为网络拥塞和负载的静态预测器,用以判断交通拥堵等情况,因为介数中心性是基于最短路径的图中心性的一种度量,有的节点介数中心性较小,经过它的最短路径较少,那么它相应的拥堵情况也会比介数中心性高的节点要轻,因此有效地利用介数中心性对网络进行分析,可以帮助判断交通网络情况和进行路径规划。再如接近中心性,接近中心性和介数中心性一样,都利用了整个网络的特征,即一个节点在整个结构中所处的位置;如果节点到图中其他节点的最短距离都很小,那么它的接近中心性就很高;相比介数中心性,接近中心性更接近几何上的中心位置;例如在社交网络中,接近中心性越高的节点,说明它的信息传递能力更强。同时它们也被广泛应用于图的聚类和分类技术中,图分类在提取图数据的特征时,会对图的拓扑特征进行提取以获取特征向量,网络拓扑特征中的作为网络的重要属性,它与图分类中特征提取的特征向量相关性很大。
3.在网络的分析与应用中,若能有充足的与已有网络图的某些拓扑特征近似或一致的生成网络,能更好地分析、评估网络的某些特征。专利cn113255933a提出了一种特征工程和图网络生成方法和装置、分布式系统,主要核心是基于叶子节点特征信息的网络生成,其针对特征较为单一,可扩性差。


技术实现要素:

4.本发明要克服现有技术的上述缺点,提出基于网络拓扑特征的图网络生成方法及系统,这是一种启发式的网络生成方法。
5.本发明结合零模型的思想,使用构建零模型常用的断边重连的方法,并添加了一些限制条件,即有倾向性地对原网络图进行断边重连,以获得和原网络图拓扑特征近似或一致的生成网络。本发明所提出的数据生成方法的技术方案如下:
6.基于网络拓扑特征的图网络生成方法,包括以下步骤:
7.s1:读取数据集,获取原网络图特征;
8.s2:根据网络分析任务针对的拓扑特征,从规则库中选择网络生成规则以进行网络生成操作,所述的规则库包含三种图网络生成规则,分别对应平均介数中心性、平均接近中心性和叶子节点百分比,网络生成前后原网络和新网络的特征可以达到近似或保持一致的效果;
9.s3:输出生成网络。
10.优选的,所述步骤s1中:读取数据集,数据集包含多个原始网络g=(v,e),其中v表示网络中节点的集合,e表示网络中连边的集合;网络中共有n个节点,m条连边,并计算原始网络的平均介数中心性、平均接近中心性、叶子节点百分比;平均介数中心性由网络中各个节点的介数中心性平均而得,网络图g的平均介数中心性bcg的计算公式为:
[0011][0012]
其中bci为节点i的介数中心性如公式(2)所示,
[0013][0014]
其中p
st
表示从节点s到节点t的最短路径的数量,其中表示从节点s到节点t的经过节点i的最短路径的数量;平均接近中心性由网络中各个节点的接近中心性平均而得,网络图g的平均接近中心性ccg的计算公式为:
[0015][0016]
其中cci为节点i的接近中心性如公式(4)所示,
[0017][0018]
其中d
ij
表示从节点i到节点j的距离;叶子节点为只有一个邻居的节点,网络图g的叶子节点百分比pg的计算公式为:
[0019][0020]
其中fg为网络图g中叶子节点的数量。
[0021]
优选的,步骤s2所述的从规则库中选择网络生成规则的具体方式如下:根据预先设定的目标,选择对应的生成规则以进行网络生成;当对图网络的介数中心性进行分析、或针对介数中心性进行特征提取时,则可以将目标设定为介数中心性,选择基于平均介数中心性的图网络生成规则;当对图网络的接近中心性进行分析、或针对接近中心性进行特征提取时,则可以将目标设定为接近中心性,选择基于平均接近中心性的图网络生成规则;当对图网络的叶子节点进行分析、或针对叶子节点进行特征提取时,则可以将目标设定为叶子节点,选择基于叶子节点百分比的图网络生成规则。
[0022]
优选的,步骤s2所述的基于平均介数中心性的网络生成规则如下:基于平均介数中心性的网络生成规则包含输入参数有原始图连边更改比例alpha和迭代次数iters;遍历筛选原始网络图的连边集合e,从中随机选择一条不包含叶子节点的连边e=(v1,v2);选择比较节点v1,v2的介数中心性,选择连边中介数中心性更大的节点作为改动节点且设为vc[0023][0024]
将另一个节点设为vd,并删除这条连边;判断删除连边后网络图的连通性,若网络图不连通则撤销本次操作,并累计第一类失败(连通性尝试失败)次数;获取其余节点的介数中心性列表m
bc
,遍历m
bc
选择其中与节点vd的介数中心性相近的节点作为重连节点vr,并设定e
add
=(vc,vr)为候选重连连边;判断候选重连连边的有效性,若连边已存在网络图中,则撤销本次数据生成操作,并累计第二类失败(重边失败)尝试次数,反之则添加重连连边;以上仅是针对网络图中一条连边的改动,在数据生成过程中会发生数次这样的操作流程,直至达到设定改变连边比例alpha或失败次数超过网络图连边数量时结束本次网络生成操作;当每结束一次网络生成操作时,迭代次数加一,直至达到设定的迭代次数后输出与原图的平均介数中心性最为接近的生成图。
[0025]
优选的,步骤s2所述的基于平均接近中心性的网络生成规则如下:基于平均接近中心性的网络生成规则包含输入参数有原始图连边更改比例alpha和迭代次数iters;遍历筛选原始网络图的连边集合e,从中随机选择一条不包含叶子节点的连边e=(v1,v2);选择比较节点v1,v2的接近中心性,选择连边中接近中心性更大的节点作为改动节点且设为vc[0026][0027]
将另一个节点设为vd,并删除这条连边;判断删除连边后网络图的连通性,若网络图不连通则撤销本次操作,并累计第一类失败(连通性尝试失败)次数;获取其余节点的接近中心性列表m
cc
,遍历m
cc
选择其中与节点vd的接近中心性相近的节点作为重连节点vr,并设定e
add
=(vc,vr)为候选重连连边;判断候选重连连边的有效性,若连边已存在网络图中,则撤销本次数据生成操作,并累计第二类失败(重边失败)尝试次数,反之则添加重连连边;以上仅是针对网络图中一条连边的改动,在数据生成过程中会发生数次这样的操作流程,直至达到设定改变连边比例alpha或失败次数超过网络图连边数量时结束本次网络生成操作;当每结束一次网络生成操作时,迭代次数加一,直至达到设定的迭代次数后输出与原图的平均接近中心性最为接近的生成图。
[0028]
优选的,步骤s2所述的基于叶子节点百分比的网络生成规则如下:基于叶子节点百分比的网络生成规则包含输入参数有原始图叶子节点连边更改比例alpha;首先,获取网络中叶子节点列表v
p
[0029]vp
={vi|vi.degree=1},
ꢀꢀ
(8)
[0030]
和叶子节点的邻居列表v
pn
;以当断开叶子节点v
p
的邻居节点v
pn
连接的所有含有叶子节点的连边时,它自身不会变成新的叶子节点为规则筛选叶子节点的邻居节点,由此获取可更改的包含叶子节点的连边集合e
p
;根据参数alpha的设定,随机挑选一部分连边作为删除连边集合e
del
;遍历节点列表v,获取e
del
中每一条删除连边中叶子节点v
p
对应的二阶邻居中度最大的节点vr,对应叶子节点v
p
所在连边被删除后添加的连边为e
add
=(v
p
,vr),对应的所有的添加连边的集合为e
add
;根据删除连边集合e
del
和添加连边集合e
add
对原始网络图进行删除连边和添加连边的操作。
[0031]
优选的,所述步骤s3中:经过s2步骤,对所有原始网络进行了网络生成操作后,使
生成网络携带上对应原始网络的标签并输出最终的生成网络。
[0032]
实现本发明的基于网络拓扑特征的图网络生成方法的系统,包括:网络读取模块,网络生成模块,网络输出模块;
[0033]
所述网络读取模块对数据集进行读取,并对网络特征进行提取以方便在网络生成模块中调用;
[0034]
所述网络生成模块是根据系统设定的网络生成规则,执行基于原始网络的网络生成操作;
[0035]
所述网络输出模块使生成网络携带上对应的原始网络的标签并输出;
[0036]
所述网络读取模块、网络生成模块和网络输出模块按先后顺序依次连接。
[0037]
本发明的有益效果为:
[0038]
(1).与其他的网络生成模型相比,本发明的基于网络拓扑特征的图网络生成方法及系统具有更好的可扩展性,当前,本系统的网络生成规则有三种,但它同样适用于针对更多网络拓扑特征的应用。
[0039]
(2).本发明的基于网络拓扑特征的图网络生成方法及系统有三种针对不同网络特征的生成规则;每一种生成规则在进行网络生成时,不仅保证了其针对特征与原始网络的近似或一致,还保证了网络的节点数、连边数、网络密度和平均度的一致性,这对网络分析有很好的帮助。
[0040]
(3).本发明的基于网络拓扑特征的图网络生成方法及系统还可以应用于数据增强和图分类中,对图分类的精度具有较好的提升效果。
附图说明
[0041]
图1是本发明的基于平均介数中心性的网络生成规则的网络生成流程图;
[0042]
图2是本发明的基于平均接近中心性的网络生成规则的网络生成流程图;
[0043]
图3是本发明的基于叶子节点百分比的网络生成规则的网络生成流程图;
[0044]
图4是本发明的系统结构图;
[0045]
图5是本发明的基于平均介数中心性的网络生成规则的图分类应用效果图;
[0046]
图6是本发明的基于平均接近中心性的网络生成规则的图分类应用效果图;
[0047]
图7是本发明的基于叶子节点百分比的网络生成规则的图分类应用效果图。
具体实施方式
[0048]
下面结合说明书附图对本发明的具体实施方式作进一步详细的描述。
[0049]
由于本发明的基于网络拓扑特征的图网络生成方法及系统包含三种网络生成规则,下面将分别对三种网络生成规则的实施应用做说明,其中实施例一为基于平均介数中心性的网络生成规则的实施应用,实施例二为基于平均接近中心性的网络生成规则的实施应用,实施例三为基于叶子节点百分比的网络生成规则的实施应用。
[0050]
实施例一:
[0051]
参照图1,4,基于网络拓扑特征的图网络生成方法及系统,本实例讲的是将本文提出的方法结合数据增强应用于图分类中,使用的数据集是mutag数据集,mutag是关于化学分子和化合物的数据集,其中原子作为节点,化学键作为连边构成网络图。mutag数据集包
含188个硝基化合物,该数据集每个图的平均节点数为17.93,平均连边数为19.79,它的标签可以判断化合物是芳香族还是杂芳族。在实例训练中,数据集可以分为已有标签数据集和待测数据集,已有标签的数据集中可以挑选小部分用于验证分类精度。本实例采用的数据集特征提取器为graph2vec,分类器为随机森林分类器,并将已有标签数据集划分为7:1分别用于训练和检验模型。
[0052]
本实例基本分为一下几个步骤:
[0053]
步骤一:导入数据集并划分数据集;
[0054]
步骤二:使用已有标签数据集进行训练得到原始分类器;
[0055]
步骤三:使用基于网络拓扑特征的图网络生成方法及系统扩充已有标签数据集,重训练原始分类器得到增强分类器以对待测数据集做分类;
[0056]
步骤四:比较原始分类器和增强分类器的分类精度,评估本文的数据生成方法对图分类的优化效果。
[0057]
使用基于平均介数中心性的网络生成规则的基于网络拓扑特征的图网络生成方法及系统的具体步骤如下:
[0058]
s1:导入网络g=(v,e),其中v表示网络中节点的集合,e表示网络中连边的集合,该网络中共有n个节点,m条连边,并计算原始网络的平均介数中心性;平均介数中心性由网络中各个节点的介数中心性平均而得,网络图g的平均介数中心性bcg的计算公式为:
[0059][0060]
其中bci为节点i的介数中心性如公式(2)所示,
[0061][0062]
其中p
st
表示从节点s到节点t的最短路径的数量,其中表示从节点s到节点t的经过节点i的最短路径的数量;
[0063]
s2:此处使用基于平均介数中心性的网络生成规则;
[0064]
s2.1:首先,遍历筛选原始网络图的连边集合e,从中随机选择一条不包含叶子节点的连边e=(v1,v2);
[0065]
s2.2:而后选择比较节点v1,v2的介数中心性,选择连边中介数中心性更大的节点作为改动节点且设为vc[0066][0067]
将另一个节点设为vd,并删除这条连边;
[0068]
s2.3:判断删除连边后网络图的连通性,若网络图不连通则撤销本次操作,并累计第一类失败(连通性尝试失败)次数;
[0069]
s2.4:获取其余节点的介数中心性列表m
bc
,遍历m
bc
选择其中与节点vd的介数中心性相近的节点作为重连节点vr,并设定e
add
=(vc,vr)为候选重连连边;
[0070]
s2.5:判断候选重连连边的有效性,若连边已存在网络图中,则撤销本次数据生成操作,并累计第二类失败(重边失败)尝试次数,反之则添加重连连边;
[0071]
s2.6:s2.1-s2.5仅是针对网络图中一条连边的改动,在数据生成过程中会发生数
次这样的操作流程,直至达到设定改变连边比例alpha或失败次数超过网络图连边数量时结束本次网络生成操作;
[0072]
s2.7:当每结束一次网络生成操作时,迭代次数加一,直至达到设定的迭代次数后输出与原图的平均介数中心性最为接近的生成图;
[0073]
s3:经过步骤s2完成对所有原始网络进行了网络生成操作后,使生成网络携带上对应原始网络的标签并输出最终的生成网络。
[0074]
在此应用实例中,网络生成的迭代次数设置为5,其连边修改比例从0.1至0.9皆有试验。图5是使用上述方法后,数据集分类效果的精度对比柱状图。其中的横坐标代表设定的修改连边数量占网络图总连边数量的比例。由图可知,相比较于原始分类器的分类精度,本方法在数据增强和图分类的应用中有较好的效果,有效地提升了分类精度;且在0.1至0.9的连边修改比例下,本发明对图分类的精度都有提升。
[0075]
实施例二:
[0076]
参照图2,4,基于网络拓扑特征的图网络生成方法及系统,本实例讲的是将本文提出的方法结合数据增强应用于图分类中,使用的数据集是mutag数据集,mutag是关于化学分子和化合物的数据集,其中原子作为节点,化学键作为连边构成网络图。mutag数据集包含188个硝基化合物,该数据集每个图的平均节点数为17.93,平均连边数为19.79,它的标签可以判断化合物是芳香族还是杂芳族。在实例训练中,数据集可以分为已有标签数据集和待测数据集,已有标签的数据集中可以挑选小部分用于验证分类精度。本实例采用的数据集特征提取器为graph2vec,分类器为随机森林分类器,并将已有标签数据集划分为7:1分别用于训练和检验模型。
[0077]
本实例基本分为一下几个步骤:
[0078]
步骤一:导入数据集并划分数据集;
[0079]
步骤二:使用已有标签数据集进行训练得到原始分类器;
[0080]
步骤三:使用基于网络拓扑特征的图网络生成方法及系统扩充已有标签数据集,重训练原始分类器得到增强分类器以对待测数据集做分类;
[0081]
步骤四:比较原始分类器和增强分类器的分类精度,评估本文的数据生成方法对图分类的优化效果。
[0082]
使用基于平均接近中心性的网络生成规则的基于网络拓扑特征的图网络生成方法及系统的具体步骤如下:
[0083]
s1:导入网络g=(v,e),其中v表示网络中节点的集合,e表示网络中连边的集合,该网络中共有n个节点,m条连边,并计算原始网络的平均接近中心性;平均接近中心性由网络中各个节点的接近中心性平均而得,网络图g的平均接近中心性ccg的计算公式为:
[0084][0085]
其中cci为节点i的接近中心性如公式(4)所示,
[0086][0087]
其中d
ij
表示从节点i到节点j的距离;
[0088]
s2:此处使用基于平均接近中心性的网络生成规则;
[0089]
s2.1:首先,遍历筛选原始网络图的连边集合e,从中随机选择一条不包含叶子节点的连边e=(v1,v2);
[0090]
s2.2:而后选择比较节点v1,v2的接近中心性,选择连边中接近中心性更大的节点作为改动节点且设为vc[0091][0092]
将另一个节点设为vd,并删除这条连边;
[0093]
s2.3:判断删除连边后网络图的连通性,若网络图不连通则撤销本次操作,并累计第一类失败(连通性尝试失败)次数;
[0094]
s2.4:获取其余节点的接近中心性列表m
cc
,遍历m
bc
选择其中与节点vd的接近中心性相近的节点作为重连节点vr,并设定e
add
=(vc,vr)为候选重连连边;
[0095]
s2.5:判断候选重连连边的有效性,若连边已存在网络图中,则撤销本次数据生成操作,并累计第二类失败(重边失败)尝试次数,反之则添加重连连边;
[0096]
s2.6:s2.1-s2.5仅是针对网络图中一条连边的改动,在数据生成过程中会发生数次这样的操作流程,直至达到设定改变连边比例alpha或失败次数超过网络图连边数量时结束本次网络生成操作;
[0097]
s2.7:当每结束一次网络生成操作时,迭代次数加一,直至达到设定的迭代次数后输出与原图的平均接近中心性最为接近的生成图。
[0098]
s3:经过步骤s2完成对所有原始网络进行了网络生成操作后,使生成网络携带上对应原始网络的标签并输出最终的生成网络。
[0099]
在此应用实例中,网络生成的迭代次数设置为5,其连边修改比例从0.1至0.9皆有试验。图6是使用上述方法后,数据集分类效果的精度对比柱状图。其中的横坐标代表设定的修改连边数量占网络图总连边数量的比例。由图可知,相比较于原始分类器的分类精度,本文的数据生成方法有效地提升了分类精度,且在0.1至0.9的连边修改比例下,图分类精度皆有提升。
[0100]
实施例三:
[0101]
参照图3,4,基于网络拓扑特征的图网络生成方法及系统,本实例讲的是将本文提出的方法结合数据增强应用于图分类中,使用的数据集是mutag数据集,mutag是关于化学分子和化合物的数据集,其中原子作为节点,化学键作为连边构成网络图。mutag数据集包含188个硝基化合物,该数据集每个图的平均节点数为17.93,平均连边数为19.79,它的标签可以判断化合物是芳香族还是杂芳族。在实例训练中,数据集可以分为已有标签数据集和待测数据集,已有标签的数据集中可以挑选小部分用于验证分类精度。本实例采用的数据集特征提取器为graph2vec,分类器为随机森林分类器,并将已有标签数据集划分为7:1分别用于训练和检验模型。
[0102]
本实例基本分为一下几个步骤:
[0103]
步骤一:导入数据集并划分数据集;
[0104]
步骤二:使用已有标签数据集进行训练得到原始分类器;
[0105]
步骤三:使用基于网络拓扑特征的图网络生成方法及系统扩充已有标签数据集,重训练原始分类器得到增强分类器以对待测数据集做分类;
[0106]
步骤四:比较原始分类器和增强分类器的分类精度,评估本文的数据生成方法对图分类的优化效果。
[0107]
使用基于叶子节点百分比的网络生成规则的基于网络拓扑特征的图网络生成方法及系统的具体步骤如下:
[0108]
s1:导入网络g=(v,e),其中v表示网络中节点的集合,e表示网络中连边的集合,该网络中共有n个节点,m条连边,并计算原始网络的叶子节点百分比;叶子节点为只有一个邻居的节点,网络图g的叶子节点百分比pg的计算公式为:
[0109][0110]
其中fg为网络图g中叶子节点的数量;
[0111]
s2:此处使用基于叶子节点百分比的网络生成规则,基于叶子节点百分比的网络生成规则包含输入参数有原始图叶子节点连边更改比例alpha;
[0112]
s2.1:首先,获取网络中叶子节点列表v
p
[0113]vp
={vi|vi.degree=1}, (8)
[0114]
和叶子节点的邻居列表v
pn

[0115]
s2.2:以“当断开叶子节点v
p
的邻居节点v
pn
连接的所有含有叶子节点的连边时,它自身不会变成新的叶子节点”为规则筛选叶子节点的邻居节点,由此获取可更改的包含叶子节点的连边集合e
p

[0116]
s2.3:根据参数alpha的设定,随机挑选一部分连边作为删除连边集合e
del

[0117]
s2.4:遍历节点列表v,获取e
del
中每一条删除连边e
del
=(v
p
,v
pn
)中叶子节点v
p
对应的二阶邻居中度最大的节点vr,对应叶子节点v
p
所在连边被删除后添加的连边为e
add
=(v
p
,vr),对应的所有的添加连边的集合为e
add

[0118]
s2.5:根据删除连边集合e
del
和添加连边集合e
add
对原始网络图进行删除连边和添加连边的操作;
[0119]
s3:经过步骤s2完成对所有原始网络进行了网络生成操作后,使生成网络携带上对应原始网络的标签并输出最终的生成网络。
[0120]
在此应用实例中,网络生成的连边修改比例从0.1至0.9调整,步进为0.1。图7是使用上述方法后,数据集分类效果的精度对比柱状图。其中的横坐标代表设定的修改连边数量占网络图总连边数量的比例。由图可知,相比较于原始分类器的分类精度,本文的数据生成方法有效地提升了分类精度,在设置修改连边比例为0.1至0.9中,其每一个比例都有着较好的提升效果。
[0121]
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献