一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于异质模体特征的链路预测方法、系统及可存储介质

2022-04-24 22:33:07 来源:中国专利 TAG:


1.本发明涉及信息通讯技术领域,更具体的说是涉及一种基于异质模体特征的链路预测方法、系统及可存储介质。


背景技术:

2.随着信息时代的来临,网络社交已经成为大众日常,越来越多的人倾向于通过网络平台进行交流沟通。互联网技术的快速发展使得社交网络的研究得到广泛关注,目前,微信、qq、钉钉等社交媒体已经成为人们交流的主要渠道,然而,如何对社交网络中复杂而庞大的用户关系进行预测和推荐是社交网络领域的研究热点,也是链路预测的重要应用方向。链路预测能够揭示网络中用户之间的潜在关系,挖掘社交用户的兴趣,为用户推荐感兴趣的朋友等,在社交服务中具有广泛应用。
3.在现有现有技术中,复杂网络根据结构可以分为同质网络和异质网络。同质网络中的节点和连边为同一种类型,异质网络中的节点或连边为多种类型。目前关于社交网络链路预测问题的研究主要针对同质网络,针对异质网络的链路预测研究相对较少。虽然目前针对异质网络的链路预测方法取得了较好性能,但是它们主要都是采用元路径方法利用连边异质性进行链路预测,这类方法只考虑了网络中部分关系模式,因此还需要进一步精细刻画多类型用户之间复杂的网络关系进行研究,如从网络的节点异质性角度挖掘拓扑结构特征进行精准预测。并且,在传统的同质网络链路预测研究中,最经典的方法是基于节点局部结构的相似性,如共同邻居、adamic-adar、资源分配指标(resource allocation,ra)等。但上述指标都是基于网络中的共同邻居特征,计算复杂度较低准确率较高。
4.模体是指网络中出现频率较高的子图结构,是一种重要的网络拓扑结构。模体可以用来研究拓扑结构中节点之间的交互模式,有助于理解复杂网络的局部结构和功能,是研究链路预测问题的重要方法。虽然已有基于模体特征进行链路预测的研究,但大多都是在同质网络中进行分析的。如使用模体来描述刻画科学家合作关系模式,并通过模体的组合对科学家合作网络进行预测。但如果不区分节点类型来刻画网络的结构特征,就会忽略节点的类型差异,无法充分利用节点的异质信息。
5.综上,当前现有技术中的同质网络的链路预测研究往往不存在或者没有考虑节点的异质信息,存在一定的局限性,影响预测准确性。
6.因此,如何提供一种基于异质模体特征的链路预测方法、系统及可存储介质是本领域技术人员亟需解决的问题。


技术实现要素:

7.有鉴于此,本发明提供了一种基于异质模体特征的链路预测方法、系统及可存储介质,将网络中区分节点类型的模体结构特征定义为异质模体,相较于同质模体特征,基于异质模体特征的链路预测方法可以有效提升链路预测准确性,本发明能够泛化并适用于现有单模以及同质等环境,更具普适性,不仅可用于多模异质信息网络,还可用于社交网络、
交通网络、生物信息、电子商务系统、知识图谱等其他领域数据。
8.为了实现上述目的,本发明提供如下技术方案:
9.一方面,本发明实施例了一种基于异质模体特征的链路预测方法,包括以下步骤:
10.s1:获取社交网络结构,判断社交网络的类型是否为异质网络;
11.s2:若社交网络的类型为异质网络,则获取异质网络中的节点和边的模体特征值;
12.s3:将模体特征值输入机器学习算法,得到对应的相似度得分,根据相似度得分获得链路预测结果。
13.优选的,所述s1中,判断社交网络的类型是否为异质网络的过程为:
14.s11:获取的社交网络结构的形式为g(v,e),其中v,e分别是网络中的节点集合、连边集合;
15.s12:定义节点类型映射函数f:v

a,其中每个节点v∈v都对应特定的类型f(v)∈a,a为网络节点类型集合;
16.s13:定义链接类型映射函数γ:e

r,其中每条链接e∈e都对应特定的类型γ(e)∈r,r为网络连边类型集合;
17.s14:当r和a满足|a|>1或|r|>1时,即边的类型数或者节点的类型数大于1,则该网络定义为异质网络。
18.优选的,所述s2中,获取异质网络中的节点和边的模体特征值的过程为:
19.s21:将异质模体网络中的节点类型分为第一节点类型与第二节点类型;
20.s22:根据第一节点类型以及第二节点类型的模体特征建立所述异质模体对应的关系模式。
21.优选的,所述s3中,根据关系模式计算异质模体网络中训练集的模体特征总数,并将得到的每种模体数量作为机器学习算法的输入,得到连边的相似度得分,根据相似度得分获得链路预测结果。
22.优选的,还包括,s4:对链路预测结果进行评价。
23.优选的,所述s4中,将auc作为衡量链路预测算法性能的评价指标,将precision作为衡量链路预测算法精确度的评价指标。
24.另一方面,本实施例提供一种基于异质模体特征的链路预测系统,包括:
25.获取模块:用于获取社交网络结构,并判断社交网络的类型是否为异质网络;
26.规则模块:与所述获取模块连接,用于当社交网络的类型为异质网络,则获取异质网络中的节点和边的模体特征值;
27.处理模块:与所述规则模块连接,用于将模体特征值输入机器学习算法,得到对应的相似度得分,根据相似度得分获得链路预测结果。
28.再一方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现上述的基于异质模体特征的链路预测方法。
29.再一方面,本实施例提供一种电子设备,包括:一个或多个处理器;
30.存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述的基于异质模体特征的链路预测方法。
31.经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于异质模
体特征的链路预测方法、系统及可存储介质,将网络中区分节点性别类型的模体结构特征定义为异质模体,相较于同质模体特征,基于异质模体特征的链路预测方法可以有效提升链路预测准确性,本发明能够泛化并适用于现有单模以及同质等环境,更具普适性,不仅可用于多模异质信息网络,还可用于社交网络、交通网络、生物信息、电子商务系统、知识图谱等其他领域数据,有助于对社交网络的用户关系进行预测和推荐,在用户行为分析、推荐系统等方面具有广阔的应用前景。
附图说明
32.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
33.图1为本发明提供的链路预测方法流程示意图;
34.图2为本实施例1提供的链路预测系统结构示意图;
35.图3为本实施例2提供的同质模体边的分布示意图;
36.图4为本实施例2提供的异质模体边的分布示意图;
37.图5为本实施例2提供的同质模体特征与异质模体特征结构差异示意图。
具体实施方式
38.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
39.实施例1
40.一方面,参见附图1所示,本发明提供了一种基于异质模体特征的链路预测方法,包括以下步骤:
41.s1:获取社交网络结构,判断社交网络的类型是否为异质网络;
42.s2:若社交网络的类型为异质网络,则获取异质网络中的节点和边的模体特征值;
43.s3:将模体特征值输入机器学习算法,得到对应的相似度得分,根据相似度得分获得链路预测结果。
44.在一个具体实施例中,s1,判断社交网络的类型是否为异质网络的过程为:
45.s11:获取的社交网络结构的形式为g(v,e),其中v,e分别是网络中的节点集合、连边集合;
46.s12:定义节点类型映射函数f:v

a,其中每个节点v∈v都对应特定的类型f(v)∈a,a为网络节点类型集合;
47.s13:定义链接类型映射函数γ:e

r,其中每条链接e∈e都对应特定的类型γ(e)∈r,r为网络连边类型集合;
48.s14:当r和a满足|a|>1或|r|>1时,即边的类型数或者节点的类型数大于1,则该网络定义为异质网络。
49.在一个具体实施例中,s2中获取异质网络中的节点和边的模体特征值的过程为:
50.s21:将异质模体网络中的节点类型分为第一节点类型与第二节点类型;
51.s22:根据第一节点类型以及第二节点类型的模体特征建立异质模体对应的关系模式。
52.具体的,s22中,异质模体对应的关系模式为:
53.y1:一位第一节点类型用户与两位第二节点类型用户的其中的一位具有社交关系,则与另一位第二节点类型用户也有社交关系;
54.y2:一位第二节点类型用户与两位无社交关系的第一节点类型用户其中一位具有社交关系,则与另一位第一节点类型也有社交关系;
55.y3:一位第二节点类型用户与三位无社交关系的第一节点类型用户中的两位有关系,则与另一位第一节点类型有社交关系;
56.y4:一位第一节点类型用户与三位无社交关系的第二节点类型用户中的两位有关系,则与另一位第二节点类型有社交关系;
57.y5:两位有社交关系的男女用户,其中一位第二节点类型用户与一位第一节点类型用户有关系,则另外一位第一节点类型用户与其他第二节点类型有社交关系;
58.y6:两位有社交关系的男女用户,其中第一节点类型用户与另外一位第二节点类型用户有社交关系,则另外一位第二节点类型用户与其他第一节点类型有社交关系;
59.y7:两位无社交关系的男女用户分别与两位男女用户有社交关系,则这两位男女用户有社交关系;
60.y8:除某两位男女用户无社交关系外,其余男女用户之间两两相互有关系,则无社交关系的男女用户有社交关系。
61.在一个具体实施例中,s3中,根据关系模式计算异质模体网络中训练集的模体特征总数,并将得到的每种模体数量作为机器学习算法的输入,得到连边的相似度得分,根据相似度得分获得链路预测结果。
62.具体的,根据关系模式计算异质模体网络中训练集的模体特征总数的方法为:
63.模体特征y1的计算方法为:寻找第一节点类型u的邻居节点,且该邻居节点不是第二节点类型v的邻居;
64.模体特征y7的计算方法为:寻找第一节点类型u以及第二节点类型v各自的邻居节点,且该邻居节点不互为邻居,
65.其他模体特征的计算方法以此类推,通过计算得出模体特征y1的个数为2,模体特征y3的个数为1,模体特征y7的个数为1,模体特征y8的个数为1。
66.在一个具体实施例中,还包括,s4:对链路预测结果进行评价。
67.具体的,s4中,将auc作为衡量链路预测算法性能的评价指标,将precision作为衡量链路预测算法精确度的评价指标。
68.更具体的,auc值可以定义为:
[0069][0070]
其中,n为测试集中任意选取的边与不存在边的分数值比较次数,n

为测试集中边分数值大于不存在边的分数值的比较次数,n

为两分数值相等的比较次数。
[0071]
更具体的,precision可以定义为:
[0072][0073]
其中,m为预测准确的边的个数,l为按照预测值大小排序后选取的边的数量。
[0074]
另一方面,参见附图2所示,本发明提供一种基于异质模体特征的链路预测系统,包括:
[0075]
获取模块:用于获取社交网络结构,并判断社交网络的类型是否为异质网络;
[0076]
规则模块:与获取模块连接,用于当社交网络的类型为异质网络,则获取异质网络中的节点和边的模体特征值;
[0077]
处理模块:与规则模块连接,用于将模体特征值输入机器学习算法,得到对应的相似度得分,根据相似度得分获得链路预测结果。
[0078]
在一个具体实施例中,还包括评价模块,与所述处理模块连接,用于对链路预测结果进行评价。
[0079]
再一方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,程序被处理器执行时实现上述任意一项的基于异质模体特征的链路预测方法。
[0080]
再一方面,本发明提供一种电子设备,其特征在于,包括:一个或多个处理器;
[0081]
存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任意一项的基于异质模体特征的链路预测方法。
[0082]
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于异质模体特征的链路预测方法、系统及可存储介质,将网络中区分节点性别类型的模体结构特征定义为异质模体,相较于同质模体特征,基于异质模体特征的链路预测方法可以有效提升链路预测准确性,本发明能够泛化并适用于现有单模以及同质等环境,更具普适性,不仅可用于多模异质信息网络,还可用于社交网络、交通网络、生物信息、电子商务系统、知识图谱等其他领域数据,有助于对社交网络的用户关系进行预测和推荐,在用户行为分析、推荐系统等方面具有广阔的应用前景。
[0083]
实施例2
[0084]
将现有技术中同质模体特征预测方法与本发明提供的异质模体特征预测方法进行比较。
[0085]
具体的,为了比较同质模体特征与本发明异质模体特征之间的差异,对两种模体结构存在边和不存在边的分布情况进行分析比较。
[0086]
获取报读贴吧以及性接触网络数据,其中,参见附图3以及附图4所示,分别为百度贴吧数据中同质模体t1和异质模体y1存在边和不存在边的分布差别。其中实线和虚线分别代表网络中的正边和负边即存在边和不存在边的模体数量分布。可以看出,对于同质模体而言,正比和负边有很大程度的重叠,重叠程度越大越不利于链路预测准确性。对于异质模体而言,正边和负边的重叠分布小于同质模体,说明相较于同质模体,使用异质模体进行链路预测的性能更好。
[0087]
在一个具体实施例中,基于同质模体特征方法与本发明异质模体特征方法进行链路预测,在相同的网络拓扑结构下,同质模体和异质模体具有一定的相关性。
[0088]
具体的,参见附图5所示,为相同的网络拓扑结构下,同质模体与异质模体之间的
关联性。其中节点代表用户个体,节点之间的连边代表用户之间的社交关系。
[0089]
具体的,在本实施例中将第一节点类型代表男性用户(白色),将第二节点类型代表女性用户(黑色)。
[0090]
y1、y2和t1,y3、y4和t2,y5、y6和t4分别具有相同的网络拓扑结构,为了探究相同网络拓扑结构下,考虑节点异质信息和不考虑节点异质信息的模体的链路预测效果,进行了基于单个异质模体特征、单个同质模体特征、同一网络拓扑结构下多异质模体特征的链路预测。
[0091]
在一个具体实施例中,将评价指标auc作为衡量链路预测算法性能的一种重要指标,从整体上衡量算法的精确度。
[0092]
更具体的,auc指标可以描述为如下形式:
[0093]
每次从测试集中随机选取一条存在的边,然后随机选取一条不存在的边,比较这两条边的相似度得分。如果存在边的分数大于不存在边的分数,就加1分;如果两条边的分数相等,就加0.5分。这样独立比较次,如果有次存在边的分数值大于不存在边的分数值,有次两条边的分数值是相等的,则auc值可以定义为:
[0094][0095]
其中,n为测试集中任意选取的边与不存在边的分数值比较次数,n

为测试集中边分数值大于不存在边的分数值的比较次数,n

为两分数值相等的比较次数。
[0096]
上述评分算法计算出的auc值应该至少大于0.5。auc的值越高,算法的精确度越高,但auc的值最高不会超过1。
[0097]
在一个具体实施例中,评价指标precision作为衡量链路预测算法精确度的指标之一,主要从局部衡量预测的准确性。
[0098]
具体的,评价指标precision指标关注的是预测值排序在前个预测边中预测准确的比例。根据特征的分数值从大到小排序,如果有条边是真实存在即预测准确的边,precision可以定义为:
[0099][0100]
其中,m为预测准确的边的个数,l为按照预测值大小排序后选取的边的数量。
[0101]
由上述评分算法可知,越大则precision值越高,预测越准确。
[0102]
在一个具体实施例中,对所有单个模体特征(5个同质模体和8个异质模体)和多个模体特征(所有5个同质模体和所有8个异质模体)进行链路预测,得到评价指标auc与precision的值。链路预测的结果如表1和表2所示。
[0103]
表1基于同质模体特征的链路预测结果
[0104][0105]
由表1可以发现,使用单个同质模体特征进行链路预测时,模体特征t3的预测准确率和精确度最高。说明在社交网络中,如果两位无关系用户分别与两位其他用户具有社交关系,则其他两位用户有社交关系的可能性较大。本实施例综合多个同质模体特征进行预测,发现多同质模体特征的预测效果比单个同质模体特征的最好预测效果高4.3%~16.6%,说明综合多种用户关系模式进行链路预测效果更好。
[0106]
表2基于异质模体特征的链路预测结果
[0107][0108]
由表2可以发现,使用单个异质模体特征进行链路预测时,模体特征y7的预测准确率与精确度最高,说明在社交网络中,如果两位有关系的男女分别与两位无关系的男女有关系,则另外两位男女有关系的可能性越大。在y7与t3的网络拓扑结构一致的情况下,本发明提出的异质模体特征的预测效果优于同质模体特征的预测效果。本实施例综合多个异质模体特征进行预测,发现本发明提供的多异质模体特征的预测效果比单个异质模体特征的最好预测效果高5.2%~12.8%,说明综合多种男女用户关系模式进行链路预测效果更好。
[0109]
在一个具体实施例中,在链路预测问题中,将所有同质模体特征与所有异质模体特征进行融合,通过链路预测的结果发现融合多同质模体和异质模体特征的链路预测准确率高于只使用多异质模体特征的链路预测准确率。说明相较于只使用多异质模体进行链路预测,融合同质模体特征对提升链路预测准确性具有一定的积极作用。结果如表3所示。
[0110]
表3三类方法的链路预测结果
[0111][0112]
由表3中数据可知,融合多异质模体和同质模体特征的链路预测算法准确率最高,说明在社交网络中将多同质模体特征与本发明所提供的异质模体特征相融合后进行链路预测能够有效提高预测的准确性,
[0113]
上述的技术方案可知,与现有技术相比,融合所有区分节点异质信息的异质模体特征链路预测准确性高于单个异质模体特征以及不考虑节点异质信息的同质模体特征,能够泛化并适用于现有单模以及同质等环境,更具普适性,不仅可用于多模异质信息网络,还可用于社交网络、交通网络、生物信息、电子商务系统、知识图谱等其他领域数据,有助于对社交网络的用户关系进行预测和推荐,在用户行为分析、推荐系统等方面具有广阔的应用前景。
[0114]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0115]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献