一种时空社交网络中用户联动行为模式检测方法

2023-02-06 13:39:05 来源：中国专利 TAG：

1.本发明属于时空社交网络技术领域，尤其涉及一种时空社交网络中用户联动行为模式检测方法。

背景技术：

2.随着在线社交网络的普及和具有多样化定位技术的飞速发展，一种新型社交网络，时空社交网络(spatio-temporalsocialnetwork，stsn)应运而生，例如大众点评、新浪微博、foursquare、yelp等平台。这类平台蕴含了复杂且丰富的用户生成数据，例如用户个人信息、签到数据、点评数据等，为分析用户行为的移动性带来了新的机遇。用户联动行为是指多个用户在同一时间段内，具有高重合度的活动轨迹的行为。检测用户联动行为的模式是分析用户群体移动性的重要手段，在用户群体行为分析、精准营销、个性化推荐等方面具有广泛的应用。
3.时空社交网络的数据模型如附图1(a)所示，是一种两层网络结构，主要包括社交层和地理空间层。具体而言，如附图1(a)社交层常被建模为无向图g＝(v，e)，其中节点集合v表示社交用户，边集合e中的任意一条边e连接的两个用户之间存在社交关系(如好友关系)。而在地理空间层存在具有语义标注的地点(称为兴趣点)，如咖啡厅、图书馆等。签到是时空社交网络平台中最常见的用户行为之一，记录了社交网络用户在线下地理空间层的行为活动。如附图1(b)所示，每一条签到记录由3元组(u，s，t)，表示用户u在t时刻访问了兴趣点s。时空社交网络蕴含的丰富数据类型为联动行为模式的检测带来了新的机遇。时空社交网络中用户联动行为的定义是：多个用户在同一时间段内，访问相同兴趣点或邻近兴趣点的行为，其中，这些用户具有较亲密的社交关系。在给定时间段，由发生联动行为的用户及相应的兴趣构成的元组称为用户联动行为模式。
4.在用户移动性分析方面，中国专利“cn113990075a一种交通调查数据和轨迹数据融合的流量分配方法及系统”提供了一种交通流量的检测与分配方法。此专利首先对城市路网进行预处理，根据路网的拓扑关系进行路段编码；其次，将用户的轨迹点匹配至相应的路段，形成用户的出行轨迹并构建轨迹集合；然后，查询给定调查位置和轨迹的关联关系，计算轨迹扩样系数，并根据汇总调查位置的扩样系数值更新路段剩余流量；最后，将轨迹系数汇总到路段上获取相应的交通流量，从而实现交通流量的监测与动态分配。中国专利“cn113990075a一种交通调查数据和轨迹数据融合的流量分配方法及系统”所述的技术方案主要通过将用户的轨迹数据融合到路段，进而分析道路交通网络中用户的移动性。然而，在时空社交网络中，不存在用户的轨迹数据，此外，在现实生活中的用户往往会比较注重个人轨迹数据的隐私性，并不会选择公开行动轨迹数据，此专利的技术无法适用于时空社交网络场景。
5.中国专利“cn114119840a一种海量轨迹数据的热力流向图生成方法”提供了一种车辆轨迹数据的热力流向图生产方法。此专利主要通过空间聚合技术将海量有向轨迹线聚合为有向热力点数据，并通过有向热力点数据集动态渲染方法，生成车辆轨迹的热力流向
图，为城市车辆及其用户移动性的可视化与分析提供了一种有力工具。虽然该专利技术可在宏观上呈现用户的移动性，并不能捕捉不同用户个体之间的联动行为模式，即无法检测不同用户在连续时间内，具有高重合度的活动轨迹。

技术实现要素：

6.针对现有技术的不足，本发明设计一种时空社交网络中用户联动行为模式检测方法。
7.对于一个给定的时空社交网络和一个查询时间段，处理联动行为模式检测时，首先根据用户的签到行为，选取在t时段内的活跃用户集合及相对应的被访问即签到兴趣点集合s
t
，该兴趣点集合表示在该时段内联动行为模式的活动地点；其次，对于给定的空间距离r，在兴趣点s
t
中进行范围查询，查找在空间层距离小于等于r的兴趣点对；然后，从中选择访问过该兴趣点对的用户，形成联动行为模式候选；最后，验证这些用户之间的社交相关性，得出最终检测的用户联动行为模式。
8.一种时空社交网络中用户联动行为模式检测方法，包括以下步骤：
9.步骤1：获取存在联动行为的用户的活动地点；
10.在时空社交网络中，采用三元组来表示签到行为，记c为一条签到记录，那么c＝(v，s，t)，表示社交网络用户v在t时刻访问了兴趣点s；为了检测时空社交网络中的联动行为模式，选择给定时间段t内的签到记录c
t
＝{c|c.t∈t}，这些签到的用户为该时间段t的活跃用户并将签到记录c
t
中的兴趣点集合记为s
t
；所述时空社交网络包括社交网络g＝(v，e)、地理空间层兴趣点集合s以及社交用户在地理空间层的历史签到记录，每条签到记录c由3元组构成c＝(v，s，t)；
11.步骤2：通过对时空社交网络地理空间层的过滤处理，得到构成联动行为模式的用户集合；
12.对于任意两个社交用户u和v，如果在时间段t存在联动行为模式，那么这两个用户在该时段访问过同一兴趣点，或者所访问的不同兴趣点在地里空间上的距离不超过r；如果两个兴趣点之间的距离大于r，那么在同一时段访问这两个兴趣点的用户不属于联动行为；
13.基于上述，从地理空间层进行过滤；计算步骤1所得集合s
t
中任意两个兴趣点si，sj之间的距离d(si，sj)，如果d(si，sj)＞r，那么在t时段内，访问兴趣点si的用户vi与访问兴趣点sj的用户vj不存在联动行为模式；反之，集合vi与vj中的用户之间可能构成联动行为模式；
14.另一方面，访问同一个兴趣点的用户之间可能存在联动行为，即对于兴趣点si或si的用户之间形成联动行为模式；
15.在上述情况中，通过对地理空间层的过滤处理，得到构成联动行为模式的用户集合，称之为候选集合；
16.步骤3：通过对步骤2中得到的存在联动行为的用户集合进行社交相关性过滤，得到一个新的构成联动行为模式的用户候选集合；
17.虽然在步骤2中获得了构成联动行为模式的潜在用户集合，但集合中任意数量的用户组合都构成联动行为模式；因此从社交层对潜在用户集合形成的组合进行过滤；
18.首先将社交相关性定义为：
19.定义1，社交相关性：设时空社交网络中的社交层为g＝(v，e)，其中，节点集合v表示社交用户，边集合e中的任意一条边e连接的两个用户之间存在社交关系，如好友关系；记path(u，v)表示节点u和v之间的一条社交路径，其长度为该路径经过的边数，节点u和v的社交距离dist(u，v)为这两个节点之间最短社交路径的长度，那么这个用户之间的社交相关性sr(u，v)可以表示为：
20.sr(u，v)＝max(0，1-dist(u，v)/maxdist)
ꢀꢀꢀꢀ
(1)
21.其中，maxdist表示联动行为模式查询所能容忍的最大社交距离；
22.对于在同一时段访问同一兴趣点或者邻近兴趣点的用户集合，如果构成联动行为模式，那么该集合用户的具有高的社交相关性；在现实生活中，如果两个用户存在联动行为模式，那么这两个用户通常具有较亲密的社交关系，即具有较小的社交距离，此外，根据小世界现象、四度分割理论、三度人脉现象，将最大社交距离的容忍值maxdist设为较小的常数；假设maxdist＝3，当两个用户之间的社交距离大于3时，即dist(u，v)大于3，那么(1-dist(u，v)/maxdist))＜0，则sr(u，v)＝0，因此，这两个用户在该时段无法构成联动行为模式；
23.定义2，集合社交距离下界：两个用户集合vi，vj之间社交距离的下界lowd(vi，vj)为这两个集合中节点之间社交距离的最小值，因此有：
[0024][0025]
其中，vi为访问过兴趣点i的用户集合；
[0026]
用户集合v中与其他用户集合中用户有社交边连接的节点为边界节点v.cro，而仅与其所属集合内的其他用户有社交边相连的节点为内部节点v.int，且v＝v.cro∪v.int；两个集合之间的社交距离为相对应的边界节点之间距离的最小值，因此有：
[0027][0028]
通过计算两个潜在用户集合vi，vj之间距离的下界对搜索空间进行缩减，如果lowd(vi，vj)＞maxdist，则这两个集合之间的用户无法构成联动行为模式；反之，如果lowd(vi，vj)≤maxdist，则这两个集合之间的用户构成联动行为模式，那么生成联动行为模式候选p
*
＝({vi，vj}，{si，sj}，t)作为下一步的输入；该联动行为模式候选p
*
表示访问兴趣点si的用户vi与访问兴趣点sj的用户vj之间形成联动行为模式；除此之外，访问兴趣点si或sj的用户之间也形成联动行为模式，那么联动行为模式候选还包括(vi，si，t)和(vj，sj，t)，该步骤得到的联动行为模式候选均作为下一步的输入；
[0029]
步骤4：对步骤3得到的联动行为模式候选结果进行验证；
[0030]
在步骤3得到的联动行为模式候选中，用户均为集合，表示该集合中的用户之间可能形成联动行为模式，针对每一种候选中的具体联动行为模式进行验证；有两个情况：
[0031]
(1)联动行为模式的用户源于单个候选用户集合；
[0032]
当联动行为模式的用户源于单个候选用户集合时，那么这一类联动行为模式的参与用户访问的同一个兴趣点；以vi为例进行阐述，即联动行为模式的参与用户均属于vi，且在t时段内，该集合的用户均访问了si；对于vi中的任意两个用户u、v，存在联动行为模式候
选p＝({u，v}，si，t)，计算u与v之间的最短社交路径的长度，即社交距离dist(u，v)，如果dist(u，v)≤maxdist，则将p＝({u，v}，si，t)加到最终的联动行为模式结果集p；
[0033]
(2)联动行为模式的用户源于不同的候选用户集合；
[0034]
当联动行为模式的用户源于不同的候选用户集合vi、vj时，假设有v
x
∈vi，vy∈vj，那么，在t时段内，v
x
访问了si，vy访问了sj，构成的联动行为模式候选为p＝({v
x
，vy}，{si，sj}，t)；将通过计算v
x
与vy的社交距离dist(v
x
，vy)来验证该候选p是否为联动行为模式：如果dist(v
x
，vy)≤maxdist，则将p＝({v
x
，vy}，{si，sj}，t)加到最终的联动行为模式结果集p；
[0035]
联动行为模式满足传递性原则，即在t时段，若u和v存在联动行为模式，v和w存在联动行为模式，则u和w存在联动行为模式，且该联动行为模式的参与用户为{u，v，w}；根据联动行为模式的传递性原则，不仅检测出两名用户形成的联动行为模式，还能检测多用户的联动行为模式。
[0036]
本发明有益技术效果：
[0037]
与现有技术相比，本发明从时空社交网络的视角出发检测联动行为模式，充分结合了社交拓扑结构和用户在地理空间层的行为活动(签到)，丰富并拓展了计算机数据管理领域的查询处理体系。本发明提出的技术方案提出基于空间距离的过滤技术，补全了仅考虑访问同一个兴趣点的联动行为模式的检测，提出的基于社交相关性的剪枝策略通过将社交相关性转化为社交距离的计算，利用用户集合社交距离的下界对搜索空间进行缩减，避免了对不同用户集合之间组合式搜索，从而提高了搜索效率。根据联动行为模式的传递性，本发明提供的技术方案，不仅可以检测出两名用户形成的联动行为模式，还能检测多用户的联动行为模式。
附图说明
[0038]
图1本发明实施例时空社交网络数据模型示例图，其中图a为时空社交网络层次结构；图b为签到信息；
[0039]
图2本发明实施例一种时空社交网络中用户联动行为模式检测方法流程图。
具体实施方式
[0040]
下面结合附图和实施例对本发明做进一步说明；
[0041]
本发明的目的是提供一种时空社交网络中的用户联动行为模式检测方法。具体而言，本发明根据时空社交网络中用户的行为活动数据，包括签到数据以及用户之间的社交关系，采用基于社交拓扑的“过滤-验证”的处理框架，对于输入的时间条件进行社交用户联动行为模式分析处理。具体地，在过滤阶段，根据空间距离进行剪枝，对于访问不同兴趣点的用户，判断是否可能存在联动行为，进而根据社交距离，选择可能存在联动行为模式的用户群组作为候选结果集；在验证阶段，通过计算候选结果中用户之间的社交相关性进行验证，实现时空社交网络中用户联动行为模式的检测。
[0042]
一个时空社交网络主要包括社交网络g＝(v，e)、地理空间层兴趣点集合s以及社交用户在地理空间层的历史签到记录，每条签到记录c由3元组构成c＝(v，s，t)。本发明旨在返回时空社交网络中具有高重合度的线下活动行为的用户群体，即每一个返回的用户群体在社交层具有高社交相关性，且在给定查询时间段内，在地理空间层的活动范围比较邻
近。时空社交网络数据模型示例图如附图1所示；
[0043]
对于一个给定的时空社交网络和一个查询时间段，处理联动行为模式检测时，首先根据用户的签到行为，选取在t时段内的活跃用户集合及相对应的被访问即签到兴趣点集合s
t
，该兴趣点集合表示在该时段内联动行为模式的活动地点；其次，对于给定的空间距离r，在兴趣点s
t
中进行范围查询，查找在空间层距离小于等于r的兴趣点对；然后，从中选择访问过该兴趣点对的用户，形成联动行为模式候选；最后，验证这些用户之间的社交相关性，得出最终检测的用户联动行为模式。
[0044]
一种时空社交网络中用户联动行为模式检测方法，流程如附图2所示，包括以下步骤：
[0045]
步骤1：获取存在联动行为的用户的活动地点；
[0046]
在时空社交网络中，签到是一类常见的行为，记录的社交用户访问空间层中兴趣点的情况，通常以三元组的形式来表示，采用三元组来表示签到行为，记c为一条签到记录，那么c＝(v，s，t)，表示社交网络用户v在t时刻访问了兴趣点s；为了检测时空社交网络中的联动行为模式，选择给定时间段t内的签到记录c
t
＝{c|c.t∈t}，这些签到的用户为该时间段t的活跃用户并将签到记录c
t
中的兴趣点集合记为s
t
；所述时空社交网络主要包括社交网络g＝(v，e)、地理空间层兴趣点集合s以及社交用户在地理空间层的历史签到记录，每条签到记录c由3元组构成c＝(v，s，t)；
[0047]
步骤2：通过对时空社交网络地理空间层的过滤处理，得到构成联动行为模式的用户集合；
[0048]
对于任意两个社交用户u和v，如果在时间段t存在联动行为模式，那么这两个用户在该时段访问过同一兴趣点，或者所访问的不同兴趣点在地里空间上的距离不超过r(r通常为一个很小正数，意味着两个地点相距很近)；如果两个兴趣点之间的距离大于r，那么在同一时段访问这两个兴趣点的用户不属于联动行为；
[0049]
基于上述，从地理空间层进行过滤；计算步骤1所得集合s
t
中任意两个兴趣点si，sj之间的距离d(si，sj)，如果d(si，sj)＞r，那么在t时段内，访问兴趣点si的用户vi与访问兴趣点sj的用户vj不存在联动行为模式；反之，集合vi与vj中的用户之间可能构成联动行为模式；
[0050]
另一方面，访问同一个兴趣点的用户之间可能存在联动行为，即对于兴趣点si或sj的用户之间可能形成联动行为模式；
[0051]
在上述情况中，通过对地理空间层的过滤处理，得到可能构成联动行为模式的用户集合，称之为候选集合；
[0052]
步骤3：通过对步骤2中得到的存在联动行为的用户集合进行社交相关性过滤，得到一个新的构成联动行为模式的用户候选集合；
[0053]
虽然在步骤2中获得了构成联动行为模式的潜在用户集合，但集合中任意数量的用户组合都可能构成联动行为模式；如果对每一组合均进行验证，将增加计算量，导致效率低下，因此从社交层对潜在用户集合形成的组合进行过滤；
[0054]
首先将社交相关性定义为：
[0055]
定义1，社交相关性：设时空社交网络中的社交层为g＝(v，e)，其中，节点集合v表
示社交用户，边集合e中的任意一条边e连接的两个用户之间存在社交关系，如好友关系；记path(u，v)表示节点u和v之间的一条社交路径，其长度为该路径经过的边数，节点u和v的社交距离dist(u，v)为这两个节点之间最短社交路径的长度，那么这个用户之间的社交相关性sr(u，v)可以表示为：
[0056]
sr(u，v)＝max(0，1-dist(u，v)/maxdist)
ꢀꢀꢀꢀ
(1)
[0057]
其中，maxdist表示联动行为模式查询所能容忍的最大社交距离；
[0058]
对于在同一时段访问同一兴趣点或者邻近兴趣点的用户集合，如果构成联动行为模式，那么该集合用户的具有高的社交相关性；在现实生活中，如果两个用户存在联动行为模式，那么这两个用户通常具有较亲密的社交关系，即具有较小的社交距离，此外，根据小世界现象、四度分割理论、三度人脉现象，将最大社交距离的容忍值maxdist设为较小的常数；假设maxdist＝3，当两个用户之间的社交距离大于3时，即dist(u，v)大于3，那么(1-dist(u，v)/maxdist))＜0，则sr(u，v)＝0，因此，这两个用户在该时段无法构成联动行为模式；
[0059]
定义2，集合社交距离下界：两个用户集合vi，vj之间社交距离的下界lowd(vi，vj)为这两个集合中节点之间社交距离的最小值，因此有：
[0060][0061]
其中，vi为访问过兴趣点i的用户集合；
[0062]
用户集合v中与其他用户集合中用户有社交边连接的节点为边界节点v.cro，而仅与其所属集合内的其他用户有社交边相连的节点为内部节点v.int，且v＝v.cro∪v.int；两个集合之间的社交距离为相对应的边界节点之间距离的最小值，因此有：
[0063][0064]
通过计算两个潜在用户集合vi，vj之间距离的下界对搜索空间进行缩减，如果lowd(vi，vj)＞maxdist，则这两个集合之间的用户无法构成联动行为模式；反之，如果lowd(vi，vj)≤maxdist，则这两个集合之间的用户可能构成联动行为模式，那么生成联动行为模式候选p
*
＝({vi，vj}，{si，sj}，t)作为下一步的输入；该联动行为模式候选p
*
表示访问兴趣点si的用户vi与访问兴趣点sj的用户vj之间可能形成联动行为模式；除此之外，访问兴趣点si或sj的用户之间也可能形成联动行为模式，那么联动行为模式候选还包括(vi，si，t)和(vj，sj，t)，该步骤得到的联动行为模式候选均作为下一步的输入；
[0065]
步骤4：对步骤3得到的联动行为模式候选结果进行验证；
[0066]
在步骤3得到的联动行为模式候选中，用户均为集合，表示该集合中的用户之间可能形成联动行为模式，针对每一种候选中的具体联动行为模式进行验证；有两个情况：
[0067]
(1)联动行为模式的用户源于单个候选用户集合；
[0068]
当联动行为模式的用户源于单个候选用户集合时，那么这一类联动行为模式的参与用户访问的同一个兴趣点；不失一般性，以vi为例进行阐述，即联动行为模式的参与用户均属于vi，且在t时段内，该集合的用户均访问了si；对于vi中的任意两个用户u、v，存在联动行为模式候选p＝({u，v}，si，t)，计算u与v之间的最短社交路径的长度，即社交距离dist(u，v)，如果dist(u，v)≤maxdist，则将p＝({u，v}，si，t)加到最终的联动行为模式结果集
p；
[0069]
(2)联动行为模式的用户源于不同的候选用户集合；
[0070]
当联动行为模式的用户源于不同的候选用户集合vi、vj时，假设有v
x
∈vi，vy∈vj，那么，在t时段内，v
x
访问了si，vy访问了sj，构成的联动行为模式候选为p＝({v
x
，vy}，{si，sj}，t)；将通过计算v
x
与vy的社交距离dist(v
x
，vy)来验证该候选p是否为联动行为模式：如果dist(v
x
，vy)≤maxdist，则将p＝({v
x
，vy}，{si，sj}，t)加到最终的联动行为模式结果集p；
[0071]
联动行为模式满足传递性原则，即在t时段，若u和v存在联动行为模式，v和w存在联动行为模式，则u和w存在联动行为模式，且该联动行为模式的参与用户为{u，v，w}；根据联动行为模式的传递性原则，不仅检测出两名用户形成的联动行为模式，还能检测多用户的联动行为模式。
[0072]
本发明旨在提供一种面向时空社交网络的联动行为模式检测方法，提出一种基于社交拓扑的“过滤-验证”的处理框架，对输入的时间条件进行社交用户联动行为模式分析处理。在过滤阶段，对于给定的查询时间段，根据不同用户所访问的兴趣点之间的距离，判断访问不同兴趣点的用户之间是否存在联动行为，补全了仅对当个兴趣点访问用户之间联动行为的检测。并且提出基于用户集合社交距离下界的剪枝策略，若两个用户集合的社交距离下界大于社交距离容忍值，则这两个集合之间的用户不存在联动行为。该策略避免了对不同用户集合之间组合式搜索，减小了解空间，从而提供了搜索效率。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种高弹性电网指标评价体系管理系统的制作方法

一种时空社交网络中用户联动行为模式检测方法

相关文献

最热文献