一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种团体用户识别方法、装置、设备及存储介质与流程

2022-02-20 01:17:44 来源:中国专利 TAG:


1.本发明涉及人工智能技术领域,尤其涉及一种团体用户识别方法、装置、设备及存储介质。


背景技术:

2.常用的团体用户识别方法主要有无监督方法、传统有监督方法、图神经网络有监督方法三类,其中:
3.无监督方法首先需要构建关联图谱,也就是确认节点和关系(边),然后采用标签传播、最大连通图等进行社群划分。
4.传统的有监督方法等价为节点分类问题,通过对节点的特征提取,进行训练分类模型和预测。
5.图神经网络方法主要是节点的业务特征和网络拓扑结构进行学习,用于对未知数据的预测。
6.当前主流的团体用户识别方法是无监督识别方法,基于构造关系图谱,依据构造的关系图谱采用社群发现等算法进行团体识别。但是,对于当前的无监督识别方法而言,其主要是根据关联图谱进行聚类,而在现实的电商环境中,用户数量以亿计,这在离线情况下可以很好的识别团体关系,但是在实时任务中,大批量节点计算耗时较长,很难满足实时性任务要求。
7.因此,现有的团体用户识别方法无法进行实时防范团体行为带来的风险,也不能及时进行止损。


技术实现要素:

8.有鉴于此,本发明实施例提供一种团体用户识别方法、装置、设备及存储介质,以解决现有的团体计算时间过长无法实时识别的问题。
9.为实现上述目的,本发明提供了一种团体用户识别方法,所述方法包括以下步骤:
10.读取用户基础信息,获得用户关联关系;
11.将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员;
12.根据用户实时信息获得具有同源关系的同源用户;
13.根据所述团体成员判断参加活动的第一用户是否归属所述团体成员;
14.若否,从所述同源用户中获取与所述第一用户具有同源关系的第二用户;
15.判断所述第二用户是否归属所述团体成员;若所述第二用户归属所述团体成员,则确定所述第一用户也归属所述团体成员;
16.若是,则确认所述第一用户归属所述团体成员。
17.可选地,所述读取用户基础信息,获得用户关联关系,包括以下步骤:
18.读取用户基础信息,得到多个用户的至少一种介质;
19.其中,所述至少一种介质包括银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间;
20.若银行账号相同,和/或ip地址相同,和/或手机号码相同,和/或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号的使用时间在预设时间范围内,则确认所述多个用户之间存在关联关系。
21.可选地,所述将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员,包括以下步骤:
22.读取用户关联关系;
23.采用团体识别算法对多个用户进行聚类计算,将多个用户划分为多个用户团;
24.若聚类出的所述用户团内的用户数量满足第一预设规则,则将所述用户团内的用户作为团体成员。
25.可选地,所述团体识别算法包括以下步骤:
26.对所述用户关联关系中的每个节点初始化其所属的标签,且每个节点所属的标签唯一;其中,归属节点为x,初始化标签为
27.设置迭代次数t,对于每个节点其中x是所有节点的集合,得到
28.其中表示节点x在t 次迭代时的标签;
29.判断每个节点的标签都不再变化或者满足迭代次数,如果满足则结束;如果不满足,则设置t=t 1,重新遍历。
30.可选地,所述根据用户实时信息获得具有同源关系的同源用户,包括以下步骤:
31.获取用户实时信息,所述用户实时信息包括:日志消息和/或协议消息和/ 或操作记录;
32.采用实时流式作业计算方式对所述用户实时信息进行处理,获得具有同源关系的同源用户;
33.所述同源关系为用户的银行账号相同,和/或ip地址相同,和/或手机号码相同,和/或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号在预设时间内进行相同操作。
34.可选地,所述根据所述团体成员判断参加活动的第一用户是否归属所述团体成员,包括以下步骤:
35.判断所述第一用户的账号是否属于所述团体成员中的账号;
36.如果属于,则所述第一用户属于所述团体成员;
37.如果不属于,则所述第一用户不属于所述团体成员。
38.可选地,所述团体用户识别方法还包括以下步骤:
39.所述第一用户为所述团体成员,则禁止所述第一用户参加活动。
40.此外,为实现上述目的,本发明还提出一种团体用户识别装置,所述团体用户识别装置包括:
41.信息读取单元,用于读取用户基础信息,获得用户关联关系;
42.用户划分单元,用于将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员;
43.同源计算单元,用于根据用户实时信息获得具有同源关系的同源用户;
44.团体确认单元,用于根据所述团体成员判断参加活动的第一用户是否归属所述团体成员;
45.若否,从所述同源用户中获取与所述第一用户具有同源关系的第二用户;判断所述第二用户是否归属所述团体成员;若所述第二用户归属所述团体成员,则确定所述第一用户也归属所述团体成员;
46.若是,则确认所述第一用户归属所述团体成员。
47.此外,为实现上述目的,本发明还提出一种设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的团体用户识别程序,所述团体用户识别程序配置为实现如上文所述团体用户识别方法的步骤。
48.此外,为实现上述目的,本发明还提出一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的团体用户识别方法的步骤。
49.本发明通过读取用户基础信息,获得用户关联关系;将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员;根据用户实时信息获得具有同源关系的同源用户;根据所述团体成员判断参加活动的第一用户是否归属所述团体成员;若是,则确认所述第一用户归属所述团体成员;若否,从所述同源用户中获取与所述第一用户具有同源关系的第二用户;判断所述第二用户是否归属所述团体成员;若所述第二用户归属所述团体成员,则确定所述第一用户也归属所述团体成员。这样,通过采用离线全量团体识别和实时同源拟合进行实时团体识别,解决了现有的团体计算时间过长无法实时识别的问题,提高了团体识别的时效性和准确性。
附图说明
50.图1为本发明提供的一种团体用户识别方法的一个流程示意图。
51.图2为本发明提供的用户之间的关联关系图的一个示例图。
52.图3为本发明提供的团体聚类算法结果的一个示例图。
53.图4为本发明提供的一种团体成员识别方法的一个流程示意图。
54.图5为本发明提供的一种同源用户识别方法的一个流程示意图。
55.图6为本发明提供的一种团体用户识别方法的另一个流程示意图。
56.图7为本发明团体用户识别装置实施例的结构框图。
57.图8是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
58.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
59.为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅以
解释本发明,并不用于限定本发明。
60.在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
61.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
62.在一个实施例中,如图1所示,本发明提供一种团体用户识别方法,所述方法包括:
63.步骤101、读取用户基础信息,获得用户关联关系。
64.步骤102、将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员。
65.对于一个购物应用程序而言,若用户使用app进行登录、访问、下单等行为,则会留下大量的用户数据。在进行实时团体识别的过程中,可以先针对现有的或者一直不断增加的全量用户数据,判断是否存在团体成员。而用户的相关数据可以被存储在数据库、表格等位置,本实施例以存储在数据库中进行说明。
66.在本实施例中,可以先从数据库中读取的用户基础信息,由于可以针对多个用户,可以得到多个用户的至少一种介质;具体的,所述至少一种介质包括银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间。
67.若多个用户之间,存在银行账号相同,和/或ip地址相同,和/或手机号码相同,和/或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号的使用时间在预设时间范围内,则确认所述多个用户之间存在关联关系。
68.举例说明,获取用户基础信息,可以是银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间中的一种或多种,这里以手机号码为例,如果用户1和用户2使用的手机号码相同,都是138****5675,则认为用户1和用户2之间具有关联关系,若不相同,则认为用户1和用户2 之间不具有关联关系。
69.本实施例中,在确认所述多个用户之间存在关联关系之后,可以进一步的读取用户关联关系,然后采用团体识别算法对多个用户进行聚类计算,从而将多个用户划分为多个用户团。具体的,团体识别算法可以将用户划分为一个个不同大小的团,团体识别算法可以是标签传播、louvian等算法,本实施例以标签传播算法为例,即具体的团体识别算法可以是:
70.对所述用户关联关系中的每个节点初始化其所属的标签,且每个节点所属的标签唯一;其中,归属节点为x,初始化标签为
71.设置迭代次数t,对于每个节点其中x是所有节点的集合,得到
72.其中表示节点x在t 次迭代时的标签;
73.判断每个节点的标签都不再变化或者满足迭代次数,如果满足则结束;如果不满足,则设置t=t 1,重新遍历。
74.请一并参阅图2,图2为用户(即图中的每一节点)之间的关联关系图的一个示例。
75.进一步的,将所述用户团进行聚类,可以对上述结果采用团体聚类算法,请一并参阅图3,图3为团体聚类算法后结果的一个示例。其中,u1、u2、 u3和u4表示第一团体201内的四个用户,u5、u6、u7和u8表示第二团体 202内的四个用户。
76.若聚类出的所述用户团内的用户数量满足第一预设规则,则将所述用户团内的用户作为团体成员。上述第一预设规则可以是:以团体成员数量举例,若团的成员数量大于等于n,则认为是团体;否则不是团体(n为正整数)。即如果团内的成员个数满足第一预设规则要求,则认为该团为一个团体,团内的成员为团体成员。
77.步骤103、根据用户实时信息获得具有同源关系的同源用户。
78.对于一个购物应用程序而言,除了存在历史用户数据和不断增加的用户数据,还包括实时在线的用户。在进行实时团体识别的过程中,还可以先针对实时用户,判断不同的用户之间是否为同源用户。
79.本实施例中,可以先获取用户实时信息,获取的方式可以从实时传送的日志消息和/或协议消息和/或操作记录得到。然后,采用实时流式作业计算方式对所述用户实时信息进行处理,获得具有同源关系的同源用户。具体的,所述同源关系可以是用户的银行账号相同,和/或ip地址相同,和/或手机号码相同,和/或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号在预设时间内进行相同操作,即只要用户之间存在同源关系中的一种或多种,就认为是具有同源关系的同源用户。
80.举例说明,从实时传送的日志消息中获得用户的相关信息,可以是银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间中的一种或多种,这里以手机号码为例,如果用户3和用户4使用的手机号码相同,都是187****3521,则认为用户3和用户4是具有同源关系的同源用户。
81.步骤104、根据所述团体成员判断参加活动的第一用户是否归属所述团体成员。
82.在得到实时同源关系和数据库中的团体成员之后,在本实施例中,针对实时参与该购物应用程序的优惠活动的第一用户,首先根据所述团体成员来判断参加活动的第一用户的账号是否属于所述团体成员中的账号。若是,则进入步骤105,若否,则进入步骤106。
83.步骤105、若是,则确认所述第一用户归属所述团体成员。
84.如果参加活动的第一用户的账号属于所述团体成员中的账号,则确认所述第一用户属于所述团体成员,禁止所述第一用户参加活动。
85.步骤106、若否,从所述同源用户中获取与所述第一用户具有同源关系的第二用户;判断所述第二用户是否归属所述团体成员;若所述第二用户归属所述团体成员,则确定所述第一用户也归属所述团体成员。
86.如果参加活动的第一用户的账号不属于所述团体成员中的账号,则进一步的从所述同源用户中获取与所述第一用户具有同源关系的第二用户,即获取第一用户的至少一种介质,包括银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间中的一种或多种,然后从同源关系中查找与第一用户具有同源关系的第二用户,举例说明,若第一用户的银行账号为x,根据同源关系可以查找到银行账号同样为x的第二用户,若第一用户的手机号码为y,根据同源关系可以查找到银行账号同样为y的第二用户。可以理解的是,第二用户并不单纯指代某一个用户,第二用户可以包括和所述第一用户具有同源关系的多个用户。
87.在得到与所述第一用户具有同源关系的第二用户之后,进一步的判断所述第二用户是否归属所述团体成员;如果第二用户的账号属于所述团体成员中的账号,则可以确认所述第一用户也归属所述团体成员。
88.本发明实施例中,通过读取用户基础信息,获得用户关联关系;将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员;根据用户实时信息获得具有同源关系的同源用户;根据所述团体成员判断参加活动的第一用户是否归属所述团体成员;若是,则确认所述第一用户归属所述团体成员;若否,从所述同源用户中获取与所述第一用户具有同源关系的第二用户;判断所述第二用户是否归属所述团体成员;若所述第二用户归属所述团体成员,则确定所述第一用户也归属所述团体成员。这样,通过采用离线全量团体识别和实时同源拟合进行实时团体识别,解决了现有的团体计算时间过长无法实时识别的问题,提高了团体识别的时效性和准确性。
89.在另一个实施例中,对于一个购物应用程序而言,若用户使用app进行登录、访问、下单等行为,则会留下大量的用户数据。在进行实时团体识别的过程中,可以先针对现有的或者一直不断增加的全量用户数据,判断是否存在团体成员。如图4所示,本发明提供一种团体成员识别方法,所述方法包括:
90.步骤401、读取用户基础信息,得到多个用户的至少一种介质。
91.由于用户的相关数据可以被存储在数据库、表格等位置,本实施例以存储在数据库中进行说明。
92.在本实施例中,可以先从数据库中读取的用户基础信息,由于可以针对多个用户,可以得到多个用户的至少一种介质;具体的,所述至少一种介质包括银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间。
93.步骤402、若银行账号相同,和/或ip地址相同,和/或手机号码相同,和 /或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号的使用时间在预设时间范围内,则确认所述多个用户之间存在关联关系。
94.若多个用户之间,存在银行账号相同,和/或ip地址相同,和/或手机号码相同,和/或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号的使用时间在预设时间范围内,则确认所述多个用户之间存在关联关系。
95.举例说明,获取用户基础信息,可以是银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间中的一种或多种,这里以手机号码为例,如果用户1和用户2使用的手机号码相同,都是138****5675,则认为用户1和用户2之间具有关联关系,若不相同,则认为用户1和用户2 之间不具有关联关系。
96.步骤403、读取用户关联关系,采用团体识别算法对多个用户进行聚类计算,将多个用户划分为多个用户团。
97.本实施例中,在确认所述多个用户之间存在关联关系之后,可以进一步的读取用户关联关系,然后采用团体识别算法对多个用户进行聚类计算,从而将多个用户划分为多个用户团。具体的,团体识别算法可以将用户划分为一个个不同大小的团,团体识别算法可以是标签传播、louvian等算法,本实施例以标签传播算法为例,即具体的团体识别算法可以是:
98.对所述用户关联关系中的每个节点初始化其所属的标签,且每个节点所属的标签唯一;其中,归属节点为x,初始化标签为
99.设置迭代次数t,对于每个节点其中x是所有节点的集合,得到
100.其中表示节点x在t 次迭代时的标签;
101.判断每个节点的标签都不再变化或者满足迭代次数,如果满足则结束;如果不满足,则设置t=t 1,重新遍历。
102.请一并参阅图2,图2为用户(即图中的每一节点)之间的关联关系图的一个示例。
103.进一步的,将所述用户团进行聚类,可以对上述结果采用团体聚类算法,请一并参阅图3,图3为团体聚类算法后结果的一个示例。其中,u1、u2、 u3和u4表示第一团体201内的四个用户,u5、u6、u7和u8表示第二团体 202内的四个用户。
104.步骤404、若聚类出的所述用户团内的用户数量满足第一预设规则,则将所述用户团内的用户作为团体成员。
105.本实施例中,若聚类出的所述用户团内的用户数量满足第一预设规则,则将所述用户团内的用户作为团体成员。上述第一预设规则可以是:以团体成员数量举例,若团的成员数量大于等于n,则认为是团体;否则不是团体 (n为正整数)。即如果团内的成员个数满足第一预设规则要求,则认为该团为一个团体,团内的成员为团体成员。
106.本发明实施例中,通过历史用户数据和不断增加的已存储的用户数据使用团体识别算法进行团体识别,可以得到现有的团体成员,为后续进行实时团体识别提供基础。
107.在另一个实施例中,对于一个购物应用程序而言,除了存在历史用户数据和不断增加的用户数据,还包括实时在线的用户。在进行实时团体识别的过程中,还可以先针对实时用户,判断不同的用户之间是否为同源用户。如图5所示,本发明提供一种同源用户识别方法,所述方法包括:
108.步骤501、获取用户实时信息。
109.步骤502、采用实时流式作业计算方式对所述用户实时信息进行处理,获得具有同源关系的同源用户。
110.本实施例中,可以先获取用户实时信息,获取的方式可以从实时传送的日志消息和/或协议消息和/或操作记录得到。然后,采用实时流式作业计算方式对所述用户实时信息进行处理,获得具有同源关系的同源用户。具体的,所述同源关系可以是用户的银行账号相同,和/或ip地址相同,和/或手机号码相同,和/或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号在预设时间内进行相同操作,即只要用户之间存在同源关系中的一种或多种,就认为是具有同源关系的同源用户。
111.举例说明,从实时传送的日志消息中获得用户的相关信息,可以是银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间中的一种或多种,这里以手机号码为例,如果用户3和用户4使用的手机号码相同,都是187****3521,则认为用户3和用户4是具有同源关系的同源用户。
112.本发明实施例中,通过对用户实时信息进行实时计算、实时存储,得到具有同源关
系的同源用户,为后续进行实时团体识别提供基础。
113.在另一个实施例中,在得到实时同源关系和数据库中的团体成员之后,可以针对实时参与该购物应用程序的优惠活动的第一用户判断其是否为团体用户。如图6所示,本发明提供一种团体用户识别方法,所述方法包括:
114.步骤601、根据所述团体成员判断参加活动的第一用户是否归属所述团体成员。
115.在本实施例中,针对实时参与该购物应用程序的优惠活动的第一用户,首先根据所述团体成员来判断参加活动的第一用户的账号是否属于所述团体成员中的账号。若是,则进入步骤604,若否,则进入步骤602。
116.步骤602、从所述同源用户中获取与所述第一用户具有同源关系的第二用户。
117.如果参加活动的第一用户的账号不属于所述团体成员中的账号,则进一步的从所述同源用户中获取与所述第一用户具有同源关系的第二用户,即获取第一用户的至少一种介质,包括银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间中的一种或多种,然后从同源关系中查找与第一用户具有同源关系的第二用户,举例说明,若第一用户的银行账号为x,根据同源关系可以查找到银行账号同样为x的第二用户,若第一用户的手机号码为y,根据同源关系可以查找到银行账号同样为y的第二用户。可以理解的是,第二用户并不单纯指代某一个用户,第二用户可以包括和所述第一用户具有同源关系的多个用户。
118.步骤603、判断所述第二用户是否归属所述团体成员。
119.在得到与所述第一用户具有同源关系的第二用户之后,进一步的判断所述第二用户是否归属所述团体成员;如果第二用户的账号属于所述团体成员中的账号,则可以确认所述第一用户也归属所述团体成员,进入步骤604,否则,进入步骤605。
120.步骤604、确认所述第一用户属于团体用户。
121.如果参加活动的第一用户的账号属于所述团体成员中的账号,则确认所述第一用户属于所述团体成员,即所述第一用户为团体用户,禁止所述第一用户参加活动。
122.步骤605、确认所述第一用户属于正常用户。
123.如果参加活动的第一用户的账号不属于所述团体成员中的账号,则确认所述第一用户不属于所述团体成员,确认所述第一用户属于正常用户,可以允许所述第一用户参加活动。
124.本发明实施例中,通过离线全量团体识别和实时同源拟合进行实时团体识别,解决了现有的团体计算时间过长无法实时识别的问题,提高了团体识别的时效性和准确性。
125.此外,本发明实施例还提出一种团体用户识别装置,参照图7,所述团体用户识别装置包括:
126.信息读取单元701,用于读取用户基础信息,获得用户关联关系;
127.用户划分单元702,用于将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员;
128.同源计算单元703,用于根据用户实时信息获得具有同源关系的同源用户;
129.团体确认单元704,用于根据所述团体成员判断参加活动的第一用户是否归属所述团体成员;
130.若否,从所述同源用户中获取与所述第一用户具有同源关系的第二用户;
131.判断所述第二用户是否归属所述团体成员;若所述第二用户归属所述团体成员,则确定所述第一用户也归属所述团体成员;
132.若是,则确认所述第一用户归属所述团体成员。
133.本发明实施例中,通过离线全量团体识别和实时同源拟合进行实时团体识别,解决了现有的团体计算时间过长无法实时识别的问题,提高了团体识别的时效性和准确性。
134.需要说明的是,上述装置中的各单元可用于实现上述方法中的各个步骤,同时达到相应的技术效果,本实施例在此不再赘述。
135.参照图8,图8为本发明实施例方案涉及的硬件运行环境的设备的结构示意图。
136.如图8所示,该设备可以包括:处理器1001,例如cpu,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如 wi-fi、4g、5g接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
137.本领域技术人员可以理解,图8中示出的结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
138.如图8所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及团体用户识别程序。
139.在图8所示的设备中,网络接口1004主要用于与外部网络进行数据通信;用户接口1003主要用于接收用户的输入指令;设备通过处理器1001调用存储器1005中存储的团体用户识别程序,并执行以下操作:
140.读取用户基础信息,获得用户关联关系;
141.将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员;
142.根据用户实时信息获得具有同源关系的同源用户;
143.根据所述团体成员判断参加活动的第一用户是否归属所述团体成员;
144.若否,从所述同源用户中获取与所述第一用户具有同源关系的第二用户;判断所述第二用户是否归属所述团体成员;若所述第二用户归属所述团体成员,则确定所述第一用户也归属所述团体成员;
145.若是,则确认所述第一用户归属所述团体成员。
146.可选地,所述读取用户基础信息,获得用户关联关系,包括以下步骤:
147.读取用户基础信息,得到多个用户的至少一种介质;
148.其中,所述至少一种介质包括银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间;
149.若银行账号相同,和/或ip地址相同,和/或手机号码相同,和/或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号的使用时间在预设时间范围内,则确认所述多个用户之间存在关联关系。
150.可选地,所述将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员,包括以下步骤:
151.读取用户关联关系;
152.采用团体识别算法对多个用户进行聚类计算,将多个用户划分为多个用户团;
153.若聚类出的所述用户团内的用户数量满足第一预设规则,则将所述用户团内的用户作为团体成员。
154.可选地,所述团体识别算法包括以下步骤:
155.对所述用户关联关系中的每个节点初始化其所属的标签,且每个节点所属的标签唯一;其中,归属节点为x,初始化标签为
156.设置迭代次数t,对于每个节点其中x是所有节点的集合,得到
157.其中表示节点x在t 次迭代时的标签;
158.判断每个节点的标签都不再变化或者满足迭代次数,如果满足则结束;如果不满足,则设置t=t 1,重新遍历。
159.可选地,所述根据用户实时信息获得具有同源关系的同源用户,包括以下步骤:
160.获取用户实时信息,所述用户实时信息包括:日志消息和/或协议消息和/ 或操作记录;
161.采用实时流式作业计算方式对所述用户实时信息进行处理,获得具有同源关系的同源用户;
162.所述同源关系为用户的银行账号相同,和/或ip地址相同,和/或手机号码相同,和/或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号在预设时间内进行相同操作。
163.可选地,所述根据所述团体成员判断参加活动的第一用户是否归属所述团体成员,包括以下步骤:
164.判断所述第一用户的账号是否属于所述团体成员中的账号;
165.如果属于,则所述第一用户属于所述团体成员;
166.如果不属于,则所述第一用户不属于所述团体成员。
167.可选地,所述团体用户识别方法还包括以下步骤:
168.所述第一用户为所述团体成员,则禁止所述第一用户参加活动。
169.本发明实施例中,通过离线全量团体识别和实时同源拟合进行实时团体识别,解决了现有的团体计算时间过长无法实时识别的问题,提高了团体识别的时效性和准确性。
170.此外,本发明实施例还提出一种计算机可读存储介质,计算机可读存储介质上存储有团体用户识别程序,团体用户识别程序被处理器执行时实现如下操作:
171.读取用户基础信息,获得用户关联关系;
172.将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员;
173.根据用户实时信息获得具有同源关系的同源用户;
174.根据所述团体成员判断参加活动的第一用户是否归属所述团体成员;
175.若否,从所述同源用户中获取与所述第一用户具有同源关系的第二用户;判断所述第二用户是否归属所述团体成员;若所述第二用户归属所述团体成员,则确定所述第一用户也归属所述团体成员;
176.若是,则确认所述第一用户归属所述团体成员。
177.可选地,所述读取用户基础信息,获得用户关联关系,包括以下步骤:
178.读取用户基础信息,得到多个用户的至少一种介质;
179.其中,所述至少一种介质包括银行账号、ip地址、手机号码、登录使用的国际移动设备识别码、账号的使用时间;
180.若银行账号相同,和/或ip地址相同,和/或手机号码相同,和/或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号的使用时间在预设时间范围内,则确认所述多个用户之间存在关联关系。
181.可选地,所述将所述用户关联关系根据团体识别算法进行计算,依此将用户划分为多个用户团,若用户团内的用户数量满足第一预设规则则确认用户为团体成员,包括以下步骤:
182.读取用户关联关系;
183.读取用户关联关系;
184.采用团体识别算法对多个用户进行聚类计算,将多个用户划分为多个用户团;
185.若聚类出的所述用户团内的用户数量满足第一预设规则,则将所述用户团内的用户作为团体成员。
186.可选地,所述团体识别算法包括以下步骤:
187.对所述用户关联关系中的每个节点初始化其所属的标签,且每个节点所属的标签唯一;其中,归属节点为x,初始化标签为
188.设置迭代次数t,对于每个节点其中x是所有节点的集合,得到
189.其中表示节点x在t 次迭代时的标签;
190.判断每个节点的标签都不再变化或者满足迭代次数,如果满足则结束;如果不满足,则设置t=t 1,重新遍历。
191.可选地,所述根据用户实时信息获得具有同源关系的同源用户,包括以下步骤:
192.获取用户实时信息,所述用户实时信息包括:日志消息和/或协议消息和/ 或操作记录;
193.采用实时流式作业计算方式对所述用户实时信息进行处理,获得具有同源关系的同源用户;
194.所述同源关系为用户的银行账号相同,和/或ip地址相同,和/或手机号码相同,和/或登录使用的国际移动设备识别码属于同一型号或相同,和/或账号在预设时间内进行相同操作。
195.可选地,所述根据所述团体成员判断参加活动的第一用户是否归属所述团体成员,包括以下步骤:
196.判断所述第一用户的账号是否属于所述团体成员中的账号;
197.如果属于,则所述第一用户属于所述团体成员;
198.如果不属于,则所述第一用户不属于所述团体成员。
199.可选地,所述团体用户识别方法还包括以下步骤:
200.所述第一用户为所述团体成员,则禁止所述第一用户参加活动。
201.本发明实施例中,通过离线全量团体识别和实时同源拟合进行实时团体识别,解决了现有的团体计算时间过长无法实时识别的问题,提高了团体识别的时效性和准确性。
202.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
203.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
204.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,控制器,或者网络设备等)执行本发明各个实施例所述的方法。
205.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献