一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种违规号码的识别方法、装置、存储介质和计算机设备与流程

2022-02-22 01:51:26 来源:中国专利 TAG:

一种违规号码的识别方法、装置、存储介质和计算机设备
【技术领域】
1.本发明涉及信息安全领域,具体地涉及一种违规号码的识别方法、装置、存储介质和计算机设备。


背景技术:

2.随着电信技术迅猛发展,电信诈骗呈现高发态势,因此对违规号码进行快速准确识别对维护社会稳定、保护人民财产安全有着重要的社会现实意义。在相关技术中,通常采用无监督的方式,利用电话号码之间的呼叫记录信息,为每个电话号码定义可疑性度量,采用风险等级量化的方式识别团伙诈骗电话。然而在相关技术中仅基于出度(该号码在一个时间窗口内给多少人打过电话)、入度(该号码在一个时间窗口被多少人呼叫过)以及呼叫次数计算每个电话号码的可疑度,由于特征不够全面且过于简单从而导致违规号码的识别结果不够精准。


技术实现要素:

3.有鉴于此,本发明提供一种违规号码的识别方法、装置、存储介质和计算机设备,能够提高识别违规号码的精确程度。
4.一方面,本发明实施例提供了一种违规号码的识别方法,包括:
5.从获取的呼叫关系团伙中确定出多个主叫方团伙,每个所述主叫方团伙包括多个主叫号码,所述多个主叫号码包括多个违规标识的主叫号码和多个无标识的主叫号码;
6.针对每个所述主叫方团伙,根据获取的多个所述违规标识的主叫号码的历史呼叫规律,从多个所述违规标识的主叫号码中确定出第一正式主叫号码;
7.根据获取的多个所述第一正式主叫号码的多个特征指标参数和被叫方信息以及获取的多个所述无标识的主叫号码的多个特征指标参数和被叫方信息,从多个所述无标识的主叫号码中确定出第二正式主叫号码;
8.将所述第一正式主叫号码和第二正式主叫号码确定为所述主叫方团伙中的违规号码。
9.可选地,所述多个主叫号码包括无违规标识的主叫号码;
10.所述方法还包括:
11.从所述主叫方团伙中剔除所述无违规标识的主叫号码。
12.可选地,在所述从获取的呼叫关系团伙中确定出多个主叫方团伙之前,还包括:
13.从拦截业务话单中获取多个呼叫关系数据,每个所述呼叫关系数据包括一个主叫号码、一个被叫号码以及所述主叫号码和所述被叫号码之间的呼叫关系;
14.将所述主叫号码和所述被叫号码作为节点,所述呼叫关系作为边,生成呼叫关系网络;
15.从所述呼叫关系网络中确定出多个呼叫关系团伙,所述呼叫关系团伙内的任一号码可沿所述呼叫关系的路径到达所述呼叫关系团伙内任一号码,且所述呼叫关系团伙内包
括至少一个主叫号码、至少一个被叫号码以及至少一个呼叫关系。
16.可选地,所述从获取的呼叫关系团伙中确定出多个主叫方团伙,包括:
17.从所述呼叫关系团伙中筛选出多个初始主叫方团伙,每个所述初始主叫方团伙包括多个主叫号码;
18.判断每个所述初始主叫方团伙中所述违规标识的主叫号码的数量是否大于或者等于第一预设数量;
19.若判断出所述违规标识的主叫号码的数量小于第一预设数量,剔除所述初始主叫方团伙;
20.若判断出每个所述初始主叫方团伙中所述违规标识的主叫号码的数量大于或者等于第一预设数量,判断所述初始主叫方团伙中多个主叫号码的数量是否大于或者等于第二预设数量;
21.若判断出所述多个标识类型的主叫号码的数量小于第二预设数量,剔除所述初始主叫方团伙;
22.若判断出所述多个标识类型的主叫号码的数量大于或者等于第二预设数量,将所述初始主叫方团伙确定为主叫方团伙,以确定出多个主叫方团伙。
23.可选地,所述针对每个所述主叫方团伙,根据获取的多个所述违规标识的主叫号码的历史呼叫规律,从多个所述违规标识的主叫号码中确定出第一正式主叫号码,包括:
24.根据获取的多个所述违规标识的主叫号码的历史呼叫规律,生成呼叫规律矩阵图;
25.计算每个所述违规标识的主叫号码的历史呼叫规律与所述呼叫规律矩阵图之间的匹合度,剔除匹合度小于预设匹配值的违规标识的主叫号码,并将匹合度大于或者等于预设匹配值的违规标识的主叫号码确定为第一正式主叫号码。
26.可选地,所述根据获取的多个所述第一正式主叫号码的多个特征指标参数和被叫方信息以及获取的多个所述无标识的主叫号码的多个特征指标参数和被叫方信息,从多个所述无标识的主叫号码中确定出第二正式主叫号码,包括:
27.根据获取的所述第一正式主叫号码的多个特征指标参数,计算出每个特征指标参数的标准差;
28.按照大到小的方式对所述多个特征指标参数的标准差进行排序,并将前n个特征指标参数的标准差所对应的特征指标参数确定为共性行为参数,将剩余的特征指标参数的标准差所对应的特征指标参数确定为非公性行为参数;
29.针对每个所述无标识的主叫号码,根据获取的多个所述第一正式主叫号码的非共性行为参数和所述无标识的主叫号码的非共性行为参数,计算出每个所述第一正式主叫号码与所述无标识的主叫号码的非共性行为相似度;
30.判断是否有超过预设数量个所述第一正式主叫号码与所述无标识的主叫号码的非共性行为相似度高于第一预设阈值;
31.若判断出未有超过预设数量个所述第一正式主叫号码与所述无标识的主叫号码的非共性行为相似度高于第一预设阈值,将所述无标识的主叫号码确定为正常号码,并剔除所述正常号码;
32.若判断出有超过预设数量个所述第一正式主叫号码与所述无标识的主叫号码的
非共性行为相似度高于第一预设阈值,将与所述无标识的主叫号码的非共性行为相似度高于第一预设阈值的所述第一正式主叫号码作为推荐号码,将剩余的所述第一正式主叫号码作为所述无标识的主叫号码的非推荐号码,将所述无标识的主叫号码确定为被推荐号码,针对每个所述被推荐号码,获取所述推荐号码和被推荐号码的初始被叫方信息,并剔除所述推荐号码和被推荐号码之间相同的初始被叫方信息,生成被叫方信息;
33.根据所述推荐号码和被推荐号码的被叫方信息,计算出被推荐号码与所述推荐号码的被叫方相似度,并剔除所述被叫方相似度低于第二预设阈值的被推荐号码;
34.针对剩余的每个所述被推荐号码,将所述被推荐号码代替对应的推荐号码,计算所述被推荐号码与所述非推荐号码之间的团伙共性值,并剔除所述团伙共性值小于初始团伙共性值的被推荐号码,并将所述团伙共性值大于或者等于初始团伙共性值的被推荐号码确定为第二正式成员。
35.可选地,在所述将所述被推荐号码代替对应的推荐号码,计算所述被推荐号码与所述非推荐号码之间的团伙共性值,并剔除所述团伙共性值小于初始团伙共性值的被推荐号码之前,包括:
36.获取所述被推荐号码对应的推荐号码;
37.计算所述推荐号码与所述被推荐号码对应的非推荐号码之间的团伙共性值,生成初始团伙共性值。
38.另一方面,本发明实施例提供了一种违规号码的识别装置,所述装置包括:
39.第一确定模块,用于从获取的呼叫关系团伙中确定出多个主叫方团伙,每个所述主叫方团伙包括多个主叫号码,所述多个主叫号码包括多个违规标识的主叫号码和多个无标识的主叫号码;
40.第二确定模块,用于针对每个所述主叫方团伙,根据获取的多个所述违规标识的主叫号码的历史呼叫规律,从多个所述违规标识的主叫号码中确定出第一正式主叫号码;
41.第三确定模块,用于根据获取的多个所述第一正式主叫号码的多个特征指标参数和被叫方信息以及获取的多个所述无标识的主叫号码的多个特征指标参数和被叫方信息,从多个所述无标识的主叫号码中确定出第二正式主叫号码;
42.第四确定模块,用于将所述第一正式主叫号码和第二正式主叫号码确定为所述主叫方团伙中的违规号码。
43.另一方面,本发明实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述的违规号码的识别方法。
44.另一方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行上述的违规号码的识别方法的步骤。
45.本发明实施例提供的技术方案中,从获取的呼叫关系团伙中确定出多个主叫方团伙,针对每个主叫方团伙,根据获取的多个违规标识的主叫号码的历史呼叫规律,从多个违规标识的主叫号码中确定出第一正式主叫号码,根据获取的多个第一正式主叫号码的多个特征指标参数和被叫方信息以及获取的多个无标识的主叫号码的多个特征指标参数和被叫方信息,从多个无标识的主叫号码中确定出第二正式主叫号码,将第一正式主叫号码和第二正式主叫号码确定为主叫方团伙中的违规号码,从而能够提高识别违规号码的精确程
度。
【附图说明】
46.为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
47.图1是本发明一实施例所提供的一种违规号码的识别方法的流程图;
48.图2是本发明又一实施例所提供的一种违规号码的识别方法的流程图;
49.图3是本发明一实施例所提供的一种呼叫关系网络10的结构示意图;
50.图4是本发明一实施例所提供的一种主叫方团伙的结构示意图;
51.图5是本发明一实施例所提供的一种初始化的呼叫规律矩阵图;
52.图6是本发明一实施例所提供的一种呼叫规律矩阵图;
53.图7是本发明一实施例所提供的一种违规号码的识别装置的结构示意图;
54.图8为本发明实施例提供的一种计算机设备的示意图。
【具体实施方式】
55.为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
56.应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
57.在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
58.应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,甲和/或乙,可以表示:单独存在甲,同时存在甲和乙,单独存在乙这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
59.在对本发明的实施例所提供的一种违规号码的识别方法的流程进行介绍之前,先对相关技术中的违规号码的识别方法的流程进行简单介绍:
60.在相关技术中采用一种基于可疑性度量的团伙诈骗电话识别方法,采用无监督的方式,利用电话号码之间的呼叫记录信息,为每个电话号码定义可疑性度量,采用风险等级量化的方式识别团伙诈骗电话。然而相关技术存在以下缺点:仅基于出度、入度以及呼叫次数计算每个电话号码的可疑度,由于特征不够全面且过于简单从而导致违规号码的识别结果不够精准。
61.基于此,本发明所要解决的技术问题:如何提高识别违规号码的精确程度。具体地,本发明提供一种违规号码的识别方法,通过采集多个主叫号码和该主叫号码所对应的被叫号码,构建呼叫关系网络,从呼叫关系网络中获取呼叫关系团伙,并经过团伙数据预处理后,获取主叫方团伙,对主叫方团伙中标识类型的不同主叫号码,采用不同的算法分别进
行针对性处理和筛选,最后确定出违规号码。下面通过以下实施例对上述一种违规号码的识别方法进行详细解释。
62.图1为本发明一实施例提供的一种违规号码的识别方法的流程图,如图1所示,该方法包括:
63.步骤101、从获取的呼叫关系团伙中确定出多个主叫方团伙,每个主叫方团伙包括多个主叫号码,多个主叫号码包括多个违规标识的主叫号码和多个无标识的主叫号码。
64.步骤102、针对每个主叫方团伙,根据获取的多个违规标识的主叫号码的历史呼叫规律,从多个违规标识的主叫号码中确定出第一正式主叫号码。
65.步骤103、根据获取的多个第一正式主叫号码的多个特征指标参数和被叫方信息以及获取的多个无标识的主叫号码的多个特征指标参数和被叫方信息,从多个无标识的主叫号码中确定出第二正式主叫号码。
66.步骤104、将第一正式主叫号码和第二正式主叫号码确定为主叫方团伙中的违规号码。
67.本发明实施例提供的技术方案中,从获取的呼叫关系团伙中确定出多个主叫方团伙,针对每个主叫方团伙,根据获取的多个违规标识的主叫号码的历史呼叫规律,从多个违规标识的主叫号码中确定出第一正式主叫号码,根据获取的多个第一正式主叫号码的多个特征指标参数和被叫方信息以及获取的多个无标识的主叫号码的多个特征指标参数和被叫方信息,从多个无标识的主叫号码中确定出第二正式主叫号码,将第一正式主叫号码和第二正式主叫号码确定为主叫方团伙中的违规号码,从而能够提高识别违规号码的精确程度。
68.图2为本发明又一实施例提供的一种违规号码的识别方法的流程图,如图2所示,该方法包括:
69.步骤201、从拦截业务话单中获取多个呼叫关系数据。
70.本发明实施例中,拦截业务话单可包括从高频骚扰电话拦截业务中获取的用户业务话单。其中,每个呼叫关系数据包括一个主叫号码、一个被叫号码以及主叫号码和被叫号码之间的呼叫关系。需要说明的是,在获取呼叫关系数据时,需要对呼叫关系数据进行去重处理,也就是说,需要剔除呼叫关系数据中重复的主叫号码、被叫号码以及主叫号码和被叫号码之间的呼叫关系,从而保证后续计算的违规号码的准确性,同时也能够降低系统计算处理时间。
71.步骤202、将主叫号码和被叫号码作为节点,呼叫关系作为边,生成呼叫关系网络。
72.本发明实施例中,如图3所示,在呼叫关系网络图中,主叫号码、被叫号码构成呼叫关系网络的顶点,呼叫关系为呼叫关系网络的边。具体地,在呼叫关系网络图10中,包括主叫号码1、主叫号码2、主叫号码3、主叫号码4、主叫号码5、主叫号码6、被叫号码a、被叫号码b、被叫号码c、呼叫关系1a、呼叫关系2a、呼叫关系2b、呼叫关系6b、呼叫关系3b、呼叫关系4c以及呼叫关系5c,其中,主叫号码1与被叫号码a之间的呼叫关系为1a,主叫号码2与被叫号码a之间的呼叫关系为2a,主叫号码2与被叫号码b之间的呼叫关系为2b,主叫号码6与被叫号码b之间的呼叫关系为6b,主叫号码3与被叫号码b之间的呼叫关系为3b,主叫号码4与被叫号码c之间的呼叫关系为4c,主叫号码5与被叫号码c之间的呼叫关系为5c。
73.步骤203、从呼叫关系网络中确定出多个呼叫关系团伙,呼叫关系团伙内的任一号
码可沿呼叫关系的路径到达呼叫关系团伙内任一号码,且呼叫关系团伙内包括至少一个主叫号码、至少一个被叫号码以及至少一个呼叫关系。
74.本发明实施例中,如图3所示,通过执行步骤202,能够从呼叫关系网络10中确定出2个呼叫关系团伙,且2个呼叫关系团伙包括呼叫关系团伙a和呼叫关系团伙b。在呼叫关系团伙a中,呼叫关系团伙a内的任一号码可通过呼叫关系的路径到达呼叫关系团伙内任一号码。例如,主叫号码2能够通过呼叫关系2b、呼叫关系3b到达主叫号码3。需要说明的是,非同一呼叫关系团伙内的号码,互相不可到达。例如,呼叫关系团伙b内的任一号码无法通过呼叫关系的路径达到呼叫关系团结a内的任一号码。
75.步骤204、从获取的呼叫关系团伙中确定出多个主叫方团伙,每个主叫方团伙包括多个主叫号码,多个主叫号码包括多个违规标识的主叫号码和多个无标识的主叫号码。
76.本发明实施例中,如图3所示,呼叫关系团伙内包括至少一个主叫号码、至少一个被叫号码以及至少一个呼叫关系。通过执行步骤204,仅保留主叫号码,从而将呼叫关系团伙转为主叫方团伙。除此之外,对主叫方团伙中的主叫号码按照标识进行分类,多个主叫号码包括违规标识的主叫号码、无标识的主叫号码或者无违规标识的主叫号码,例如,如图4所示,主叫方团伙a’中包括主叫号码1、主叫号码2、主叫号码3、主叫号码6,其中,主叫号码1和主叫号码2为违规标识的主叫号码(本发明用圆形代替),主叫号码3为无标识的主叫号码(本发明用六边形代替),主叫号码6为无违规标识的主叫号码(本发明用三角形代替)。其中,对主叫方团伙中的主叫号码按照标识进行分类的依据包括平台系统黑名单、第三方平台标记库以及本发明输出的违规号码库,也就是说,可通过平台系统黑名单、第三方平台标记库以及本发明输出的违规号码库,确定出每个主叫号码所属的标识类型。例如,主叫号码1为平台系统黑名单中的违规号码,则将主叫号码1确定为违规标识的主叫号码。
77.本发明实施例中,步骤204中从获取的呼叫关系团伙中确定出多个主叫方团伙的具体过程可包括:
78.步骤2041、从呼叫关系团伙中筛选出多个初始主叫方团伙,每个初始主叫方团伙包括多个主叫号码。
79.本发明实施例中,一个呼叫关系团伙中可包括多个初始主叫方团伙,每个初始主叫方团伙包括多个主叫号码。由于并非是每个初始主叫方团伙中的主叫号码均为违规号码,因此需要执行以下步骤进行一一排除,确定为违规号码。例如,如图4所示所示,从呼叫关系团伙a和呼叫关系团伙b中筛选出呼叫关系团伙a’和呼叫关系团伙b’,但并非每个主叫方团伙中的主叫号码,均为违规号码,因此需要执行后续步骤进行一一排除,确定为违规号码。
80.步骤2042、判断每个初始主叫方团伙中违规标识的主叫号码的数量是否大于或者等于第一预设数量,若否,执行步骤2043;若是,执行步骤2044。
81.本发明实施例中,第一预设数量可包括1个。针对每个初始主叫方团伙,需要判断每个初始主叫方团伙中违规标识的主叫号码的数量是否大于或者等于第一预设数量,若判断出违规标识的主叫号码的数量小于第一预设数量,表明该初始主叫方团伙不是违规团伙,即表明该初始主叫方团伙中不存在违规号码;若判断出每个初始主叫方团伙中违规标识的主叫号码的数量大于或者等于第一预设数量,表明该初始主叫方团伙可能是违规团伙需要进行后续的判断步骤。除此之外,还可以通过判断初始主叫方团伙中主叫号码是否处
于黑名单库或者违规号码库,从而确定出初始主叫方团伙是否为违规团伙。
82.步骤2043、剔除初始主叫方团伙。
83.本发明实施例中,通过将不属于违规团伙的初始主叫方团伙进行剔除,从而避免了计算负荷,提高违规号码的识别效率。
84.步骤2044、判断初始主叫方团伙中多个主叫号码的数量是否大于或者等于第二预设数量,若否,执行步骤2045;若是,执行步骤2046。
85.本发明实施例中,第二预设数量可包括2个。针对每个剩余的初始主叫方团伙,需要判断剩余的初始主叫方团伙中多个主叫号码的数量是否大于或者等于第二预设数量,若判断出多个标识类型的主叫号码的数量小于第二预设数量,表明该初始主叫方团伙不是违规团伙,即表明该初始主叫方团伙中不存在违规号码;若判断出多个标识类型的主叫号码的数量大于或者等于第二预设数量,表明该初始主叫方团伙可能是违规团伙需要后续步骤,确定出违规号码。
86.步骤2045、剔除初始主叫方团伙。
87.本发明实施例中,通过将不属于违规团伙的初始主叫方团伙进行剔除,从而避免了计算负荷,提高违规号码的识别效率。
88.步骤2046、将初始主叫方团伙确定为主叫方团伙,以确定出多个主叫方团伙。
89.步骤205、针对每个主叫方团伙,根据获取的多个违规标识的主叫号码的历史呼叫规律,从多个违规标识的主叫号码中确定出第一正式主叫号码。
90.本发明实施例中,通过上述步骤204确定出的主叫方团伙可包括违规标识的主叫号码、无标识的主叫号码以及非违规标识的主叫号码,其中,无标识号码们中可能有正常号码,有违规标识号码们可能不属于同一团伙。因此确定出的主叫方团伙中的主叫号码的仍处于“非正式”状态,还需执行步骤205,从多个违规标识的主叫号码中确定出第一正式主叫号码。
91.在步骤205之前,还包括:从主叫方团伙中剔除无违规标识的主叫号码。
92.本发明实施例中,步骤205可具体包括:
93.步骤2051、根据获取的多个违规标识的主叫号码的历史呼叫规律,生成呼叫规律矩阵图。
94.本发明实施例中,本发明考虑到由于存在多个违规标识的主叫号码可能不属于同一团伙,而同一团伙的主叫号码的呼叫时间重合度比较高,因此对于每个主叫方团伙,可通过执行步骤2051和步骤2052,对于违规标识的主叫号码,根据其历史呼叫规律,创建呼叫规律矩阵图,并剔除匹合度小于预设匹配值的违规标识的主叫号码,并将匹合度大于或者等于预设匹配值的违规标识的主叫号码确定为第一正式主叫号码。
95.其中,生成呼叫规律矩阵图的过程可包括:
96.第一步:根据多个违规标识的主叫号码的历史呼叫规律,建立初始化的呼叫规律矩阵图。
97.本发明实施例中,例如,如图5的左图(初始化)所示,假设追溯该主叫关系团伙中的每个违规标识的主叫号码前7天的活跃情况,将每天按24小时进行划分,生成24*7的零元素矩阵,其中,每个矩阵单元代表某天的一个时间段,并将该零元素矩阵确定为初始化的呼叫规律矩阵图。例如,(d1,1h)表示为第1天的第1个小时。除了24*7的零元素矩阵之外,还可
以根据项目实际情况调整,从而生成符合需求的初始化的呼叫规律矩阵图,例如,在上述24*7的零元素矩阵的基础上,再按每10分钟进行划分一个时间段,从而生成144*7的零元素矩阵,并将该零元素矩阵确定为初始化的呼叫规律矩阵图。
98.第二步:针对每个主叫方团伙,通过遍历该主叫方团伙中每个违规标识的主叫号码的历史呼叫规律,更新初始化的呼叫规律矩阵图的元素值,生成更新元素值后的呼叫规律矩阵图。
99.本发明实施例中,其中,更新后的元素值=元素旧值 元素增值。具体地,可通过遍历该违规标识的主叫号码的每个时间段的呼叫情况,得到该时间段对应的矩阵单元的元素增值。例如,若该违规标识的主叫号码在该时段无呼叫时,则元素增值=0;若该成员在该时段有呼叫,则元素增值=1/被叫号码数。需要说明的是,将“被叫号码数”作为分母的原因,是由于群呼类骚扰号码所呼叫的被叫号码数量大,若考察此类号码可能会让团伙数据中包含大量噪声。因此为了削减此类号码对团伙构建的影响力,将“被叫号码数”作为分母,使得当被叫号码数越多时,该号码影响力越弱。
100.其中,执行第二步的过程,例如,如图5所示,图5的左图为初始化的呼叫规律矩阵图,此时假设某个主叫方团伙在遍历完所有的违规标识的主叫号码的历史呼叫规律后,生成的更新初始化的呼叫规律矩阵图的元素值如图5的右图所示,其中,该主叫方团伙在第3天的6时仅有2个号码有呼叫,且被叫方均只有1个,则6h
×
d3该单元元素值=0 1/1 1/1=2,该团伙在第2天的7时仅有1个号码有呼叫,被叫方有3个,则6h
×
d3该单元元素值=0 1/3=1/3。上述计算过程,仅举例了其中几项单元元素值的计算过程,将全部的单元元素值计算完成后,可生成如图5的右图所示的更新初始化的呼叫规律矩阵图。
101.第三步:通过预设的转化规则,将更新元素值后的呼叫规律矩阵图转化为呼叫规律矩阵图。
102.本发明实施例中,例如,如图6所示,以均值作为集中位置指标值,计算出呼叫规律矩阵图中行平均值。将每个元素值与行平均值(该行的元素均值)进行比较,若元素值大于等于行平均值,则将元素值更新为1,否则更新为0,从而得到呼叫规律矩阵图(规范化)。
103.需要说明的是,呼叫规律矩阵图能够反映主叫方团伙中所有的违规标识的主叫号码的呼叫集中规律,集中位置指标值包括不限于均值、顺序统计量等,通过上述的转化规则,将通过元素值与集中位置指标值相比,将呼叫规律矩阵图规范化为只有0和1元素的矩阵。此外,需要说明的是,由于根据业务经验,不同时间段号码呼叫表现有较大差异,因此在计算集中位置指标值时,需要按行计算。
104.步骤2052、计算每个违规标识的主叫号码的历史呼叫规律与呼叫规律矩阵图之间的匹合度,剔除匹合度小于预设匹配值的违规标识的主叫号码,并将匹合度大于或者等于预设匹配值的违规标识的主叫号码确定为第一正式主叫号码。
105.本发明实施例中,同一团伙内的主叫号码,通常来说,该主叫号码的历史呼叫规律与呼叫规律矩阵图具有较高的匹合度,因此可通过计算匹合度的方式确定出“正式”号码。
106.其中,计算每个违规标识的主叫号码的历史呼叫规律与呼叫规律矩阵图之间的匹合度的过程可包括:
107.第一步、根据违规标识的主叫号码的历史呼叫规律,建立初始化的个体呼叫规律矩阵图。
108.本发明实施例中,与上述生成呼叫规律矩阵图的区别在于,该步骤建立的是初始化的个体呼叫规律矩阵图,而上述的呼叫规律矩阵图是根据多个违规标识的主叫号码的历史呼叫规律生成的呼叫规律矩阵图。
109.第二步、判断该违规标识的主叫号码在团伙呼叫规律矩阵图元素值为1的时间段是否有呼叫,若有呼叫,则计数1,否则计数0,基于此,得到违规标识的主叫号码的个体呼叫规律矩阵图。
110.第三步、对该个体呼叫规律矩阵图的所有元素求和,得到匹合度分子,并将团伙呼叫规律矩阵图元素值为1的元素个数作为匹合度分母,生成匹合度。
111.本发明实施例中,在步骤2052执行剔除匹合度小于预设匹配值的违规标识的主叫号码,并将匹合度大于或者等于预设匹配值的违规标识的主叫号码确定为第一正式主叫号码之前,还包括:判断违规标识的主叫号码对应的匹合度是否大于预设匹配值,若是,将匹合度大于或者等于预设匹配值的违规标识的主叫号码确定为第一正式主叫号码,若否,剔除匹合度小于预设匹配值的违规标识的主叫号码。
112.步骤206、根据获取的多个第一正式主叫号码的多个特征指标参数和被叫方信息以及获取的多个无标识的主叫号码的多个特征指标参数和被叫方信息,从多个无标识的主叫号码中确定出第二正式主叫号码。
113.本发明实施例中,步骤206可具体包括:
114.步骤2061、根据获取的第一正式主叫号码的多个特征指标参数,计算出每个特征指标参数的标准差。
115.本发明实施例中,多个特征指标参数包括呼叫频次、被叫离散度、短振铃占比、短呼叫占比、指标时间粒度等。其中,指标时间粒度包括但不限于1小时、2小时或者1天。
116.本发明实施例中,标准差能够综合反映各样本在某指标值的差异程度。当标准差越大,则表示该指标差异程度越大,反之则越小。因此,本发明中需要计算每个特征指标参数的标准差。具体地,标准差的计算公式如下:
117.标准差:
118.其中,n表示为是当前该主叫方团伙的第一正式主叫号码的数量,xi为第i个第一正式主叫号码的某特征指标参数对应的指标数值,为某特征指标参数对应的指标均值。
119.本发明实施例中,还可以根据获取的第一正式主叫号码的多个特征指标参数,计算出每个特征指标参数的平均差,一般来说,标准差优于平均差,但由于标准差的样本数量要求不少于5个,实际操作时根据情况进行选择,例如,当第一正式主叫号码的数量《5个时,计算平均差,否则用标准差。具体地,平均差的计算公式如下:
120.平均差:
121.其中,n表示为是当前该主叫方团伙的第一正式主叫号码的数量,xi为第i个第一正式主叫号码的某特征指标参数对应的指标数值,为某特征指标参数对应的指标均值。
122.步骤2062、按照大到小的方式对多个特征指标参数的标准差进行排序,并将前n个
特征指标参数的标准差所对应的特征指标参数确定为共性行为参数,将剩余的特征指标参数的标准差所对应的特征指标参数确定为非公性行为参数。
123.本发明实施例中,所有特征指标参数均计算出平均差或标准差后,按平均差或标准差大小将指标升序排列,取排序前k个指标作为“共性行为”表现指标,即共性行为参数,剩下的指标作为“非共性行为”表现指标,即非公性行为参数。
124.步骤2063、针对每个无标识的主叫号码,根据获取的多个第一正式主叫号码的非共性行为参数和无标识的主叫号码的非共性行为参数,计算出每个第一正式主叫号码与无标识的主叫号码的非共性行为相似度。
125.本发明实施例中,在执行步骤2063之前,需要说明的是,本发明认为在一个主叫方团伙中,由于主叫号码的个性行为相互贴近,因此会产生小团体,因此通过计算每个第一正式主叫号码与无标识的主叫号码的非共性行为相似度,从而能够判定出与第一正式主叫号码的个性行为贴近的无标识的主叫号码是否为违规号码。
126.步骤2064、判断是否有超过预设数量个第一正式主叫号码与无标识的主叫号码的非共性行为相似度高于第一预设阈值,若否,执行步骤2065,若是,执行步骤2066。
127.本发明实施例中,预设数量可包括2个,第一预设阈值可包括80%。例如,若判断出未有超过2个第一正式主叫号码与无标识的主叫号码的非共性行为相似度高于80%,则表明非共性行为相似未通过,即无标识的主叫号码确定为正常号码,需要剔除正常号码,若判断出有超过2个第一正式主叫号码与无标识的主叫号码的非共性行为相似度高于80%,则表明非共性行为相似通过,该无标识的主叫号码可能是违规号码,需要通过后续步骤进一步确定该无标识的主叫号码是否为违规号码。
128.步骤2065、将无标识的主叫号码确定为正常号码,并剔除正常号码。
129.步骤2066、将与无标识的主叫号码的非共性行为相似度高于第一预设阈值的第一正式主叫号码作为推荐号码,将剩余的第一正式主叫号码作为无标识的主叫号码的非推荐号码,将无标识的主叫号码确定为被推荐号码,针对每个被推荐号码,获取推荐号码和被推荐号码的初始被叫方信息,并剔除推荐号码和被推荐号码之间相同的初始被叫方信息,生成被叫方信息。
130.本发明实施例中,通过收集推荐号码和被推荐号码的被叫方信息,并剔除推荐号码与被推荐号码之间的相同的初始被叫方信息。
131.本发明实施例中,进一步地,还包括:若未获取到推荐号码与被推荐号码之间的相同的初始被叫方信息,剔除被推荐号码。
132.步骤2067、根据推荐号码和被推荐号码的被叫方信息,计算出被推荐号码与推荐号码的被叫方相似度,并剔除被叫方相似度低于第二预设阈值的被推荐号码。
133.本发明实施例中,被叫方信息包括基本信息特征、行为特征、地理特征。当剔除相同的初始被叫方信息后,通过执行步骤2067,计算出被推荐号码与推荐号码的被叫方相似度。
134.本发明实施例中,进一步地,在步骤2067中剔除被叫方相似度低于第二预设阈值的被推荐号码之前,还包括:判断是否有超过预设数量个推荐号码与被推荐号码的被叫方相似度高于第二预设阈值。若判断出有超过预设数量个推荐号码与被推荐号码的被叫方相似度高于第二预设阈值,则继续执行步骤2068,若判断出未有超过预设数量个推荐号码与
被推荐号码的被叫方相似度高于第二预设阈值,则剔除被叫方相似度低于第二预设阈值的被推荐号码。
135.例如,若判断出有2个以上推荐号码与被推荐号码的被叫方相似度高于第二预设阈值,则表明被叫方相似度通过,可继续执行后续步骤进一步确定出被推荐号码是否为违规号码。
136.步骤2068、针对剩余的每个被推荐号码,将被推荐号码代替对应的推荐号码,计算被推荐号码与非推荐号码之间的团伙共性值,并剔除团伙共性值小于初始团伙共性值的被推荐号码,并将团伙共性值大于或者等于初始团伙共性值的被推荐号码确定为第二正式成员。
137.本发明实施例中,考虑到被推荐号码不能与团伙中除了推荐号码以外的其他号码行为表现差异过大,因此需要根据团伙共性值变化情况做最后的评估判断。具体地,在执行步骤2068之前,还包括:获取被推荐号码对应的推荐号码;计算推荐号码与被推荐号码对应的非推荐号码之间的团伙共性值,生成初始团伙共性值。
138.本发明实施例中,推荐号码和被推荐号码对应的非推荐号码,均为第一正式成员,因此初始团伙共性值的计算方式可包括:获取第一正式成员的共性行为参数的标准差,并将多个共性行为参数的标准差之和加确定为初始团伙共性值。
139.本发明实施例中,剔除团伙共性值小于初始团伙共性值的被推荐号码,并将团伙共性值大于或者等于初始团伙共性值的被推荐号码确定为第二正式成员的过程,可包括:判断团伙共性值是否大于或者等于初始团伙共性值,若判断出团伙共性值大于或者等于初始团伙共性值,将被推荐号码确定为第二正式成员,若判断出团伙共性值小于初始团伙共性值,剔除被推荐号码。
140.本发明实施例中,根据团伙共性值变化情况对输出的违规号码做最后的评估,增加算法结果的置信度。
141.本发明实施例中,进一步,还包括:当被推荐号码确定为第二正式成员,被推荐号码可作为推荐号码,可执行推荐号码的业务,即无标识的主叫号码经步骤2068确定为第二正式成员后,可以“享受”作为正式成员的权利去推荐其他无标识的主叫号码。
142.步骤207、将第一正式主叫号码和第二正式主叫号码确定为主叫方团伙中的违规号码。
143.本发明实施例中,当确定出第一正式主叫号码和第二正式主叫号码之后,将第一正式主叫号码和第二正式主叫号码确定为主叫方团伙中的违规号码,并将该违规号码存储至违规号码库、直接加入黑名单库或者输出送审。
144.本发明实施例中,迭代利用每次违规号码的识别方法的执行输出的违规号码,并利用第二正式主叫号码来推荐更多的违规号码,从而增加送审号码量。相对于相关技术而言,本发明合理利用了外部标识,通过多种团伙数据过滤手段缩减识别范围,锁定研究对象。本发明认为团伙号码具备相似的呼叫规律,因此回溯历史长时间段的呼叫情况,通过构造团伙呼叫规律矩阵图充分度量号码的呼叫规律。本发明的所依据的维度更多,不仅关注个体取向以及个性行为,还关注个体号码与团伙的相互作用和意义。
145.本发明实施例提供的技术方案中,从获取的呼叫关系团伙中确定出多个主叫方团伙,针对每个主叫方团伙,根据获取的多个违规标识的主叫号码的历史呼叫规律,从多个违
规标识的主叫号码中确定出第一正式主叫号码,根据获取的多个第一正式主叫号码的多个特征指标参数和被叫方信息以及获取的多个无标识的主叫号码的多个特征指标参数和被叫方信息,从多个无标识的主叫号码中确定出第二正式主叫号码,将第一正式主叫号码和第二正式主叫号码确定为主叫方团伙中的违规号码,从而能够提高识别违规号码的精确程度。
146.图7是本发明一实施例所提供的一种违规号码的识别装置的结构示意图,如图7所示,该装置包括:第一确定模块11、第二确定模块12、第三确定模块13和第四确定模块14。
147.第一确定模块11,用于从获取的呼叫关系团伙中确定出多个主叫方团伙,每个所述主叫方团伙包括多个主叫号码,所述多个主叫号码包括多个违规标识的主叫号码和多个无标识的主叫号码;
148.第二确定模块12,用于针对每个所述主叫方团伙,根据获取的多个所述违规标识的主叫号码的历史呼叫规律,从多个所述违规标识的主叫号码中确定出第一正式主叫号码;
149.第三确定模块13,用于根据获取的多个所述第一正式主叫号码的多个特征指标参数和被叫方信息以及获取的多个所述无标识的主叫号码的多个特征指标参数和被叫方信息,从多个所述无标识的主叫号码中确定出第二正式主叫号码;
150.第四确定模块14,用于将所述第一正式主叫号码和第二正式主叫号码确定为所述主叫方团伙中的违规号码。
151.本发明实施例中,所述多个主叫号码包括无违规标识的主叫号码;所述装置还包括:剔除模块15。
152.剔除模块15用于从所述主叫方团伙中剔除所述无违规标识的主叫号码。
153.本发明实施例中,所述装置还包括:获取模块16、生成模块17和第五确定模块18。
154.获取模块16用于从拦截业务话单中获取多个呼叫关系数据,每个所述呼叫关系数据包括一个主叫号码、一个被叫号码以及所述主叫号码和所述被叫号码之间的呼叫关系;
155.生成模块17用于将所述主叫号码和所述被叫号码作为节点,所述呼叫关系作为边,生成呼叫关系网络。
156.第五确定模块18用于从所述呼叫关系网络中确定出多个呼叫关系团伙,所述呼叫关系团伙内的任一号码可沿呼叫关系的路径到达所述呼叫关系团伙内任一号码,且所述呼叫关系团伙内包括至少一个主叫号码、至少一个被叫号码以及至少一个呼叫关系。
157.本发明实施例中,该装置的第五确定模块18具体用于从所述呼叫关系团伙中筛选出多个所述初始主叫方团伙,每个所述初始主叫方团伙包括多个主叫号码;判断每个所述初始主叫方团伙中所述违规标识的主叫号码的数量是否大于或者等于第一预设数量;若判断出所述违规标识的主叫号码的数量小于第一预设数量,剔除所述初始主叫方团伙;若判断出每个所述初始主叫方团伙中所述违规标识的主叫号码的数量大于或者等于第一预设数量,判断所述初始主叫方团伙中多个主叫号码的数量是否大于或者等于第二预设数量;若判断出所述多个标识类型的主叫号码的数量小于第二预设数量,剔除所述初始主叫方团伙;若判断出所述多个标识类型的主叫号码的数量大于或者等于第二预设数量,将所述初始主叫方团伙确定为主叫方团伙,以确定出多个主叫方团伙。
158.本发明实施例中,该装置的第二确定模块12具体用于根据获取的多个所述违规标
识的主叫号码的历史呼叫规律,生成呼叫规律矩阵图;计算每个违规标识的主叫号码的历史呼叫规律与呼叫规律矩阵图之间的匹合度,剔除匹合度小于预设匹配值的违规标识的主叫号码,并将匹合度大于或者等于预设匹配值的违规标识的主叫号码确定为第一正式主叫号码。
159.本发明实施例中,第三确定模块13具体用于根据获取的所述第一正式主叫号码的多个特征指标参数,计算出每个特征指标参数的标准差;
160.按照大到小的方式对所述多个特征指标参数的标准差进行排序,并将前n个特征指标参数的标准差所对应的特征指标参数确定为共性行为参数,将剩余的特征指标参数的标准差所对应的特征指标参数确定为非公性行为参数;
161.针对每个所述无标识的主叫号码,根据获取的多个所述第一正式主叫号码的非共性行为参数和所述无标识的主叫号码的非共性行为参数,计算出每个所述第一正式主叫号码与所述无标识的主叫号码的非共性行为相似度;
162.判断是否有超过预设数量个所述第一正式主叫号码与所述无标识的主叫号码的非共性行为相似度高于第一预设阈值;
163.若判断出未有超过预设数量个所述第一正式主叫号码与所述无标识的主叫号码的非共性行为相似度高于第一预设阈值,将所述无标识的主叫号码确定为正常号码,并剔除所述正常号码;
164.若判断出有超过预设数量个所述第一正式主叫号码与所述无标识的主叫号码的非共性行为相似度高于第一预设阈值,将与所述无标识的主叫号码的非共性行为相似度高于第一预设阈值的所述第一正式主叫号码作为推荐号码,将剩余的所述第一正式主叫号码作为所述无标识的主叫号码的非推荐号码,将所述无标识的主叫号码确定为被推荐号码,针对每个所述被推荐号码,获取所述推荐号码和被推荐号码的初始被叫方信息,并剔除所述推荐号码和被推荐号码之间相同的初始被叫方信息,生成被叫方信息;
165.根据所述推荐号码和被推荐号码的被叫方信息,计算出被推荐号码与所述推荐号码的被叫方相似度,并剔除所述被叫方相似度低于第二预设阈值的被推荐号码;
166.针对剩余的每个所述被推荐号码,将所述被推荐号码代替对应的推荐号码,计算所述被推荐号码与所述非推荐号码之间的团伙共性值,并剔除所述团伙共性值小于初始团伙共性值的被推荐号码,并将所述团伙共性值大于或者等于初始团伙共性值的被推荐号码确定为第二正式成员。
167.本发明实施例中,在第三确定模块13执行在所述将所述被推荐号码代替对应的推荐号码,计算所述被推荐号码与所述非推荐号码之间的团伙共性值,并剔除所述团伙共性值小于初始团伙共性值的被推荐号码步骤之前,还包括:获取所述被推荐号码对应的推荐号码;计算所述推荐号码与所述被推荐号码对应的非推荐号码之间的团伙共性值,生成初始团伙共性值。
168.本发明实施例提供的技术方案中,从获取的呼叫关系团伙中确定出多个主叫方团伙,针对每个主叫方团伙,根据获取的多个违规标识的主叫号码的历史呼叫规律,从多个违规标识的主叫号码中确定出第一正式主叫号码,根据获取的多个第一正式主叫号码的多个特征指标参数和被叫方信息以及获取的多个无标识的主叫号码的多个特征指标参数和被叫方信息,从多个无标识的主叫号码中确定出第二正式主叫号码,将第一正式主叫号码和
第二正式主叫号码确定为主叫方团伙中的违规号码,从而能够提高识别违规号码的精确程度。
169.本发明实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述违规号码的识别方法的实施例的各步骤,具体描述可参见上述违规号码的识别方法的实施例。
170.本发明实施例提供了一种计算机设备,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现上述违规号码的识别方法的步骤。具体描述可参见上述违规号码的识别方法的实施例。
171.图8为本发明实施例提供的一种计算机设备的示意图。如图8所示,该实施例的计算机设备4包括:处理器41、存储器42以及存储在存储42中并可在处理器41上运行的计算机程序43,该计算机程序43被处理器41执行时实现实施例中的应用于违规号码的识别方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器41执行时实现实施例中应用于违规号码的识别装置中各模型/单元的功能,为避免重复,此处不一一赘述。
172.计算机设备4包括,但不仅限于,处理器41、存储器42。本领域技术人员可以理解,图8仅仅是计算机设备4的示例,并不构成对计算机设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备4还可以包括输入输出设备、网络接入设备、总线等。
173.所称处理器41可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
174.存储器42可以是计算机设备4的内部存储单元,例如计算机设备4的硬盘或内存。存储器42也可以是计算机设备4的外部存储设备,例如计算机设备4上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,存储器42还可以既包括计算机设备4的内部存储单元也包括外部存储设备。存储器42用于存储计算机程序以及计算机设备4所需的其他程序和数据。存储器42还可以用于暂时地存储已经输出或者将要输出的数据。
175.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
176.在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
177.作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络
单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
178.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
179.上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
180.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献