侦别高频呼叫的方法和装置、电子设备和可读存储介质与流程

2022-03-31 07:36:44 来源：中国专利 TAG：

1.本发明涉及大数据技术领域，尤其涉及一种侦别高频呼叫的方法、侦别高频呼叫的装置、电子设备和计算机可读存储介质。

背景技术：

2.目前在电信行业的实时应用中，通常需要通过信令话单识别用户的高频呼叫，在对高频呼叫号码进行分析查证后，对疑似诈骗用户进行语音功能限制，例如，高频呼叫可以为5分钟内拨打电话超过5次，并利用用户的标签信息进行过滤，得到最终高频呼叫的用户。目前，通常采用两种方式识别用户的高频呼叫：一种是通过实时流引擎处理，基于引擎的时间窗口api，缓存用户的明细数据，时间窗口内落地快照文件，采用hive/spark关联用户的标签信息进行过滤统计；另一种是采集完用户的数据后，放入hbase以列的方式记录用户出现的时间点，采用hive/spark关联用户的标签信息进行过滤统计。
3.对于第一种方案，通过实时流引擎计算时间窗口内5分钟内拨打电话超5次的行为，对于海量的实时数据需要将用户符合该行为条件的记录存储于计算节点中，并通过hdfs做对应的checkpoint，以保证数据不会因为计算节点重启而丢失，需要定时定点落地快照文件，进行二次标签运算，整个运算处理过程，需要基于全量数据进行，并且产生了二次运算，耗费大量的存储空间与计算资源，影响数据处理的实时性。
4.对于第二种方案，通过hbase以列的方式，记录用户一定周期内出现特定行为的时间点，基于hbase的读取方式，需要每次将完整记录从hbase中取出，进行时间段的统计分析，计算用户的行为规律，在这一过程中，对hbase的并发吞吐量巨大，大批量的数据交互易造成带宽上的压力，另外因围需通过用户的标签信息进行过滤，需经过hive/spark的二次运算，导致数据无法得到实时处理。

技术实现要素：

5.本发明实施例的目的是提供一种侦别高频呼叫的方法、侦别高频呼叫的装置、电子设备和计算机可读存储介质，通过将用户的通话行为轨迹转换为二进制位图的形式，使用内存数据库进行数据的存取，实现了通过一次的实时计算得到高频呼叫的信息。
6.为了解决上述技术问题，本发明实施例是这样实现的：
7.第一方面，本发明实施例提供了一种侦别高频呼叫的方法，包括：
8.采集用户通话业务的信令数据，根据所述用户通话业务的信令数据获取用户的标识信息和最新通话时间；
9.根据所述用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据所述最新通话时间和所述最后通话时间更新所述第一用户通话信息位图，得到第二用户通话信息位图；其中，所述用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话；
10.根据预设高频呼叫规则，确定所述第二用户通话信息位图中用户的高频呼叫信
息，并将所述第二用户通话信息位图写入所述内存数据库中，替代所述第一用户通话信息位图；
11.根据所述用户的标识信息，从所述内存数据库中读取用户的标签信息，根据所述用户的标签信息对所述用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息。
12.第二方面，本发明实施例提供了一种侦别高频呼叫的装置，包括：
13.采集模块，用于采集用户通话业务的信令数据，根据所述用户通话业务的信令数据获取用户的标识信息和最新通话时间；
14.处理模块，用于根据所述用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据所述最新通话时间和所述最后通话时间更新所述第一用户通话信息位图，得到第二用户通话信息位图；其中，所述用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话；
15.计算模块，用于根据预设高频呼叫规则，确定所述第二用户通话信息位图中用户的高频呼叫信息，并将所述第二用户通话信息位图写入所述内存数据库中，替代所述第一用户通话信息位图；
16.过滤模块，用于根据所述用户的标识信息，从所述内存数据库中读取用户的标签信息，根据所述用户的标签信息对所述用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息。
17.第三方面，本发明实施例提供了一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线；其中，所述处理器、所述通信接口以及所述存储器通过总线完成相互间的通信；所述存储器，用于存放计算机程序；所述处理器，用于执行所述存储器上所存放的程序，实现如第一方面所述的侦别高频呼叫的方法。
18.第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述的侦别高频呼叫的方法。
19.本发明实施例提供的侦别高频呼叫的方法、侦别高频呼叫的装置、电子设备和计算机可读存储介质，通过采集用户通话业务的信令数据，根据用户通话业务的信令数据获取用户的标识信息和最新通话时间，根据用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据最新通话时间和最后通话时间更新第一用户通话信息位图，得到第二用户通话信息位图，其中，用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话，然后根据预设高频呼叫规则，确定第二用户通话信息位图中用户的高频呼叫信息，并将第二用户通话信息位图写入内存数据库中，替代第一用户通话信息位图，根据用户的标识信息，从内存数据库中读取用户的标签信息，根据用户的标签信息对用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息；将用户的通话行为轨迹转换为二进制位图的形式，可以节约存储空间，全过程使用内存数据库进行数据的存取，无需磁盘写入，可以对用户连续性通话行为次数进行快速统计，满足海量数据实时计算的需求，实现通过一次的实时计算即可感知用户的通话行为、快速侦别高频呼叫用户，可以减少二次运算过程，节约计算资源，可以利用流式计算与内存数据库结合实现实时在线通话行为、通话轨迹、以及通过数仓分析计算的用户标签信息的融合计算，解决了海量数据运算，采用传统数据库查询统计分析运算时间长，无法实时侦别高频
呼叫用户的问题。
附图说明
20.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
21.图1为本发明实施例侦别高频呼叫的方法的一种实现方式的流程示意图；
22.图2为本发明实施例更新第一用户通话信息位图的一种实现方式的流程示意图；
23.图3为本发明实施例得到第二用户通话信息位图的一种实现方式的流程示意图；
24.图4为本发明实施例确定第二用户通话信息位图的初始通话时间的一种实现方式的流程示意图；
25.图5为本发明实施例确定用户的高频呼叫信息的一种实现方式的流程示意图；
26.图6为本发明实施例的侦别高频呼叫的装置的一种组成结构示意图；
27.图7为实现本发明实施例的一种电子设备的组成结构示意图。
具体实施方式
28.为了使本技术领域的人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。
29.图1为本发明实施例侦别高频呼叫的方法的一种实现方式的流程示意图，图1中的方法可以由侦别高频呼叫的装置作为执行主体执行，该侦别高频呼叫的装置可以应用于电信行业运营商的服务器平台，例如，该服务器可以为包含独立主机的物理服务器，或者为主机集群承载的虚拟服务器，或者为云服务器，本发明实施例对此不作限定，如图1所示，该方法至少包括：
30.s102，采集用户通话业务的信令数据，根据用户通话业务的信令数据获取用户的标识信息和最新通话时间。
31.在本发明实施例中，信令数据可以是通过网络接口从移动通信网络采集，例如，移动通信网络可以为2g移动通信网络、3g移动通信网络、4g移动通信网络、5g移动通信网络等，网络接口可以为x2接口、s1-mme接口、s1-u接口、s6a接口等，本发明实施例对采集信令数据的实现方式不作限定。可以对从移动通信网络采集的信令数据进行解析、过滤等处理，从中获取用户通话业务的信令数据，本发明实施例对从信令数据中获取用户通话业务的信令数据的实现方式不作限定。在本发明实施例中，由于从移动通信网络采集的信令数据数量巨大，对海量的信令数据采用数据不落地的方式进行实时分析与处理，需要通过消息队列对采集的信令数据进行收集，例如，消息队列可以采用kafka等，本发明实施例对用于信令数据收集的消息队列的类型不作限定。
32.在本发明实施例中，可以从用户通话业务的信令数据中提取用户的标识信息和最
新通话时间，将用户通话业务的信令数据转换为用户的标识信息和最新通话时间两个字段，其中，用户的标识信息可以为国际移动用户识别码(international mobile subscriber identity，简称imsi)。
33.s104，根据用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据最新通话时间和最后通话时间更新第一用户通话信息位图，得到第二用户通话信息位图；其中，用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话。
34.在本发明实施例中，在内存数据库中至少存储有用户的标识信息、用户通话信息位图及其最后通话时间，其中，用户通话信息位图及其最后通话时间分别与用户的标识信息相关联，可以通过查询用户的标识信息获取内存数据库中存储的用户通话信息位图及其最后通话时间，例如，内存数据库可以采用远程字典服务(remote dictionary server，简称redis)等，本发明实施例对内存数据库的实现方式不作限定。在本发明实施例中，用户通话信息位图可以采用二进制位图，其中，以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话，即若在用户通话信息位图中某一位为1则表示用户在这一秒中出现过拨打电话的行为，若在用户通话信息位图中某一位为0则表示用户在这一秒中未出现过拨打电话的行为。
35.在本发明实施例中，在根据用户的标识信息从内存数据库中读取用户通话信息位图时，为了保证对用户通话信息的实时处理，需要预设时间窗口，根据用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，例如，预设时间窗口可以为一小时，也就是说，第一用户通话信息位图的时间长度为一小时，它包含60个二进制位，其中，预设时间窗口的大小可以根据数据处理的需求等合理的设置，本发明实施例对此不作限定。可选地，在从信令数据中获取海量的用户的标识信息后，可以根据海量的用户的标识信息，通过管道方式，分批次从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，例如，采用redisson中间件从redis读取数据。
36.在本发明实施例中，可以根据最新通话时间与最后通话时间的差值，确定最新通话时间在用户通话信息位图中对应的位置，并在所确定的对应的位置填充1，得到包含最新通话时间的第二用户通话信息位图。
37.s106，根据预设高频呼叫规则，确定第二用户通话信息位图中用户的高频呼叫信息，并将第二用户通话信息位图写入内存数据库中，替代第一用户通话信息位图。
38.在本发明实施例中，在得到包含最新通话时间的第二用户通话信息位图后，可以预设高频呼叫规则，例如，预设高频呼叫规则可以为5分钟内拨打电话超过5次，可以通过统计第二用户通话信息位图中连续为1的位置的位数，与预设高频呼叫规则进行比较，当第二用户通话信息位图中连续为1的位置的位数符合预设高频呼叫规则时，将用户确定为高频呼叫用户，得到第二用户通话信息位图中用户的高频呼叫信息。在一些可选的例子中，可以采用json格式定义预设高频呼叫规则，例如，5分钟内拨打电话超过5次可以表示为{“通话次数”:》5,“时间周期”:5,“单位”:min}。本发明实施例对预设高频呼叫规则的形式及实现方式不作限定。
39.可选地，在确定第二用户通话信息位图中用户的高频呼叫信息后，可以根据海量的用户的标识信息，通过管道方式，分批次将相应的第二用户通话信息位图写入内存数据
库中，替代内存数据库中存储的对应的第一用户通话信息位图，例如，采用redisson中间件向redis写入数据。
40.s108，根据用户的标识信息，从内存数据库中读取用户的标签信息，根据用户的标签信息对用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息。
41.在本发明实施例中，用户的标签信息可以包括用户的等级，例如五星级用户等，用户的套餐级别，例如50g套餐等，用户使用的移动通信网络的类型，例如物联网等，等，本发明实施例对用户的标签信息的内容不作限定。可选地，可以将用户的标签信息以哈希存储模型，采用键值对的形式存储于内存数据库中，其中，可以将用户的电话号码作为键，将标签信息的属性作为子键，将用户的标签信息作为值，本发明实施例对将用户的标签信息存储于内存数据库中采用的存储模型的类型不作限定。
42.可选地，可以根据海量的用户的标识信息，确定对应的用户的电话号码，根据用户的电话号码，通过管道方式，分批次查询内存数据库，读取用户的标签信息，然后根据用户的标签信息对用户的高频呼叫信息进行过滤处理，以根据用户的标签信息实时地将用户的高频呼叫信息中的某些高频呼叫用户剔除，根据用户的高频呼叫信息中剩下的高频呼叫用户，得到目标高频呼叫信息，例如，采用redisson中间件查询redis中的数据。其中，根据用户的标识信息确定用户的电话号码的实现方式可以采用现有方式实现，本发明实施例对此不作限定。
43.本发明实施例的侦别高频呼叫的方法，通过采集用户通话业务的信令数据，根据用户通话业务的信令数据获取用户的标识信息和最新通话时间，根据用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据最新通话时间和最后通话时间更新第一用户通话信息位图，得到第二用户通话信息位图，其中，用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话，然后根据预设高频呼叫规则，确定第二用户通话信息位图中用户的高频呼叫信息，并将第二用户通话信息位图写入内存数据库中，替代第一用户通话信息位图，根据用户的标识信息，从内存数据库中读取用户的标签信息，根据用户的标签信息对用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息；将用户的通话行为轨迹转换为二进制位图的形式，可以节约存储空间，全过程使用内存数据库进行数据的存取，无需磁盘写入，可以对用户连续性通话行为次数进行快速统计，满足海量数据实时计算的需求，实现通过一次的实时计算即可感知用户的通话行为、快速侦别高频呼叫用户，可以减少二次运算过程，节约计算资源，可以利用流式计算与内存数据库结合实现实时在线通话行为、通话轨迹、以及通过数仓分析计算的用户标签信息的融合计算，解决了海量数据运算，采用传统数据库查询统计分析运算时间长，无法实时侦别高频呼叫用户的问题。
44.下面将结合图2至图5的实施例对本发明侦别高频呼叫的方法进行详细说明。
45.图2为本发明实施例更新第一用户通话信息位图的一种实现方式的流程示意图，如图2所示，根据最新通话时间和最后通话时间更新第一用户通话信息位图，得到第二用户通话信息位图，至少包括：
46.s202，判断最新通话时间与最后通话时间的差值是否大于根据预设高频呼叫规则确定的预设高频呼叫时间阈值。
47.若最新通话时间与最后通话时间的差值大于预设高频呼叫时间阈值，执行s204；
若最新通话时间与最后通话时间的差值小于或等于预设高频呼叫时间阈值，执行s206。
48.在一些可选的例子中，预设高频呼叫规则为5分钟内拨打电话超过5次，则根据预设高频呼叫规则确定的预设高频呼叫时间阈值为5分钟。通过计算最新通话时间与最后通话时间的差值，与预设高频呼叫时间阈值进行比较，可以根据比较结果的大小关系，选择采用不同的方式更新第一用户通话信息位图，以在使用户通话信息位图包含最新通话时间的同时，实现对用户通话信息位图的压缩，从而得到第二用户通话信息位图。
49.s204，将最新通话时间作为初始通话时间，得到第二用户通话信息位图。
50.可选地，可以在最新通话时间与最后通话时间的差值大于预设高频呼叫时间阈值时，将最新通话时间作为第二用户通话信息位图的初始通话时间，得到包含最新通话时间的第二用户通话信息位图，此时第二用户通话信息位图是由1位1构成的二进制位图，也就是说，第二用户通话信息位图的初始通话时间和最后通话时间均为最新通话时间。
51.例如：预设高频呼叫时间阈值为5分钟，第一用户通话信息位图的最后通话时间为20200325231700，以二进制位图表示为0
……
011111，最新通话时间为20200325232300，最新通话时间与最后通话时间的差值为6，大于预设高频呼叫时间阈值，也就是说，用户的最新通话发生在第一用户通话信息位图中最后一次通话之后的第6分钟，在这期间并未发生用户通话，以二进制位图表示为0
……
011111000001，由于在内存数据库中所存储的第一用户通话信息位图中并不存在用户连续通话大于5次的情况，因此在由第一用户通话信息位图与最新通话时间所构成的用户通话信息位图中，并不会由于最新通话时间的加入而出现用户连续通话大于5次的情况，此时可以最新通话时间作为初始通话时间，构成第二用户通话信息位图，开始记载用户的通话信息，可以节约存储空间，同时也不会造成用户通话信息的丢失。
52.s206，将最新通话时间作为最后通话时间，得到第二用户通话信息位图。
53.可选地，可以在最新通话时间与最后通话时间的差值小于或等于预设高频呼叫时间阈值时，将最新通话时间作为第二用户通话信息位图的最后通话时间，得到包含最新通话时间的第二用户通话信息位图，此时第二用户通话信息位图是由第一用户通话信息位图与最新通话时间构成的二进制位图，也就是说，第二用户通话信息位图的最后通话时间为最新通话时间。
54.例如：预设高频呼叫时间阈值为5分钟，第一用户通话信息位图的最后通话时间为20200325231700，以二进制位图表示为0
……
011111，对应的最新通话时间为20200325231800，最新通话时间与最后通话时间的差值为1，小于预设高频呼叫时间阈值，也就是说，用户的最新通话发生在第一用户通话信息位图中最后一次通话之后的第1分钟，虽然在内存数据库中所存储的第一用户通话信息位图中并不存在用户连续通话大于5次的情况，但是如果当第一用户通话信息位图中从最后通话时间开始向前的5分钟存在用户连续通话等于5次的情况时，在由第一用户通话信息位图与最新通话时间所构成的第二用户通话信息位图中，将会由于最新通话时间的加入而出现用户连续通话6次，即大于5次的情况，以二进制位图表示为0
……
0111111，此时可以最新通话时间作为最后通话时间与第一用户通话信息位图构成第二用户通话信息位图，继续记载用户的通话信息，可以节约存储空间，同时也不会造成用户通话信息的丢失。
55.本实施例通过对用户的通话行为轨迹的二进制位图进行压缩，可以节约内存数据
库的存储空间，例如以亿级的用户计算，可节约大量的存储空间，提高内存的利用率。
56.图3为本发明实施例得到第二用户通话信息位图的一种实现方式的流程示意图，如图3所示，将最新通话时间作为最后通话时间，得到第二用户通话信息位图，至少包括：
57.s302，根据第一用户通话信息位图和最后通话时间，确定第一用户通话信息位图的初始通话时间。
58.可选地，可以根据第一用户通话信息位图的最后通话时间和第一用户通话信息位图中初始通话时间的位置，确定第一用户通话信息位图的初始通话时间，例如：第一用户通话信息位图的最后通话时间为20200325231700，以二进制位图表示为0
……
1011111，第一用户通话信息位图的初始通话时间在最后通话时间前的第6分钟，则第一用户通话信息位图的初始通话时间为20200325231100。
59.s304，判断最新通话时间与第一用户通话信息位图的初始通话时间的差值是否大于预设高频呼叫时间阈值。
60.若最新通话时间与第一用户通话信息位图的初始通话时间的差值大于预设高频呼叫时间阈值，执行s306；若最新通话时间与第一用户通话信息位图的初始通过时间的差值小于或等于预设高频呼叫时间阈值，执行s308。
61.在一些可选的例子中，预设高频呼叫规则为5分钟内拨打电话超过5次，则根据预设高频呼叫规则确定的预设高频呼叫时间阈值为5分钟。通过计算最新通话时间与第一用户通话信息位图的初始通话时间的差值，与预设高频呼叫时间阈值进行比较，可以根据比较结果的大小关系，选择采用不同的方式更新第一用户通话信息位图，以在使用户通话信息位图包含最新通话时间的同时，实现对用户通话信息位图的压缩，从而得到第二用户通话信息位图。
62.s306，将最新通话时间作为最后通话时间，根据最新通话时间和预设高频呼叫时间阈值确定初始通话时间，得到第二用户通话信息位图。
63.可选地，可以在最新通话时间与第一用户通话信息位图的初始通话时间的差值大于预设高频呼叫时间阈值时，将最新通话时间作为第二用户通话信息位图的最后通话时间，根据最新通话时间和预设高频呼叫时间阈值确定第二用户通话信息位图的初始通话时间，得到包含最新通话时间的第二用户通话信息位图，此时第二用户通话信息位图是由部分第一用户通话信息位图与最新通话时间构成的二进制位图，也就是说，第二用户通话信息位图的最后通话时间为最新通话时间。
64.例如：预设高频呼叫时间阈值为5分钟，第一用户通话信息位图的最后通话时间为20200325231700，以二进制位图表示为0
……
1011111，最新通话时间为20200325231800，第一用户通话信息位图的初始通话时间为20200325231100，最新通话时间与第一用户通话信息位图的初始通话时间的差值为7，大于预设高频呼叫时间阈值，也就是说，用户的最新通话发生在第一用户通话信息位图中最后一次通话之后的第1分钟，虽然在内存数据库中所存储的第一用户通话信息位图中并不存在用户连续通话大于5次的情况，但是如果当第一用户通话信息位图中从最后通话时间开始向前的5分钟存在用户连续通话等于5次的情况时，在由第一用户通话信息位图与最新通话时间所构成的用户通话信息位图中，将会由于最新通话时间的加入而出现用户连续通话6次，即大于5次的情况，以二进制位图表示为0
……
10111111，此时可以最新通话时间作为最后通话时间，以最新通话时间之前，与最新
通话时间相距预设高频呼叫时间阈值的时间作为初始通话时间，构成第二用户通话信息位图，以二进制位图表示为111111，继续记载用户的通话信息，可以节约存储空间，同时也不会造成用户通话信息的丢失。
65.s308，将第一用户通话信息位图的初始通话时间作为初始通话时间，将最新通话时间作为最后通话时间，得到第二用户通话信息位图。
66.可选地，可以在最新通话时间与第一用户通话信息位图的初始通话时间的差值小于或等于预设高频呼叫时间阈值时，将第一用户通话信息位图的初始通话时间作为第二用户通话信息位图的初始通话时间，将最新通话时间作为第二用户通话信息位图的最后通话时间，得到包含最新通话时间的第二用户通话信息位图，此时第二用户通话信息位图是由部分第一用户通话信息位图与最新通话时间构成的二进制位图，也就是说，第二用户通话信息位图的最后通话时间为最新通话时间。
67.例如：预设高频呼叫时间阈值为5分钟，第一用户通话信息位图的最后通话时间为20200325231700，以二进制位图表示为0
……
011111，对应的最新通话时间为20200325231800，第一用户通话信息位图的初始通话时间为20200325231300，最新通话时间与第一用户通话信息位图的初始通话时间的差值为5，等于预设高频呼叫时间阈值，也就是说，用户的最新通话发生在第一用户通话信息位图中最后一次通话之后的第1分钟，虽然在内存数据库中所存储的第一用户通话信息位图中并不存在用户连续通话大于5次的情况，但是如果当第一用户通话信息位图中从最后通话时间开始向前的5分钟存在用户连续通话等于5次的情况时，在由第一用户通话信息位图与最新通话时间所构成的第二用户通话信息位图中，将会由于最新通话时间的加入而出现用户连续通话6次，即大于5次的情况，以二进制位图表示为0
……
0111111，此时可以第一用户通话信息位图的初始通话时间作为初始通话时间，以最新通话时间作为最后通话时间，构成第二用户通话信息位图，继续记载用户的通话信息，可以节约存储空间，同时也不会造成用户通话信息的丢失。
68.本实施例通过对用户的通话行为轨迹的二进制位图进行压缩，可以节约内存数据库的存储空间，例如以亿级的用户计算，可节约大量的存储空间，提高内存的利用率。
69.图4为本发明实施例确定第二用户通话信息位图的初始通话时间的一种实现方式的流程示意图，如图4所示，根据最新通话时间和预设高频呼叫时间阈值确定初始通话时间，至少包括：
70.s402，判断最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间是否发生用户通话。
71.若最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间发生用户通话，执行s404；若最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间未发生用户通话，执行s406。
72.可选地，在根据最新通话时间和预设高频呼叫时间阈值确定初始通话时间时，根据最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间作为初始通话时间是否发生生用户通话，即是否为1，可以选择采用不同的方式确定第二用户通话信息位图的初始通话时间，以使第二用户通话信息位图简洁，进一步实现对用户通话信息位图的压缩。
73.s404，将最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间
作为初始通话时间。
74.可选地，可以在最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间发生用户通话时，将最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间，作为第二用户通话信息位图的初始通话时间，将最新通话时间作为第二用户通话信息位图的最后通话时间，得到包含最新通话时间的第二用户通话信息位图，此时第二用户通话信息位图是由部分第一用户通话信息位图与最新通话时间构成的二进制位图，也就是说，第二用户通话信息位图的最后通话时间为最新通话时间。
75.关于s404的举例说明可以参见图3中关于s306的举例说明，故在此处不再敷述。
76.s406，将最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间最近的发生用户通话的时间，作为初始通话时间。
77.可选地，可以在最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间未发生用户通话时，将将最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间最近的发生用户通话的时间，作为第二用户通话信息位图的初始通话时间，将最新通话时间作为第二用户通话信息位图的最后通话时间，得到包含最新通话时间的第二用户通话信息位图，此时第二用户通话信息位图是由部分第一用户通话信息位图与最新通话时间构成的二进制位图，也就是说，第二用户通话信息位图的最后通话时间为最新通话时间。
78.例如：预设高频呼叫时间阈值为5分钟，第一用户通话信息位图的最后通话时间为20200325231700，以二进制位图表示为0
……
1001111，最新通话时间为20200325231800，第一用户通话信息位图的初始通话时间为20200325231100，最新通话时间与第一用户通话信息位图的初始通话时间的差值为7，大于预设高频呼叫时间阈值，也就是说，用户的最新通话发生在第一用户通话信息位图中最后一次通话之后的第1分钟，虽然在内存数据库中所存储的第一用户通话信息位图中并不存在用户连续通话大于5次的情况，但是如果当第一用户通话信息位图中从最后通话时间开始向前的4分钟存在用户连续通话等于4次的情况时，在由第一用户通话信息位图与最新通话时间所构成的用户通话信息位图中，将会由于最新通话时间的加入而出现用户连续通话5次的情况，以二进制位图表示为0
……
10011111，此时可以最新通话时间作为最后通话时间，以最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间最近的发生用户通话的时间作为初始通话时间，构成第二用户通话信息位图，即初始通话时间为20200325231400，以二进制位图表示为11111，继续记载用户的通话信息，可以节约存储空间，同时也不会造成用户通话信息的丢失。
79.本实施例通过对用户的通话行为轨迹的二进制位图进行压缩，可以节约内存数据库的存储空间，例如以亿级的用户计算，可节约大量的存储空间，提高内存的利用率。
80.图5为本发明实施例确定用户的高频呼叫信息的一种实现方式的流程示意图，如图5所示，根据预设高频呼叫规则，确定第二用户通话信息位图中用户的高频呼叫信息，至少包括：
81.s502，统计第二用户通话信息位图中1的数量，得到用户的通话次数。
82.s504，将用户的通话次数符合预设高频呼叫规则的用户，确定为高频呼叫用户。
83.可选地，本实施例是针对采用图2至图4中的方法对用户通话信息位图进行压缩所得到的第二用户通话信息位图，确定用户的高频呼叫信息，由于采用图2至图4中的方法所
得到的第二用户通话信息位图是根据预设高频呼叫时间阈值确定的时间长度，例如，当预设高频呼叫时间阈值为5分钟时，第二用户通话信息位图的时间长度最长为6分钟，最短为1分钟，因此可以通过统计第二用户通话信息位图中1的数量，得到用户的通话次数，根据预设高频呼叫规则，确定第二用户通话信息位图中的用户的通话次数是否符合高频呼叫对用户通话次数的要求，例如，1的数量是否大于5，若第二用户通话信息位图中的用户的通话次数符合高频呼叫对用户通话次数的要求，则确定用户为高频呼叫用户。
84.本实施例通过对用户的通话行为轨迹的二进制位图进行压缩，可以简化侦别高频呼叫用户的运算，进一步加快计算过程，节约计算资源。
85.对应上述描述的方法，基于相同的技术构思，本发明实施例还提供了一种侦别高频呼叫的装置，图6为本发明实施例的侦别高频呼叫的装置的一种组成结构示意图，该侦别高频呼叫的装置可以应用于电信行业运营商的服务器平台，可用于执行图1描述的侦别高频呼叫的方法，如图6所示，该侦别高频呼叫的装置至少包括：采集模块610、处理模块620、计算模块630和过滤模块640，其中，采集模块610、处理模块620、计算模块630和过滤模块640依次连接。
86.采集模块610，用于采集用户通话业务的信令数据，根据用户通话业务的信令数据获取用户的标识信息和最新通话时间。
87.在本实施例中，关于采集模块610的说明可以参见图1中关于s102的说明，故在此不再敷述。
88.处理模块620，用于根据用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据最新通话时间和最后通话时间更新所述第一用户通话信息位图，得到第二用户通话信息位图；其中，用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话。
89.在本实施例中，关于处理模块620的说明可以参见图1中关于s104的说明，故在此不再敷述。
90.计算模块630，用于根据预设高频呼叫规则，确定第二用户通话信息位图中用户的高频呼叫信息，并将第二用户通话信息位图写入内存数据库中，替代第一用户通话信息位图。
91.在本实施例中，关于计算模块630的说明可以参见图1中关于s106的说明，故在此不再敷述。
92.过滤模块640，用于根据用户的标识信息，从内存数据库中读取用户的标签信息，根据用户的标签信息对用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息。
93.在本实施例中，关于过滤模块640的说明可以参见图1中关于s108的说明，故在此不再敷述。
94.本发明实施例的侦别高频呼叫的装置，通过采集用户通话业务的信令数据，根据用户通话业务的信令数据获取用户的标识信息和最新通话时间，根据用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据最新通话时间和最后通话时间更新第一用户通话信息位图，得到第二用户通话信息位图，其中，用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话，然后根据预设高频呼叫规则，确定第二用户通话信息位图中用户的高频呼叫信息，并将第
二用户通话信息位图写入内存数据库中，替代第一用户通话信息位图，根据用户的标识信息，从内存数据库中读取用户的标签信息，根据用户的标签信息对用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息；将用户的通话行为轨迹转换为二进制位图的形式，可以节约存储空间，全过程使用内存数据库进行数据的存取，无需磁盘写入，可以对用户连续性通话行为次数进行快速统计，满足海量数据实时计算的需求，实现通过一次的实时计算即可感知用户的通话行为、快速侦别高频呼叫用户，可以减少二次运算过程，节约计算资源，可以利用流式计算与内存数据库结合实现实时在线通话行为、通话轨迹、以及通过数仓分析计算的用户标签信息的融合计算，解决了海量数据运算，采用传统数据库查询统计分析运算时间长，无法实时侦别高频呼叫用户的问题。
95.可选地，处理模块620，用于判断最新通话时间与最后通话时间的差值是否大于根据预设高频呼叫规则确定的预设高频呼叫时间阈值；若最新通话时间与最后通话时间的差值大于预设高频呼叫时间阈值，将最新通话时间作为初始通话时间，得到第二用户通话信息位图；若最新通话时间与最后通话时间的差值小于或等于预设高频呼叫时间阈值，将最新通话时间作为最后通话时间，得到第二用户通话信息位图。
96.可选地，处理模块620，用于根据第一用户通话信息位图和最后通话时间，确定第一用户通话信息位图的初始通话时间；判断最新通话时间与第一用户通话信息位图的初始通话时间的差值是否大于预设高频呼叫时间阈值；若最新通话时间与第一用户通话信息位图的初始通话时间的差值大于预设高频呼叫时间阈值，将最新通话时间作为最后通话时间，根据最新通话时间和预设高频呼叫时间阈值确定初始通话时间，得到第二用户通话信息位图；若最新通话时间与第一用户通话信息位图的初始通过时间的差值小于或等于预设高频呼叫时间阈值，将第一用户通话信息位图的初始通话时间作为初始通话时间，将最新通话时间作为最后通话时间，得到第二用户通话信息位图。
97.可选地，处理模块620，用于判断最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间是否发生用户通话；若最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间发生用户通话，将最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间作为初始通话时间；若最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间未发生用户通话，将最新通话时间之前，与最新通话时间相距预设高频呼叫时间阈值的时间最近的发生用户通话的时间，作为初始通话时间。
98.可选地，计算模块630，用于统计第二用户通话信息位图中1的数量，得到用户的通话次数；将用户的通话次数符合预设高频呼叫规则的用户，确定为高频呼叫用户。
99.可选地，处理模块620，用于根据用户的标识信息，通过管道方式分批次从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间；将第二用户通话信息位图通过管道方式分批次写入内存数据库中，替代对应的第一用户通话信息位图。
100.可选地，用户的标签信息在内存数据库中以哈希存储模型进行存储，其中，在哈希存储模型中，用户的电话号码作为键，标签信息的属性作为子键，用户的标签信息作为值；过滤模块640，用于根据用户的标识信息确定用户的电话号码，根据用户的电话号码通过管道方式分批次查询内存数据库，读取用户的标签信息；根据用户的标签信息对用户的高频呼叫的信息进行过滤处理，得到目标高频呼叫信息。
101.对应上述描述的方法，基于相同的技术构思，本发明实施例还提供了一种电子设
备，图7为实现本发明实施例的一种电子设备的组成结构示意图，如图7所示，该电子设备可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上的处理器701和存储器702，存储器702中可以存储有一个或一个以上存储应用程序或数据。其中，存储器702可以是短暂存储或持久存储。存储在存储器702的应用程序可以包括一个或一个以上模块(图示未示出)，每个模块可以包括对计算机设备中的一系列计算机可执行指令。更进一步地，处理器701可以设置为与存储器702通信，在计算机设备上执行存储器702中的一系列计算机可执行指令。计算机设备还可以包括一个或一个以上电源703，一个或一个以上有线或无线网络接口704，一个或一个以上输入输出接口705，一个或一个以上键盘706。
102.在本实施例中，该电子设备包括有处理器、通信接口、存储器和通信总线；其中，处理器、通信接口以及存储器通过总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序，实现以下方法：
103.采集用户通话业务的信令数据，根据所述用户通话业务的信令数据获取用户的标识信息和最新通话时间；
104.根据所述用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据所述最新通话时间和所述最后通话时间更新所述第一用户通话信息位图，得到第二用户通话信息位图；其中，所述用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话；
105.根据预设高频呼叫规则，确定所述第二用户通话信息位图中用户的高频呼叫信息，并将所述第二用户通话信息位图写入所述内存数据库中，替代所述第一用户通话信息位图；
106.根据所述用户的标识信息，从所述内存数据库中读取用户的标签信息，根据所述用户的标签信息对所述用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息。
107.本发明实施例的电子设备，通过采集用户通话业务的信令数据，根据用户通话业务的信令数据获取用户的标识信息和最新通话时间，根据用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据最新通话时间和最后通话时间更新第一用户通话信息位图，得到第二用户通话信息位图，其中，用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话，然后根据预设高频呼叫规则，确定第二用户通话信息位图中用户的高频呼叫信息，并将第二用户通话信息位图写入内存数据库中，替代第一用户通话信息位图，根据用户的标识信息，从内存数据库中读取用户的标签信息，根据用户的标签信息对用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息；将用户的通话行为轨迹转换为二进制位图的形式，可以节约存储空间，全过程使用内存数据库进行数据的存取，无需磁盘写入，可以对用户连续性通话行为次数进行快速统计，满足海量数据实时计算的需求，实现通过一次的实时计算即可感知用户的通话行为、快速侦别高频呼叫用户，可以减少二次运算过程，节约计算资源，可以利用流式计算与内存数据库结合实现实时在线通话行为、通话轨迹、以及通过数仓分析计算的用户标签信息的融合计算，解决了海量数据运算，采用传统数据库查询统计分析运算时间长，无法实时侦别高频呼叫用户的问题。
108.对应上述描述的方法，基于相同的技术构思，本发明实施例还提供一种计算机可读存储介质，存储介质内存储有计算机程序，计算机程序被处理器执行时实现以下方法：
109.采集用户通话业务的信令数据，根据所述用户通话业务的信令数据获取用户的标识信息和最新通话时间；
110.根据所述用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据所述最新通话时间和所述最后通话时间更新所述第一用户通话信息位图，得到第二用户通话信息位图；其中，所述用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话；
111.根据预设高频呼叫规则，确定所述第二用户通话信息位图中用户的高频呼叫信息，并将所述第二用户通话信息位图写入所述内存数据库中，替代所述第一用户通话信息位图；
112.根据所述用户的标识信息，从所述内存数据库中读取用户的标签信息，根据所述用户的标签信息对所述用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息。
113.本发明实施例的计算机可读存储介质，通过采集用户通话业务的信令数据，根据用户通话业务的信令数据获取用户的标识信息和最新通话时间，根据用户的标识信息，从内存数据库中读取预设时间窗口的第一用户通话信息位图及其最后通话时间，并根据最新通话时间和最后通话时间更新第一用户通话信息位图，得到第二用户通话信息位图，其中，用户通话信息位图以每一位代表1分钟，以1表征发生用户通话，以0表征未发生用户通话，然后根据预设高频呼叫规则，确定第二用户通话信息位图中用户的高频呼叫信息，并将第二用户通话信息位图写入内存数据库中，替代第一用户通话信息位图，根据用户的标识信息，从内存数据库中读取用户的标签信息，根据用户的标签信息对用户的高频呼叫信息进行过滤处理，得到目标高频呼叫信息；将用户的通话行为轨迹转换为二进制位图的形式，可以节约存储空间，全过程使用内存数据库进行数据的存取，无需磁盘写入，可以对用户连续性通话行为次数进行快速统计，满足海量数据实时计算的需求，实现通过一次的实时计算即可感知用户的通话行为、快速侦别高频呼叫用户，可以减少二次运算过程，节约计算资源，可以利用流式计算与内存数据库结合实现实时在线通话行为、通话轨迹、以及通过数仓分析计算的用户标签信息的融合计算，解决了海量数据运算，采用传统数据库查询统计分析运算时间长，无法实时侦别高频呼叫用户的问题。
114.本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
115.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
116.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指
令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
117.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
118.在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
119.内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
120.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。
121.还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
122.本领域技术人员应明白，本发明的实施例可提供为方法、系统或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
123.以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种视频中隐私内容的处理方法、系统、电子设备及介质与流程

侦别高频呼叫的方法和装置、电子设备和可读存储介质与流程

相关文献

最热文献