一种账号操作者身份的预测方法及装置与流程

2022-03-09 01:01:59 来源：中国专利 TAG：

1.本说明书一个或多个实施例涉及人工智能技术领域，尤其涉及一种账号操作者身份的预测方法及装置。

背景技术：

2.随着互联网技术与社会生活方方面面的交织，各类线上业务的开展往往需要基于账号执行相关操作。其中，对于个人用户而言，进行社交和娱乐活动需要依托账号，这一账号的操作者就是用户本人；对于企业和组织机构而言，商业交易、合作洽谈等业务处理也要依托于账号，而这类账号往往会有多个不同的操作者。
3.对于这些企业和组织机构的账号而言，其操作者虽然是企业和组织机构中的个人，但却存在着身份差异，他可能对所述账号的相关业务有决策权，也可能并无决策权。以企业账号为例，其操作者可能是对企业业务有决策权的法人、店主等，也可能是对企业业务无决策权的财务人员、运营人员等。
4.确定这类账号的操作者身份在诸如推广营销、关系维护等多种场景下具有很高的应用价值。然而，目前相关技术中鲜有针对账号操作者身份的预测方案，此问题亟待解决。

技术实现要素：

5.有鉴于此，本说明书一个或多个实施例提供一种账号操作者身份的预测方法及装置。
6.为实现上述目的，本说明书一个或多个实施例提供的技术方案如下：
7.根据本说明书一个或多个实施例的第一方面，提供了一种账号操作者身份的预测方法，所述方法包括：
8.获取目标账号的操作日志，并从所述操作日志中提取指定的操作事件；
9.基于所述指定的操作事件生成不同维度的事件时间序列；
10.从所述事件时间序列中提取所述目标账号操作者的操作特征；
11.将所述操作特征作为入参输入已训练的身份预测模型，基于所述身份预测模型的输出结果，确定所述目标账号操作者的身份。
12.根据本说明书一个或多个实施例的第二方面，提供了一种账号操作者身份的预测装置，所述装置包括日志获取单元、序列生成单元、特征提取单元和身份预测单元：
13.所述日志获取单元，获取目标账号的操作日志，并从所述操作日志中提取指定的操作事件；
14.所述序列生成单元，基于所述指定的操作事件生成不同维度的事件时间序列；
15.所述特征提取单元，从所述事件时间序列中提取所述目标账号操作者的操作特征；
16.所述身份预测单元，将所述操作特征作为入参输入已训练的身份预测模型，基于所述身份预测模型的输出结果，确定所述目标账号操作者的身份。
17.根据本说明书一个或多个实施例的第三方面，提供了一种电子设备，包括处理器和用于存储处理器可执行指令的存储器；
18.其中，所述处理器通过运行所述可执行指令实现上述第一方面所述方法中的步骤。
19.根据本说明书一个或多个实施例的第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面所述方法中的步骤。
20.由以上描述可以看出，本说明书中，通过采集目标账号的操作日志并从中提取出指定的操作事件，基于所述操作事件生成不同维度的事件时间序列，从所述不同维度的事件时间序列中提取出所述目标账号操作者的多个操作特征，将所述操作特征作为入参输入已训练的身份预测模型，并基于模型输出结果确定目标账号操作者的身份。该方案，基于账号操作日志中包含的指定的操作事件生成不同维度的事件时间序列，并基于所述事件时间序列提取账号操作者的操作特征，所述事件时间序列反映着账号操作者执行操作事件的时间特征，从所述事件时间序列中提取的操作特征反映着账号操作者的行为模式，基于所述操作特征进一步结合已训练的身份预测模型，能够以智能化的方式对账号操作者的身份进行准确预测。
附图说明
21.图1是一示例性实施例提供的一种账号操作者身份的预测方法的流程图。
22.图2是一示例性实施例示出的基于指定的操作事件生成对应维度的事件时间序列的方法流程图。
23.图3是另一示例性实施例示出的基于指定的操作事件生成对应维度的事件时间序列的方法流程图。
24.图4是一示例性实施例示出的基于事件时间序列提取目标账号操作者的操作特征的方法流程图。
25.图5是一示例性实施例提供的一种账号操作者身份的预测装置所在电子设备的结构示意图。
26.图6是一示例性实施例提供的一种账号操作者身份的预测装置的框图。
具体实施方式
27.这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
28.需要说明的是：在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中，其方法所包括的步骤可以比本说明书所描述的更多或更少。此外，本说明书中所描述的单个步骤，在其他实施例中可能被分解为多个步骤进行描述；而本说明书中所描述的多个步骤，在其他实施例中也可能被合并为单个步骤进行
描述。
29.在互联网中，用户需要基于账号执行相关操作以实现业务处理。
30.一般来说，账号可以分为个人账号和团体账号。其中，个人账号归一自然人所有，使用所述个人账号可以处理诸如购物娱乐、亲友转账等私人业务；而团体账号则归企业商户、组织机构等团体所有，使用所述团体账号可以处理诸如企业采购、项目合作及资金往来等团体业务。
31.对于个人账号而言，其操作者即个人账号的所有者；而对企业商户、组织机构等团体的账号而言，其操作者实际则为团体中的个人，且所述账号操作者存在着多种可能的人选，其可以对团体业务具有决策权，也可以对团体业务并无决策权。以企业账号为例，其操作者可能是对企业业务有决策权的法人、店主等，也可能是对企业业务无决策权的财务人员和运营人员等。
32.目前，相关技术中鲜有对账号操作者身份进行预测的方案，并且，由于个人账号并不存在账号操作者身份差异的特点，个人账号的相关方案难以适用于企业商户、组织机构等团体的账号操作者身份的预测场景中。
33.举例来说，常见的个人账号相关的预测方案包括以设备地址、流量状态等数据预测其是否为恶意用户，以及以所浏览内容或所购买商品确定其兴趣偏好等，这些方案中皆不涉及账号操作者可能为决策级别相异的不同人选的问题，将这些方案引入企业商户、组织机构等团体的账号操作者身份的预测场景并无裨益。
34.其次，由于同一用户操作个人账号的行为不能反映其操作企业商户、组织机构等团体的账号的行为，一个人的生活偏好不等同于其工作偏好，如果针对与团体账号关联的个人账号进行身份预测，所预测的个人账号操作者的身份对于团体账号操作者的身份也不具有参考价值。举例来说，如果在预测电商店铺账号操作者的身份时，引入与所述电商店铺账号关联的支付账号的行为标签，因为所述支付账号的行为标签反映的是支付账号操作者在个人生活中的行为偏好，故对所述电商店铺账号操作者的身份预测并无用处。
35.有鉴于此，本说明书一个或多个实施例提供一种账号操作者身份的预测方法，可以应用于服务器或服务器集群中。
36.请参考图1，图1所示为本说明书一示例性实施例提供的账号操作者身份的预测方法的流程图。
37.所述账号操作者身份的预测方法，可以包括如下具体步骤：
38.步骤102，获取目标账号的操作日志，并从所述操作日志中提取指定的操作事件。
39.执行账号操作者身份预测的服务器或服务器集群，获取作为本次预测目标的目标账号的操作日志，在获取操作日志时，不同账号的操作日志可以通过账号的账号标识加以区分，而所获取的操作日志实际则为所述目标账号在一预设时间段内的操作日志，即，所述服务器或服务器集群可以基于所述目标账号的账号标识以及预设的时间段要求获取所述目标账号在预设时间段内的操作日志。
40.在一个例子中，各个账号的操作日志可以统一存储于数据库中，所述服务器或服务器集群可以基于账号标识和预设的时间段要求，向所述数据库请求作为本次预测目标的目标账号的操作日志，并接收所述数据库返回的所述目标账号在所述预设的时间段内的操作日志。举例来说，所述服务器或服务器集群可以基于作为本次预测目标的目标账号的账
号id，向存储有各个账号操作日志的数据库请求所述目标账号在最近一季度内的操作日志，并接收所述数据库返回的所述目标账号在最近一季度内的所有操作日志。
41.可以理解的是，在一种可能的情况下，执行身份预测的服务器或服务器集群即存储操作日志的电子设备，所述服务器或服务器集群也可以读取存储于自身的所述目标账号的操作日志。
42.账号的操作日志中包含多个操作事件，在获取所述目标账号的操作日志后，所述服务器或服务器集群将从所述操作日志中提取指定的操作事件。每个操作事件均记录了账号操作者在一具体时刻基于所述目标账号执行的一具体操作，执行操作的具体时间即所述操作事件的操作时间，而基于所述具体操作的不同，所述操作事件可以分为多种不同类型的操作事件。
43.所述提取指定的操作事件可以是提取指定类型的操作事件。在提取操作事件时，不同类型的操作事件可以通过所述操作事件的事件标识加以区分，所述服务器或服务器集群可以基于预先指定的操作事件的事件标识，从所述操作日志中提取出所述指定的操作事件。举例来说，所述指定的操作事件可以包括登录事件和埋点事件等，本说明书中对指定的操作事件的类型不做具体限制。
44.步骤104，基于提取出的指定的操作事件生成不同维度的事件时间序列。
45.在提取出指定的操作事件后，所述服务器或服务器集群可以基于各个操作事件的操作时间确定不同维度的时间参数，从而生成不同维度的事件时间序列。
46.在一个例子中，所述服务器或服务器集群可以针对某一特定类型的操作事件，基于该类型操作事件的操作时间确定该类型操作事件的时间参数，以生成该类型操作事件的事件时间序列。举例来说，针对类型a的操作事件，可以基于提取出的预设时间段内同属类型a的各个操作事件的操作时间，确定类型a的操作事件的时间参数并生成类型a的操作事件的事件时间序列。
47.在另一个例子中，所述服务器或服务器集群也可以针对多种特定类型的操作事件，基于所述多种特定类型的操作事件的操作时间共同确定这些类型操作事件的时间参数，以生成所述多种类型操作事件的事件时间序列。举例来说，针对类型b、c的操作事件，可以基于提取出的预设时间段内分属类型b和类型c的各个操作事件的操作时间，共同确定类型b、c的操作事件的时间参数并生成类型b、c的操作事件的事件时间序列。
48.其中，所述时间参数可以为操作事件的时间间隔，也可以为操作事件所属会话的会话时长等。
49.所述事件时间序列可以为一离散时间序列，所述离散时间序列可以由多个二维点表征，所述二维点中的自变量可以为某一类型操作事件的操作时间，因变量则可以为与各个操作时间对应的时间参数。所述事件时间序列基于操作日志中操作事件的操作时间确定，反映着目标账号操作者执行操作事件的时间特征，从中提取出的能够反映出目标账号操作者的行为模式。
50.步骤106，从所述事件时间序列中提取所述目标账号操作者的操作特征。
51.所述事件时间序列反映着目标账号操作者执行操作事件的时间特征，所述服务器或服务器集群基于所述事件时间序列进行序列分解、变换等处理，能够提取出反映着所述目标账号操作者行为模式的操作特征，基于所述操作特征反映的行为模式可以进一步确定
目标账号操作者的身份。
52.可以理解的是，所述目标账号操作者的操作特征，除了提取自所述事件时间序列的部分操作特征外，还可以进一步包括基于所述操作日志确定的其他操作特征。举例来说，基于操作日志中的各个登录事件，可以确定所述目标账号操作者在预设时间段内的登录次数，基于各个登录事件中的设备标识和ip地址等，通过熵函数换算可以确定空间稳定性特征等。
53.步骤108，将所述操作特征作为入参输入已训练的身份预测模型，基于所述身份预测模型的输出结果，确定所述目标账号操作者的身份。
54.在提取出目标账号操作者的操作特征后，所述服务器或服务器集群将所述操作特征作为入参输入已训练的身份预测模型，基于所述身份预测模型的具体输出结果，确定所述目标账号操作者的具体身份。
55.其中，所述身份预测模型存在多种可选择的实现模型，它可以是有监督模型，也可以是无监督模型。比较常见的，所述身份预测模型为分类模型，包括决策树模型、随机森林模型、gbdt模型、adaboost模型和xgboost模型等，而所述目标账号操作者所属的身份类别可以简单分为具有决策权的主事型，和没有决策权的常规型。在训练时可以基于标记有身份类别标签的历史样本，基于步骤102至步骤106所述方法，对所述历史样本进行操作日志的获取、事件时间序列的生成以及账号操作者的操作特征的提取，将提取出的所述历史样本的操作特征输入模型并结合所述历史样本标记的身份类别标签进行有监督学习，从而得到已训练的身份预测模型。此处提到的分类模型以及预设的身份类别仅用以示例说明，可以理解的是，账号操作者所属的身份类别也可以基于实际场景设置为更多的身份类别。
56.在基于所述身份预测模型的具体输出结果确定目标账号操作者的具体身份时，需要结合所采用的实现模型的具体输出方式对目标账号操作者的具体身份进行确定，以分类模型为例，其输出结果可以是所述目标账号操作者属于不同的身份类别的置信度，因而可以将各个身份类别的置信度中最高的一个确定为所述目标账号操作者的身份。
57.由以上描述可以看出，本说明书中，通过采集目标账号的操作日志并从中提取出指定的操作事件，基于所述操作事件生成不同维度的事件时间序列，从所述不同维度的事件时间序列中提取出所述目标账号操作者的多个操作特征，将所述操作特征作为入参输入已训练的身份预测模型，并基于模型输出结果确定目标账号操作者的身份。
58.该方案，基于账号的操作日志中包含的指定的操作事件生成不同维度的事件时间序列，并基于所述事件时间序列提取账号操作者的操作特征，所述事件时间序列反映着账号操作者执行操作事件的时间特征，从所述事件时间序列中提取的操作特征反映着账号操作者的行为模式，基于所述操作特征进一步结合已训练的身份预测模型，能够以智能化的方式对账号操作者的身份进行准确预测。
59.为了使本领域技术人员更好地理解本说明书中的技术方案，下面对前文所述内容做进一步的详细说明。
60.请参考图2，在一种可选择的实现方式下，上述步骤104中，所述指定的操作事件包括登录事件，基于所述登录事件生成事件时间序列的过程包括：
61.步骤1042-a，基于各个登录事件的操作时间对所述登录事件进行排序。
62.所述登录事件即账号操作者通过用户名、密码等认证方式在浏览器或应用程序上
登录所述目标账号的操作事件，每一个所述登录事件中可以记录有当次登录的操作时间、登录设备的设备标识和ip地址等等。
63.基于各个登录事件的操作时间的先后，可以将各个登录事件排序，操作时间早的登录事件在前，操作时间晚的登录事件在后，举例来说，可以排序为登录事件r1、登录事件r2、登录事件r3......，其中登录事件r1的操作时间tr1早于登录事件r2的操作时间tr2，登录事件r2的操作时间tr2早于登录事件r3的操作时间tr3，依次类推，不再赘述。
64.步骤1044-b，基于排序相邻的登录事件的操作时间间隔生成登录时间维度下的事件时间序列。
65.针对排序后的各个登录事件中排序相邻的两个登录事件，确定二者操作时间之间的时间间隔，基于前例，可以确定登录事件r1、r2各自的操作时间tr1、tr2之间的时间间隔tr12，即由操作时间tr1到操作时间tr2之间的时间间隔，确定登录事件r2、r3各自的操作时间tr2、tr3之间的时间间隔tr23，即由操作时间tr2到操作时间tr3之间的时间间隔，依次类推，不再赘述。
66.在确定排序相邻的登录事件的操作时间间隔后，可以基于所述排序相邻的登录事件的操作时间间隔生成登录时间维度下的事件时间序列。所述登录时间维度下的事件时间序列可以是由多个二维点构成的离散时间序列，序列中的每个二维点包括一登录事件的操作时间以及该登录事件与其相邻登录事件之间的操作时间间隔，各个二维点依据所述操作时间的先后依次排列。
67.举例来说，所述登录时间维度下的事件时间序列可以由二维点(操作时间tr2，操作时间间隔tr12)，二维点(操作时间tr3，操作时间间隔tr23)......共同构成。
68.请参考图3，在另一种可选择的实现方式下，上述步骤104中，所述指定的操作事件包括埋点事件，基于所述埋点事件生成事件时间序列的过程包括：
69.步骤1042-a，基于各个埋点事件的操作时间对所述埋点事件进行排序。
70.埋点即基于业务需求、以植入代码的形式对特定的操作行为加以监测和数据采集，通过预先在网页或应用程序的代码中设置埋点，在客户端基于设置有埋点的代码呈现网页或运行应用程序时，响应于触发埋点的用户操作，进行数据采集和日志生成。所述埋点事件即预先设置的需要监测和数据采集的特定操作事件，常见的，包括曝光事件和点击事件等，每一个所述埋点事件中可以记录有所述埋点事件的具体操作行为、操作时间、设备标识和ip地址等等。
71.基于各个埋点事件的操作时间的先后，可以将各个埋点事件排序，操作时间早的埋点事件在前，操作时间晚的登录事件在后，举例来说，可以排序为埋点事件b1、埋点事件b2、埋点事件b3......，其中，埋点事件b1的操作时间tb1早于埋点事件b2的操作时间tb2，埋点事件b2的操作时间tb2早于埋点事件b3的操作时间tb3，依次类推，不再赘述。
72.步骤1044-b，基于排序相邻的埋点事件的操作时间间隔将所述埋点事件划分为若干会话。
73.针对排序后的各个埋点事件中排序相邻的两个埋点事件，确定二者操作时间之间的时间间隔，基于前例，可以确定埋点事件b1、b2各自的操作时间tb1、tb2之间的时间间隔tb12，即由操作时间tb1到操作时间tb2之间的时间间隔，确定埋点事件b2、b3各自的操作时间tb2、tb3之间的时间间隔tb23，即由操作时间tb2到操作时间tb3之间的时间间隔，依次类
推，不再赘述。
74.在确定排序相邻的埋点事件的操作时间间隔后，通过所述排序相邻的埋点事件的操作时间间隔与预设的时间间隔阈值的比较，可以将所述埋点事件划分为若干会话。
75.基于预先设置的时间间隔阈值，确定排序相邻的埋点事件的操作时间间隔是否超出所述时间间隔阈值，其中，针对操作时间间隔超出所述时间间隔阈值的排序相邻的埋点事件，将它们划分到不同的会话中，针对操作时间间隔未超出所述时间间隔阈值的排序相邻的埋点事件，将它们划分到同一会话中，基于此规则依照各个埋点事件的操作时间的先后完成会话的划分。
76.举例来说，预先设置时间间隔阈值为30min，假设所有埋点事件包括埋点事件b1至埋点事件b8，确定埋点事件b2、b3为操作时间间隔tb23超出30min的一对排序相邻的埋点事件，埋点事件b6、b7为操作时间间隔tb67超出30min的另一对排序相邻的埋点事件，依照埋点事件的操作时间的先后，可以将操作时间间隔未超出时间间隔阈值的相邻埋点事件b1与b2划分为同一会话s1，超出时间间隔阈值的相邻埋点事件b2与b3分别划分至不同的会话s1与会话s2，未超出时间间隔阈值的相邻埋点事件b3与b4、b4与b5、b5与b6划分为同一会话s2，超出时间间隔阈值的相邻埋点事件b6与b7分别划分至不同的会话s2与会话s3，未超出时间间隔阈值的相邻埋点事件b7与b8划分为同一会话s3。
77.步骤1046-c，基于各个会话中首个埋点事件与最后一个埋点事件的操作时间间隔生成会话时长维度下的事件时间序列。
78.在划分会话完毕后，可以基于各个会话中的首个埋点事件与最后一个埋点事件的操作时间间隔确定所述会话的会话时长，特别的，如果某一会话中仅包含一个埋点事件，可以将所述会话的会话时长确定为0。基于前例，可以确定会话s1的会话时长ts1即埋点事件b1、b2之间的操作时间间隔tb12，会话s2的会话时长ts2即埋点事件b3、b6之间的操作时间间隔tb36，会话s3的会话时长ts3即埋点事件b7、b8之间的操作时间间隔tb78。
79.基于所确定的各个会话的会话时长生成会话时长维度下的事件时间序列，所述会话时长维度下的事件时间序列可以是由多个二维点构成的离散时间序列，序列中的每个二维点包括一会话中首个埋点事件的操作时间以及所述会话的会话时长，各个二维点依据所述操作时间的先后依次排列。
80.举例来说，所述会话时长维度下的事件时间序列可以由二维点(操作时间tb1，会话时长ts1)，二维点(操作时间tb3，会话时长ts2)，二维点(操作时间tb7，会话时长ts3)共同构成。
81.可选地，所述埋点事件可以包括曝光事件和点击事件。
82.其中，所述曝光事件即用户对特定的网页或应用程序内容加以浏览的事件，举例来说，可以针对客户端网页中出现的图片预先设置埋点，当所述图片在网页页面中出现的时长超出预设的时长阈值，则会触发服务端进行数据采集并成对应曝光事件。所述点击事件即用户对特定的网页或应用程序内容加以点击的事件，举例来说，可以针对客户端网页中出现的链接预先设置埋点，当用户点击所述链接，则会触发服务端进行数据采集并生成对应的点击事件。
83.针对步骤1044-b所划分的每个会话，确定所述会话中是否存在点击事件；将其中存在点击事件的会话确定为有效会话，将其中不存在点击事件的会话确定为无效会话。
84.由于在浏览器或应用程序休眠再激活等场景下总是会自动再生成曝光事件，相较于点击事件，曝光事件能够反映出的账号操作者的主动行为较少，在本说明书中，基于各个会话中是否存在点击事件，将会话中存在至少一个点击事件的会话确定为有效会话，将会话中不存在点击事件的会话确定为无效会话。
85.步骤1046-c中，所述基于各个会话中首个埋点事件与最后一个埋点事件的操作时间间隔生成会话时长维度下的事件时间序列，包括：
86.基于各个有效会话中首个埋点事件与最后一个埋点事件的操作时间间隔生成会话时长维度下的事件时间序列。
87.在区分有效会话和无效会话后，只需确定有效会话的会话时长，并基于有效会话的会话时长生成会话时长维度下的事件时间序列，而无效会话的会话时长则无需再确定且不参与所述会话时长维度下的事件时间序列的生成。
88.基于前例，假设会话s3中埋点事件b7、b8均为曝光事件，确定所述会话s3为无效会话，则无需对所述会话s3的会话时长ts3加以确定，所述会话时长维度下的事件时间序列可以基于有效会话s1和有效会话s2，由二维点(操作时间tb1，会话时长ts1)，(操作时间tb3，会话时长ts2)构成。
89.在该实现方式下，会话时长维度下的事件时间序列基于有效会话进行生成，而难以反映出账号操作者行为的无效会话则不参与所述事件时间序列的生成，所生成的会话时长维度下的事件时间序列能够更加准确地反映出账号操作者执行操作事件的时间特征，从而也提高了账号操作者身份预测的准确度。
90.请参考图4，在一种可选择的实现方式下，上述步骤106中，所述从所述事件时间序列中提取所述目标账号操作者的操作特征，包括：
91.步骤1062，针对每个事件时间序列，进行序列分解，得到所述事件时间序列对应的多个分解项序列。
92.事件时间序列是由多个二维点构成的离散时间序列，序列中的每个二维点可以包括一操作事件的操作时间及其对应的时间参数，可以基于预设的序列分解算法对所述事件时间序列进行序列分解，从而得到所述事件时间序列对应的多个分解项序列。
93.其中，所述序列分解算法存在多种可选择的实现算法，包括但不限于stl算法、x11算法、seats算法和prophet算法，所述序列分解算法可以是加性分解算法，即原始序列为所分解的多个分解项序列之和，也可以是乘性分解算法，即原始序列为所分解的多个分解项序列之积。
94.对各个事件时间序列进行序列分解的具体过程应视所采用的具体算法而定，可以参见相关技术，此处不再赘述。
95.序列分解得到的多个分解项序列亦视所采用的具体算法而定，比较常见的，所述分解项序列包括趋势(trend)项序列t(t)、季节(season)项序列s(t)和残差(residue)项序列r(t)，而在prophet算法下，所述分解项序列则包括趋势(trend)项序列t(t)、季节(season)项序列s(t)、假日(holiday)项序列h(t)和残差(residue)项序列r(t)，该算法可以针对节假日等特定日期的序列数据进行分解，从而将节假日等特定日期的序列数据对原始序列从所述原始序列中抽离，以体现原始序列的真实规律。
96.所述趋势项序列t(t)反映分解前的所述事件时间序列的数值变化的整体趋势，所
述季节项序列s(t)反映所述事件时间序列的季节性规律，所述假日项序列h(t)反映所述事件时间序列在节假日等预设的特定日期的特性，所述残差项序列r(t)为所述趋势项序列、季节项序列和假日项序列的结合与分解前的所述事件时间序列之间的误差，它们都是所述分解前的所述事件时间序列更为深层的特征体现。
97.步骤1064，基于每个事件时间序列对应的多个分解项序列，确定所述事件时间序列对应的操作特征，进而得到各个事件时间序列对应的所述目标账号操作者的操作特征。
98.在分解序列得到各个事件时间序列各自对应的多个分解项序列后，针对每个事件时间序列，可以基于其对应的多个分解项序列确定所述事件时间序列对应的目标账号操作者的操作特征。
99.举例来说，针对登录时间维度下的事件时间序列，分解得到其对应的趋势项序列t1(t)、季节项序列s1(t)、假日项序列h1(t)和残差项序列r1(t)。
100.基于趋势项序列t1(t)的均值和标准差σ
t1
，如公式(1)所示，可以确定所述登录时间维度下的事件时间序列对应的趋势稳定性特征。
[0101][0102]
基于季节项序列s1(t)的均值和标准差σ
s1
，如公式(2)所示，可以确定所述登录时间维度下的事件时间序列对应的季节稳定性特征。
[0103][0104]
基于残差项序列r1(t)的方差var(r1(t))，以及趋势项序列t1(t)结合残差项序列r1(t)的方差var(r1(t) t1(t))，如公式(3)所示，可以确定所述登录时间维度下的事件时间序列对应的趋势强度特征。
[0105]
趋势强度特征＝max(0，1-var(r1(t)/var(r1(t) t1(t)))
ꢀꢀꢀꢀꢀꢀ
公式(3)
[0106]
基于残差项序列r1(t)的方差var(r1(t))，以及季节项序列s1(t)结合残差项序列r1(t)的方差var(r1(t) s1(t))，如公式(4)所示，可以确定所述登录时间维度下的事件时间序列对应的季节强度特征。
[0107]
季节强度特征＝max(0，1-var(r1(t)/var(r1(t) s1(t)))
ꢀꢀꢀꢀꢀ
公式(4)
[0108]
同理，针对会话时长维度下的事件时间序列，分解得到其对应的趋势项序列t2(t)、季节项序列s2(t)、假日项序列h2(t)和残差项序列r2(t)，也可以得到所述会话时长维度下的事件时间序列对应的趋势稳定性特征、季节稳定性特征、趋势强度特征、季节强度特征。实践证明基于趋势项序列和季节项序列得到的上述操作特征在账号操作者身份的预测场景中能够准确地刻画用户的行为模式。
[0109]
要说明的是，上述趋势稳定性特征、季节稳定性特征、趋势强度特征和季节强度特征只是基于所述事件时间序列能够提取的部分操作特征，仅用以示例说明，不构成具体限制。
[0110]
在该实现方式下，对各个维度的事件时间序列进行序列分解得到所述事件时间序列对应的多个分解项序列，并基于所述分解项序列提取出所述事件时间序列对应的趋势稳定性、季节稳定性、趋势强度、季节强度等操作特征，不同维度的事件时间序列提取出的各自对应的操作特征皆能够有效反映出账号操作者的行为模式，基于这些操作特征能够更为准确地预测账号操作者的身份。
[0111]
账号操作者的身份在多种场景中具有应用价值，举例来说，当面向企业商户、组织机构等团体进行宣传推广时，就可以基于其账号操作者的身份制定有针对性的推送策略。
[0112]
在一种可选择的实现方式下，所述账号操作者身份的预测方法，还可以包括：
[0113]
基于所确定的所述目标账号操作者的身份，获取与所述目标账号操作者的身份对应的推送策略；基于所述推送策略，向所述目标账号操作者进行信息推送。
[0114]
预先设置账号操作者的身份与推送策略之间的映射关系，周期性地，或者在需要确定下一阶段针对各个账号的具体推送策略时，执行上述账号操作者身份的预测方法，基于与所确定的身份对应的推送策略，确定是否向所述目标账号操作者执行弹窗推送、消息推送以及向所述目标账号操作者弹窗推送、消息推送的具体内容等。
[0115]
举例来说，在电子商务的应用场景下，可以设置b(business)端账号操作者身份和具体的推送策略之间的映射关系，所述b端账号为各个厂家、电商商铺用于实现各自商业业务的账号，针对诸如财务、运营等缺乏决策权的常规型b端账号操作者，可以预先设置其对应的推送策略为线下推广策略，而针对诸如店主、法人等具有决策权的主事型b端账号操作者，则可以预先设置其对应的推送策略为线上推送策略。在基于前述方法预测出b端账号操作者属常规型时，确定其对应的推送策略为线下推广策略，所述线下推广策略中由于所述常规型b端账号操作者实际并没有诸如贷款、功能升级等b端账号增值服务的决策权，因而可由市场推广人员通过线下联系的方式向所述b端账号所属团体中具有决策权的人员进行宣传推广，而在预测出b端账号操作者属主事型时，确定其对应的推送策略为线上推送策略，所述线上推广策略中由于所述主事型b端账号操作者具有决策权，因而可以通过线上方式向其推送有关b端产品的广告弹窗或私信相关内容。
[0116]
从而能够在面对具有不同决策级别的账号操作者时，采取更有针对性、更为有效的分层处理方法，以获得更高效且更有效的宣传推广效果。
[0117]
图5是一示例性实施例提供的一种电子设备的示意结构图。请参考图5，在硬件层面，该设备包括处理器502、内部总线504、网络接口506、内存508以及非易失性存储器510，当然还可能包括其他业务所需要的硬件。本说明书一个或多个实施例可以基于软件方式来实现，比如由处理器502从非易失性存储器510中读取对应的计算机程序到内存508中然后运行。当然，除了软件实现方式之外，本说明书一个或多个实施例并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。
[0118]
请参考图6，账号操作者身份的预测装置可以应用于如图5所示的电子设备中，以实现本说明书的技术方案。其中，所述账号操作者身份的预测装置可以包括日志获取单元610、序列生成单元620、特征提取单元630和身份预测单元640：
[0119]
其中，所述日志获取单元610，获取目标账号的操作日志，并从所述操作日志中提取指定的操作事件；
[0120]
所述序列生成单元620，基于所述指定的操作事件生成不同维度的事件时间序列；
[0121]
所述特征提取单元630，从所述事件时间序列中提取所述目标账号操作者的操作特征；
[0122]
所述身份预测单元640，将所述操作特征作为入参输入已训练的身份预测模型，基于所述身份预测模型的输出结果，确定所述目标账号操作者的操作者身份。
[0123]
可选地，所述指定的操作事件包括登录事件，所述序列生成单元620，基于所述登录事件生成事件时间序列的过程包括：
[0124]
基于各个登录事件的操作时间对所述登录事件进行排序；
[0125]
基于排序相邻的登录事件的操作时间间隔生成登录时间维度下的事件时间序列。
[0126]
可选地，所述指定的操作事件包括预设的埋点事件，所述序列生成单元620，基于所述埋点事件生成事件时间序列的过程包括：
[0127]
基于各个埋点事件的操作时间对所述埋点事件进行排序；
[0128]
基于排序相邻的埋点事件的操作时间间隔将所述埋点事件划分为若干会话；
[0129]
基于各个会话中首个埋点事件与最后一个埋点事件的操作时间间隔生成会话时长维度下的事件时间序列。
[0130]
可选地，所述埋点事件包括曝光事件和点击事件；
[0131]
所述序列生成单元620，还用于：
[0132]
针对每个会话，确定所述会话中是否存在点击事件；
[0133]
将其中存在点击事件的会话确定为有效会话，将其中不存在点击事件的会话确定为无效会话；
[0134]
所述序列生成单元620，基于各个会话中首个埋点事件与最后一个埋点事件的操作时间间隔生成会话时长维度下的事件时间序列，包括：
[0135]
基于各个有效会话中首个埋点事件与最后一个埋点事件的操作时间间隔生成会话时长维度下的事件时间序列。
[0136]
可选地，所述特征提取单元630，从所述事件时间序列中提取所述目标账号操作者的操作特征，包括：
[0137]
针对每个事件时间序列，进行序列分解，得到所述事件时间序列对应的多个分解项序列；
[0138]
基于每个事件时间序列对应的多个分解项序列，确定所述事件时间序列对应的操作特征，进而得到所有事件时间序列对应的所述目标账号操作者的操作特征。
[0139]
可选地，所述账号操作者身份的预测装置还包括：
[0140]
信息推送单元650，基于所确定的所述目标账号操作者的身份，获取与所述目标账号操作者的身份对应的推送策略；
[0141]
基于所述推送策略，向所述目标账号操作者进行信息推送。
[0142]
上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
[0143]
在一个典型的配置中，计算机包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0144]
内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
[0145]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。
[0146]
还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0147]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
[0148]
在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0149]
应当理解，尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书一个或多个实施例范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0150]
以上所述仅为本说明书一个或多个实施例的较佳实施例而已，并不用以限制本说明书一个或多个实施例，凡在本说明书一个或多个实施例的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本说明书一个或多个实施例保护的范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于任务相似度的多AGV分布式调度方法与系统与流程

一种账号操作者身份的预测方法及装置与流程

相关文献

最热文献