手机银行用户的活跃度预测策略的确定方法及装置与流程

2021-11-10 03:48:00 来源：中国专利 TAG：

1.本发明涉及活跃度预测技术领域，尤其涉及一种手机银行用户的活跃度预测策略的确定方法及装置。

背景技术：

2.手机银行用户的活跃度预测是一个二分类问题，即预测手机银行用户是否会活跃。二分类模型是机器学习智能识别领域常用的一种模型。在二分类模型中，lightgbm是预测效果较好的算法，它是集成学习的一种，通过梯度提升决策树的高效实现，具有预测精度高和运行速度快的特点。
3.在使用lightgbm算法进行二分类模型的预测时，为提升模型预测的精度，业界一般使用以下方法：一是通过算法参数调优，例如限定每棵树的深度、叶子数或者树的数量等；二是在特征工程的过程中增加预测力更强的样本特征。基于上述方法的以lightgbm算法训练的二分类模型的应用中预测精度能有效提升。但是，第一种方法，需要不断地调整模型结构，浪费时间精力，第二种方法其预测结果受所收集的样本影响，且依赖样本收集时预测力强的样本特征，因此仍缺少可以提高用户活跃度预测准确度的方法。

技术实现要素：

4.本发明的主要目的在于提供一种手机银行用户的活跃度预测策略的确定方法、装置、计算机设备及存储介质，可以解决现有技术中缺少可以提高用户活跃度预测准确度的方法的问题。
5.为实现上述目的，本发明第一方面提供一种手机银行用户的活跃度预测策略的确定方法，所述方法包括：
6.采集d个手机银行用户在所述手机银行上的使用数据，并利用所述d个手机银行用户的第一用户活跃度对所述d个手机银行用户按照从高到低的顺序进行排序，得到用户序列；所述第一用户活跃度为利用二分类模型对所述使用数据进行预测得到的，所述使用数据至少包括脱敏后的手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；
7.按照预设的k种分组方法，及所述第一用户活跃度对所述用户序列进行等距分组，得到k种分组方法分别对应的多个用户组，所述k种分组方法划分的用户组的数量不同；
8.基于预设的lightgbm算法，将第个用户组包含的手机银行用户的使用数据进行活跃度预测模型的训练和验证，得到训练后的第个活跃度预测模型，n为分组方法k对应的组别数量，n为正整数，表示第n组中的第i个；
9.根据第n个组中的各个用户组对应的活跃度预测模型的模型价值度、及所述第n个组中的手机银行用户的使用数据，确定所述第n个组的模型综合价值度，所述模型综合价值度用于反映利用所述第n个组对应的各个活跃度预测模型进行所述手机银行用户的用户活
跃度预测时，得到的用户活跃度的真实程度；
10.将所述k种分组方法中具有最大的模型综合价值度的分组方法确定为目标分组方法，将所述目标分组方法、所述目标分组方法对应的多个用户组的活跃度预测模型、以及所述二分类模型作为目标预测策略，所述目标预测策略用于对待预测的手机银行进行用户活跃度预测。
11.为实现上述目的，本发明第二方面提供一种手机银行用户活跃度的预测方法，所述方法包括：
12.获取待预测手机银行用户在所述手机银行上的使用数据，所述使用数据至少包括脱敏后的待预测手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；
13.将所述使用数据输入目标预测策略包括的二分类模型，确定所述待预测手机银行用户对应的第二用户活跃度，所述目标预测策略为使用如第一方面所述的手机银行用户的活跃度预测策略的确定方法确定的；
14.根据所述第二用户活跃度及所述目标预测策略包括的目标分组方法对应的多个用户组的活跃度预测模型，确定目标活跃度预测模型；
15.将所述使用数据输入所述目标活跃度预测模型，确定所述待预测手机银行用户对应的第三用户活跃度；
16.将所述第二用户活跃度以及所述第三用户活跃度进行均值计算，确定所述待预测手机银行用户的最终用户活跃度。
17.为实现上述目的，本发明第三方面提供一种手机银行用户的活跃度预测策略的确定装置，所述装置包括：
18.特征获取模块：用于采集d个手机银行用户在所述手机银行上的使用数据，并利用所述d个手机银行用户的第一用户活跃度对所述d个手机银行用户按照从高到低的顺序进行排序，得到用户序列；所述第一用户活跃度为利用二分类模型对所述使用数据进行预测得到的，所述使用数据至少包括脱敏后的手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；
19.用户分组模块：用于按照预设的k种分组方法，及所述第一用户活跃度对所述用户序列进行等距分组，得到k种分组方法分别对应的多个用户组，所述k种分组方法划分的用户组的数量不同；
20.模型训练模块：用于基于预设的lightgbm算法，将第个用户组包含的手机银行用户的使用数据进行活跃度预测模型的训练和验证，得到训练后的第个活跃度预测模型，n为分组方法k对应的组别数量，n为正整数，表示第n组中的第i个；
21.价值计算模块：用于根据第n个组中的各个用户组对应的活跃度预测模型的模型价值度、及所述第n个组中的手机银行用户的使用数据，确定所述第n个组的模型综合价值度，所述模型综合价值度用于反映利用所述第n个组对应的各个活跃度预测模型进行所述手机银行用户的用户活跃度预测时，得到的用户活跃度的真实程度；
22.策略存取模块：用于将所述k种分组方法中具有最大的模型综合价值度的分组方法确定为目标分组方法，将所述目标分组方法、所述目标分组方法对应的多个用户组的活
跃度预测模型、以及所述二分类模型作为目标预测策略，所述目标预测策略用于对待预测的手机银行进行用户活跃度预测。
23.为实现上述目的，本发明第四方面提供一种手机银行用户活跃度的预测装置，所述装置包括：
24.数据获取模块：用于获取待预测手机银行用户在所述手机银行上的使用数据，所述使用数据至少包括脱敏后的待预测手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；
25.第一预测模块：用于将所述使用数据输入目标预测策略包括的二分类模型，确定所述待预测手机银行用户对应的第二用户活跃度，所述目标预测策略为使用如第一方面中任意一项所述的手机银行用户的活跃度预测策略的确定方法确定的；
26.模型确定模块：用于根据所述第二用户活跃度及所述目标预测策略包括的目标分组方法对应的多个用户组的活跃度预测模型，确定目标活跃度预测模型；
27.第二预测模块：用于将所述使用数据输入所述目标活跃度预测模型，确定所述待预测手机银行用户对应的第三用户活跃度；
28.概率确定模块：用于将所述第二用户活跃度以及所述第三用户活跃度进行均值计算，确定所述待预测手机银行用户的最终用户活跃度。
29.为实现上述目的，本发明第五方面提供一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如第一方面或第二方面中任一项所示步骤。
30.为实现上述目的，本发明第六方面提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如第一方面或第二方面中任一项所示步骤。
31.采用本发明实施例，具有如下有益效果：
32.本发明提供一种手机银行用户活跃度预测策略的确定方法及装置，方法包括：通过基于二分类模型对各个手机银行用户的使用数据进行预测，得到各个手机银行用户的第一用户活跃度；对第一用户活跃度按照从高到低的排序得到各个手机银行用户构成的用户序列；对用户序列进行预设的k种分组方法的等距分组，得到各分组方法对应的多个用户组；基于各分组方法对应的多个用户组进行活跃度预测模型的训练与验证，选出各个分组方法中所有活跃度预测模型的最大的模型综合价值度对应的目标分组方法，将目标分组方法、目标分组方法对应的各个活跃度预测模型及二分类模型作为目标预测策略，以进行待预测的手机银行用户的用户活跃度预测。一来不需要不断地调整模型参数，减少时间与精力，二来无需依赖样本收集时采集预测力强的样本特征，通过采用该目标预测策略可提升实际预测的用户活跃度的准确性，且模型预测稳定。
附图说明
33.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
34.其中：
35.图1为本发明实施例中一种手机银行用户的活跃度预测策略的确定方法的流程示意图；
36.图2为本发明实施例中一种手机银行用户的活跃度预测策略的确定方法的另一流程示意图；
37.图3为本发明实施例中一种手机银行用户活跃度的预测方法的流程示意图；
38.图4为本发明实施例中一种手机银行用户的活跃度预测策略的确定装置的结构框图；
39.图5为本发明实施例中一种手机银行用户活跃度的预测装置的结构框图；
40.图6为本发明实施例中计算机设备的结构框图。
具体实施方式
41.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
42.请参阅图1，图1为本发明实施例中一种手机银行用户的活跃度预测策略的确定方法的流程示意图。如图1所示方法包括如下步骤：
43.101、采集d个手机银行用户在所述手机银行上的使用数据，并利用所述d个手机银行用户的第一用户活跃度对所述d个手机银行用户按照从高到低的顺序进行排序，得到用户序列；所述第一用户活跃度为利用二分类模型对所述使用数据进行预测得到的，所述使用数据至少包括脱敏后的手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；
44.在本发明实施例中，通过对采集到的手机银行用户在手机银行上的使用数据进行二分类模型的活跃度预测，得到指示手机银行用户的活跃程度的第一用户活跃度，并对第一用户活跃度进行从高到低的顺序排序，以完成对各个手机银行用户的排序确定用户序列。
45.示例的，采集方式可以通过对手机银行的服务器端的历史数据进行读取，并且采集的频率可以是仅获取某个时段的手机银行用户的使用数据或者获取全部时段的使用数据，根据不同活跃度预测目的，可以选择不同数据采集方式以及数据统计时间，在此举例不做限定。手机银行用户的范围可以为在手机银行进行开户的所有手机银行用户。
46.在一种可行实现方式中，使用数据包括但不限于手机银行用户在手机银行上的使用足迹数据，例如：手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征进行脱敏得到的数据集，其中，脱敏则是指将手机银行用户的敏感信息过滤掉或者屏蔽掉涉及手机银行用户隐私部分的信息。进一步的，使用数据中包括的基本属性特征包括但不限于性别，年龄，学历，职业等脱敏后的手机银行用户的个人基本情况数据；使用数据中包括的资产状况特征包括但不限于月均以及日均资产，活期存款余额，定期存款余额，基金余额，理财产品余额，保险余额，国债余额等等脱敏后的手机银行用户个人资产数据；使用数据中包括的资金流水特征包括用户在近1、3、6、12个月时间
内，储蓄卡资金流入的总金额以及流出的总金额、流入以及流出的总次数，以及各资金项目或金融产品等等手机银行用户的交易流动记录数据，进一步的，资金项目包括消费、理财产品、基金、保险、转账、第三方支付、发薪、缴费等等手机银行用户的资金来往项目；使用数据中包括的手机银行使用特征包括手机银行用户在近1、3、6、12个月时间内，手机银行用户通过手机银行交易的总金额、总次数，以及各资金项目的金额、次数。此外，使用数据中还包括手机银行用户开户距今月份数，手机银行活跃距今天数，手机银行近期活跃特征。使用数据中包括的银行开通的金融产品特征包括手机银行用户在银行开通的短信通知，手机银行开户，基金开户，理财开户，保险开户，国债开户，信用卡开户，购汇开户等等业务产品。通过统计所有开户用户的使用数据，实现各个手机银行用户在所述手机银行上的留下的使用足迹，进而采集到各个手机银行用户的使用数据。
47.以手机银行近期活跃特征为例，手机银行近期活跃特征的计算方式可以由下述计算方式确定：
48.手机银行近期活跃特征＝8*m1 4*m2 2*m3 1*m4，
49.其中
50.其中，用户序列为一种有序队列，基于d个手机银行用户的第一用户活跃度从高到低对d个手机银行用户从高到低进行排序得到的，可以理解的是，在对手机银行用户进行上述排序的同时，与各个手机银行用户对应的使用数据，也会相应的改变排序，因而用户序列是包括按照第一活跃度从高到低排列的d个手机银行用户的第一活跃度概率以及与各个手机银行用户对应的使用数据。进一步的，d代表手机银行用户的个数，d为正整数。
51.二分类模型用于预测用户活跃度对应的概率值，进而得到用户序列中各个用户的第一用户活跃度。通过将使用数据输入该二分类模型即可得到各个手机银行用户的第一用户活跃度，可以理解的是，第一用户活跃度可以用来反映手机银行用户在手机银行上的活跃程度。
52.102、按照预设的k种分组方法，及所述第一用户活跃度对所述用户序列进行等距分组，得到k种分组方法分别对应的多个用户组，所述k种分组方法划分的用户组的数量不同；
53.在本发明实施例中，分组方法表示将手机银行用户分为多少个用户组，其中，k种分组方法代表有k种(即多种)分组方法，k取值大于等于2，进而，假设k取值为2，则表明现在有两种分组方法，k取值为3，则表明现在有三种分组方法，并且每种分组方法的用户组数量不同，示例性，两种分组方法中分组方法1为用户组数量为10组，分组方法2用户组数量为为12组(即每种分组方法对应的用户组的组别数量不一)。
54.进一步的，同种分组方法中包括的各个用户组的用户数量也不同，基于等距分组进行每种分组方法的用户组的划分，使得同种分组方法中包括的各个用户组的各用户组标志值的变动都限于相同的范围，各组的标志值可以理解为各用户组中的第一活跃度上限值以及第一活跃度下限值，因而各用户组标志值的变动的也就是第一活跃度上限值以及第一活跃度下限值之间的变动幅度相同，因而k种分组方法等距划分的用户组的手机银行用户的数量未必相同，但同种分组方法中包括的各个用户组的用户活跃度概率临界值的变动范围是一致的。
55.103、基于预设的lightgbm算法，将第个用户组包含的手机银行用户的使用数据进行活跃度预测模型的训练和验证，得到训练后的第个活跃度预测模型，n为分组方法k对应的组别数量，n为正整数，表示第n组中的第i个；
56.在本发明实施例中，基于预设的lightgbm算法，对各个用户组的使用数据输入至对应的活跃度预测模型进行训练和验证，直至得到训练后的第个活跃度预测模型。
57.示例性的，k＝2，则预设的k种分组方法就为分组方法1及分组方法2，若对应的预设的用户组的组别数量分别为2、3，则分组方法1＝2对应存在有p
21
以及p
22
两个用户组；分组方法2＝3存在p
31
、p
32
以及p
33
三个用户组；进而需要将第p
21
个、第p
22
个、第p
31
个、第p
32
个及第p
33
个用户组对应的使用数据输入对应的活跃度预测模型进行训练和验证。进而得到第p
21
个、第p
22
个、第p
31
个、第p
32
个及第p
33
个对应的五个活跃度预测模型，并且分组方法1＝2包括第p
21
个、第p
22
个构成的两个活跃度预测模型；分组方法2＝3包括第p
31
个、第p
32
个及第p
33
个构成的三个活跃度预测模型。
58.可以理解的是，d个手机银行用户在所述手机银行上的使用数据还可以包括用户活跃的第一标签或用户不活跃的第二标签。基于预设的lightgbm算法，分别将各个用户组对应的用户数据进行活跃度模型的训练和验证，进而得到训练后的各个活跃度预测模型，进一步的，模型训练：是将一个或多个使用数据作为输入，然后返回一个用户活跃程度的预测值(y’)作为输出，而模型训练的目的就是指通过使用数据得到计算模型的最佳参数，以达成模型预测值尽可能的接近实际真实值。模型验证：是指用已经训练好的模型，对新的使用进行预测，比较其预测结果与模型在训练时的预测结果，以评估模型是否可靠。进一步的验证方式可以采用样本交叉验证等，在此举例不做限定。
59.示例性的，k＝4，则预设的k种分组方法就为分组方法1、分组方法2、分组方法3及分组方法4，若对应的预设的用户组的组别数量分别为4、5、6、7，则可以得到按照各个分组方法1、分组方法2、分组方法3及分组方法4分别对应的用户组的数量对d各手机银行用户进行四次等距划分，使得在分组方法1对应4个用户组，在分组方法2对应5个用户组，并以此类推。进一步的，此时得到22个用户组，将22个用户组包括的使用数据分别输入对应的活跃度预测模型对各个活跃度预测模型进行训练和验证。也即将第个用户组包含的手机银行用户的使用数据作为输入变量输入至与所述第个用户组对应的活跃度预测模型进行训练，将第个用户组包含的手机银行用户对应的用户活跃标签或用户不活跃标签作为目标变量，基于预设lightgbm算法进行训练，并在训练结束后，再利用各个用户组对训练后的活跃度预测模型进行验证。最终，得到训练后的22个与各个用户组对应的活跃度预测模型。
60.104、根据第n个组中的各个用户组对应的活跃度预测模型的模型价值度、及所述第n个组中的手机银行用户的使用数据，确定所述第n个组的模型综合价值度，所述模型综合价值度用于反映利用所述第n个组对应的各个活跃度预测模型进行所述手机银行用户的用户活跃度预测时，得到的用户活跃度的真实程度；
61.需要说明的是，模型价值度是指分类模型评价指标auc(area under curve)，通过auc反映活跃度预测模型的预测性能的优劣。
62.示例性的，若auc＝1，则该活跃度预测模型为完美分类器；若auc＝[0.85,0.95],
则该活跃度预测模型为预测效果很好的分类器；若auc＝[0.7,0.85]，则该活跃度预测模型为预测效果一般的分类器；依次类推，若auc＝0.5，则该活跃度预测模型的预测效果形同随机猜测(例如：丢铜板)，也即模型没有预测价值。当若auc<0.5时，则预测效果比随机猜测还差。
[0063]
模型综合价值度是指多个分类模型的综合评价指标。需要说明的是，在本发明实施例中，模型综合价值度为第n个组的模型综合价值度，也即在各个个n取值为同一数值时，对应的各个至个用户组对应的各个至个活跃度预测模型的n个模型的综合评价指标(即同种分组方法中包括的各个用户组对应的各个活跃度预测模型的综合价值度)。示例性的，若预设的k种分组方法为4种，则n分别按照分组方法1、分组方法2、分组方法3及分组方法4对应的组别数量进行取值，进而得到第n个组的模型综合价值度。
[0064]
105、将所述k种分组方法中具有最大的模型综合价值度的分组方法确定为目标分组方法，将所述目标分组方法、所述目标分组方法对应的多个用户组的活跃度预测模型、以及所述二分类模型作为目标预测策略，所述目标预测策略用于对待预测的手机银行进行用户活跃度预测。
[0065]
需要说明的是，目标分组方法为模型综合价值度中的模型综合价值度最大值对应的分组方法，将最大值对应的分组方法k选取为目标分组方法。进而得到目标预测策略，其中目标预测策略包括二分类模型、目标分组方法以及目标分组方法对应的多个用户组的活跃度预测模型。
[0066]
本发明提供一种手机银行用户活跃度预测策略的确定方法，方法包括：通过基于二分类模型对各个手机银行用户的使用数据进行预测，得到各个手机银行用户的第一用户活跃度；对第一用户活跃度按照从高到低的排序得到各个手机银行用户构成的用户序列；对用户序列进行预设的k种分组方法的等距分组，得到各分组方法对应的多个用户组；基于各分组方法对应的多个用户组进行活跃度预测模型的训练与验证，选出各个分组方法中所有活跃度预测模型的最大的模型综合价值度对应的目标分组方法，将目标分组方法、目标分组方法对应的各个活跃度预测模型及二分类模型作为目标预测策略，以进行待预测的手机银行用户的用户活跃度预测。一来不需要不断地调整模型参数，减少时间与精力，二来无需依赖样本收集时采集预测力强的样本特征，通过采用该目标预测策略可提升实际预测的用户活跃度的准确性，且模型预测稳定。
[0067]
请参阅图2，图2为本发明实施例中一种手机银行用户的活跃度预测策略的确定方法的另一流程示意图。如图2所示方法包括如下步骤：
[0068]
201、获取d个手机银行样本用户在所述手机银行上的使用样本数据以及所述手机银行样本用户对应的用户活跃标签，所述使用样本数据至少包括脱敏后的手机银行样本用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征，所述用户活跃标签包括与活跃用户对应的第一标签或与不活跃用户对应的第二标签；
[0069]
需要说明的是，步骤201与步骤101内容部分相似，在此对重复内容不再赘述，具体可参考前述步骤101所示内容。
[0070]
需要说明的是，手机银行样本用户对应的使用样本数据与手机银行用户对应的使用数据的数据采集维度相同，包括但不限于与各手机银行样本用户对应的脱敏后的基本属
性数据、资产状况数据、资金流水数据、手机银行使用数据及开通的金融产品数据等等，具体可参考步骤步骤101中对使用数据所做表述。
[0071]
202、基于预设lightgbm算法，利用所述d个手机银行样本用户在所述手机银行上的使用样本数据对二分类模型进行迭代训练，直至根据所述d个所述手机银行样本用户对应的用户活跃标签确定二分类模型收敛；
[0072]
需要说明的是，步骤201与步骤103内容部分相似，在此对重复内容不再赘述，具体可参考前述步骤103所示内容。
[0073]
可以理解的是，通过利用携带有活跃与否标签的手机银行样本用户进行二分类模型的迭代训练和验证，直至输出的活跃度预测结果与用户活跃标签对应的第一标签或第二标签相同或逼近，进而确定二分类模型收敛，其中收敛可以理解为参数优化对预测结果影响较小，无法进一步对预测结果的准确度再次提升，进而得到可以实现活跃度预测的二分类模型，进而对手机银行用户的第一用户活跃度的预测。
[0074]
203、将所述d个手机银行用户包括的使用数据输入训练后的二分类模型，确定各个所述手机银行用户对应的所述第一用户活跃度；
[0075]
其中，第一用户活跃概率的个数与手机银行用户个数相同，用于指示各个手机银行用户使用手机银行的活跃程度，可以理解的是，不同的用户之间的用户活跃度存在差异，因此，每个手机银行用户的第一用户活跃度也会有所不同。
[0076]
204、采集d个手机银行用户在所述手机银行上的使用数据，并利用所述d个手机银行用户的第一用户活跃度对所述d个手机银行用户按照从高到低的顺序进行排序，得到用户序列；所述第一用户活跃度为利用二分类模型对所述使用数据进行预测得到的，所述使用数据至少包括脱敏后的手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；
[0077]
205、按照预设的k种分组方法，及所述第一用户活跃度对所述用户序列进行等距分组，得到k种分组方法分别对应的多个用户组，所述k种分组方法划分的用户组的数量不同；
[0078]
206、基于预设的lightgbm算法，将第个用户组包含的手机银行用户的使用数据进行活跃度预测模型的训练和验证，得到训练后的第个活跃度预测模型，n为分组方法k对应的组别数量，n为正整数，表示第n组中的第i个；
[0079]
207、根据第n个组中的各个用户组对应的活跃度预测模型的模型价值度、及所述第n个组中的手机银行用户的使用数据，确定所述第n个组的模型综合价值度，所述模型综合价值度用于反映利用所述第n个组对应的各个活跃度预测模型进行所述手机银行用户的用户活跃度预测时，得到的用户活跃度的真实程度；
[0080]
需要说明的是，如图2所示步骤204到207与图1所示步骤101
‑
104内容相似，为避免重复此处不做赘述，具体可参考前述图1所示步骤101
‑
104的内容。
[0081]
其中，步骤207之前还包括：利用所述第个用户组包含的手机银行用户的使用数据及预设模型价值度算法，确定各个所述第个活跃度预测模型对应的所述模型价值度。
[0082]
其中，预设模型价值度算法用于计算每个活跃度预测模型的模型价值度。示例性
的，通过分别将各个第个用户组包括的各个手机银行用户在所述手机银行上的使用数据对应的第一用户活跃度按照从高到低的顺序进行排序，进而对排列后的各个d个手机银行用户在所述手机银行上的使用数据二等分得到两个用户组，将一个v用户组作为v＝d/2个手机银行用户在所述手机银行上的活跃样本数据，另一个h用户组作为h＝d/2个手机银行用户在所述手机银行上的不活跃样本数据，将两个组进行排列组合，得到h*v个排列组合组，并累计每个排列组合组中的活跃样本数据对应的第一用户活跃度大于不活跃样本数据对应的第一用户活跃度的个数q，最后通过auc
i
＝q/(h*v)确定各个模型价值度auc
i
。
[0083]
进一步的，其中，步骤207具体包括：
[0084]
a、获取每个用户组对应的所述手机银行用户的个数di、所述手机银行用户的总个数d、以及每个所述活跃度预测模型的模型价值度；
[0085]
b、利用所述第n个组对应的各个用户组包括的所述手机银行用户的个数di、所述第n个组中的各个用户组对应的活跃度预测模型的模型价值度及所述手机银行用户的总个数d，确定所述第n个组的模型综合价值度。
[0086]
需要说明的是，根据k的不同取值第n个组的模型综合价值度也会不同，当k取值存在多种，就可以得到多种与k对应的第n个组的模型综合价值度。通过分别计算分组方法k对应的各个活跃度预测模型的模型综合价值度，即可得到第n个组的模型综合价值度。
[0087]
进一步的，模型综合价值度也即综合评价指标可以通过预设模型综合价值度算法得到，预设模型综合价值度算法公式可以表示如下：
[0088][0089]
式中，k表示分组方法，n代表分组方法k对应的组别数量，i表示分组方法k内包含n个用户组中各个用户组的组别；auc
i
(i∈{1,2,...,n})为第i个用户组对应的活跃度预测模型的模型价值度；d
i
(i∈{1,2,...,n})表示第i个组别中的用户数量，对于不同的分组方法，其n值是不同的，即不同的分组方法包含的用户组的组别数量是不同的；d代表总用户数量。
[0090]
208、将所述k种分组方法中具有最大的模型综合价值度的分组方法确定为目标分组方法，将所述目标分组方法、所述目标分组方法对应的多个用户组的活跃度预测模型、以及所述二分类模型作为目标预测策略，所述目标预测策略用于对待预测的手机银行进行用户活跃度预测。
[0091]
需要说明的是，步骤208与步骤105内容相似，在为避免重复，在此不再赘述，具体可参考前述步骤105所示内容。
[0092]
在一种可行实现方式中，通过k种分组方法进而得到各个分组方法的多个用户组，则就可以利用上述预设模型综合价值度算法公式得到与k对应的多个模型综合价值度，通过各分组方法的模型综合价值度比较，选择出最大的模型综合价值度的分组方法确定为目标分组方法，进行后续的待预测手机银行用户的活跃度预测，可以保证以最大的预测准确度对待预测手机银行用户极性活跃度预测。
[0093]
本发明提供一种手机银行用户活跃度预测策略的确定方法，方法包括：通过基于二分类模型对各个手机银行用户的使用数据进行预测，得到各个手机银行用户的第一用户活跃度；对第一用户活跃度按照从高到低的排序得到各个手机银行用户构成的用户序列；对用户序列进行预设的k种分组方法的等距分组，得到各分组方法对应的多个用户组；基于各分组方法对应的多个用户组进行活跃度预测模型的训练与验证，选出各个分组方法中所有活跃度预测模型的最大的模型综合价值度对应的目标分组方法，将目标分组方法、目标分组方法对应的各个活跃度预测模型及二分类模型作为目标预测策略，以进行待预测的手机银行用户的用户活跃度预测。一来不需要不断地调整模型参数，减少时间与精力，二来无需依赖样本收集时采集预测力强的样本特征，通过采用该目标预测策略可提升实际预测的用户活跃度的准确性，且模型预测稳定。
[0094]
请参阅图3，图3为本发明实施例中一种手机银行用户活跃度的预测方法的流程示意图。如图3所示方法包括如下步骤：
[0095]
301、获取待预测手机银行用户在所述手机银行上的使用数据，所述使用数据至少包括脱敏后的待预测手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；
[0096]
需要说明的是，步骤301与步骤201内容部分相似，在此对重复内容不再赘述，具体可参考前述步骤201所示内容。
[0097]
需要说明的是，待预测手机银行用户对应的使用数据与手机银行样本用户对应的使用样本数据的数据采集维度相同，包括但不限于与各待预测手机银行用户对应的脱敏后的基本属性数据、资产状况数据、资金流水数据、手机银行使用数据及开通的金融产品数据等等.
[0098]
302、将所述使用数据输入目标预测策略包括的二分类模型，确定所述待预测手机银行用户对应的第二用户活跃度，所述目标预测策略为使用如图1或图2中任意一项所示的手机银行用户的活跃度预测策略的确定方法确定的；
[0099]
可以理解的是，步骤301及步骤302与步骤201及202内容相似，具体可参阅前述步骤201及202所示内容。
[0100]
进一步的，第二用户活跃度为将待预测用户的使用数据输入二分类模型，得到的模型预测结果，以反映待预测用户在手机银行上的活跃程度。
[0101]
303、根据所述第二用户活跃度及所述目标预测策略包括的目标分组方法对应的多个用户组的活跃度预测模型，确定目标活跃度预测模型；
[0102]
通过查找目标预测策略包括的目标分组方法中各用户组对应的活跃度预测模型，进而得到第二用户活跃度对应的用户组的活跃度预测模型，以确定目标活跃度预测模型。
[0103]
可以理解的是，目标分组方法中各用户组是通过第一用户活跃度进行等距分组得到的，因而每个用户组对应有一个用户活跃度的变动范围，进而通过第二用户活跃度可以得到在目标分组方法中各用户组中哪一个用户组中存在与第二用户活跃度相同的第一用户活跃度，进而将该存在与第二用户活跃度相同的第一用户活跃度对应的用户组的活跃度预测模型作为目标活跃度预测模型，以进行步骤304中的待预测手机银行用户对应的第三用户活跃度的预测。
[0104]
304、将所述使用数据输入所述目标活跃度预测模型，确定所述待预测手机银行用
户对应的第三用户活跃度；
[0105]
可以理解的是，第三用户活跃度为利用目标活跃度预测模型对使用数据进行活跃度预测得到的待预测手机银行用户在手机银行上的活跃程度。
[0106]
305、将所述第二用户活跃度以及所述第三用户活跃度进行均值计算，确定所述待预测手机银行用户的最终用户活跃度。
[0107]
可以理解的是，同一待预测使用数据是指同一用户对应的待预测使用数据，通过将同一用户对应的第二用户活跃概率p1以及所述第三用户活跃概率p2进行均值计算，确定最终用户活跃概率，使得对用户的活跃度预测更加准确可信。更可以真实反应该待预测用户使用手机银行的活跃程度。
[0108]
本发明提供一种手机银行用户活跃度的预测方法，方法包括：获取待预测手机银行用户在手机银行上的使用数据，使用数据至少包括脱敏后的待预测手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；将使用数据输入目标预测策略包括的二分类模型，确定待预测手机银行用户对应的第二用户活跃度，目标预测策略为使用如图1或图2任意一项所示的手机银行用户的活跃度预测策略的确定方法确定的；根据第二用户活跃度及目标预测策略包括的目标分组方法对应的多个用户组的活跃度预测模型，确定目标活跃度预测模型；将使用数据输入目标活跃度预测模型，确定待预测手机银行用户对应的第三用户活跃度；将第二用户活跃度以及第三用户活跃度进行均值计算，确定待预测手机银行用户的最终用户活跃度。通过利用二分类模型以及目标分组方法包括的目标活跃度预测模型对待预测用户进行两次活跃度的预测，并且目标分组方法是通过k种分组方法中具有最大的模型综合价值度的分组方法确定的，因而在二次活跃度预测时，可以以最大的模型综合价值度包括的活跃度预测模型进行预测保证预测准确度，最终将两次活跃度的预测结果进行均值计算确定最终的用户活跃度概率，预测结果准确，有利于对待预测手机银行用户在手机银行上的活跃度进行真实评估。
[0109]
进一步的，以同时对n个待预测手机银行用户进行活跃度预测为例，进行步骤301
‑
305的说明，可以理解的是，在同时对n个待预测手机银行用户进行活跃度预测时，其步骤301及305与对一个待预测手机银行用户进行活跃度预测相似，因此不做赘述，可参考前述实施例的描述，其中，当待测用户为n个，则将个手机银行用户对应的n个待预测使用数据的第二用户活跃度从高到低排序后得到待预测用户序列，并按照目标分组方法进行待预测用户序列的等距分组，确定所述目标分组方法各个待预测用户组，其中，目标分组方法为模型综合价值度中的最大的模型综合价值度对应的等距分组的分组方法，进而将各个用户组输入目标分组方法对应的活跃度预测模型，得到n个用户的第三用户活跃度；
[0110]
此外，假设目标分组方法k的组别数量＝3为例，则活跃度预测模型i则有三个，将各组输入对应的活跃度预测模型i中，其中这里的对应指按照用户组进行对应。
[0111]
在一种可行实现方式中，也可以按照n个待预测手机银行用户对应的第二用户活跃度，以及在模型训练阶段以该目标分组方法划分的用户组中各用户第一用户活跃度进行匹配的方式，进而得到各个用户对应的目标活跃度预测模型，并利用目标活跃度预测模型得到各个用户对应的第三用户活跃度。因此，上述以同时对n个待预测手机银行用户进行活跃度预测为例，所进行的步骤301
‑
305的说明，仅仅作为举例不做具体限定。
[0112]
在一种可行实现方式中，上述手机银行用户活跃度的预测方法，还包括：
[0113]
a、若所述最终用户活跃度大于等于预设第一活跃阈值，则确定所述待预测手机银行用户为高度活跃客群，并按照第一发送频率发送第一推荐信息至所述待预测手机银行用户的预设终端，所述第一发送频率包括每日，所述第一推荐信息包括温馨提示信息；
[0114]
b、若所述最终用户活跃度小于预设第一活跃阈值，且所述最终用户活跃度大于等于第二活跃阈值，则确定所述待预测手机银行用户为中度活跃客群，并按照第二发送频率发送第二推荐信息至所述待预测手机银行用户的预设终端，所述第二发送频率包括每日，所述第二推荐信息包括每日对应的优惠活动；所述预设第一活跃阈值大于所述预设第二活跃阈值；
[0115]
c、若所述最终用户活跃度小于预设第二活跃阈值，则确定所述待预测手机银行用户为低度活跃客群，并按照第三发送频率发送第三推荐信息至所述待预测手机银行用户的预设终端，所述第三发送频率包括预先设定的特殊日期，所述第三推荐信息包括所述特殊日期对应的优惠活动。
[0116]
需要说明的是，第一发送频率、第二发送频率及第三发送频率为对不同的客群采取的不同的信息推送频率，以满足不同客群需求的同时，还可以提高低活跃客群的活跃度，以及维持高活跃客群的活跃度。
[0117]
示例性的，预设第一活跃度阈值可以为0.8，预设第二活跃度阈值可以为0.2，进一步的，高度活跃客群为最终用户活跃概率大于等于0.8的用户；中度活跃客群为最终用户活跃概率大于等于0.2，且小于0.8的用户；低度活跃客群为最终用户活跃概率小于0.2的用户。分别对高度活跃客群、中度活跃客群以及低度活跃客群按照不同推荐策略发送推荐信息，以实现加强用户活跃度，不同推荐策略包括第一推荐策略、第二推荐策略以及第三推荐策略；第一推荐策略为对低度活跃度客群采用屏蔽接触营销策略；第二推荐策略为对中度活跃度客户采用积极营销策略；第三推荐策略为对高度活跃度客户采用非营销策略；屏蔽接触策略为在特殊日期发送与特殊日期对应的推荐优惠活动相关的第一推荐信息；积极营销策略为在每日发送与每日对应的推荐活动相关的第二推荐信息；非营销策略包括在每日发送与每日对应的温馨提示的第三推荐信息。
[0118]
在一种可行实现方式中，屏蔽接触营销策略可以为仅在小长假、年终等优惠力度大的活动时通知低度活跃度客群对应的用户；积极营销策略可以为对每日的活动和优惠均通知中度活跃度客群对应的用户，将中度活跃度客群对应的用户作为日常重点营销客群；非营销策略可以为仅在平时定时发送温馨提示，以保持与高度活跃度客群的接触。
[0119]
进一步的，还可以基于手机银行用户近2个月的活跃度变化，将两个月内活跃概率下降超过预设流失阈值的客户定为流失预警客群，其中，预设流失阈值可以为0.2，对流失预警客群采用大额刺激营销策略，通过优惠金额较大的活动进行防流失的同时，及时提升用户活跃程度，还可以防止流失预警客群对应的手机银行用户长时间不操作手机银行造成账户存在风险问题，防止不法人员盗取信息等等。
[0120]
请参阅图4，图4为本发明实施例中一种手机银行用户的活跃度预测策略的确定装置的结构框图。如图4所示装置包括：
[0121]
特征获取模块401：用于采集d个手机银行用户在所述手机银行上的使用数据，并利用所述d个手机银行用户的第一用户活跃度对所述d个手机银行用户按照从高到低的顺序进行排序，得到用户序列；所述第一用户活跃度为利用二分类模型对所述使用数据进行
预测得到的，所述使用数据至少包括脱敏后的手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；
[0122]
用户分组模块402：用于按照预设的k种分组方法，及所述第一用户活跃度对所述用户序列进行等距分组，得到k种分组方法分别对应的多个用户组，所述k种分组方法划分的用户组的数量不同；
[0123]
模型训练模块403：用于基于预设的lightgbm算法，将第p
ni
个用户组包含的手机银行用户的使用数据进行活跃度预测模型的训练和验证，得到训练后的第p
ni
个活跃度预测模型，n为分组方法k对应的组别数量，n为正整数，p
ni
表示第n组中的第i个；
[0124]
价值计算模块404：用于根据第n个组中的各个用户组对应的活跃度预测模型的模型价值度、及所述第n个组中的手机银行用户的使用数据，确定所述第n个组的模型综合价值度，所述模型综合价值度用于反映利用所述第n个组对应的各个活跃度预测模型进行所述手机银行用户的用户活跃度预测时，得到的用户活跃度的真实程度；
[0125]
策略存取模块405：用于将所述k种分组方法中具有最大的模型综合价值度的分组方法确定为目标分组方法，将所述目标分组方法、所述目标分组方法对应的多个用户组的活跃度预测模型、以及所述二分类模型作为目标预测策略，所述目标预测策略用于对待预测的手机银行进行用户活跃度预测。
[0126]
可以理解的是，图4所示各模块作用与图1所示方法的步骤内容相似，为避免重复在此不作赘述，具体可参阅前述图1所示方法的步骤的相关内容。
[0127]
本发明提供一种手机银行用户活跃度预测策略的确定装置。通过基于二分类模型对各个手机银行用户的使用数据进行预测，得到各个手机银行用户的第一用户活跃度；对第一用户活跃度按照从高到低的排序得到各个手机银行用户构成的用户序列；对用户序列进行预设的k种分组方法的等距分组，得到各分组方法对应的多个用户组；基于各分组方法对应的多个用户组进行活跃度预测模型的训练与验证，选出各个分组方法中所有活跃度预测模型的最大的模型综合价值度对应的目标分组方法，将目标分组方法、目标分组方法对应的各个活跃度预测模型及二分类模型作为目标预测策略，以进行待预测的手机银行用户的用户活跃度预测。一来不需要不断地调整模型参数，减少时间与精力，二来无需依赖样本收集时采集预测力强的样本特征，通过采用该目标预测策略可提升实际预测的用户活跃度的准确性，且模型预测稳定。
[0128]
请参阅图5，图5为本发明实施例中一种手机银行用户活跃度的预测装置的结构框图。如图5所示装置包括：
[0129]
数据获取模块501：用于获取待预测手机银行用户在所述手机银行上的使用数据，所述使用数据至少包括脱敏后的待预测手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；
[0130]
第一预测模块502：用于将所述使用数据输入目标预测策略包括的二分类模型，确定所述待预测手机银行用户对应的第二用户活跃度，所述目标预测策略为使用如图1或图2中任意一项所述的手机银行用户的活跃度预测策略的确定方法确定的；
[0131]
模型确定模块503：用于根据所述第二用户活跃度及所述目标预测策略包括的目标分组方法对应的多个用户组的活跃度预测模型，确定目标活跃度预测模型；
[0132]
第二预测模块504：用于将所述使用数据输入所述目标活跃度预测模型，确定所述
待预测手机银行用户对应的第三用户活跃度；
[0133]
概率确定模块505：用于将所述第二用户活跃度以及所述第三用户活跃度进行均值计算，确定所述待预测手机银行用户的最终用户活跃度。
[0134]
可以理解的是，图5所示各模块作用与图3所示方法的步骤内容相似，为避免重复在此不作赘述，具体可参阅前述图3所示方法的步骤的相关内容。
[0135]
本发明提供一种手机银行用户活跃度的预测装置，装置包括：数据获取模块：用于获取待预测手机银行用户在手机银行上的使用数据，使用数据至少包括脱敏后的待预测手机银行用户的基本属性特征、资产状况特征、资金流水特征、手机银行使用特征及开通的金融产品特征；第一预测模块：用于将使用数据输入目标预测策略包括的二分类模型，确定待预测手机银行用户对应的第二用户活跃度，目标预测策略为使用如图1或图2中任意一项的手机银行用户的活跃度预测策略的确定方法确定的；模型确定模块：用于根据第二用户活跃度及目标预测策略包括的目标分组方法对应的多个用户组的活跃度预测模型，确定目标活跃度预测模型；第二预测模块：用于将使用数据输入目标活跃度预测模型，确定待预测手机银行用户对应的第三用户活跃度；概率确定模块：用于将第二用户活跃度以及第三用户活跃度进行均值计算，确定待预测手机银行用户的最终用户活跃度。通过利用二分类模型以及目标分组方法包括的目标活跃度预测模型对待预测用户进行两次活跃度的预测，并且目标分组方法是通过k种分组方法中具有最大的模型综合价值度的分组方法确定的，因而在二次活跃度预测时，可以以最大的模型综合价值度包括的活跃度预测模型进行预测保证预测准确度，最终将两次活跃度的预测结果进行均值计算确定最终的用户活跃度概率，预测结果准确，有利于对待预测手机银行用户在手机银行上的活跃度进行真实评估。
[0136]
在一种，可行实现方式中，图5所示装置还包括：
[0137]
客群推荐模块，用于若所述最终用户活跃度大于等于预设第一活跃阈值，则确定所述待预测手机银行用户为高度活跃客群，并按照第一发送频率发送第一推荐信息至所述待预测手机银行用户的预设终端，所述第一发送频率包括每日，所述第一推荐信息包括温馨提示信息；若所述最终用户活跃度小于预设第一活跃阈值，且所述最终用户活跃度大于等于第二活跃阈值，则确定所述待预测手机银行用户为中度活跃客群，并按照第二发送频率发送第二推荐信息至所述待预测手机银行用户的预设终端，所述第二发送频率包括每日，所述第二推荐信息包括每日对应的优惠活动；所述预设第一活跃阈值大于所述预设第二活跃阈值；若所述最终用户活跃度小于预设第二活跃阈值，则确定所述待预测手机银行用户为低度活跃客群，并按照第三发送频率发送第三推荐信息至所述待预测手机银行用户的预设终端，所述第三发送频率包括预先设定的特殊日期，所述第三推荐信息包括所述特殊日期对应的优惠活动。
[0138]
图6示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是终端，也可以是服务器。如图6所示，该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中，存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现上述方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行上述方法。本领域技术人员可以理解，图6中示出的结构，仅仅是与本技术方案相关的部分结构的框图，并不构成对本技术方案所应用于其上的计算机设备的限定，
具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0139]
在一个实施例中，提出了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如图1、图2或图3中任一项所示步骤。
[0140]
在一个实施例中，提出了一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如图1、图2或图3中任一项所示步骤。
[0141]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rod)、可编程rod(prod)、电可编程rod(eprod)、电可擦除可编程rod(eeprod)或闪存。易失性存储器可包括随机存取存储器(rad)或者外部高速缓冲存储器。作为说明而非局限，rad以多种形式可得，诸如静态rad(srad)、动态rad(drad)、同步drad(sdrad)、双数据率sdrad(ddrsdrad)、增强型sdrad(esdrad)、同步链路(synchldink)drad(sldrad)、存储器总线(radbus)直接rad(rdrad)、直接存储器总线动态rad(drdrad)、以及存储器总线动态rad(rdrad)等。
[0142]
以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
[0143]
以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本技术专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种基于空间相关性和监测数据的精细风场模拟方法与流程

手机银行用户的活跃度预测策略的确定方法及装置与流程

相关文献

最热文献