基于机器学习的用户线上导流推荐方法和装置与流程

2022-03-22 22:42:49 来源：中国专利 TAG：

1.本公开涉及大数据数据分析技术领域，尤其涉及一种基于机器学习的用户线上导流推荐方法和装置。

背景技术：

2.随着金融服务的不断更新，个人信贷产品正在成为一种全民性金融产品，层出不穷的金融机构大大地增加了行业竞争，使得获客成本较高。
3.相关技术中，通过线下方式获取个人信贷产品用户，如：面对面推广，在人流量大的地方摆设摊点，免费办理个人信贷产品后赠送礼品，此外还有一些电话推广和活动推广方式，在互联网上时代发展的驱动下，越来越多的银行开始着手于通过线上渠道进行个人信贷产品业务引流。但该种方法形成一个进件的成本价格较高，推广方需要花费高额的广告费用，并且线上用户群的审批通过率较线下申请用户群的审批通过率低，大大的增加了获得有效用户的成本。
4.因此，如何有效的识别用户，提高线上用户群的审批通过率，为亟需解决的技术问题。

技术实现要素：

5.本公开提供一种基于机器学习的用户线上导流推荐方法和装置。
6.本公开的技术方案如下：
7.根据本公开实施例的第一方面，提供一种基于机器学习的用户线上导流推荐方法，包括：获取待导流用户的数据；将所述待导流用户的数据输入至导流规则模型，获取所述待导流用户所在的用户群及所在用户群的第一审批通过率a；对所述第一审批通过率a大于或等于预设阈值的第一待导流用户直接进行推荐；将所述第一审批通过率a小于预设阈值的第二待导流用户的数据输入至训练好的导流分流模型，得到所述第二待导流用户的导流推荐分数；根据所述导流推荐分数，确定所述第二待导流用户的导流推荐等级，并基于所述导流推荐等级对所述第二待导流用户进行推荐。
8.在一些实施例中，所述将所述第一审批通过率a小于预设阈值的第二待导流用户的数据输入至训练好的导流分流模型，得到所述第二待导流用户的导流推荐分数，包括：
9.将所述第二待导流用户的数据输入至训练好的导流分流模型，预测所述第二待导流用户通过审批的第二审批通过率b；根据所述第一审批通过率a和所述第二审批通过率b，计算得到审批通过率坏好比odds；其中，odds＝a/(1-a)*b/(1-b)；根据所述审批通过率坏好比odds，得到所述第二待导流用户的导流推荐分数score；其中，score＝base-score pdo/ln(2)ln(odds)，base-score为基础分且为大于0的整数，pdo为翻倍数且为大于0的整数。
10.在一些实施例中，所述方法，还包括：获取训练样本数据集；根据所述训练样本数据集获取导流规则模型；根据所述训练样本数据集，对导流分流模型进行训练，生成训练好
的导流分流模型。
11.在一些实施例中，所述获取训练样本数据集，包括：采集多个训练样本用户的样本数据；其中，所述样本数据包括样本特征和样本审批结果；对所述样本特征进行预处理，搭建导流标签池；其中，所述导流标签池包括多个特征标签；根据所述样本审批结果和所述导流标签池，生成所述训练样本数据集。
12.在一些实施例中，所述根据所述训练样本数据集获取导流规则模型，包括：根据所述特征标签，将多个训练样本用户划分为多个样本用户群；根据所述样本用户群、所述样本审批结果和业务规则，应用单变量分箱和交叉分析训练规则，生成所述导流规则模型。
13.在一些实施例中，所述根据所述训练样本数据集，对导流分流模型进行训练，生成训练好的导流分流模型，包括：对所述特征标签进行特征筛选，获取模型训练特征；采用机器学习算法搭建所述导流分流模型；将所述模型训练特征输入至所述导流分流模型，对所述导流分流模型进行训练，生成训练好的导流分流模型。
14.根据本公开实施例的第二方面，提供一种基于机器学习的用户线上导流推荐装置，包括：数据获取单元，用于获取待导流用户的数据；第一处理单元，用于将所述待导流用户的数据输入至导流规则模型，获取所述待导流用户所在的用户群及所在用户群的第一审批通过率a；第一推荐单元，用于对所述第一审批通过率a大于或等于预设阈值的第一待导流用户直接进行推荐；第二处理单元，用于将所述第一审批通过率a小于预设阈值的第二待导流用户的数据输入至训练好的导流分流模型，得到所述第二待导流用户的导流推荐分数；第二推荐单元单元，用于根据所述导流推荐分数，确定所述第二待导流用户的导流推荐等级，并基于所述导流推荐等级对所述第二待导流用户进行推荐。
15.在一些实施例中，所述第二处理单元，包括：第一计算单元，用于将所述第二待导流用户的数据输入至训练好的导流分流模型，预测所述第二待导流用户通过审批的第二审批通过率b；第二计算单元，用于根据所述第一审批通过率a和所述第二审批通过率b，计算得到审批通过率坏好比odds；其中，odds＝a/(1-a)*b/(1-b)；第三计算单元，用于根据所述审批通过率坏好比odds，得到所述第二待导流用户的导流推荐分数score；其中，score＝base-score pdo/ln(2)ln(odds)，base-score为基础分且为大于0的整数，pdo为翻倍数且为大于0的整数。
16.在一些实施例中，所述装置，还包括：样本数据获取单元，用于获取训练样本数据集；第一模型生成单元，用于根据所述训练样本数据集获取导流规则模型；第二模型生成单元，用于根据所述训练样本数据集，对导流分流模型进行训练，生成训练好的导流分流模型。
17.在一些实施例中，所述样本数据获取单元，具体用于：采集多个训练样本用户的样本数据；其中，所述样本数据包括样本特征和样本审批结果；对所述样本特征进行预处理，搭建导流标签池；其中，所述导流标签池包括多个特征标签；根据所述样本审批结果和所述导流标签池，生成所述训练样本数据集。
18.在一些实施例中，所述第一模型生成单元，具体用于：根据所述特征标签，将多个训练样本用户划分为多个样本用户群；根据所述样本用户群、所述样本审批结果和业务规则，应用单变量分箱和交叉分析训练规则，生成所述导流规则模型。
19.在一些实施例中，所述第二模型生成单元，具体用于：对所述特征标签进行特征筛
选，获取模型训练特征；采用机器学习算法搭建所述导流分流模型；将所述模型训练特征输入至所述导流分流模型，对所述导流分流模型进行训练，生成训练好的导流分流模型。
20.根据本公开实施例的第三方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现本公开第一方面实施例提出的基于机器学习的用户线上导流推荐方法。
21.根据本公开实施例的第四方面，提供一种存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行本公开第一方面实施例提出的基于机器学习的用户线上导流推荐方法。
22.根据本公开实施例的第五方面，提供一种计算机程序产品，该计算机程序产品由电子设备的处理器执行时，使得电子设备能够执行本公开第一方面实施例提出的基于机器学习的用户线上导流推荐方法。
23.本公开的实施例提供的技术方案至少带来以下有益效果：
24.获取待导流用户的数据；将待导流用户的数据输入至训练好的导流分流模型，得到待导流用户的导流推荐分数；根据导流推荐分数，确定待导流用户的导流推荐等级。由此，能够对待导流用户进行识别，以确定待导流用户的导流推荐等级，以根据待导流用户的导流推荐等级制定不同的导流营销方案，能够取得更好地营销效果，提升用户审批通过率，降低获客成本。
25.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
附图说明
26.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。
27.图1是根据本公开第一实施例的流程图；
28.图2是根据本公开第二实施例的流程图；
29.图3是根据本公开第二实施例的另一种流程图；
30.图4是根据本公开第二实施例的s100的子步骤的流程图；
31.图5是根据本公开第二实施例的s200的子步骤的流程图；
32.图6是根据本公开第二实施例的s300的子步骤的流程图；
33.图7是根据本公开第三实施例的结构图；
34.图8是根据本公开第三实施例的又一种的结构图；
35.图9是根据本公开第三实施例的另一种结构图；
36.图10是用来实现本公开实施例的基于机器学习的用户线上导流推荐方法的电子设备的框图。
具体实施方式
37.为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。
38.需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
39.图1是根据一示例性实施例示出的一种基于机器学习的用户线上导流推荐方法的流程图。
40.本公开实施例以该基于机器学习的用户线上导流推荐方法被配置于基于机器学习的用户线上导流推荐装置中来举例说明，该基于机器学习的用户线上导流推荐装置可以由软件和/或硬件的方式实现，该基于机器学习的用户线上导流推荐装置可以配置在电子设备，以使该电子设备可以执行任务的处理功能。
41.其中，电子设备可以为任一具有计算能力的设备，例如可以为pc(personal computer，个人电脑)、移动终端、服务器等，移动终端例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。
42.在互联网上时代发展的驱动下，越来越多的银行开始着手于通过线上渠道进行个人信贷产品业务引流。但该种方法形成一个进件的成本价格较高，推广方需要花费高额的广告费用，并且线上用户群的审批通过率较线下申请用户群的审批通过率低，大大的增加了获得有效用户的成本。
43.需要说明的是，本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。
44.基于此，本公开实施例中提供一种基于机器学习的用户线上导流推荐方法，能够更好地优化营销效果，提升用户审批通过率，降低获客成本。
45.本公开提供一种基于机器学习的用户线上导流推荐方法，图1为根据本公开第一实施例的流程图。
46.如图1所示，基于机器学习的用户线上导流推荐方法可以包括但不限于以下步骤：
47.s1：获取待导流用户的数据。
48.本公开实施例中，待导流用户的数据包括：待导流用户的基本信息、行内外资产信息及行内外负债信息。
49.其中，待导流用户的基本信息可以为行内个人基本信息、征信基本信息等；资产信息可以为行内aum(asset under management,资产管理规模)信息、行内代发工资信息、行内对私流水交易信息等；负债信息可以为行内贷款信息、行内贷记卡交易信息、征信负债信息等。
50.需要说明的是，上述示例仅作为示意，不作为对本公开实施例的具体限制，本公开实施例中，获取的待导流用户的数据还可以为上述示例以外的其他数据。
51.可以理解的是，本公开实施例中获取待导流用户的数据可以为从金融机构的后台获取数据，也可以通过第三方机构获取数据，本公开实施例对此不作具体限制。
52.s2：将待导流用户的数据输入至导流规则模型，获取待导流用户所在的用户群及所在用户群的第一审批通过率a。
53.本公开实施例中，待导流用户的数据，包括基本信息、行内外资产信息及行内外负
债信息的情况下，在待导流用户的数据输入至导流规则模型之前，还可以包括：对待导流用户的基本信息、行内外资产信息及行内外负债信息进行预处理，并提取第一入模特征。
54.本公开实施例中，对待导流用户的数据进行预处理，可以为对数据进行数据清理和数据集成。
55.示例性的，对待导流用户的数据进行数据清理，可以进行缺失值处理、离群和噪声值处理、异常范围及类型值的处理。
56.其中，对待导流用户的数据进行缺失值处理，可以为剔除样本特征中缺失率或不可用率大于50％的特征，剔除样本特征的离群点和噪声值，可以为删除样本特征中的异常值，类型值可以为将类型特征转化为数据值特征等。
57.对待导流用户的数据进行数据集成，可以为对数据清理之后的数据进行拼接处理。
58.可以理解的是，待导流用户的数据内容较多，不同待导流用户的数据内容可能存在区别，本公开实施例中，对于导流规则模型，可以依据待导流用户的数据中均包含的一部分数据，或者大多数待导流用户的数据中包含的一部分数据作为第一入模特征，根据第一入模特征预先构建导流规则模型。
59.本公开实施例中，从待导流用户的基本信息、行内外资产信息及行内外负债信息中提取第一入模特征，将第一入模特征输入至导流规则模型，获取待导流用户的用户群及所在用户群的第一审批通过率a。
60.可以理解的是，本公开实施例中，用户群可以为根据用户的基本信息和/或行内外资产信息和/或行内外负债信息而划分的不同群体，示例性的，根据用户是否为代发工资存量用户划分为代发工资存量用户群和非代发工资存量用户群；或者，根据用户是否为房贷存量用户划分为房贷存量用户群和非房贷存量用户群等。
61.本公开实施例中，导流规则模型能够计算出待导流用户所在的用户群的第一审批通过率a，导流规则模型中，针对不同的用户群中可以采用不同的审批通过率计算规则，以对处于不同用户群的待导流用户，选择对应的审批通过率计算规则，得到符合用户实际情况的第一审批通过率a，使得计算得到的第一审批通过率a在运用于后续的分析计算中能够对不同的待导流用户进行区分。
62.s3：对第一审批通过率a大于或等于预设阈值的第一待导流用户直接进行推荐。
63.本公开实施例中，对于第一审批通过率a大于等于预设阈值的第一待导流用户，可以直接进行推荐。
64.示例性的，第一审批通过率a的取值范围为[0，1]，第一审批通过率a越接近1则说明用户审批通过率越高，则倾向于向这部分待导流用户进行推荐，本公开实施例中，预设阈值可以设置为0.8、或者0.75、或者0.9，或者0.95等，可以理解的是，预设阈值设置越高，待导流用户大于或等于预设阈值的数量越少，直接进行推荐的待导流用户的数量越少，但是用户审批通过的概率越高。
[0065]
s4：将第一审批通过率a小于预设阈值的第二待导流用户的数据输入至训练好的导流分流模型，得到第二待导流用户的导流推荐分数。
[0066]
本公开实施例中，第二待导流用户的数据，包括基本信息、行内外资产信息及行内外负债信息的情况下，在第二待导流用户的数据输入至训练好的导流分流模型之前，还可
以包括：对第二待导流用户的基本信息、行内外资产信息及行内外负债信息进行预处理，并提取第二入模特征。
[0067]
需要说明的是，对第二待导流用户的基本信息、行内外资产信息及行内外负债信息进行预处理与上述示例中预处理的方式相同，此处不再赘述。
[0068]
可以理解的是，第二待导流用户的数据内容较多，不同第二待导流用户的数据内容可能存在区别，本公开实施例中，对于训练好的导流分流模型，可以依据第二待导流用户的数据中均包含的一部分数据，或者大多数第二待导流用户的数据中包含的一部分数据作为第二入模特征，其中，第二入模特征可以与第一入模特征相同或者不同，本公开实施例对此不作具体限制。
[0069]
本公开实施例中，从第二待导流用户的基本信息、行内外资产信息及行内外负债信息中提取第二入模特征，将第二入模特征输入至训练好的导流分流模型，得到第二待导流用户的导流推荐分数。
[0070]
本公开实施例中，可以预先设置有导流分流模型，通过对导流分流模型进行训练，得到训练好的导流分流模型，使得能够使用训练好的导流分流模型对第二待导流用户的数据进行处理，得到第二待导流用户的导流推荐分数。
[0071]
s5：根据导流推荐分数，确定第二待导流用户的导流推荐等级，并基于导流推荐等级对第二待导流用户进行推荐。
[0072]
本公开实施例中，根据导流分流模型输出的导流推荐分数，确定第二待导流用户的导流推荐等级，并基于导流推荐等级对第二待导流用户进行推荐。
[0073]
其中，导流推荐等级包括多个等级，可以通过设置一定的阈值来划分不同的导流推荐等级，以对不同的第二待导流用户划分不同的优先级。
[0074]
本公开实施例中，导流推荐等级可以包括a、b、c三个等级，也可以包括a1、b1、c1、d1四个等级，示例性的，如下表一所示，本公开实施例中，导流推荐等级包括a1、b1、c1、d1四个等级，分别对应导流推荐分数500分以上、400到500分、350到400分、350分以下四个导流推荐分数。
[0075]
导流推荐分数导流推荐等级500分以上a1400到500分b1350到400分c1350分以下d1
[0076]
表一
[0077]
需要说明的是，上述示例仅作为示意，不作为对本公开实施例的具体限制，本领域的技术人员可以根据需要采用其他任意可以实现上述功能的方式进行任意设置。
[0078]
通过实施本公开实施例，获取待导流用户的数据；将待导流用户的数据输入至导流规则模型，获取待导流用户所在的用户群及所在用户群的第一审批通过率a；对第一审批通过率a大于或等于预设阈值的第一待导流用户直接进行推荐；将第一审批通过率a小于预设阈值的第二待导流用户的数据输入至训练好的导流分流模型，得到第二待导流用户的导流推荐分数；根据导流推荐分数，确定第二待导流用户的导流推荐等级，并基于导流推荐等级对第二待导流用户进行推荐。由此，能够对待导流用户进行识别，以确定待导流用户的导
流推荐等级，以根据待导流用户的导流推荐等级制定不同的导流营销方案，能够取得更好地营销效果，提升用户审批通过率，降低获客成本。
[0079]
图2为根据本公开第二实施例的流程图。
[0080]
如图2所示，基于机器学习的用户线上导流推荐方法可以包括但不限于以下步骤：
[0081]
s10：获取待导流用户的数据。
[0082]
s20：将待导流用户的数据输入至导流规则模型，获取待导流用户所在的用户群及所在用户群的第一审批通过率a。
[0083]
s30：对第一审批通过率a大于或等于预设阈值的第一待导流用户直接进行推荐。
[0084]
本公开实施例中s10-s30的描述说明可以参见上述实施例中的s1-s3中的描述，此处不再赘述。
[0085]
s40：将第一审批通过率a小于预设阈值的第二待导流用户的数据输入至训练好的导流分流模型，预测第二待导流用户通过审批的第二审批通过率b。
[0086]
本公开实施例中，可以采用lgbm(light gradient boosting machine)算法构建导流分流模型，其中，lgbm算法为目前较为先进的集成学习模型框架，该框架基于boosti ng思想，通过gbdt(gradient boosting decision tree，梯度提升决策树)算法对多棵决策树进行快速迭代，最终可以获得更精确的预测结果。
[0087]
本公开实施例中，对采用lgbm算法构建的导流分流模型进行训练，得到训练好的导流分流模型，将第二待导流用户的数据输入至训练好的导流分流模型，可以得到预测的第二待导流用户通过审批的第二审批通过率b。
[0088]
本公开实施例中，第二审批通过率b的取值范围为[0，1]，第二审批通过率b越接近于1说明第二待导流用户通过审批的概率越高，可以理解为第二待导流用户更容易通过审核，第二审批通过率b越接近于0说明第二待导流用户通过审批的概率越低，可以理解为第二待导流用户越不容易通过审核。
[0089]
s50：根据第一审批通过率a和第二审批通过率b，计算得到审批通过率坏好比odds；其中，odds＝a/(1-a)*b/(1-b)。
[0090]
本公开实施例中，将导流规则模型输出的第一审批通过率a和训练好的导流分流模型输出的第二审批通过率b，代入公式odds＝a/(1-a)*b/(1-b)，计算得到审批通过率坏好比odds。
[0091]
s60：根据审批通过率坏好比odds，得到待导流用户的导流推荐分数score；其中，score＝base-score pdo/ln(2)ln(odds)，base-score为基础分且为大于0的整数，pdo为翻倍数且为大于0的整数。
[0092]
本公开实施例中，将审批通过率坏好比odds，代入公式score＝base-score pdo/ln(2)ln(odds)，得到第二待导流用户的导流推荐分数score。
[0093]
可以理解的是，base-score为可以预先设置的基础分，pdo为可以预先设置翻倍数。示例性的，base-score可以设置为600分，也可以设置为700分等，同理，pdo可以设置为70分，也可以设置为80分等。
[0094]
需要说明的是，上述示例仅作为示意，不作为对本公开实施例的具体限制，本领域的技术人员可以根据需要采用其他任意可以实现上述功能的方式进行任意设置。
[0095]
s70：根据导流推荐分数，确定第二待导流用户的导流推荐等级。
[0096]
本公开实施例中s70的描述说明可以参见上述实施例中的s5中的描述，此处不再赘述。
[0097]
本公开实施例中，将第二待导流用户的数据输入训练好的导流分流模型，得到第二待导流用户的导流推荐分数，根据导流推荐分数，确定第二待导流用户的导流推荐等级，生成营销种子包，推送给导流营销商或者产品方，为导流营销商或者产品方提供人群定向参考，有助于导流营销商及产品方可以选择特定或者某一导流推荐等级的用户进行广告触达，提升营销转化率。由此，能够帮助营销商或者产品方更有效地筛选出第二待导流用户中的特定或者某一导流推荐等级的用户，筛出的特定或者某一导流推荐等级的用户可以直接应用于线上营销平台中进行投放，可以更好地优化营销效果，提升用户审批通过率，降低获客成本。
[0098]
本公开实施例中，将第二待导流用户的数据输入训练好的导流分流模型，得到待导流用户的导流推荐分数，根据导流推荐分数，确定第二待导流用户的导流推荐等级，具体确定第二待导流用户的导流推荐等级属于“黑箱”，因此在信息交互过程中，不会造成用户行内信息泄露等问题。
[0099]
图3是根据本公开第二实施例的另一种流程图。
[0100]
在一些实施例中，如图3所示，本公开实施例中提供的基于机器学习的用户线上导流推荐方法，还包括：
[0101]
s100：获取训练样本数据集。
[0102]
本公开实施例中，训练样本可以是金融机构中能反映客户资产信息的数据及用户办理个人信贷产品的审批结果，例如：银行中的反映客户质量及信用情况的数据：训练样本的基本信息、资产信息以及负债信息、用户办理信用卡的审批结果等。
[0103]
示例性的，训练样本的基本信息可以为行内个人基本信息、征信基本信息等；资产信息可以为行内aum(asset under management,资产管理规模)信息、行内代发工资信息、行内对私流水交易信息等；负债信息可以为行内贷款信息、行内贷记卡交易信息、征信负债信息等。
[0104]
需要说明的是，上述示例仅作为示意，不作为对本公开实施例的具体限制，本公开实施例中，获取的训练样本的数据还可以为上述示例以外的其他数据。
[0105]
可以理解的是，本公开实施例中获取训练样本的数据可以为从金融机构的后台获取数据，也可以通过第三方机构获取数据，本公开实施例对此不作具体限制。
[0106]
在一些实施例中，如图4所示，本公开实施例中s100包括但不限于如下子步骤：
[0107]
s101：采集多个训练样本用户的样本数据；其中，样本数据包括样本特征和样本审批结果。
[0108]
可以理解的是，本公开实施例中可以为预先筛选一部分用户作为训练样本用户，将用户的数据作为样本数据，其中，样本数据可以包括样本特征和样本审批结果。
[0109]
示例性的，样本特征可以包括：行内个人基本信息、征信基本信息等；资产信息可以为行内aum(asset under management,资产管理规模)信息、行内代发工资信息、行内对私流水交易信息等；负债信息可以为行内贷款信息、行内贷记卡交易信息、征信负债信息等。样本审批结果可以包括：持有信用卡大于0张，房贷信息等。
[0110]
s102：对样本特征进行预处理，搭建导流标签池；其中，导流标签池包括多个特征
标签。
[0111]
本公开实施例中，可以对样本特征进行预处理，以为导流标签池的搭建做好准备工作。数据预处理可以包括数据清理与数据集成。
[0112]
其中，对样本特征进行数据清理，可以包括缺失值处理、离群和噪声值处理、异常范围及类型值的处理，示例性的，对样本特征进行缺失值处理，可以为剔除样本特征中缺失率或不可用率大于50％的特征，离群和噪声值处理，可以为剔除样本特征的离群点和噪声值。数据集成可以为对清洗之后的数据进行拼接，为导流标签池的搭建做好准备工作。
[0113]
本公开实施例中，对样本特征进行预处理，得到有用的数据信息，搭建导流标签池，其中，导流标签池包括多个特征标签。可以采用特征抽象、特征衍生的方法制作特征标签，建立导流标签池，其中，特征抽象
[0114]
用于处理分类类型特征，将其类别属性数值化；特征衍生包括业务衍生、技术衍生两方面。
[0115]
本公开实施例中，业务衍生主要指从特征的业务意义出发，生成具有不同层面业务含义的新特征(新标签)；技术衍生主要从特征之间的关系和特点出发，选择相应的衍生方法生产具有高预测性区分性的标签，技术衍生的具体衍生方法有数值运算，即
[0116]
对特征进行加减乘除、特征交叉等。
[0117]
示例性的，本公开实施例中，导流标签池中的特征标签可以为如下表二所示的标签。
[0118][0119]
表二
[0120]
需要说明的是，上述示例种，表二所列举的示例仅作为示意，并不作为对本公开实施例的具体限制，本公开实施例中导流标签池中的特征标签还可以为除表二中示出的标签
以外的其他标签，本公开实施例对此不作具体限制。
[0121]
s103：根据样本审批结果和导流标签池，生成训练样本数据集。
[0122]
本公开实施例中，结合样本审批结果和导流标签池生成训练样本数据集。
[0123]
请继续参照图3，本公开实施例中，在s100之后执行s200：根据训练样本数据集获取导流规则模型。
[0124]
本公开实施例中，结合样本审批结果和导流标签池生成训练样本数据集，根据训练样本数据集获取导流规则模型。
[0125]
在一些实施例中，如图5所示，本公开实施例中s200包括但不限于如下子步骤：
[0126]
s201：根据特征标签，将多个训练样本用户划分为多个样本用户群。
[0127]
本公开实施例中，训练样本数据集中包括样本审批结果和导流标签池，导流标签池中包括多个特征标签，可以根据导流标签池中的多个特征标签将训练样本用户划分为不同的样本用户群。
[0128]
s202：根据样本用户群、样本审批结果和业务规则，应用单变量分箱和交叉分析训练规则，生成导流规则模型。
[0129]
本公开实施例中，结合样本用户群、样本审批结果及业务规则，应用单变量分箱和交叉分析训练规则，可以对不同样本用户群设置不同的导流规则，以根据全部样本用户群的不同导流规则，生成导流规则模型。
[0130]
示例性的，在业务规则为个人信贷产品实务中倾向于对个人信贷产品新户的样本用户群进行个人信贷产品的导流营销，因此导流样本用户群为个人信贷产品存量客户的方式将不是一个最优选项。示例性的，针对各个样本用户群所涉及的规则可以如下表三所示：
[0131][0132]
表三
[0133]
可以理解的是，应用单变量分箱和交叉分析训练规则，其中，单变量分箱，即通过划分区间使连续变量离散化，最大程度将目标变量的信息反应在分箱中，使得相同区间内用户群具有更高的相似度；交叉分析，即从交叉、立体的角度出发，由浅入深地训练规则。
[0134]
请继续参照图3，本公开实施例中，在s200之后执行s300：根据训练样本数据集，对导流分流模型进行训练，生成训练好的导流分流模型。
[0135]
本公开实施例中，可以采用lgbm(light gradient boosting machine)算法构建导流分流模型，其中，lgbm算法为目前较为先进的集成学习模型框架，该框架基于boosti ng思想，通过gbdt(gradient boosting decision tree，梯度提升决策树)算法对多棵决策树进行快速迭代，最终可以获得更精确的预测结果。
[0136]
本公开实施例中，可以对采用lgbm算法构建的导流分流模型进行训练，得到训练好的导流分流模型。
[0137]
在一些实施例中，如图6所示，本公开实施例中s300包括但不限于如下子步骤：
[0138]
s301：对特征标签进行特征筛选，获取模型训练特征。
[0139]
本公开实施例中，结合业务含义及特征表现对导流标签池的特征标签进行筛选，选择有意义的特征标签输入导流分流模型进行训练。筛选方法主要有：覆盖度筛选、iv(infor mation value,信息价值)筛选、稳定性筛选、相关性筛选、业务逻辑筛选等。采用iv筛选方法对特征标签进行特征筛选，即筛选出信息价值更大的特征标签作为模型训练特征；采用相关性筛选方法对特征标签进行特征筛选，即筛选出相关性更高的特征标签作为模型训练特征。
[0140]
s302：采用机器学习算法搭建导流分流模型。
[0141]
本公开实施例中，可以采用lgbm算法搭建导流分流模型，其中，lgbm模型是目前最先进的集成学习模型框架，该框架的核心是非线性模型gbdt(gradient boosting decision tree)算法，一种以决策树为基分类器的集成学习模型。lgbm模型基于boosting思想，通过gbdt算法对多棵决策树进行快速迭代，最终获得更精确的预测结果。基于lgbm算法生成的搭建的导流分流模型训练效果好、不易过拟合，有较好的普适性。
[0142]
s303：将模型训练特征输入至导流分流模型，对导流分流模型进行训练，生成训练好的导流分流模型。
[0143]
本公开实施例中，在对特征标签进行特征筛选，获取模型训练特征之后，将模型训练特征输入至采用机器学习算法搭建的导流分流模型中，对导流分流模型进行训练，以生成训练好的导流分流模型，能够使得到训练好的导流分流模型应用于对用户进行识别，且识别结果精确度较高。
[0144]
图7是根据本公开第三实施例的结构图。
[0145]
如图7所示，该基于机器学习的用户线上导流推荐装置10包括，数据获取单元11、分数获取单元12、等级确定单元13，其中：
[0146]
数据获取单元11，用于获取待导流用户的数据。
[0147]
第一处理单元12，用于将待导流用户的数据输入至导流规则模型，获取待导流用户所在的用户群及所在用户群的第一审批通过率a。
[0148]
第一推荐单元13，用于对第一审批通过率a大于或等于预设阈值的第一待导流用户直接进行推荐。
[0149]
第二处理单元14，用于将第一审批通过率a小于预设阈值的第二待导流用户的数据输入至训练好的导流分流模型，得到第二待导流用户的导流推荐分数。
[0150]
第二推荐单元15，用于根据导流推荐分数，确定第二待导流用户的导流推荐等级，并基于导流推荐等级对第二待导流用户进行推荐。
[0151]
在一些实施例中，如图8所示，本公开实施例中，第二处理单元14，包括：
[0152]
第一计算模块121，用于将第二待导流用户的数据输入至训练好的导流分流模型，预测第二待导流用户通过审批的第二审批通过率b。
[0153]
第二计算模块122，用于根据第一审批通过率a和第二审批通过率b，计算得到审批通过率坏好比odds；其中，odds＝a/(1-a)*b/(1-b)。
[0154]
第三计算模块123，用于根据审批通过率坏好比odds，得到第二待导流用户的导流推荐分数score；其中，score＝base-score pdo/ln(2)ln(odds)，base-score为基础分且为
大于0的整数，pdo为翻倍数且为大于0的整数。
[0155]
在一些实施例中，如图9所示，本公开实施例中，该基于机器学习的用户线上导流推荐装置10，还包括：样本数据获取单元16、第一模型生成单元17、第二模型生成单元18，其中：
[0156]
样本数据获取单元16，用于获取训练样本数据集。
[0157]
第一模型生成单元17，用于根据训练样本数据集获取导流规则模型。
[0158]
第二模型生成单元18，用于根据训练样本数据集，对导流分流模型进行训练，生成训练好的导流分流模型。
[0159]
在一些实施例中，本公开实施例中，样本数据获取单元16，具体用于：采集多个训练样本用户的样本数据；其中，样本数据包括样本特征和样本审批结果；对样本特征进行预处理，搭建导流标签池；其中，导流标签池包括多个特征标签；根据样本审批结果和导流标签池，生成训练样本数据集。
[0160]
在一些实施例中，本公开实施例中，第一模型生成单元17，具体用于：根据特征标签，将多个训练样本用户划分为多个样本用户群；根据样本用户群、样本审批结果和业务规则，应用单变量分箱和交叉分析训练规则，生成导流规则模型。
[0161]
在一些实施例中，本公开实施例中，第二模型生成单元18，具体用于：对特征标签进行特征筛选，获取模型训练特征；采用机器学习算法搭建导流分流模型；将模型训练特征输入至导流分流模型，对导流分流模型进行训练，生成训练好的导流分流模型。
[0162]
关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0163]
本公开实施例的基于机器学习的用户线上导流推荐装置，数据获取单元11，用于获取待导流用户的数据；第一处理单元12，用于将待导流用户的数据输入至导流规则模型，获取待导流用户所在的用户群及所在用户群的第一审批通过率a；第一推荐单元13，用于对第一审批通过率a大于或等于预设阈值的第一待导流用户直接进行推荐；第二处理单元14，用于将第一审批通过率a小于预设阈值的第二待导流用户的数据输入至训练好的导流分流模型，得到第二待导流用户的导流推荐分数；第二推荐单元单元15，用于根据导流推荐分数，确定第二待导流用户的导流推荐等级，并基于导流推荐等级对第二待导流用户进行推荐。由此，能够对待导流用户进行识别，以确定待导流用户的导流推荐等级，以根据待导流用户的导流推荐等级制定不同的导流营销方案，能够取得更好地营销效果，提升用户审批通过率，降低获客成本。
[0164]
为了实现上述实施例，本公开实施例还提出了一种电子设备。其中，电子设备包括：处理器；用于存储处理器可执行指令的存储器；其中，处理器被配置为执行指令，以实现如前的基于机器学习的用户线上导流推荐方法。
[0165]
作为一种示例，图10是根据一示例性实施例示出的一种用于基于机器学习的用户线上导流推荐方法的电子设备200的框图，如图10所示，上述电子设备200，还可以包括：
[0166]
存储器210及处理器220，连接不同组件(包括存储器210和处理器220)的总线230，存储器210存储有计算机程序，当处理器220执行程序时实现本公开实施例的基于机器学习的用户线上导流推荐方法。
[0167]
总线230表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，
外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(isa)总线，微通道体系结构(mac)总线，增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0168]
电子设备200典型地包括多种电子设备可读介质。这些介质可以是任何能够被电子设备200访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。
[0169]
存储器210还可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(ram)240和/或高速缓存存储器250。服务器200可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统260可以用于读写不可移动的、非易失性磁介质(图10未显示，通常称为“硬盘驱动器”)。尽管图10中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如cd-rom，dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线230相连。存储器210可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本公开各实施例的功能。
[0170]
具有一组(至少一个)程序模块270的程序/实用工具280，可以存储在例如存储器210中，这样的程序模块270包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块270通常执行本公开所描述的实施例中的功能和/或方法。
[0171]
电子设备200也可以与一个或多个外部设备290(例如键盘、指向设备、显示器291等)通信，还可与一个或者多个使得用户能与该电子设备200交互的设备通信，和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口292进行。并且，电子设备200还可以通过网络适配器293与一个或者多个网络(例如局域网(lan)，广域网(wan)和/或公共网络，例如因特网)通信。如图所示，网络适配器293通过总线230与电子设备200的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备200使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0172]
处理器220通过运行存储在存储器210中的程序，从而执行各种功能应用以及数据处理。
[0173]
需要说明的是，本实施例的电子设备的实施过程和技术原理参见前述对本公开实施例的基于机器学习的用户线上导流推荐方法的解释说明，此处不再赘述。
[0174]
本公开实施例提供的电子设备，能够对待导流用户进行识别，以确定待导流用户的导流推荐等级，以根据待导流用户的导流推荐等级制定不同的导流营销方案，能够取得更好地营销效果，提升用户审批通过率，降低获客成本。
[0175]
为了实现上述实施例，本公开实施例还提出了一种存储介质。
[0176]
其中，当存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如前的基于机器学习的用户线上导流推荐方法。
[0177]
为了实现上述实施例，本公开还提供一种计算机程序产品，该计算机程序由电子设备的处理器执行时，使得电子设备能够执行如前的基于机器学习的用户线上导流推荐方
法。
[0178]
本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。
[0179]
应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：高精度定位解算处理方法、系统、存储介质及电子设备与流程

基于机器学习的用户线上导流推荐方法和装置与流程

相关文献

最热文献