一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

目标客户推荐方法及装置、电子设备和存储介质与流程

2022-08-13 19:51:34 来源:中国专利 TAG:


1.本公开涉及大数据技术领域,更具体地涉及一种目标客户推荐方法、装置、设备、介质和程序产品。


背景技术:

2.金融机构在开展业务的过程中,需要针对目标产品拓展客户。
3.在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:现有的营销处理方式中,往往通过业务人员根据客户的基本情况、客户现有产品持有情况、客户特征、征信数据、财务数据等客户关键因素,结合人工经验来制定拟推荐客户清单,这种方式较为传统单一,需要消耗大量的人力,且主观因素较强,结果的得出存在较大的盲目性,人工预测结果参考性不高。


技术实现要素:

4.鉴于上述问题,本公开提供了一种目标客户推荐方法、装置、设备、介质和程序产品。
5.本公开的一个方面,提供了一种目标客户推荐方法,包括:
6.从数据池中获取待测客户的待测客户特征数据,其中,待测客户特征数据至少包括待测客户的基础数据和交易业务类数据;
7.将待测客户特征数据输入二分类模型,以便通过二分类模型输出用于表征待测客户是否为风险客户的分类结果;
8.根据分类结果从待测客户中选取属于非风险客户的第一目标客户;
9.从规则库中获取客户筛选规则,以便按照客户筛选规则从第一目标客户中确定第二目标客户,其中第二目标客户为针对目标产品的拟推荐客户;
10.向提供目标产品的服务系统推送拟推荐客户。
11.根据本公开的实施例,其中二分类模型通过如下方式训练得到:
12.调用业务系统的数据访问接口;
13.在获得数据访问许可的情况下,通过数据访问接口从业务系统调用历史客户的基础数据和交易业务类数据,其中历史客户的基础数据和交易业务类数据关联多个原始客户特征;
14.根据历史客户的已知风险类型,对历史客户的基础数据和交易业务类数据添加数据标识,数据标识用于表征与基础数据和交易业务类数据关联的历史客户是否为风险客户;
15.利用从算法池中调用的第一预定算法对多个原始客户特征进行特征排序,以便从排序后的多个原始特征中确定多个目标客户特征,其中,原始客户特征和目标客户特征至少包括客户基本特征、资产特征、信用特征、和交易行为特征;
16.利用与多个目标客户特征关联的历史客户的基础数据和交易业务类数据,训练二
分类模型。
17.根据本公开的实施例,其中,二分类模型由多个基础模型按照各自的模型权重组合得到,其中多个基础模型中,在第一基础模型的预测准确率大于第二基础模型的预测准确率的情况下,第一基础模型的模型权重大于第二基础模型的模型权重。
18.根据本公开的实施例,其中,利用与多个目标客户特征关联的历史客户的基础数据和交易业务类数据,训练二分类模型包括:
19.利用从算法池中调用的第二预定算法,构建多个基础模型,其中基础模型中包括决策条件,决策条件根据客户基本特征、资产特征、信用特征、和交易行为特征构建得到;
20.将与多个目标客户特征关联的历史客户的基础数据和交易业务类数据输入多个基础模型,以便利用多个基础模型输出历史客户是否为风险客户的预测结果;
21.根据多个基础模型的预测结果和数据标识,计算多个基础模型的预测错误率;
22.根据多个基础模型的预测错误率,计算多个基础模型各自的模型权重;
23.将多个基础模型按照各自的模型权重进行线性组合,以得到二分类模型。
24.根据本公开的实施例,其中:客户筛选规则包括多个条件特征,以及多个条件特征分别对应的筛选阈值,其中多个条件特征至少包括客户基本特征、资产特征、信用特征、和交易行为特征。
25.根据本公开的实施例,其中,客户筛选规则通过如下方式构建得到:
26.在通过数据访问接口从业务系统调用历史客户的基础数据和交易业务类数据后,利用从算法池中调用的第三预定算法对多个原始客户特征按照贡献程度进行排序;
27.根据对多个原始客户特征按照贡献程度进行排序得到的结果,从多个原始客户特征中确定多个条件特征;
28.确定多个条件特征分别对应的筛选阈值,以便将多个条件特征和筛选阈值组合形成客户筛选规则;
29.将客户筛选规则存储至规则库。
30.根据本公开的实施例,其中,利用第三预定算法对多个原始客户特征按照贡献程度进行排序包括:
31.利用第三预定算法,根据历史客户的基础数据和交易业务类数据、以及数据标识,计算得到原始客户特征的贡献值,其中贡献值用于表征原始客户特征分别对预测历史客户是否为风险客户的贡献程度的大小;
32.根据原始客户特征的贡献值,对多个原始客户特征按照贡献程度进行排序。
33.本公开的另一个方面提供了一种目标客户推荐装置,包括第一获取模块、输入输出模块、选择模块、第二获取模块和推送模块。
34.其中,第一获取模块,用于从数据池中获取待测客户的待测客户特征数据,其中,待测客户特征数据至少包括待测客户的基础数据和交易业务类数据;
35.输入输出模块,用于将待测客户特征数据输入二分类模型,以便通过二分类模型输出用于表征待测客户是否为风险客户的分类结果;
36.选择模块,用于根据分类结果从待测客户中选取属于非风险客户的第一目标客户;
37.第二获取模块,用于从规则库中获取客户筛选规则,以便按照客户筛选规则从第
一目标客户中确定第二目标客户,其中第二目标客户为针对目标产品的拟推荐客户;
38.推送模块,用于向提供目标产品的服务系统推送拟推荐客户。
39.根据本公开的实施例,上述装置还包括训练模块,用于训练二分类模型;其中训练模块包括调用单元、获取单元、添加单元、第一排序单元和训练单元。
40.其中,调用单元,用于调用业务系统的数据访问接口;
41.获取单元,用于在获得数据访问许可的情况下,通过数据访问接口从业务系统调用历史客户的基础数据和交易业务类数据,其中历史客户的基础数据和交易业务类数据关联多个原始客户特征;
42.添加单元,用于根据历史客户的已知风险类型,对历史客户的基础数据和交易业务类数据添加数据标识,数据标识用于表征与基础数据和交易业务类数据关联的历史客户是否为风险客户;
43.第一排序单元,用于利用从算法池中调用的第一预定算法对多个原始客户特征进行特征排序,以便从排序后的多个原始特征中确定多个目标客户特征,其中,原始客户特征和目标客户特征至少包括客户基本特征、资产特征、信用特征、和交易行为特征;
44.训练单元,用于利用与多个目标客户特征关联的历史客户的基础数据和交易业务类数据,训练二分类模型。
45.根据本公开的实施例,其中:二分类模型由多个基础模型按照各自的模型权重组合得到,其中多个基础模型中,在第一基础模型的预测准确率大于第二基础模型的预测准确率的情况下,第一基础模型的模型权重大于第二基础模型的模型权重。
46.根据本公开的实施例,其中,训练单元包括构建子单元、输入输出子单元、第一计算子单元、第二计算子单元和组合子单元。
47.构建子单元,用于利用从算法池中调用的第二预定算法,构建多个基础模型,其中基础模型中包括决策条件,决策条件根据客户基本特征、资产特征、信用特征、和交易行为特征构建得到;
48.输入输出子单元,用于将与多个目标客户特征关联的历史客户的基础数据和交易业务类数据输入多个基础模型,以便利用多个基础模型输出历史客户是否为风险客户的预测结果;
49.第一计算子单元,用于根据多个基础模型的预测结果和数据标识,计算多个基础模型的预测错误率;
50.第二计算子单元,用于根据多个基础模型的预测错误率,计算多个基础模型各自的模型权重;
51.组合子单元,用于将多个基础模型按照各自的模型权重进行线性组合,以得到二分类模型。
52.根据本公开的实施例,其中:客户筛选规则包括多个条件特征,以及多个条件特征分别对应的筛选阈值,其中多个条件特征至少包括客户基本特征、资产特征、信用特征、和交易行为特征。
53.根据本公开的实施例,上述装置还包括构建模块,用于构建客户筛选规则;其中构建模块包括第二排序单元、第一确定单元、第二确定单元和存储单元。
54.其中,第二排序单元,用于在通过数据访问接口从业务系统调用历史客户的基础
数据和交易业务类数据后,利用从算法池中调用的第三预定算法对多个原始客户特征按照贡献程度进行排序;
55.第一确定单元,用于根据对多个原始客户特征按照贡献程度进行排序得到的结果,从多个原始客户特征中确定多个条件特征;
56.第二确定单元,用于确定多个条件特征分别对应的筛选阈值,以便将多个条件特征和筛选阈值组合形成客户筛选规则;
57.存储单元,用于将客户筛选规则存储至规则库。
58.根据本公开的实施例,其中,第二排序单元包括第三计算子单元和排序子单元。
59.其中,第三计算子单元,用于利用第三预定算法,根据历史客户的基础数据和交易业务类数据、以及数据标识,计算得到原始客户特征的贡献值,其中贡献值用于表征原始客户特征分别对预测历史客户是否为风险客户的贡献程度的大小;
60.排序子单元,用于根据原始客户特征的贡献值,对多个原始客户特征按照贡献程度进行排序。
61.本公开的另一个方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述目标客户推荐方法。
62.本公开的另一个方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述目标客户推荐方法。
63.本公开的另一个方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述目标客户推荐方法。
附图说明
64.通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
65.图1示意性示出了根据本公开实施例的目标客户推荐方法、装置、设备、介质和程序产品的应用场景图;
66.图2示意性示出了根据本公开实施例的目标客户推荐方法的流程图;
67.图3示意性示出了根据本公开实施例的训练二分类模型的流程图;
68.图4示意性示出了根据本公开实施例的构建客户筛选规则的流程图;
69.图5示意性示出了根据本公开实施例的目标客户推荐装置的结构框图;以及
70.图6示意性示出了根据本公开实施例的适于实现目标客户推荐方法的电子设备的方框图。
具体实施方式
71.以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
72.在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
73.在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
74.在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。
75.现有的营销处理方式中,往往通过业务人员根据客户的基本情况、客户现有产品持有情况、客户特征、征信数据、财务数据等客户关键因素,通过线下走访等形式,结合人工经验来制定拟推荐客户清单,这种方式较为传统单一,需要消耗大量的人力,且主观因素较强,结果的得出存在较大的盲目性,人工预测结果参考性不高。
76.有鉴于此,本公开的实施例提供了一种目标客户推荐方法,包括:
77.从数据池中获取待测客户的待测客户特征数据,其中,待测客户特征数据至少包括待测客户的基础数据和交易业务类数据;
78.将待测客户特征数据输入二分类模型,以便通过二分类模型输出用于表征待测客户是否为风险客户的分类结果;
79.根据分类结果从待测客户中选取属于非风险客户的第一目标客户;
80.从规则库中获取客户筛选规则,以便按照客户筛选规则从第一目标客户中确定第二目标客户,其中第二目标客户为针对目标产品的拟推荐客户;
81.向提供目标产品的服务系统推送拟推荐客户。
82.图1示意性示出了根据本公开实施例的目标客户推荐方法、装置、设备、介质和程序产品的应用场景图。
83.如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103、网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
84.用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
85.终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
86.服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
87.根据本公开的实施例,业务人员可利用终端设备101、102、103和服务器105之间进行数据交互,向服务器105发送用于获取针对目标产品的拟推荐客户的请求,响应于用户请
求,服务器105可执行本公开实施例的目标客户推荐方法,从数据池中获取待测客户的待测客户特征数据,并利用二分类模型和预设的客户筛选规则,输出针对目标产品的拟推荐客户清单,并且将拟推荐客户清单通过向终端设备101、102、103向业务人员展示。
88.需要说明的是,本公开实施例所提供的目标客户推荐方法一般可以由服务器105执行。相应地,本公开实施例所提供的目标客户推荐装置一般可以设置于服务器105中。本公开实施例所提供的目标客户推荐方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的目标客户推荐装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。
89.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
90.需要说明的是,本公开的目标客户推荐方法及装置可用于大数据技术领域和人工智能技术领域,也可用于金融技术领域,还可用于除大数据技术领域、人工智能技术领域和金融技术领域之外的任意领域,本公开的实施例对上述目标客户推荐方法及装置的应用领域不做限定。
91.在本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。
92.以下将基于图1描述的场景,通过图2~图6对公开实施例的目标客户推荐方法进行详细描述。
93.图2示意性示出了根据本公开实施例的目标客户推荐方法的流程图。
94.如图2所示,该实施例的目标客户推荐方法包括操作s201~操作s205。
95.在操作s201,从数据池中获取待测客户的待测客户特征数据,其中,待测客户特征数据至少包括待测客户的基础数据和交易业务类数据;
96.在操作s202,将待测客户特征数据输入二分类模型,以便通过二分类模型输出用于表征待测客户是否为风险客户的分类结果;
97.在操作s203,根据分类结果从待测客户中选取属于非风险客户的第一目标客户;
98.在操作s204,从规则库中获取客户筛选规则,以便按照客户筛选规则从第一目标客户中确定第二目标客户,其中第二目标客户为针对目标产品的拟推荐客户;
99.在操作s205,向提供目标产品的服务系统推送拟推荐客户。
100.本公开实施例的上述方法可应用在客户推荐的场景下,在业务人员针对目标金融产品开展营销活动前,需要首先确定针对目标金融产品的拟推荐客户清单。本公开实施例的目标客户推荐方法可以根据待测客户(例如可以是金融机构的所有客户,或者经过人工初步确定的客户清单)的客户特征数据,通过模型输出对待测客户的分析结果。
101.根据本公开的实施例,客户特征数据可至少包括待测客户的基础数据和交易业务类数据,例如客户基础数据、客户产品持有情况、客户征信数据、财务数据、交易数据等客户关键特征数据,可涉及基础信息类、资产类、融资类、交易类、产品类、贡献类等数据类型。
102.在操作s201,在从数据池中获取待测客户的待测客户特征数据之前,可以获得用户的同意或授权。例如,在操作s201之前,可以向用户发出获取用户信息的请求,在用户同
意或授权可以获取用户信息的情况下,执行所述操作s201。
103.根据本公开的实施例,二分类模型主要用于根据客户特征数据进行客户二分类,二分类模型可用于预测待测客户的风险类型,即预测待测客户是否为风险客户。二分类模型可以采用多种形式的可用于执行二分类的预测模型,例如决策树模型、随机森林模型、adaboost算法模型、xgboost算法模型等等。
104.第一目标客户为根据二分类模型的预测结果,从待测客户中确定的非风险客户,筛选出第一目标客户作为准入客户,还需要进一步从第一目标客户中确定对目标金融产品可能存在购买需求的最终拟推荐客户清单,即确定第二目标客户。
105.根据本公开的实施例,可通过预先构建的客户筛选规则进一步从第一目标客户中确定第二目标客户。客户筛选规则可以是预先设置的筛选决策条件,客户筛选规则可包括多个条件特征,以及多个条件特征分别对应的筛选阈值。例如客户筛选规则可以是:净收入(条件特征)大于等于5000万元(筛选阈值)、净利润(条件特征)大于等于1000万元(筛选阈值)、账户余额(条件特征)大于等于500万元(筛选阈值)等。
106.根据本公开的实施例,通过上述方法对客户特征分析处理得到对目标金融产品可能存在购买需求的最终拟推荐客户清单后,业务人员可根据拟推荐客户清单,开展有针对性的产品营销。
107.根据本公开的实施例,上述方法利用二分类模型和客户筛选规则,根据客户特征数据进行拟推荐客户的预测,实现了利用预测模型实现了对各种客户特征的客观评测,避免了人工预测盲目性,预测结果更具参考性,同时克服了金融机构通过线下走访的形式开展营销活动信息收集成本和管理成本较高、手工预测和报送耗费大量人力资源、效率低下的问题。另外,本公开的实施例的目标客户推荐方法,分两步应用了二分类模型和客户筛选规则,首先应用二分类模型对风险客户进行了剔除,在此基础上通过客户筛选规则进一步确定目标营销客户,综合考虑了客户风险和客户购买意向的影响,得出的预测结果可信度更高,也克服了金融基层机构盲目开展业务和营销,业务目标实现较困难的问题。
108.图3示意性示出了根据本公开实施例的训练二分类模型的流程图。根据本公开的实施例,上述用于根据客户特征数据进行客户二分类的二分类模型可以是训练好的模型,其中该二分类模型通过如下方式训练得到:
109.如图3所示,该实施例的训练二分类模型的方法包括操作s301~操作s305。
110.在操作s301,调用业务系统的数据访问接口;
111.在操作s302,在获得数据访问许可的情况下,通过数据访问接口从业务系统调用历史客户的基础数据和交易业务类数据,其中历史客户的基础数据和交易业务类数据关联多个原始客户特征;
112.在操作s303,根据历史客户的已知风险类型,对历史客户的基础数据和交易业务类数据添加数据标识,数据标识用于表征与基础数据和交易业务类数据关联的历史客户是否为风险客户;
113.在操作s304,利用从算法池中调用的第一预定算法对多个原始客户特征进行特征排序,以便从排序后的多个原始特征中确定多个目标客户特征,其中,原始客户特征和目标客户特征至少包括客户基本特征、资产特征、信用特征、和交易行为特征;
114.在操作s305,利用与多个目标客户特征关联的历史客户的基础数据和交易业务类
数据,训练二分类模型。
115.根据本公开的实施例,在操作s302,在调用历史客户的基础数据和交易业务类数据之前,可以获得用户的同意或授权。例如,在操作s302之前,可以向用户发出获取用户信息的请求。在用户同意或授权可以获取用户信息的情况下,执行所述操作s302。
116.根据本公开的实施例,历史客户的基础数据和交易业务类数据例如可以包括历史客户基础数据、客户产品持有情况、客户征信数据、财务数据、交易数据等客户关键特征数据,可涉及基础信息类、资产类、融资类、交易类、产品类、贡献类等数据类型。历史客户的基础数据和交易业务类数据与多个原始客户特征关联。例如,历史客户的基础数据和交易业务类数据可以是客户净收入为5000万元、净利润为1000万元、账户余额为500万元、客户属于星级客户、客户日交易金额为100万元等等,这些数据关联的原始客户特征可以包括:净收入、净利润、账户余额、客户等级、客户日交易金额等等。
117.根据本公开的实施例,在操作s303,根据历史客户的已知风险类型,对历史客户的基础数据和交易业务类数据添加数据标识,例如可以是根据历史客户的已知风险类型,在历史客户为风险客户的情况下,对该风险客户的基础数据和交易业务类数据添加数据标识 1,即标记为正样本;反之,在历史客户不属于风险客户的情况下,对该风险客户的基础数据和交易业务类数据添加数据标识-1,即标记为负样本。
118.根据本公开的实施例,历史客户的基础数据和交易业务类数据关联的原始特征可涉及基础信息类、资产类、融资类、交易类、产品类、贡献类等多种特征类型,因此原始特征的数量可能比较庞大,有可能达到上百个特征,但是这些所有特征中对用户风险分析起到关键作用的特征可能只是其中一部分特征,因此,可以从多个原始特征中筛选出部分特征作为目标客户特征,进一步利用与多个目标客户特征关联的历史客户的基础数据和交易业务类数据,训练二分类模型。
119.根据本公开的实施例,在操作s304,可以利用第一预定算法对多个原始客户特征进行特征排序,例如可以是基于bagging的rf(随机森林)方法对特征进行筛选,取重要性排序靠前的特征入模。
120.例如,与历史客户的基础数据和交易业务类数据关联的原始特征为97个,在利用随机森林算法对对特征进行特征排序后,取排序靠前的前17个特征作为训练二分类模型的目标客户特征。最终入模的17个特征如下表1所示。
121.表1
122.特征名净收入净利润上市公司标识监管口径小企业标识客户星级企业规模对公存款余额占比账户余额年日均余额
贷款余额最高授信额度可用额度交易笔数月合计交易金额月合计企业网银交易金额投行资管类产品个数公司类中收金额本年累计
123.根据本公开的实施例,因原始特征的数量可能比较庞大,直接将其作为训练样本数据,一方面会导致训练复杂度较高,训练时间过长,另一方面由于非重要特征对用户风险分析起到干扰,也容易导致模型训练过度拟合。通过从排序后的多个原始特征中确定多个目标客户特征,目标客户特征的数量较少,降低了训练复杂度,提高了训练速度,另一方面,通过随机森林算法选取的特征为有放回的随机抽样,目标客户特征均为关键特征,可保证筛选后的特征具有较强的分类能力,且可避免过度拟合。
124.根据本公开的实施例,可利用与多个目标客户特征关联的历史客户的基础数据和交易业务类数据作为训练样本数据,采用adaboost算法构造二分类模型。
125.根据本公开的实施例,基于adaboost算法,训练好的二分类模型由多个基础模型按照各自的模型权重组合得到,其中多个基础模型中,在第一基础模型的预测准确率大于第二基础模型的预测准确率的情况下,第一基础模型的模型权重大于第二基础模型的模型权重,即二分类模型中预测效果较好的基础模型被配置为较大的模型权重。
126.进一步地,根据本公开的实施例,其中,利用与多个目标客户特征关联的历史客户的基础数据和交易业务类数据,训练二分类模型包括:
127.利用从算法池中调用的第二预定算法,构建多个基础模型,其中基础模型中包括决策条件,决策条件根据历史客户的基础数据和交易业务类数据中包含的客户特征(客户基本特征、资产特征、信用特征、和交易行为特征)构建得到,可根据其中包含的部分或全部客户特征,每个客户特征分别建立一个决策条件,例如,决策条件1为净收入大于等于5000万元;决策条件2为净利润大于等于1000万元;决策条件3为
……

128.将与多个目标客户特征关联的历史客户的基础数据和交易业务类数据输入多个基础模型,以便利用多个基础模型输出历史客户是否为风险客户的预测结果;
129.根据多个基础模型的预测结果和数据标识,计算多个基础模型的预测错误率;
130.根据多个基础模型的预测错误率,计算多个基础模型各自的模型权重;
131.将多个基础模型按照各自的模型权重进行线性组合,以得到二分类模型。
132.根据本公开的实施例,为了便于理解,以下示例性说明基于adaboost算法,训练二分类模型的具体方法。
133.首先,构造的训练样本数据集如下式(1):
134.t={(x1,y1),(x2,y2),...(xn,yn)}
ꢀꢀꢀ
(1)
135.其中,xi为包含客户唯一标识和上述17个入模特征的样本空间,yi∈y={-1, 1}为数据标识,风险客户标记为 1,非风险客户标记为-1,n客户数量。
136.最终构造的二分类模型为g(x),对给定样本能够较准确预测其在未来是否有发生
风险事件的倾向。因预测结果只有发生/不发生两种,故g(x)是面向二分类的模型。
137.二分类的模型g(x)的构造过程如下:
138.首先,初始化t上各样本特征的权值分布如下式(2):
[0139][0140]
其中,
[0141]
之后,设置总迭代次数为m,在第m次迭代中,所使用训练集数据的权值分布为dm,由此获得基础模型,即基础分类器为gm(x)。
[0142]
其中,迭代过程中,gm(x)在训练集dm上的预测错误率如下式(3)所示:
[0143][0144]
二分类模型g(x)由各个gm(x)线性组成,其中gm(x)的权重系数根据基础模型的预测错误率计算得到,如下式(4)所示:
[0145][0146]
最后,将多个基础模型按照各自的模型权重进行线性组合,获得最终二分类模型如下式(5)所示:
[0147][0148]
根据本公开的实施例,其中,在上述训练迭代过程中,第m次迭代的迭代规则如下式(6)、式(7)所示:
[0149][0150][0151]
其中,i=1,...,n,
[0152]
其中的规范化因子如下式(8)所示:
[0153][0154]
根据本公开的实施例,因二分类模型由多个基础模型按照各自的模型权重组合得到,如此,相比于采用单个模型,组合模型可提高模型的泛化能力,并且二分类模型中预测效果较好的基础模型被配置为较大的模型权重,可提高预测的准确率。
[0155]
根据本公开的实施例,从规则库中获取的客户筛选规则可包括多个条件特征,以及多个条件特征分别对应的筛选阈值,其中多个条件特征至少包括客户基本特征、资产特征、信用特征、和交易行为特征。例如客户筛选规则可以是:净收入(条件特征)大于等于5000万元(筛选阈值)、净利润(条件特征)大于等于1000万元(筛选阈值)、账户余额(条件特征)大于等于500万元(筛选阈值)等。
[0156]
根据本公开的实施例,多个条件特征可以是与历史客户的基础数据和交易业务类
数据关联多个原始客户特征中的部分或全部特征。
[0157]
根据本公开的实施例,通过二分类模型可以确定非风险客户,然而,由于金融产品的特殊性、复杂性和多样性,使得直接将这部分客户作为针对目标金融产品的拟推荐客户,在营销实践中效果可能不甚乐观,因此,需要针对非风险客户进一步筛选,本公开实施例的客户筛选规则结合了多个客户关键特征,根据这些关键特征对客户进行筛选,筛选依据更为客观,通过上述客户筛选规则可确定更具有参考性的拟推荐客户清单。
[0158]
图4示意性示出了根据本公开实施例的构建客户筛选规则的流程图。
[0159]
如图4所示,该实施例的客户筛选规则构建方法包括操作s401~操作s404。
[0160]
在操作s401,在通过数据访问接口从业务系统调用历史客户的基础数据和交易业务类数据后,利用从算法池中调用的第三预定算法对多个原始客户特征按照贡献程度进行排序。具体地,可以是利用第三预定算法,根据历史客户的基础数据和交易业务类数据、以及数据标识,计算得到原始客户特征的贡献值。
[0161]
其中,计算原始客户特征的贡献值,可以是通过iv(information value)值算法,计算每个原始客户特征对应的iv值。其中,iv值可以衡量各变量x对y的预测能力,用于筛选变量,具体到本公开实施例的场景,iv值用于表征原始客户特征分别对预测历史客户是否为风险客户的贡献程度的大小。例如,根据客户特征1:净收入为5000万元,该特征对应的数据标识为 1(该客户为风险客户),计算得到客户特征1的iv值为:0.83;根据客户特征2:账户余额为500万元,该特征对应的数据标识为 1,计算得到客户特征2的iv值
……

[0162]
在操作s402,根据对多个原始客户特征按照贡献程度进行排序得到的结果,从多个原始客户特征中确定多个条件特征。
[0163]
根据本公开的实施例,上述方法可以是基于与历史客户的基础数据和交易业务类数据关联的多个原始特征,计算每个原始特征对应的iv值,之后根据iv值计算结果,从多个原始客户特征中确定多个条件特征。上述方法也可以是基于从多个原始特征中筛选得到的多个目标客户特征,计算每个目标客户特征对应的iv值,之后根据iv值计算结果,从多个目标客户特征中确定多个条件特征。
[0164]
例如,根据表1中列出的17个目标客户特征,根据历史客户的基础数据和交易业务类数据、以及数据标识,计算得到每个目标客户特征的iv值并进行排序,特征排序结果如下表2所示。
[0165]
表2
[0166]
特征名称iv值排序净收入l净利润2上市公司标识3最高授信额度4账户余额5客户星级6企业规模7对公存款余额占比8年日均余额9
可用额度10投行资管类产品个数11企业网银交易金额12交易笔数月合计13贷款余额14公司类中收金额本年累计15交易金额月合计16监管口径小企业标识17
[0167]
可根据特征排序结果,从这17个特征中确定部分或全部特征作为构建客户筛选规则的条件特征。可根据业务可接受的规则复杂程度,选取一定数量的特征作为条件特征,例如,待测客户的数据量较大时,可选取较多的特征,建立较为严苛的筛选条件,例如选择其中排名靠前的前12个特征建立客户筛选规则,可使得最终拟推荐客户的数量不至于过分庞大。例如,待测客户的数据量较小时,可选取较少的特征,建立较为宽松的筛选条件,例如选择其中排名靠前的前6个特征建立客户筛选规则,可使得最终拟推荐客户的数量不至于过少,而影响业务开展。
[0168]
例如,结合金融机构业务实际,划定排序靠前的6个特征,并给出具体规则如下:
[0169]
《1》净收入大于等于“5000万元”;
[0170]
《2》净利润大于等于“1000万元”;
[0171]
《3》上市公司标识为“是”;
[0172]
《4》最高授信额度大于等于“1000万元”;
[0173]
《5》账户余额大于等于“500万元”;
[0174]
《6》客户星级大于等于“4星级”。
[0175]
在操作s403,确定多个条件特征分别对应的筛选阈值,以便将多个条件特征和筛选阈值组合形成客户筛选规则;筛选阈值可以是业务人员根据业务经验预先设置好存储在数据池中,可直接从数据池中获取到这些特征阈值后,直接赋值至每个特征,组合形成客户筛选规则。
[0176]
在操作s404,可将客户筛选规则存储至规则库。
[0177]
基于上述目标客户推荐方法,本公开还提供了一种目标客户推荐装置。以下将结合图5对该装置进行详细描述。
[0178]
图5示意性示出了根据本公开实施例的目标客户推荐装置的结构框图。
[0179]
如图5所示,该实施例的目标客户推荐装置500包括第一获取模块501、输入输出模块502、选择模块503、第二获取模块504和推送模块505。
[0180]
其中,第一获取模块501,用于从数据池中获取待测客户的待测客户特征数据,其中,待测客户特征数据至少包括待测客户的基础数据和交易业务类数据;
[0181]
输入输出模块502,用于将待测客户特征数据输入二分类模型,以便通过二分类模型输出用于表征待测客户是否为风险客户的分类结果;
[0182]
选择模块503,用于根据分类结果从待测客户中选取属于非风险客户的第一目标客户;
[0183]
第二获取模块504,用于从规则库中获取客户筛选规则,以便按照客户筛选规则从
第一目标客户中确定第二目标客户,其中第二目标客户为针对目标产品的拟推荐客户;
[0184]
推送模块505,用于向提供目标产品的服务系统推送拟推荐客户。
[0185]
根据本公开的实施例,上述装置中,利用二分类模型和客户筛选规则,根据客户特征数据进行拟推荐客户的预测,实现了利用预测模型实现了对各种客户特征的客观评测,避免了人工预测盲目性,预测结果更具参考性,同时克服了金融机构通过线下走访的形式开展营销活动信息收集成本和管理成本较高、手工预测和报送耗费大量人力资源、效率低下的问题。另外,本公开的实施例的目标客户推荐装置,通过输入输出模块502、选择模块503、第二获取模块504,分两步应用了二分类模型和客户筛选规则,首先应用二分类模型对风险客户进行了剔除,在此基础上通过客户筛选规则进一步确定目标营销客户,综合考虑了客户风险和客户购买意向的影响,得出的预测结果可信度更高,也克服了金融基层机构盲目开展业务和营销,业务目标实现较困难的问题。
[0186]
根据本公开的实施例,上述装置还包括训练模块,用于训练二分类模型;其中训练模块包括调用单元、获取单元、添加单元、第一排序单元和训练单元。
[0187]
其中,调用单元,用于调用业务系统的数据访问接口;
[0188]
获取单元,用于在获得数据访问许可的情况下,通过数据访问接口从业务系统调用历史客户的基础数据和交易业务类数据,其中历史客户的基础数据和交易业务类数据关联多个原始客户特征;
[0189]
添加单元,用于根据历史客户的已知风险类型,对历史客户的基础数据和交易业务类数据添加数据标识,数据标识用于表征与基础数据和交易业务类数据关联的历史客户是否为风险客户;
[0190]
第一排序单元,用于利用从算法池中调用的第一预定算法对多个原始客户特征进行特征排序,以便从排序后的多个原始特征中确定多个目标客户特征,其中,原始客户特征和目标客户特征至少包括客户基本特征、资产特征、信用特征、和交易行为特征;
[0191]
训练单元,用于利用与多个目标客户特征关联的历史客户的基础数据和交易业务类数据,训练二分类模型。
[0192]
根据本公开的实施例,其中:二分类模型由多个基础模型按照各自的模型权重组合得到,其中多个基础模型中,在第一基础模型的预测准确率大于第二基础模型的预测准确率的情况下,第一基础模型的模型权重大于第二基础模型的模型权重。
[0193]
根据本公开的实施例,其中,训练单元包括构建子单元、输入输出子单元、第一计算子单元、第二计算子单元和组合子单元。
[0194]
构建子单元,用于利用从算法池中调用的第二预定算法,构建多个基础模型,其中基础模型中包括决策条件,决策条件根据客户基本特征、资产特征、信用特征、和交易行为特征构建得到;
[0195]
输入输出子单元,用于将与多个目标客户特征关联的历史客户的基础数据和交易业务类数据输入多个基础模型,以便利用多个基础模型输出历史客户是否为风险客户的预测结果;
[0196]
第一计算子单元,用于根据多个基础模型的预测结果和数据标识,计算多个基础模型的预测错误率;
[0197]
第二计算子单元,用于根据多个基础模型的预测错误率,计算多个基础模型各自
的模型权重;
[0198]
组合子单元,用于将多个基础模型按照各自的模型权重进行线性组合,以得到二分类模型。
[0199]
根据本公开的实施例,其中:客户筛选规则包括多个条件特征,以及多个条件特征分别对应的筛选阈值,其中多个条件特征至少包括客户基本特征、资产特征、信用特征、和交易行为特征。
[0200]
根据本公开的实施例,上述装置还包括构建模块,用于构建客户筛选规则;其中构建模块包括第二排序单元、第一确定单元、第二确定单元和存储单元。
[0201]
其中,第二排序单元,用于在通过数据访问接口从业务系统调用历史客户的基础数据和交易业务类数据后,利用从算法池中调用的第三预定算法对多个原始客户特征按照贡献程度进行排序;
[0202]
第一确定单元,用于根据对多个原始客户特征按照贡献程度进行排序得到的结果,从多个原始客户特征中确定多个条件特征;
[0203]
第二确定单元,用于确定多个条件特征分别对应的筛选阈值,以便将多个条件特征和筛选阈值组合形成客户筛选规则;
[0204]
存储单元,用于将客户筛选规则存储至规则库。
[0205]
根据本公开的实施例,其中,第二排序单元包括第三计算子单元和排序子单元。
[0206]
其中,第三计算子单元,用于利用第三预定算法,根据历史客户的基础数据和交易业务类数据、以及数据标识,计算得到原始客户特征的贡献值,其中贡献值用于表征原始客户特征分别对预测历史客户是否为风险客户的贡献程度的大小;
[0207]
排序子单元,用于根据原始客户特征的贡献值,对多个原始客户特征按照贡献程度进行排序。
[0208]
根据本公开的实施例,第一获取模块501、输入输出模块502、选择模块503、第二获取模块504和推送模块505中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一获取模块501、输入输出模块502、选择模块503、第二获取模块504和推送模块505中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块501、输入输出模块502、选择模块503、第二获取模块504和推送模块505中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
[0209]
图6示意性示出了根据本公开实施例的适于实现目标客户推荐方法的电子设备的方框图。
[0210]
如图6所示,根据本公开实施例的电子设备600包括处理器601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic))等等。处理器
601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
[0211]
在ram 603中,存储有电子设备600操作所需的各种程序和数据。处理器601、rom 602以及ram 603通过总线604彼此相连。处理器601通过执行rom 602和/或ram 603中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除rom 602和ram 603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
[0212]
根据本公开的实施例,电子设备600还可以包括输入/输出(i/o)接口605,输入/输出(i/o)接口605也连接至总线604。电子设备600还可以包括连接至i/o接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
[0213]
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
[0214]
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的rom 602和/或ram 603和/或rom 602和ram 603以外的一个或多个存储器。
[0215]
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的目标客户推荐方法。
[0216]
在该计算机程序被处理器601执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
[0217]
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分609被下载和安装,和/或从可拆卸介质611被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
[0218]
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的
系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
[0219]
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如java,c ,python,“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
[0220]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0221]
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
[0222]
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献