一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

运营商营业厅场景下风控数据模型的构建及应用方法与流程

2022-09-10 16:17:22 来源:中国专利 TAG:


1.本发明涉及金融风控技术领域,应用于电信运营商的消费分期产品,在线上线下结合的办理流程中,通过构建数据模型实现智能风控,具体为运营商营业厅场景下风控数据模型的构建及应用方法。


背景技术:

2.在风控领域,技术体系已经发展了很多年,在包括信用卡、消费贷款、现金贷款等场景下有较多实践,针对这些传统金融类场景上已经搭建出适应的数据模型,但是对于运营商自有分期业务这一特定场景,需要做调整,才能够得到更精准的结果。
3.从应用流程上看,金融机构的风控模型主要应用于信贷流程,其流程的相关方为金融机构内部的产品、风险、信贷、it等部门,业务和数据的流转基本在金融机构内部完成,从数据模型的数据基础来说,金融机构的模型一般采用个人的资产、负债、收入、消费、征信等数据构建模型,这类模型在金融信贷场景的契合度较高,从数据模型的开发方法上,现有技术使用逻辑回归算法、评分卡模型偏多。
4.针对于上述资料的检索,可以看出对于运营商自有分期业务这一特定场景而言,当前的风控技术存在如下缺陷:
5.1.现有技术缺乏在运营商消费分期业务场景的适应性,即目前的较成熟的风控方案基本是应用于金融机构的信贷场景,对个人用户的风险和信用评价均来源于金融、消费等领域。现有技术对于运营商的场景并不匹配,没有考虑到用于在运营商的消费特点和风险偏好,会造成对用户的评估不够准确;
6.2.现有技术不匹配运营商消费分期场景的业务流程,由于本业务场景是运营商自有的特定场景,需要在集团内部的交易系统、支付系统、融资租赁公司、各省分公司的结算系统中整合完成,其风控流程需要考虑到内部各职能板块和系统的交互与合作,现有技术没有该流程的应对方案。
7.针对于由于以上缺陷,可以看出现有技术方法的适用性和准确性有所不足,即现有风控模型的建立方法对本场景缺乏匹配性支持。


技术实现要素:

8.(一)解决的技术问题
9.针对现有技术的不足,本发明提供了运营商营业厅场景下风控数据模型的构建及应用方法,解决了现有技术缺乏在运营商消费分期业务场景的适应性,不匹配运营商消费分期场景的业务流程,对本场景缺乏匹配性支持的问题。
10.(二)技术方案
11.为实现上述目的,本发明提供了如下技术方案:运营商营业厅场景下风控数据模型的构建及应用方法,具体包括以下步骤:
12.步骤一、数据处理:大数据平台通过采集用户在运营商中的使用情况数据,风控系
统按照业务系统中分期产品的违约情况进行规则定义,利用大数据平台中的全量样本中,随机抽取出建模样本,在建模样本抽取中,对个人敏感信息进行脱敏处理,根据用户在运营商的使用情况进行数据的加工,从最初原始明细信息记录加工到以用户为单位的属性变量,用以描述用户的稳定性、趋势、偏好和产品偏好,同时对于联系变量进行分段,计算证据权重woe;
13.步骤二、建模:建模优化单元对步骤一中加工好的数据进行深入探索,了解数据的分布和相互影响关系,找出用以评价客户风险和信用的关键指标,随后引入数据挖掘、评分卡模型和人工智能算法来训练数据模型,整合并选择出准确率最高的数据模型;
14.步骤三、评估部署:通过评估部署单元验证样本,对模型效能进行评估,了解到不同的模型评分所对应客户的风险和信用状况,制定出合理的审批规则,在决策引擎平台中进行数据模型和审批策略的部署,当线下引导和线上申请传至系统时,数据模型进行实时运算评分,并进行自动判断;
15.步骤四、优化:建模优化单元处于测试阶段时,对数据模型的效果进行持续评价,如需调整则在调优流程中进行优化迭代;
16.步骤五、业务办理:用户来到运营商营业厅办理业务时,客户经理向客户介绍产品,客户同意办理后,引导客户通过手机应用进入到业务系统中,开始申请分期产品,申请信息填写完成后,申请信息传输到步骤三中进行评分,如果该评分满足审批条件,会将“通过”返回到手机应用,然后继续办理分期产品,通过资金方系统进行相应的分期产品派送,如果评分不满足审批条件,会将“拒绝”返回,客户无法继续办理。
17.通过采用上述技术方案,将风控要素的采集、风险模型的开发、模型决策的部署、策略应用的体系化在相关流程各环节中做了调整,让大数据风控技术能够跟业务流程相结合,来自动化配合业务开展,并且结合实际业务场景,将个人用户在运营商的数据维度引入到风控模型中,将用户的使用特征画像和风险偏好相结合,对于用户的风控评价更加适应于运营商消费分期场景,对传统方法进行了改造和调整,从模型准确度和解释性上做出平衡,并且建立动态监控体系来优化模型,让数据模型在运营商消费分期场景中应用效果得到提升。
18.本发明进一步设置为:所述风控系统分别与业务系统和资金方系统对接,并且风控系统包括数据处理单元、建模优化单元、评估部署单元和大数据平台,所述数据处理单元与建模优化单元对接,所述建模优化单元与评估部署单元对接,所述数据处理单元、建模优化单元和评估部署单元均与大数据平台对接,所述大数据平台用于采集用户在运营商中的使用情况数据。
19.本发明进一步设置为:所述数据处理单元包括业务定义模块、样本抽取模块和数据准备模块,所述业务定义模块与样本抽取模块对接,所述样本抽取模块与数据准备模块对接。
20.本发明进一步设置为:所述业务定义模块用于按照业务系统中分期产品的违约情况进行规则定义;
21.所述样本抽取模块用于从大数据平台中的全量样本中,随机抽取出建模样本,在建模样本抽取中,对个人敏感信息进行脱敏处理;
22.所述数据准备模块用于根据用户在运营商的使用情况进行数据的加工,从最初原
始明细信息记录加工到以用户为单位的属性变量,用以描述用户的稳定性、趋势、偏好和产品偏好,同时对于联系变量进行分段,计算证据权重woe。
23.本发明进一步设置为:所述建模优化单元包括数据探索模块、模型建立模块和测试调优模块,所述数据探索模块与模型建立模块对接,所述模型建立模块与测试调优模块对接。
24.本发明进一步设置为:所述数据探索模块用于对数据处理单元中加工好的数据进行深入探索,了解数据的分布和相互影响关系,找出用以评价客户风险和信用的关键指标;
25.所述模型建立模块用于引入数据挖掘、评分卡模型和人工智能算法来训练数据模型,整合并选择出准确率最高的数据模型;
26.所述测试调优模块用于数据模型处于测试阶段时,对数据模型的效果进行持续评价,如需调整则在调优流程中进行优化迭代。
27.本发明进一步设置为:所述评估部署单元包括模型评估模块和模型部署模块,所述模型评估模块与模型部署模块对接。
28.本发明进一步设置为:所述模型评估模块用于验证样本,对模型效能进行评估,了解到不同的模型评分所对应客户的风险和信用状况,制定出合理的审批规则;
29.所述模型部署模块用于在决策引擎平台中进行数据模型和审批策略的部署,当线下引导和线上申请传至系统时,数据模型进行实时运算评分,并进行自动判断。
30.(三)有益效果
31.本发明提供了运营商营业厅场景下风控数据模型的构建及应用方法。具备以下有益效果:
32.(1)该运营商营业厅场景下风控数据模型的构建及应用方法,通过结合实际业务场景,将个人用户在运营商的数据维度引入到风控模型中,将用户的使用特征画像和风险偏好相结合,对于用户的风控评价更加适应于运营商消费分期场景。
33.(2)该运营商营业厅场景下风控数据模型的构建及应用方法,通过将风控要素的采集、风险模型的开发、模型决策的部署、策略应用的体系化等在相关流程各环节中做了调整,让大数据风控技术能够跟业务流程相结合,来自动化配合业务开展。
34.(3)该运营商营业厅场景下风控数据模型的构建及应用方法,通过对传统方法进行了改造和调整,从模型准确度和解释性上做出平衡,并且建立动态监控体系来优化模型,让数据模型在运营商消费分期场景中应用效果得到提升。
附图说明
35.图1为本发明的流程示意图;
36.图2为本发明风控系统、业务系统和资金方系统的原理框图;
37.图3为本发明数据处理单元的系统原理框图;
38.图4为本发明建模优化单元的系统原理框图;
39.图5为本发明评估部署单元的系统原理框图。
40.图中,1、风控系统;2、业务系统;3、资金方系统;4、数据处理单元;5、建模优化单元;6、评估部署单元;7、大数据平台;8、业务定义模块;9、样本抽取模块;10、数据准备模块;11、数据探索模块;12、模型建立模块;13、测试调优模块;14、模型评估模块;15、模型部署模
块。
具体实施方式
41.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
42.请参阅图1-5,本发明实施例提供一种技术方案:运营商营业厅场景下风控数据模型的构建及应用方法,具体包括以下步骤:
43.步骤一、数据处理:大数据平台7通过采集用户在运营商中的使用情况数据,风控系统1按照业务系统2中分期产品的违约情况进行规则定义,利用大数据平台7中的全量样本中,随机抽取出建模样本,在建模样本抽取中,对个人敏感信息进行脱敏处理,根据用户在运营商的使用情况进行数据的加工,从最初原始明细信息记录加工到以用户为单位的属性变量,用以描述用户的稳定性、趋势、偏好和产品偏好,同时对于联系变量进行分段,计算证据权重woe;
44.步骤二、建模:建模优化单元5对步骤一中加工好的数据进行深入探索,了解数据的分布和相互影响关系,找出用以评价客户风险和信用的关键指标,随后引入数据挖掘、评分卡模型和人工智能算法来训练数据模型,整合并选择出准确率最高的数据模型;
45.步骤三、评估部署:通过评估部署单元6验证样本,对模型效能进行评估,了解到不同的模型评分所对应客户的风险和信用状况,制定出合理的审批规则,在决策引擎平台中进行数据模型和审批策略的部署,当线下引导和线上申请传至系统时,数据模型进行实时运算评分,并进行自动判断;
46.步骤四、优化:建模优化单元5处于测试阶段时,对数据模型的效果进行持续评价,如需调整则在调优流程中进行优化迭代;
47.步骤五、业务办理:用户来到运营商营业厅办理业务时,客户经理向客户介绍产品,客户同意办理后,引导客户通过手机应用进入到业务系统2中,开始申请分期产品,申请信息填写完成后,申请信息传输到步骤三中进行评分,如果该评分满足审批条件,会将“通过”返回到手机应用,然后继续办理分期产品,通过资金方系统3进行相应的分期产品派送,如果评分不满足审批条件,会将“拒绝”返回,客户无法继续办理。
48.作为优选方案,如附图2所示,风控系统1分别与业务系统2和资金方系统3对接,并且风控系统1包括数据处理单元4、建模优化单元5、评估部署单元6和大数据平台7,大数据平台7用于采集用户在运营商中的使用情况数据,数据模型搭建通过大数据平台7获取内外部数据源的对接和整合,并依据大数据平台7提供的开发运算能力进行模型训练,并且在业务系统2和资金方系统3之间提供风险判断来辅助业务的开展。
49.作为优选方案,数据处理单元4与建模优化单元5对接,如附图3所示,数据处理单元4包括业务定义模块8、样本抽取模块9和数据准备模块10,业务定义模块8与样本抽取模块9对接,样本抽取模块9与数据准备模块10对接,进一步说明,业务定义模块8用于按照业务系统2中分期产品的违约情况进行规则定义;
50.样本抽取模块9用于从大数据平台7中的全量样本中,随机抽取出建模样本,在建
模样本抽取中,对个人敏感信息进行脱敏处理;
51.数据准备模块10用于根据用户在运营商的使用情况进行数据的加工,从最初原始明细信息记录加工到以用户为单位的属性变量,用以描述用户的稳定性、趋势、偏好和产品偏好,同时对于联系变量进行分段,计算证据权重woe。
52.作为详细说明,在样本抽取阶段,采用了分层分组抽样方法,保证选取的样本具备统计代表性,能够无偏差地反应所有用户人群的特征。
53.作为优选方案,建模优化单元5与评估部署单元6对接,如附图4所示,建模优化单元5包括数据探索模块11、模型建立模块12和测试调优模块13,数据探索模块11与模型建立模块12对接,模型建立模块12与测试调优模块13对接,进一步说明,数据探索模块11用于对数据处理单元4中加工好的数据进行深入探索,了解数据的分布和相互影响关系,找出用以评价客户风险和信用的关键指标;
54.模型建立模块12用于引入数据挖掘、评分卡模型和人工智能算法来训练数据模型,整合并选择出准确率最高的数据模型;
55.测试调优模块13用于数据模型处于测试阶段时,对数据模型的效果进行持续评价,如需调整则在调优流程中进行优化迭代。
56.作为详细说明,数据探索模块11使用卡方检验、t检验、方差分析、相关分析、方差膨胀因子、iv统计方法和统计量来描述数据之间的相互关联及相互影响关系,同时由于数据准备中数据属性较多,采用人工智能算法来对变量进行重要性筛选,包括但不限于决策树、xgboost方法。
57.更进一步的,采用更多的算法来训练模型,提升数据模型精度,模型建立模块12由于适配的是新的业务场景,尝试了多种的数据挖掘和人工智能算法进行模型训练,以找寻最佳模型,包含但不限于金融行业信贷模型开发中常用的逻辑回归、评分卡模型,以及人工智能算法如神经网络、gbdt、catboost,同时进行不同模型的组合,最终挑选出准确率最高的模型供评估部署单元6进行部署应用。
58.具体的,在评分卡模型中,对于建模的目标采用logit变换,log(p/(1-p))=a0 a1*x1 a2*x2
……
an*xn,其中p代表了客户的逾期概率。
59.考虑到业务的线上线下结合的特征,模型结果需要具备可理解性,在计算出概率后,进行分值拉伸处理,让评分值处于300到1000分之间,分值越大表明风险越小,进而由风控专员制定相应的审批阈值,该分值的计算处理让分数更容易理解,同时也是便于后续的模型验证和监控,其计算公式为:
60.odds=log(p_bad/p_good)
61.score=offset factor*log(odds),
62.最终根据场景测算采用的公式为:
63.score=657-95*log(odds);
64.在xgboost中,反复调整训练的超参数,以寻找最佳模型,包括eta收缩步长为0.2,max_depth最大树深为8,并通过nthread=10,silent=0,booster=gbtree参数保证快速训练;
65.在catboost模型中,训练时采用了多种的超参数设置方案,最终找到适合场景的最优模型,如iterations最大树为200,learning_rate学习率为0.01,depth树深为6,one_
hot_max_size编码限制最大类别数为50。
66.作为详细说明,测试调优模块13在数据模型上线测试阶段,对模型的评分、分布、效果、性能等进行同步监测,并将实际上线情况跟建模样本进行比较,当跟预期有偏差时,进行调优迭代。
67.作为优选方案,数据处理单元4、建模优化单元5和评估部署单元6均与大数据平台7对接,如附图5所示,评估部署单元6包括模型评估模块14和模型部署模块15,模型评估模块14与模型部署模块15对接,进一步说明,模型评估模块14用于验证样本,对模型效能进行评估,了解到不同的模型评分所对应客户的风险和信用状况,制定出合理的审批规则;
68.模型部署模块15用于在决策引擎平台中进行数据模型和审批策略的部署,当线下引导和线上申请传至系统时,数据模型进行实时运算评分,并进行自动判断。
69.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献