一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信贷风险评估方法及装置与流程

2022-02-21 09:33:10 来源:中国专利 TAG:


1.本发明涉及人工智能技术领域,尤其涉及一种信贷风险评估方法及装置。


背景技术:

2.本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
3.信贷服务是银行的基础金融服务,用于解决个人和企业资金周转的问题。而传统的信贷业务主要通过银行业务推进,银行依赖人工、基于流程开展风控调查。风控调查的难度大导致了传统的信贷业务审批手续繁琐、信贷门槛高。
4.为了解决传统的信贷业务风控调查难的问题,现有技术中有采用回归预测算法或者采用基于均方误差的组合回归预测方法。
5.每种回归预测算法,都解决了不同的问题,如岭回归算法主要针对回归预测中出现的特征共线性,通过在目标函数中加入惩罚项消除共线性,从而求得目标函数解;支持向量回归,是将原本非线性的样本数据映射至更高维,使样本数据在高维空间可以建立线性回归方程。但是每种方法由于考虑问题角度不同,其预测能力仍然有限;同时,回归预测方法需要大量的数据支撑,而数据量大的同时数据不平衡,样本有效性低的问题也同时存在,这也导致预测结果不够准确。
6.基于均方误差的组合回归预测方法,由于均方误差是二次函数式,当数据存在噪声和异常值时,即客户的信息存在偏差时,会平方化的去影响预测结果。实际收集客户信息的过程中,由于样本量大,维度广,不免会得到有偏差的数据,使用均方误差的组合回归预测方法也难以得到准确度高的预测结果。


技术实现要素:

7.本发明实施例提供一种信贷风险评估方法,用以提升信贷风险评估结果的准确度,该方法包括:
8.获取待评估客户的第一客户信息,所述第一客户信息包括身份属性特征信息、信用属性特征信息、消费属性特征信息及行为属性特征信息;
9.按照特定属性特征从所述第一客户信息中筛选第一特定属性特征信息,所述特定属性特征为与客户信用具有相关性的属性特征;
10.将第一特定属性特征信息输入基于最大相关熵的组合预测模型进行预测,得到待评估客户的信贷风险估值;所述基于最大相关熵的组合预测模型利用最大相关熵组合多种回归算法构建。
11.本发明实施例还提供一种信贷风险评估装置,用以提升信贷风险评估结果的准确度,该装置包括:
12.获取模块,用于获取待评估客户的第一客户信息,所述第一客户信息包括身份属性特征信息、信用属性特征信息及消费属性特征信息;
13.筛选模块,用于按照特定属性特征从所述第一客户信息中筛选第一特定属性特征信息,所述特定属性特征为与客户信用具有相关性的属性特征;
14.预测模块,用于将第一特定属性特征信息输入基于最大相关熵的组合预测模型进行预测,得到待评估客户的信贷风险估值;所述基于最大相关熵的组合预测模型利用最大相关熵组合多种回归算法构建。
15.本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述信贷风险评估方法。
16.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述信贷风险评估方法的计算机程序。
17.本发明实施例中,从贷款调查慢、放款慢的实际问题出发,采用最大相关熵算法作为损失函数,组合多种回归算法构建基于最大相关熵的组合预测模型,抑制噪声和异常数据对于信贷风险评估估值的影响,与现有技术中利用单种回归算法进行信贷风险预测相比,基于最大相关熵的组合预测模型能够提现各种回归算法的优势,并规避单种回归算法预测能力有限、准确度低的问题,提高了算法的鲁棒性。通过基于最大相关熵的组合预测模型及待评估客户的第一特定属性特征信息确定的待评估客户的信贷风险估值,使得信贷风险评估结果的准确度大大提升。
附图说明
18.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
19.图1为本发明实施例中一种信贷风险评估方法的流程图;
20.图2为本发明实施例中一种信贷风险评估方法的另一种流程图;
21.图3为本发明实施例中一种基于最大相关熵的组合预测模型的构建方法流程图;
22.图4(a)为采用均方误差作为损失函数的误差分析示意图;
23.图4(b)为采用最大相关熵作为损失函数的误差分析示意图;
24.图5为本发明实施例中一种信贷风险评估装置的结构示意图;
25.图6为本发明实施例中一种计算机设备的结构示意图。
具体实施方式
26.为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
27.本发明实施例提供了一种信贷风险评估方法,如图1所示,该方法包括步骤101至步骤103:
28.步骤101、获取待评估客户的第一客户信息。
29.其中,第一客户信息包括身份属性特征信息、信用属性特征信息、消费属性特征信
息及行为属性特征信息。
30.身份属性特征信息,包括真实身份信息(姓名、身份证号等)、学历、职业、就业经历、人际关系等信息;信用属性特征信息,包括固定资产、流动资产、收入等信息,反映客户偿还能力和偿还意愿;消费属性特征信息,包括电商交易金额、交易时间、交易频率等信息,反映客户的消费档次和稳定性;行为属性特征信息,包括位置、通话等信息,反映客户的行为特点。
31.需要说明的是,考虑到对于客户的隐私保护,本技术实施例中所获取的第一客户信息、第二客户信息等均是经过客户授权使用的客户信息。
32.步骤102、按照特定属性特征从第一客户信息中筛选第一特定属性特征信息。
33.其中,特定属性特征为与客户信用具有相关性的属性特征。
34.需要说明的是,属性特征为客户信息中包含的信息类型,比如说,身份属性信息中包括真实身份信息、学历、职业、就业经历等,真实身份信息、学历、职业、就业经历分别为一项属性特征。
35.属性特征多种多样,其中一些属性特征与客户信贷风险评估几乎不具备相关性,而一些属性特征与客户信贷风险评估具有较大相关性。比如,各个客户的姓名、身份证号各不相同,无法根据该信息进行客户信贷风险评估,因此,真是身份信息被确定为与客户信用不具有相关性的属性特征;而客户的固定资产、流动资产等代表了客户的偿还能力,与客户的信贷风险评级密切相关,因此,将固定资产、流动资产等属性特征作为与客户信用具有相关性的属性特征。
36.在按照特定属性特征从第一客户信息中筛选第一特定属性特征信息之前,需要先进行特定属性特征的筛选。具体的,如图2所示,在执行步骤102之前,还执行如下所示的步骤201和步骤202:
37.步骤201、获取已评估客户的第二客户信息,将每个已评估客户的第二客户信息作为一组样本数据。
38.其中,第二客户信息中包括已评估客户的信贷风险实际值;
39.步骤202、对所有样本数据采用皮尔逊方法进行相关性分析,根据相关性分析结果从所有属性特征中筛选特定属性特征。
40.信贷风险实际值是已经通过人工调查判断等方式得到的对于客户的信贷风险评估结果。信贷风险评估结果(包括已评估客户的信贷风险实际值、信贷风险预测值,以及待评估客户的信贷风险估值)可以是分值或等级等形式,比如说,总分为10分,客户的信贷风险评估结果可以为1分至10分之间的任意分值;或者总共划分为5个等级,1级为信贷风险极高,2级为信贷风险偏高,3级为信贷风险中等,4级为信贷风险偏低,5级为信贷风险极低等,客户的信贷风险评估结果为1至5这5个等级中的任意一个等级。
41.皮尔逊(pearson)方法中的皮尔逊相关系数,用于度量两个变量x和y之间的相关(线性相关),其值介于-1与1之间。本发明实施例中,将属性特征信息作为变量x,信贷风险实际值作为变量y,确定两变量的皮尔逊相关系数,当得到的皮尔逊相关系数大于预设阈值时,确定两变量具有相关性。其中,预设阈值可以进行人为设定。
42.本发明实施例中,采用皮尔逊相关系数计算样本数据中属性特征与真值(即已评估客户的信贷风险实际值)的相关性,进行特定属性特征的筛选,筛除相关性低的属性特
征,可以提高回归算法模型对信贷风险评估的准确性。
43.步骤103、将第一特定属性特征信息输入基于最大相关熵的组合预测模型进行预测,得到待评估客户的信贷风险估值。
44.其中,基于最大相关熵的组合预测模型利用最大相关熵组合多种回归算法构建。
45.具体的,如图3所示,基于最大相关熵的组合预测模型根据如下步骤301至步骤304构建:
46.步骤301、根据特定属性特征从第二客户信息中筛选第二特定属性特征信息;
47.步骤302、基于第二特定属性特征信息,分别采用每种回归算法对每个已评估客户的信贷风险预测值;
48.步骤303、将每个已评估客户的信贷风险预测值及信贷风险实际值输入最大相关熵算法模型进行训练,得到每种回归算法的权重系数;
49.步骤304、利用每种回归算法的权重系数组合多种回归算法,得到基于最大相关熵的组合预测模型。
50.本发明实施例中,基于最大相关熵的组合预测模型中组合的回归算法包括岭回归算法、lasso回归算法和/或支持向量回归方法。
51.最大相关熵算法模型组合多种回归算法的最大目的是组合多种回归算法各自的优势,使多种回归算法组合后得到的每个客户的信贷风险预测值更加接近其信贷风险实际值。
52.通过最大相关熵算法,可以得到每种回归算法的权重系统,比如说,以a、b、c表示岭回归算法、lasso回归算法和支持向量回归方法得到的信贷风险预测值,通过最大相关熵算法得到的三种回归算法的权重系数分别为0.1、0.3、0.6,则得到的基于最大相关熵的组合预测模型为0.1a 0.3b 0.6c。在对待评估客户进行信贷风险预测时,先分别采用每种回归算法及司仪特定属性特征信息计算每种回归算法的与猜测值,将每种回归算法的预测值代入基于最大相关熵的组合预测模型0.1a 0.3b 0.6c,得到待评估客户的信贷风险估值。
53.需要说明的是,上述三种回归算法中,最少组合其中任意两种回归算法,也可组合该三种回归算法,除了上述三种回归算法之外的其他回归算法,也可以组合构建该基于最大相关熵的组合预测模型。
54.本发明实施例充分调研经典的回归预测算法与组合预测算法,一方面采用多个单回归算法从不同的角度去考虑样本数据的特征以及特征的重要性,另一方面,利用多种回归方法互相补充,从组合预测的角度出发,改变传统组合预测以均方误差作为损失函数,取而代之以最大相关熵作为组合预测的损失函数,抑制噪声和异常值对于预测结果的影响。
55.为了使最大相关熵作为损失函数组合回归算法的效果更加清楚的表示,本发明实施例中提供了将均方误差作为损失函数的误差分析图及将最大相关熵作为损失函数的误差分析图,分别如图4(a)及图4(b)所示。参见图4(a),当两点之间绝对值距离在0到1之间时,采用二范数度量距离即平方化之后则趋于0,当两点之间的绝对值距离越大时,则结果会被二次方放大。然而,数据集存在的噪声和异常值会“偏离”数据,基于二范数进行距离度量会被二次方放大,因此,噪声和异常值会影响配准的精确度。参见图4(b),当x=y时,z值最大,而当x与y的差值较大时,z趋于0,因此,其可以降低噪声和异常值的干扰,提高贷款评级预测精确度。
56.本发明实施例中,从贷款调查慢、放款慢的实际问题出发,采用最大相关熵算法作为损失函数,组合多种回归算法构建基于最大相关熵的组合预测模型,抑制噪声和异常数据对于信贷风险评估估值的影响,与现有技术中利用单种回归算法进行信贷风险预测相比,基于最大相关熵的组合预测模型能够提现各种回归算法的优势,并规避单种回归算法预测能力有限、准确度低的问题,提高了算法的鲁棒性。通过基于最大相关熵的组合预测模型及待评估客户的第一特定属性特征信息确定的待评估客户的信贷风险估值,使得信贷风险评估结果的准确度大大提升。
57.本发明实施例中还提供了一种信贷风险评估装置,如下面的实施例所述。由于该装置解决问题的原理与信贷风险评估方法相似,因此该装置的实施可以参见信贷风险评估方法的实施,重复之处不再赘述。
58.如图5所示,该装置500包括获取模块501、筛选模块502和预测模块503。
59.其中,获取模块501,用于获取待评估客户的第一客户信息,第一客户信息包括身份属性特征信息、信用属性特征信息、消费属性特征信息及行为属性特征信息;
60.筛选模块502,用于按照特定属性特征从第一客户信息中筛选第一特定属性特征信息,特定属性特征为与客户信用具有相关性的属性特征;
61.预测模块503,用于将第一特定属性特征信息输入基于最大相关熵的组合预测模型进行预测,得到待评估客户的信贷风险估值;基于最大相关熵的组合预测模型利用最大相关熵组合多种回归算法构建。
62.在本发明实施例的一种实现方式中,
63.获取模块,还用于获取已评估客户的第二客户信息,将每个已评估客户的第二客户信息作为一组样本数据,第二客户信息中包括已评估客户的信贷风险实际值;
64.相关性分析模块,用于对所有样本数据采用皮尔逊方法进行相关性分析,根据相关性分析结果从所有属性特征中筛选特定属性特征。
65.在本发明实施例的一种实现方式中,
66.筛选模块,还用于根据特定属性特征从第二客户信息中筛选第二特定属性特征信息;
67.回归预测模块,用于基于第二特定属性特征信息,分别采用每种回归算法对每个已评估客户的信贷风险预测值;
68.模型训练模块,用于将每个已评估客户的信贷风险预测值及信贷风险实际值输入最大相关熵算法模型进行训练,得到每种回归算法的权重系数;
69.模型构建模块,用于利用每种回归算法的权重系数组合多种回归算法,得到基于最大相关熵的组合预测模型。
70.在本发明实施例的一种实现方式中,基于最大相关熵的组合预测模型中组合的回归算法包括岭回归算法、lasso回归算法和/或支持向量回归算法。
71.本发明实施例中,从贷款调查慢、放款慢的实际问题出发,采用最大相关熵算法作为损失函数,组合多种回归算法构建基于最大相关熵的组合预测模型,抑制噪声和异常数据对于信贷风险评估估值的影响,与现有技术中利用单种回归算法进行信贷风险预测相比,基于最大相关熵的组合预测模型能够提现各种回归算法的优势,并规避单种回归算法预测能力有限、准确度低的问题,提高了算法的鲁棒性。通过基于最大相关熵的组合预测模
型及待评估客户的第一特定属性特征信息确定的待评估客户的信贷风险估值,使得信贷风险评估结果的准确度大大提升。
72.本发明实施例还提供一种计算机设备,图6为本发明实施例中计算机设备的示意图,该计算机设备能够实现上述实施例中的信贷风险评估方法中全部步骤,该计算机设备具体包括如下内容:
73.处理器(processor)601、存储器(memory)602、通信接口(communications interface)603和通信总线604;
74.其中,所述处理器601、存储器602、通信接口603通过所述通信总线604完成相互间的通信;所述通信接口603用于实现相关设备之间的信息传输;
75.所述处理器601用于调用所述存储器602中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的信贷风险评估方法。
76.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述信贷风险评估方法的计算机程序。
77.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
78.本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
79.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
80.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
81.以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献