一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用户授信额度的确定方法及装置与流程

2021-11-20 02:34:00 来源:中国专利 TAG:


1.本发明涉及信息处理技术领域,具体涉及一种用户授信额度的确定方法及装置。


背景技术:

2.额度管理属于金融领域的市场风险管理(主要是指银行/借贷机构)。为了确保将所承担的市场风险控制在可以承受的合理范围内,使市场风险水平与其风险管理能力和资本实力相匹配,科学的额度管理正是对市场风险进行控制的一项重要手段。
3.额度管理的意义包括:
4.(1)短期意义:随时控制客户应收帐款的回收,对出现的问题及时处理。在出现客户无法偿还款项时,应当要求其提供担保,减少坏帐损失的风险。
5.(2)长期意义:有效提升客户的质量。对资信状况良好的客户给予超过平均水平的信用额度和信用期。而对于资信状况较差的客户,则给予较小的信用额度和较短的信用期。长此以往,最终会拥有一个稳定守信的客户群,坏账风险将管控在一定范围内。
6.目前大部分金融机构(如银行)在确定授信额度时,主要是通过规则判断的方式给予相应的额度,比如利用客户在申请时所填的一些基本信息,如年龄、学历、工作信息等,通过人工方式或规则匹配的方式进行额度匹配。一方面用户所填信息的正确性无法保证,另一方面通过规则判断后额度会比较集中,很多客户可能给予相同的额度,没有做到差异化额度管理,导致有些客户额度给高了,却没有使用,有些客户额度给低了,却仍有消费需求。
7.现有技术依靠人工或规则判断的方式,通常存在着授信流程效率较低的问题。另外,现阶段大部分银行和金融机构的额度确定依赖信息较为有限,主要包括客户的财产信息,年龄,学历,工作,所在城市经济发展水平,他行使用额度等。可以看出,现有技术的判断方法较为主观,一般根据专家经验对客户的已知数据做规则判断。


技术实现要素:

8.本发明的至少一个实施例提供了一种用户授信额度的确定方法及装置,可以提高授信流程的处理效率。
9.根据本发明的一个方面,至少一个实施例提供了一种用户授信额度的确定方法,包括:
10.将目标用户的负债的预测变量输入用户负债模型得到所述目标用户的负债预测值;
11.将目标用户的收入的预测变量输入用户收入模型得到所述目标用户的收入预测值;
12.根据所述目标用户的负债预测值和收入预测值,计算得到所述目标用户的负债收入比;
13.根据所述目标用户的负债收入比,确定所述目标用户的授信额度。
14.根据本发明的至少一个实施例,根据所述目标用户的负债预测值和收入预测值,
计算得到所述目标用户的负债收入比的步骤,包括:
15.计算所述目标用户的负债预测值和收入预测值的比值,得到所述目标用户的负债收入比。
16.根据本发明的至少一个实施例,所述用户收入模型利用用户收入样本数据训练得到,具体包括:
17.根据存量用户的公积金记录、社保缴纳记录、税收缴纳记录中的任一项或多项,计算所述存量用户的收入值,作为用户收入的第一目标变量;
18.从用户信息数据库中提取所述存量用户的用户属性信息,或从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息,生成对应的特征变量,作为用户收入的第一预测变量;
19.根据所述第一目标变量和所述第一预测变量构成的第一样本数据,对预先构建的用户收入模型进行训练,得到所述用户收入模型,其中,所述预先构建的用户收入模型为基于回归预测算法的回归预测模型、决策树模型、xgboost 模型或神经网络模型中的一种或多种融合的模型;
20.其中,所述用户属性信息包括类别变量和数值变量,所述类别变量对应的特征变量是对类别变量进行数值化处理后得到的连续型特征变量。
21.根据本发明的至少一个实施例,所述用户负债模型利用用户负债样本数据训练得到,具体包括:
22.基于存量用户的征信报告中所包含的存量用户的负债数据,生成所述存量用户的用户负债的第二目标变量;
23.根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量,或根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和从用户信息数据库中提取所述存量用户的用户属性信息所对应的特征变量,或根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息所对应的特征变量,作为所述存量用户的用户负债的第二预测变量;
24.根据所述第二目标变量和所述第二预测变量构成的第二样本数据,对预先构建的用户负债模型进行训练,其中,所述预先构建的用户负债模型为回归预测模型、决策树回归模型、xgboost模型或神经网络模型中的一种或多种融合的模型。
25.根据本发明的至少一个实施例,所述根据所述目标用户的负债收入比,确定所述目标用户的授信额度的步骤,包括:
26.确定所述目标用户的负债收入比所在的目标数值区间,根据预先设定的数值区间与风险等级的对应关系,将所述目标数值区间对应的目标风险等级,作为所述目标用户的风险等级;
27.根据所述目标用户的风险等级,确定所述目标用户的授信额度,其中,高风险等级对应于低授信额度。
28.根据本发明的至少一个实施例,所述目标用户的负债的预测变量包括:根据所述目标用户的借贷交易的历史数据生成包括借贷金额类、借贷时间类和借贷次数类的特征变
量,或根据所述目标用户的借贷交易的历史数据生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和目标用户的属性信息所对应的特征变量;
29.所述目标用户的收入的预测变量包括:所述目标用户的用户属性信息所对应的特征变量,或所述目标用户的用户属性信息和用户行为信息所对应的特征变量。根据本发明的另一方面,还提供了一种用户授信额度的确定装置,包括:
30.负债获取模块,用于将目标用户的负债的预测变量输入用户负债模型得到所述目标用户的负债预测值;
31.收入获取模块,用于将目标用户的收入的预测变量输入用户收入模型得到所述目标用户的收入预测值;
32.比值获取模块,用于根据所述目标用户的负债预测值和收入预测值,计算得到所述目标用户的负债收入比;
33.授信额度确定模块,用于根据所述目标用户的负债收入比,确定所述目标用户的授信额度。
34.根据本发明的至少一个实施例,所述负债收入比计算模块,还用于计算所述目标用户的负债预测值和收入预测值的比值,得到所述目标用户的负债收入比。
35.根据本发明的至少一个实施例,所述装置还包括:
36.第一训练模块,用于:
37.根据存量用户的公积金记录、社保缴纳记录、税收缴纳记录中的任一项或多项,计算所述存量用户的收入值,作为用户收入的第一目标变量;
38.从用户信息数据库中提取所述存量用户的用户属性信息,或从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息,生成对应的特征变量,作为用户收入的第一预测变量,其中,所述用户属性信息包括类别变量和数值变量,所述类别变量对应的特征变量是对类别变量进行数值化处理后所得到的连续型特征变量;
39.根据所述第一目标变量和所述第一预测变量构成的第一样本数据,对预先构建的用户收入模型进行训练,得到所述用户收入模型,其中,所述预先构建的用户收入模型为基于回归预测算法的回归预测模型、决策树模型、xgboost 模型或神经网络模型中的一种或多种融合的模型。
40.根据本发明的至少一个实施例,所述装置还包括:
41.第二训练模块,用于:
42.基于存量用户的征信报告中所包含的存量用户的负债数据,生成所述存量用户的用户负债的第二目标变量;
43.根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量,或根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和从用户信息数据库中提取所述存量用户的用户属性信息所对应的特征变量,或根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息所对应的特征变量,作为所述存量用户的用户负债的第二预测变量;
44.根据所述第二目标变量和所述第二预测变量构成的第二样本数据,对预先构建的
用户负债模型进行训练,其中,所述预先构建的用户负债模型为回归预测模型、决策树回归模型、xgboost模型或神经网络模型中的一种或多种融合的模型。
45.根据本发明的至少一个实施例,所述授信额度确定模块,还用于确定所述目标用户的负债收入比所在的目标数值区间,根据预先设定的数值区间与风险等级的对应关系,将所述目标数值区间对应的目标风险等级,作为所述目标用户的风险等级;根据所述目标用户的风险等级,确定所述目标用户的授信额度,其中,高风险等级对应于低授信额度。
46.根据本发明的另一方面,还提供了一种处理设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上所述的方法的步骤。
47.根据本发明的另一方面,至少一个实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有程序,所述程序被处理器执行时,实现如上所述的方法的步骤。
48.与现有技术相比,本发明实施例提供的用户授信额度的确定方法及装置,本发明实施例利用预先构建好的用户收入和负债模型计算用户的负债收入比,相比于现有技术人工进行规则匹配的处理方式,本发明实施例的模型易于部署,可以大大提高授信流程的处理效率,减少人力成本。另外,本发明实施例利用较为准确的收入和负债信息作为模型目标变量,将变量信息输入预先构建的机器学习模型,预测结果更加准确。另外,本发明实施例综合利用了客户的收入水平和负债水平,对客户的偿还能力进行了量化,对不同负债收入比档位的客户授予不同的授信额度,授信方式更加科学。
附图说明
49.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
50.图1为本发明实施例的用户授信额度的确定方法的一种流程图;
51.图2为本发明实施例的用户授信额度的确定方法的另一种流程图;
52.图3为本发明实施例的用户授信额度的确定装置的一种结构示意图;
53.图4为本发明实施例的用户授信额度的确定装置的另一结构示意图。
具体实施方式
54.下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
55.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些
步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。说明书以及权利要求中“和/或”表示所连接对象的至少其中之一。
56.以下描述提供示例而并非限定权利要求中阐述的范围、适用性或者配置。可以对所讨论的要素的功能和布置作出改变而不会脱离本公开的精神和范围。各种示例可恰适地省略、替代、或添加各种规程或组件。例如,可以按不同于所描述的次序来执行所描述的方法,并且可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
57.如背景技术所述的,现有技术的授信额度确定流程通常存在着处理效率低下,且难以实现差异化的额度管理等问题,为解决以上问题中的至少一种,本发明实施例提供了一种用户授信额度的确定方法,可以提高授信额度确定流程的处理效率,并提高用户额度与用户实际情况的匹配程度,实现差异化的额度管理。
58.为了帮助理解本发明实施例的方案,下面对本发明实施例可能涉及的概念进行简单说明。
59.负债收入比:个人负债占月收入的比例就是个人负债收入比。例如,某个用户月收入是1万元的情况下,每个月有3000元的房贷要还,且信用卡账单有2000元,那么其负债收入比就是50%。
60.授信额度:授信额度是指银行类、非银行类贷款机构根据客户的信用情况和资质情况等,给予客户可以使用的授信额度。
61.请参照图1,本发明实施例提供的一种用户授信额度的确定方法,包括:
62.步骤11,将目标用户的负债的预测变量输入用户负债模型得到所述目标用户的负债预测值。
63.这里,所述用户负债模型是利用用户负债样本数据训练得到的,所述用户负债样本数据包括多个用户负债的目标变量和预测变量。
64.负债的目标变量可以看作y,负债的预测变量则为x,y=f(x)。也就是说,本发明实施例中的用户负债模型反映了从负债的预测变量到负债的目标变量的函数关系。具体的,所述用户负债模型为基于回归预测算法的回归预测模型、决策树模型、xgboost模型或神经网络模型中的一种或多种融合的模型。
65.在需要确定某个用户(为了便于描述,称之为目标用户)的授信额度的情况下,本发明实施例利用预先训练得到的用户负债模型,计算目标用户的负债预测值。
66.在使用上述模型计算负债预测值时,将目标用户的负债的预测变量输入至用户负债模型,从而获得用户负债模型输出的目标用户的负债的目标变量,作为目标用户的负债预测值。通常,目标用户的负债的预测变量,与该用户负债模型输出的负债的目标变量不是相同维度的数据。例如,步骤11中的目标用户的负债的预测变量的维度通常是多维特征向量,该向量的生成方式和具体维度,与训练该用户负债模型的样本数据中的预测变量的生成方式及维度相同。而负债的目标变量是直接指示用户负债的数值,通常为一维数据。
67.在将目标用户的负债的预测变量输入用户负债模型之前,需要生成目标用户的负债的预测变量,生成方式与该用户负债模型的样本数据中的预测变量的生成方式相同。具体的,可以根据所述目标用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量,或根据所述目标用户的借贷交易的历史数据生成包括借贷金额
类、借贷时间类和借贷次数类的特征变量和目标用户的属性信息所对应的特征变量;构建所述目标用户的负债的预测变量。其中,所述借贷金额类的特征变量为表示借贷金额大小的变量,具体可以包括贷款总金额、最大授信额度、贷款余额等。所述借贷时间类的特征变量为表示与借贷时间相关的变量,具体可以包括借贷行为发生日期、最近一次贷款距离当前日期的天数,逾期还款的最大逾期天数等。所述借贷次数类为指示用户曾经发生的借贷次数的变量,具体可以包括用户曾经发生的借贷总次数、用户已经结清的借贷的次数以及用户尚未结清的借贷的次数等等。其中,所述用户属性信息通常可以包括数值变量和类别变量,其中,数值变量是指取值为数值的变量,除数值变量以外的其他变量均可以作为类别变量。例如,数值变量可以包括年龄、工龄、财产数量(如自有车辆的数量,自有住房的数量、存款金额等)等,类别变量则可以包括性别(男、女或空值)、婚姻状况(已婚、未婚、离婚、丧偶或未知)、学历(研究生、大学本科、大专、高中、初中等),还有所在行政区域(如省份)、居住情况、职位情况等等。另外,类别变量通常无法直接使用,在本发明实施例中可以采用独热编码(one-hot)的方式对类别变量进行数值化处理,比如对于性别,将男记为1,女记为0,构造出数值型变量特征。其中所述用户的行为信息可以是用户的消费行为记录。用户的消费行为记录包括用户消费的金额、频次、以及具体消费行为的类别。
68.步骤12,将目标用户的收入的预测变量输入用户收入模型得到所述目标用户的收入预测值。
69.这里,所述用户收入模型是利用用户收入样本数据训练得到的,所述用户收入样本数据包括多个用户收入的目标变量和预测变量。
70.类似的,收入的目标变量可以看作y,收入的预测变量则为x,y=f(x)。也就是说,本发明实施例中的用户收入模型反映了从收入的预测变量到收入的目标变量的函数关系。具体的,所述用户收入模型为基于回归预测算法的回归预测模型、决策树模型、xgboost模型或神经网络模型中的一种或多种融合的模型。
71.在需要确定某个用户(为了便于描述,称之为目标用户)的授信额度的情况下,本发明实施例利用预先训练得到的用户收入模型,计算目标用户的收入预测值。
72.在使用上述模型计算收入预测值时,将目标用户的收入的预测变量输入至用户收入模型,从而获得用户收入模型输出的目标用户的收入的目标变量,作为目标用户的收入预测值。通常,目标用户的收入的预测变量,与该用户收入模型输出的收入的目标变量不是相同维度的数据。例如,步骤12中的目标用户的收入的预测变量的维度通常是多维特征向量,该向量的生成方式和具体维度,与训练该用户收入模型的样本数据中的预测变量的生成方式及维度相同。而收入的目标变量是直接指示用户收入的数值,通常为一维数据。
73.在将目标用户的收入的预测变量输入用户收入模型之前,需要生成目标用户的收入的预测变量,生成方式与该用户收入模型的样本数据中的预测变量的生成方式相同。具体的,可以从用户信息数据库中提取所述目标用户的用户属性信息,或从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息,生成对应的特征变量,作为目标用户的负债的预测变量,其中,所述用户属性信息通常可以包括数值变量和类别变量,其中,数值变量是指取值为数值的变量,除数值变量以外的其他变量均可以作为类别变量。例如,数值变量可以包括年龄、工龄、财产数量(如自有车辆的数量,自有住房的数量、存款金额等)等,类别变量则可以包括性别(男、女或空值)、婚姻状况(已婚、未婚、离婚、丧偶或未
知)、学历(研究生、大学本科、大专、高中、初中等),还有所在行政区域(如省份)、居住情况、职位情况等等。另外,类别变量通常无法直接使用,在本发明实施例中可以采用独热编码(one-hot)的方式对类别变量进行数值化处理,比如对于性别,将男记为1,女记为0,构造出数值型变量特征。其中所述用户的行为信息可以是用户的消费行为记录。用户的消费行为记录包括用户消费的金额、频次、以及具体消费行为的类别。
74.步骤13,根据所述目标用户的负债预测值和收入预测值,计算得到所述目标用户的负债收入比。
75.这里,可以通过计算负债预测值和收入预测值的比值,得到目标用户的负债收入比。
76.步骤14,根据所述目标用户的负债收入比,确定所述目标用户的授信额度。
77.这里,本发明实施例可以预先设定负债收入比所在的数值区间与风险等级之间的对应关系,通常,数值区间内的数值越大,该数值区间对应的风险等级也越高。然后,在步骤14中,可以确定所述目标用户的负债收入比所在的目标数值区间,这样可以根据所述对应关系,将所述目标数值区间对应的目标风险等级,作为所述目标用户的风险等级。然后,根据所述目标用户的风险等级,确定所述目标用户的授信额度,其中,高风险等级对应于低授信额度。例如,在第一风险等级的风险高于第二风险等级的情况下,所述第一风险等级对应的第一授信额度,低于第二风险等级对应的第二授信额度。
78.通过以上步骤,本发明实施例实现了对用户收入和用户负债的建模处理,利用建立好的模型可以预测得到目标用户的收入和负债,进而计算得到负债收入比。相比于现有技术的人工判断规则匹配的方式,本发明实施例可以提高授信额度的流程处理效率。另外,本发明实施例在建模过程中,可以引入多种预测变量的特征,从而能够更好的反映出用户的真实情况,进而为用户分配更为合理的授信额度,在降低金融风险的同时可以提高额度的使用率。
79.本发明实施例在上述步骤11之前,需要利用用户收入样本数据,训练得到用户收入模型;以及,利用用户负债样本数据,训练得到用户负债模型。
80.具体的,在训练所述用户收入模型时:
81.本发明实施例可以根据存量用户的公积金记录、社保缴纳记录、税收缴纳记录中的任一项或多项,计算所述存量用户的收入值,作为用户收入的第一目标变量;从用户信息数据库中提取所述存量用户的用户属性信息,,或从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息,生成对应的特征变量,作为用户收入的第一预测变量,其中,所述用户属性信息包括类别变量和数值变量,所述类别变量对应的特征变量是对类别变量分别进行数值化处理后所得到的连续型数值变量。所述用户的行为信息可以是用户的消费行为记录。用户的消费行为记录包括用户消费的金额、频次、以及具体消费行为的类别。所述公积金记录可以从第三方机构处获取。
82.然后,根据所述第一目标变量和所述第一预测变量构成的第一样本数据,对预先构建的用户收入模型进行训练,得到所述用户收入模型。
83.在训练所述用户负债模型时:本发明实施例可以基于存量用户的征信报告中所包含的存量用户的负债数据,生成所述存量用户的用户负债的第二目标变量;根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量,
或根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和从用户信息数据库中提取所述存量用户的用户属性信息所对应的特征变量,或根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息所对应的特征变量,作为所述存量用户的用户负债的第二预测变量;这里,所述征信报告可以从第三方机构处获取。
84.然后,根据包括多个存量用户所述第二目标变量和所述第二预测变量构成的第二样本数据,对预先构建的用户负债模型进行训练,得到所述用户负债模型。
85.在本实施例中,首先是目标人群的确定,即找到有收入和负债数据的用户。这里,本发明实施例从存量客户中筛选出有央行征信记录并且有公积金缴纳的用户,根据用户的公积金缴纳情况以及公积金在用户月收入的占比,计算出用户的月收入,作为用户收入模型的目标变量值。而用户的负债情况,可以从征信报告中包含的贷款、贷记卡和准贷记卡交易信息,计算并输出用户的月负债,作为用户负债模型的目标变量值。
86.接着,找到与目标变量相关的预测变量。其中:
87.对于用户收入模型,可以利用用户属性信息,构建所述用户属性信息对应的特征变量,作为用户收入模型的预测变量。所述用户属性信息可以包括用户基本属性、工作信息,其他借贷机构信用额度等中的一种或多种。其中,所述用户基本属性可以包括性别(男、女或空值)、年龄、籍贯、居住情况、婚姻状况(已婚、未婚、离婚、丧偶或未知)、学历(研究生、大学本科、大专、高中、初中等)等中的至少一种,所述工作信息可以包括工作单位名称、工作地、行业类别、工龄以及职位等中的至少一种。
88.对于用户负债模型,可以利用用户的各类多头信息、借贷交易的历史数据等构建对应的特征变量,作为用户负债模型的预测变量。当然,这里还可以利用所述用户基本属性来构建对应的特征变量,作为用户负债模型的预测变量。
89.在特征变量构建阶段,构建特征变量的相关信息(如用户属性信息、多头信息以及借贷交易的历史数据等)可以分成两大类:类别变量和数值变量,针对不同类型的变量分别衍生特征。
90.例如,对于用户收入模型,用户在申请贷款时填写的一些用户属性信息,如性别(男、女或空值)、婚姻状况(已婚、未婚、离婚、丧偶或未知)、学历 (研究生、大学本科、大专、高中、初中等),还有所在行政区域(如省份)、居住情况、职位情况等等。这些信息多为类别变量,通常无法直接使用,在本发明实施例中可以采用独热编码(one-hot)的方式对上述变量进行数值化处理,比如对于性别,将男记为1,女记为0,构造出连续型特征。
91.又例如,对于用户负债模型,本发明实施例还可以利用借贷交易的历史数据(如用户的贷款信息,贷款人的交易明细数据)进行衍生,衍生出几大类的特征,如金额类、次数类和时间类等。对于金额类,可以构造出贷款总金额、最大授信额度和贷款余额等特征;对于次数类,可以构造出贷款机构总数、账户数和贷款逾期笔数等特征;对于时间类,可以构造出最近一次的贷款日期距当前日期的天数、逾期天数等特征。本发明实施例可以从贷款人的申请信息和贷款信息中衍生出用户不同维度的特征。
92.另外,还可以利用外部数据源信息,根据用户的历史信息,预估出通过率,并预估授信额度,再根据客户的查询次数,估算出客户的负债水平。
93.在其他实施例中,也可以根据存量用户的公积金记录、社保缴纳记录、税收缴纳记录中的任一项或多项,计算所述存量用户的收入值,作为用户收入的目标变量值。也可以从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息,生成对应的特征变量,作为用户收入模型的第一预测变量。
94.在其他实施例中,也可以根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和从用户信息数据库中提取所述存量用户的用户属性信息所对应的特征变量,或根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息所对应的特征变量,作为所述存量用户的用户负债的预测变量。特征准备好以后,可以采用各种回归预测算法、决策树回归、xgboost模型和神经网络等算法等,分别构建用户收入和用户负债模型。
95.请参照图2,本发明另一实施例提供的用户授信额度的确定方法的流程,主要包括:提取目标用户的用户属性信息,生成目标用户的特征变量作为目标用户的收入的预测变量(步骤21),然后输入用户收入模型(步骤22),获得用户收入模型输出的收入预测值(步骤23),提取目标用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量作为目标用户的负债的预测变量(步骤24),然后输入用户负债模型(步骤25),获得用户负债模型输出的负债预测值(步骤26);然后,根据目标用户的负债预测值和收入预测值,计算该用户的负债收入比(步骤27),最后根据授信策略给出用户的授信额度。具体的:
96.利用目标用户属性信息,构建目标用户属性信息对应的特征变量,作为用户收入模型的预测变量。目标用户属性信息可以包括目标用户基本属性、工作信息,其他借贷机构信用额度等中的一种或多种。其中,目标用户基本属性可以包括性别(男、女或空值)、年龄、籍贯、居住情况、婚姻状况(已婚、未婚、离婚、丧偶或未知)、学历(研究生、大学本科、大专、高中、初中等) 等中的至少一种,所述工作信息可以包括工作单位名称、工作地、行业类别、工龄以及职位等中的至少一种。
97.利用目标用户的各类多头信息、借贷交易的历史数据等构建对应的特征变量,作为用户负债模型的预测变量。当然,这里还可以利用所述目标用户基本属性来构建对应的特征变量,作为用户负债模型的预测变量。
98.本实施例中,将目标用户的收入的预测变量输入用户收入模型,将目标用户的负债的预测变量输入用户负债模型,输出目标用户的收入预测值和负债预测值,并计算目标用户的负债收入比。然后,根据相应的授信策略,进行目标用户分档,给出目标用户的授信额度。
99.本发明又一实施例提供的用户授信额度的确定方法应用于信贷授信额度评估场景,其中收入和负债模型的训练方法为:
100.首先是目标人群的确定,即找到有收入和负债数据的用户,从某个公司的存量客户(也可以称作用户)中筛选出有央行征信记录并且有公积金缴纳的用户,根据用户的公积金缴纳情况以及公积金在用户月收入的占比,计算出用户的月收入,作为用户收入模型的目标变量值。而用户的负债情况,可以从征信报告中包含的贷款、贷记卡和准贷记卡交易信息,计算并输出用户的月负债,作为用户负债模型的目标变量值。
101.接着,找到与目标变量相关的预测变量。其中:
102.对于用户收入模型,可以利用用户属性信息,构建所述用户属性信息对应的特征变量,作为用户收入模型的预测变量。所述用户属性信息可以包括用户基本属性、工作信息,其他借贷机构信用额度等中的一种或多种。其中,所述用户基本属性可以包括性别(男、女或空值)、年龄、籍贯、居住情况、婚姻状况(已婚、未婚、离婚、丧偶或未知)、学历(研究生、大学本科、大专、高中、初中等)等中的至少一种,所述工作信息可以包括工作单位名称、工作地、行业类别、工龄以及职位等中的至少一种。
103.对于用户负债模型,可以利用用户的各类多头信息、借贷交易的历史数据等构建对应的特征变量,作为用户负债模型的预测变量。当然,这里还可以利用所述用户基本属性来构建对应的特征变量,作为用户负债模型的预测变量。
104.在特征变量构建阶段,构建特征变量的相关信息(如用户属性信息、多头信息以及借贷交易的历史数据等)可以分成两大类:类别变量和数值变量,针对不同类型的变量分别衍生特征。
105.例如,对于用户收入模型,用户在申请贷款时填写的一些用户属性信息,如性别(男、女或空值)、婚姻状况(已婚、未婚、离婚、丧偶或未知)、学历(研究生、大学本科、大专、高中、初中等),还有所在行政区域(如省份)、居住情况、职位情况等等。这些信息多为类别变量,通常无法直接使用,在本发明实施例中可以采用独热编码(one-hot)的方式对上述变量进行数值化处理,比如对于性别,将男记为1,女记为0,构造出连续型特征。
106.又例如,对于用户负债模型,本发明实施例还可以利用借贷交易的历史数据(如用户的贷款信息,贷款人的交易明细数据)进行衍生,衍生出几大类的特征,如金额类、次数类和时间类等。对于金额类,可以构造出贷款总金额、最大授信额度和贷款余额等特征;对于次数类,可以构造出贷款机构总数、账户数和贷款逾期笔数等特征;对于时间类,可以构造出最近一次的贷款日期距当前日期的天数、逾期天数等特征。本发明实施例可以从贷款人的申请信息和贷款信息中衍生出用户不同维度的特征。作为一个示例,本发明实施例可共衍生出多达149个特征。
107.特征构造完成后,构建机器学习模型,本实施例采用的是xgboost回归预测算法,分别构建用户收入模型和负债模型。在模型构建过程中,利用筛选出的目标用户的目标变量和预测变量,对模型进行训练,最终得到构建好的模型。
108.在为某个待授信用户确定其授信额度时,本发明实施例可以利用预先构建好的用户收入和负债模型,计算负债收入比,根据相应的授信规则进行分档处理,对同档位的客户给予不同的授信额度。负债收入比越高,表明该客户收入中大部分需要用于偿债,预示着该客户可能会有较强的贷款需求,但对于金融公司来说,该客户也可能具有较高的风险。针对负债收入大于第一门限(第一门限取值可以相对较大,比如0.7)的客户,可以定义为高风险客户,对于高风险客户采取较保守的授信策略,给予较低的额度,来规避未来可能出现的风险;在比值在0.1至0.7之间的客户,可以定义为低风险客户,对此类客户可采取较为灵活的策略,可以在此比值区间内再进行细分,进行阶梯化的授信。当然,本发明实施例中授信额度与负债收入比可以是更为复杂的关系,通常并非负债收入比越低表示客户越好,对于低负债收入比客户,虽然风险可能相对较小,但额度利用率可能不高,对此类客户可以通过加强贷中管理,刺激客户进行贷款消费。
109.以上实施例中,通过采用xgboost回归预测算法对客户的月收入和负债进行预测,进而计算出客户的负债收入比,综合了用户的收入水平和负债水平,并进行授信的量化,更具科学性。
110.从以上实施例可以看出,本发明实施例利用预先构建好的用户收入和负债模型计算用户的负债收入比,相比于现有技术人工进行规则匹配的处理方式,本发明实施例的模型易于部署,可以大大提高授信流程的处理效率,减少人力成本。另外,本发明实施例利用较为准确的收入和负债信息作为模型目标变量,对所有客户构建机器学习模型,预测结果更加准确。另外,本发明实施例综合利用了客户的收入水平和负债水平,对客户的偿还能力进行了量化,对不同负债收入比档位的客户授予不同的授信额度,授信方式更加科学。另外,在构建用户收入和负债模型的时候,本发明实施例可以使用多种机器学习算法,也可以融合多种机器学习算法,综合起来作为模型预测的最终结果。
111.以上介绍了本发明实施例的各种方法。下面将进一步提供实施上述方法的装置。
112.请参照图3,本发明实施例提供了一种用户授信额度的确定装置30,包括:
113.负债获取模块31,用于将目标用户的负债的预测变量输入用户负债模型得到所述目标用户的负债预测值;
114.收入获取模块32,用于将目标用户的收入的预测变量输入用户收入模型得到所述目标用户的收入预测值;
115.比值获取模块33,用于根据所述目标用户的负债预测值和收入预测值,计算得到所述目标用户的负债收入比;
116.授信额度确定模块32,用于根据所述目标用户的负债收入比,确定所述目标用户的授信额度。
117.通过以上模块,本发明实施例利用较为准确的收入和负债信息作为模型目标变量,对所有客户构建机器学习模型,预测结果更加准确,授信过程更加科学。
118.可选的,所述负债收入比计算模块31,还用于计算所述目标用户的负债预测值和收入预测值的比值,得到所述目标用户的负债收入比。
119.可选的,所述确定装置还包括以下模块(图中未示出):
120.第一训练模块,用于:
121.根据存量用户的公积金记录、社保缴纳记录、税收缴纳记录中的任一项或多项,计算所述存量用户的收入值,作为用户收入的第一目标变量;
122.从用户信息数据库中提取所述存量用户的用户属性信息,或从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息,生成对应的特征变量,作为用户收入的第一预测变量,其中,所述用户属性信息包括类别变量和数值变量,所述类别变量对应的特征变量是对类别变量进行数值化处理后所得到的连续型特征变量;其中所述用户的行为信息可以是用户的消费行为记录。用户的消费行为记录包括用户消费的金额、频次、以及具体消费行为的类别。
123.根据所述第一目标变量和所述第一预测变量构成的第一样本数据,对预先构建的用户收入模型进行训练,其中,所述预先构建的用户收入模型为基于回归预测算法的回归预测模型、决策树模型、xgboost模型或神经网络模型中的一种或多种融合的模型。
124.可选的,所述确定装置还包括以下模块(图中未示出):
125.第二训练模块,用于:
126.基于存量用户的征信报告中所包含的存量用户的负债数据,生成所述存量用户的用户负债的第二目标变量;
127.根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量,或根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和从用户信息数据库中提取所述存量用户的用户属性信息所对应的特征变量,或根据所述存量用户的借贷交易的历史数据,生成包括借贷金额类、借贷时间类和借贷次数类的特征变量和从用户信息数据库中提取所述存量用户的用户属性信息和用户行为信息所对应的特征变量,作为所述存量用户的用户负债的第二预测变量;
128.根据包括多个存量用户所述第二目标变量和所述第二预测变量构成的第二样本数据,对预先构建的用户负债模型进行训练,其中,所述预先构建的用户负债模型为回归预测模型、决策树回归模型、xgboost模型或神经网络模型中的一种或多种融合的模型。
129.可选的,所述授信额度确定模块,还用于确定所述目标用户的负债收入比所在的目标数值区间,根据预先设定的数值区间与风险等级的对应关系,将所述目标数值区间对应的目标风险等级,作为所述目标用户的风险等级;根据所述目标用户的风险等级,确定所述目标用户的授信额度,其中,高风险等级对应于低授信额度。
130.请参照图4,本发明实施例提供的用户授信额度的确定装置的一种结构示意图,该训练装置400包括:处理器401、收发机402、存储器403、用户接口404和总线接口。
131.在本发明实施例中,确定装置400还包括:存储在存储器上403并可在处理器401上运行的程序。
132.所述处理器401执行所述程序时实现以下步骤:
133.将目标用户的负债的预测变量输入用户负债模型得到所述目标用户的负债预测值;
134.将目标用户的收入的预测变量输入用户收入模型得到所述目标用户的收入预测值;
135.根据所述目标用户的负债预测值和收入预测值,计算得到所述目标用户的负债收入比;
136.根据所述目标用户的负债收入比,确定所述目标用户的授信额度。
137.可理解的,本发明实施例中,所述计算机程序被处理器401执行时可实现上述实施例所述的用户授信额度的确定方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
138.在图4中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器 401代表的一个或多个处理器和存储器403代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机402可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。针对不同的用户设备,用户接口404还可以是能够外接内接需要设备的接口,连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。
139.处理器401负责管理总线架构和通常的处理,存储器403可以存储处理器 401在执行操作时所使用的数据。
140.在本发明的一些实施例中,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现以下步骤:
141.将目标用户的负债的预测变量输入用户负债模型得到所述目标用户的负债预测值;
142.将目标用户的收入的预测变量输入用户收入模型得到所述目标用户的收入预测值;
143.根据所述目标用户的负债预测值和收入预测值,计算得到所述目标用户的负债收入比;
144.根据所述目标用户的负债收入比,确定所述目标用户的授信额度。
145.该程序被处理器执行时能实现上述用户授信额度的确定方法中的所有实现方式,且能达到相同的技术效果,为避免重复,此处不再赘述。
146.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
147.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
148.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
149.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
150.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
151.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
152.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献