一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

信贷客户贷中风险评估方法、装置、设备和介质与流程

2021-12-04 01:34:00 来源:中国专利 TAG:


1.本公开一般涉及客户评分技术领域,尤其涉及一种信贷客户贷中风险评估方法、装置、设备和介质。


背景技术:

2.随着新客获客成本越来越高,风险更加隐蔽,贷中客户管理越来越重要。如何对信贷客户贷中风险进行评价成为亟待解决的问题。


技术实现要素:

3.鉴于现有技术中的上述缺陷或不足,期望提供一种信贷客户贷中风险评估方法、装置、设备和介质,能够有效对贷中客户进行风险评估。
4.第一方面,本技术实施例提供了一种信贷客户贷中风险评估方法,包括:
5.获取信贷客户的基础客户信息数据;
6.根据所述基础客户信息数据,确定所述基础客户信息数据对应的社群关系;
7.基于所述社群关系,确定满足预设条件的目标社群,并获取所述目标社群中每个所述信贷客户对应的聚集特征参数;
8.将所述聚集特征参数输入至目标模型中,得到所述信贷客户对应的评分结果。
9.在一些实施例中,所述根据所述基础客户信息数据,确定所述基础客户信息数据对应的社群关系,包括:
10.基于所述基础客户信息数据,构造所述基础客户信息数据对应的客户关系网络图;
11.基于图论gn算法,获取针对所述客户关系网络图的每种社群划分方法对应的模块度值;
12.将模块度值最大的划分方法对应的社群关系,作为所述基础客户信息数据对应的社群关系。
13.在一些实施例中,所述基于所述社群关系,确定满足预设条件的目标社群,并获取所述目标社群中每个所述信贷客户对应的聚集特征参数,包括:
14.将所述社群关系中社群人数大于预设人数的社群作为目标社群;
15.针对所述目标社群中的每个节点,获取所述节点对应的度、聚集系数、介数和节点紧密度,所述度为所述节点对应的邻居节点的个数,所述聚集系数为所述节点与所述邻居节点之间的紧密程度,所述节点紧密度为所述节点与目标社群中其余节点的最短路径之和。
16.在一些实施例中,所述目标模型包括一度客户模型和多度客户模型,所述将所述聚集特征参数输入至目标模型中,得到所述信贷客户对应的评分结果,包括:
17.针对所述目标社群中的每个所述节点,识别所述节点对应的度值,在所述度值为1时,将所述节点对应的所述聚集特征参数输入至所述一度客户模型中,在所述度值大于1
时,将所述节点对应的聚集特征参数输入至所述多度客户模型中;
18.分别根据所述一度客户模型和所述多度客户模型,获取每个所述节点对应的所述信贷客户的评分结果。
19.第二方面,本技术实施例提供了一种信贷客户贷中风险评估装置,包括:
20.获取模块,用于获取信贷客户的基础客户信息数据;
21.划分模块,用于根据所述基础客户信息数据,确定所述基础客户信息数据对应的社群关系;
22.特征模块,用于基于所述社群关系,确定满足预设条件的目标社群,并获取所述目标社群中每个所述信贷客户对应的聚集特征参数;
23.评估模块,用于将所述聚集特征参数输入至目标模型中,得到所述信贷客户对应的评分结果。
24.在一些实施例中,所述划分模块,还用于:
25.基于所述基础客户信息数据,构造所述基础客户信息数据对应的客户关系网络图;
26.基于图论gn算法,获取针对所述客户关系网络图的每种社群划分方法对应的模块度值;
27.将模块度值最大的划分方法对应的社群关系,作为所述基础客户信息数据对应的社群关系。
28.在一些实施例中,所述特征模块,还用于:
29.将所述社群关系中社群人数大于预设人数的社群作为目标社群;
30.针对所述目标社群中的每个节点,获取所述节点对应的度、聚集系数、介数和节点紧密度,所述度为所述节点对应的邻居节点的个数,所述聚集系数为所述节点与所述邻居节点之间的紧密程度,所述节点紧密度为所述节点与目标社群中其余节点的最短路径之和。
31.在一些实施例中,所述评估模块,还用于:
32.针对所述目标社群中的每个所述节点,识别所述节点对应的度值,在所述度值为1时,将所述节点对应的所述聚集特征参数输入至所述一度客户模型中,在所述度值大于1时,将所述节点对应的聚集特征参数输入至所述多度客户模型中;
33.分别根据所述一度客户模型和所述多度客户模型,获取每个所述节点对应的所述信贷客户的评分结果。
34.第三方面,本技术实施例提供了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如本技术实施例描述的方法。
35.第四方面,本技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本技术实施例描述的方法。
36.本技术能够充分利用基础客户信息反应出的社群关系,进而根据社群关系中各节点之间连结程度对具有相似性的社群客户进行进一步的风险评估,从而使得评估结果兼具客户之间的相似性也充分考虑客户之间的差异性,有效提高信贷客户贷中风险评估的准确性。
37.本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
38.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本技术的其它特征、目的和优点将会变得更明显:
39.图1为本技术一个实施例提出的信贷客户贷中风险评估方法的流程图;
40.图2为本技术另一个实施例提出的信贷客户贷中风险评估方法的流程图;
41.图3为本技术一个具体实施例的客户关系网络图的示意图;
42.图4为本技术一个具体实施例的社群关系图;
43.图5为本技术对目标模型测试结果示意图;
44.图6为本技术一个实施例提出的信贷客户贷中风险评估装置的方框示意图;
45.图7示出了适于用来实现本技术实施例的电子设备或服务器的计算机系统的结构示意图。
具体实施方式
46.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
47.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
48.图1为本技术实施例提出的信贷客户贷中风险评估方法的流程图。其中,需要说明的是,本实施例的信贷客户贷中风险评估方法的执行主体为信贷客户贷中风险评估装置,信贷客户贷中风险评估装置可以由软件和/或硬件的方式实现,该实施例中的信贷客户贷中风险评估装置可以配置在电子设备中,也可以配置在用于对电子设备进行控制的服务器中,该服务器与电子设备进行通信进而对其进行控制。
49.其中,本实施例中的电子设备可以包括但不限于个人计算、平台电脑、智能手机、智能音箱等设备,该实施例对电子设备不作具体限定。
50.如图1所示,本技术实施例提出的信贷客户袋中风险评估方法,包括如下步骤:
51.步骤101,获取信贷客户的基础客户信息数据。
52.其中,基础客户信息数据为用户的身份信息以及用户在行内的账号和金融行为数据,包括但不限于基础客户对应的身份信息、账号信息、账号归属信息和行内资金往来关系等,其中,行内资金往来关系包括但不限于行内交易数据、行内交易网络特征数据、行内app行为数据和行外移动互联网行为数据。
53.步骤102,根据基础客户信息数据,确定基础客户信息数据对应的社群关系。
54.进一步地,如图2所示,步骤102,根据基础客户信息,确定基础客户信息数据对应的社群关系,包括:
55.步骤1021,基于基础客户信息数据,构造基础客户信息数据对应的客户关系网络图。
56.需要说明的是,在确定基础客户信息数据对应的社群关系之前,需要根据基础客户信息数据构建客户信息关系图谱。具体地,以基础客户信息数据中的用户身份信息和账号信息为网络图节点,并以用户在行内的金融行为数据作为边构建客户信息关系图谱。
57.举例来说,可定义客户信息关系图谱为graph=(v,e),其中,v为非空有限集合,表示用户的身份信息和账号信息,e为边的集合,表示账户归属关系以及行内转账关系。
58.作为一个可行实施例,如图3所示,为根据某18万客户的基础信息建立的客户信息关系图谱。
59.步骤1022,基于图论gn算法,获取针对客户关系网络图的每种社群划分对应的模块度值。
60.其中,图论gn算法是由grivan和newman所提出的一种图论经典算法。基本思想就是:社团之间成员的联系多,不同社团的成员之间联系少。
61.具体地,计算客户关系网络图中每条边的边介数,其中,边介数为网络中所有最短路径中经过该边的路径的数目占最短路径总数的比例。然后依次去掉图中当前边介数最大的那条边,直至客户关系网络图中没有任何边存在。也就是说,在最初认为客户关系网络图中所有的节点都属于一个社群,然后通过去掉边介数最大的边排除异己,最终每个节点都成为一个社群,并计算整个过程中得到的每个社群的模块度值。
62.其中,模块度值用来评估社区划分的质量,一个好的划分,是在社区内部节点相似度高,社区外部节点相似度低。模块度的大小定义为社区内部的总边数和网络中总边数的比例减去一个期望值,该期望值是将网络设定为随机网络时同样的社区分配所形成的社区内部的总边数和网络中总边数的比例的大小,可采用如下方法计算:
[0063][0064]
其中,m为客户关系网络图中的边的总数,a
ij
表示网络邻接矩阵的一个元素(节点i、j连接的时候取1,其他取0),其中表示节点i的度,其中k
j
是节点j的度,c
i
和c
j
分别表示节点i和节点j所在的两个社区,函数δ(c
i
,c
j
)的取值定义为:如果i和j在一个社区,即c
i
=c
j
,则为1,否则为0。
[0065]
在一个或多个实施例中,在获取到客户关系网络图后,计算当前客户关系网络图的边介数和初始模块度值q0,存储当前网络中的社群分割情况和对应的初始模块度值,删除边介数最高的边,计算当前网络图对应的模块度值q1,如果q1>q0,则利用当前的模块度值和社群分割情况存储更新,如果q1≤q0,则进行下一次分割,直至所有边被删除完毕,返回最终的模块度值和社群分割情况。应当理解的是,保存的最终的模块度值为针对原始客户关系网络图最大的模块度值及其对应的社群关系。
[0066]
步骤1023,将模块度值最大的划分方法对应的社群关系,作为基础客户信息数据对应的社群关系。
[0067]
作为一个可行实施例,如图4所示,为根据如图3所示的客户关系网路图得到的社群关系图。其中,规模为23900的社群有1个,规模为1个的社群有250个,规模为2个的社群有5107个。
[0068]
其中,采用图论gn算法对客户关系网络图进行社群分割,不需要预先指定社群个
数,可以发现社群的层次关系,提高社群内群体特征,为下一步的风险评估减少障碍。
[0069]
由此,本技术采用适合中小型网络的图论gn算法对客户关系网络图进行社群关系划分,能够快速准确划分出客户关系网络图中的社群关系。
[0070]
步骤103,基于社群关系,确定满足预设条件的目标社群,并获取目标社群中每个所述信贷客户对应的聚集特征参数。
[0071]
其中,预设条件为社群中的节点数量,也就是说,将社群中节点数量大于预设数量的社群作为目标社群。其中,预设数量可以是预先设定的阈值,可以是通过有限次实验获取的阈值,也可以是通过有限次计算机仿真得到的阈值。优选地,在一个或多个实施例中,预设数量可以为2万,以便于具有合理的节点数量输入至目标模型中。
[0072]
在一个或多个实施例中,基于社群关系,确定满足预设条件的目标社群,并获取目标社群中每个所述信贷客户对应的聚集特征参数,包括,将社群关系中社群人数大于预设人数的社群作为目标社群,针对目标社群中的每个节点,获取节点对应的度、聚集系数、介数和节点紧密度,度为节点对应的邻居节点的个数,聚集系数为节点与邻居节点之间的紧密程度,节点紧密度为节点与目标社群中其余节点的最短路径之和。
[0073]
具体地,节点的度为与它相连的节点数据,当网络中该客户有多个其他客户跟他发生转账交易,则说明该客户的度值较大。节点的聚集系数c表示该节点与其邻居节点之间的紧密程度,其中,节点的聚集系数c由如下公式计算得到:
[0074]
c(i)=e(i)/t(i)
[0075]
其中,节点i的度为k,e(i)时节点i的邻居节点之间实际连接的变数,t(i)是节点i的k个邻居节点之间可能形成的最大连接数。
[0076]
其中,t(i)通过如下公式计算:
[0077]
t(i)=k(k

1)/2
[0078]
进一步地,网络中所有节点聚集系数的平均值即为整个网络的聚集系数。
[0079]
介数,通常分为边介数和节点介数两种,节点介数定义为网络中所有最短路径中经过该节点的路径的数目占最短路径总数的比例,边介数定义为网络中所有最短路径中经过该边的路径的数目占最短路径总数的比例。最短路径指两个节点间距离最小的路径,可以理解为从i点到j点经过最少的边的情况。也就是说,介数反映了相应的节点或者边在整个网络中的作用和影响力,具有很强的现实意义。在本技术实施例中,将节点介数作为信贷客户对应的聚集特征参数之一。
[0080]
举例来说,在行内核心交易网络中,网络中所有最短路径中经过该节点的数量占网络内最短路径总数比例较高,比如某个拼团购物网络中,某个擅长拼团的团长,通过该客户的账户节点,发生公对私、私对公或者说团员对团长,团长对商家的交易往来比较多,更容易产生混淆视听的欺诈交易。因此,需要根据描述团长对应节点的节点介数,来描述该团长在网络中作用和影响力,从而使得在后续的模型分析中能够充分考虑团长在网络中的作用和影响力,对团长做出准确的风险评估。
[0081]
由此,本技术利用聚集特征参数充分描述节点在网络中的重要程度、网络途中节点之间连接的紧密程度等信息,从而能够充分表达出社群内各节点之间的关联信息。
[0082]
步骤104,将聚集特征参数输入至目标模型中,得到信贷客户对应的评分结果。
[0083]
需要说明的是,目标模型是利用样本集训练好的模型,其中,样本集包括正样本和
负样本,正样本为逾期40天以上的客户,负样本为历史从未逾期且征信良好的客户。
[0084]
在一个或多个实施例中,目标模型包括卷积层和全连接层,其中,卷积层利用keras中sequential序贯模型来搭建,该模型是函数式模型的简略版,具有较为简单的线性、从头到尾的结构顺序,不分叉,是多个网络层的线性堆叠,从而使得数据具有较为丰富的特征信息。
[0085]
其中,对训练好的目标模型进行测试评价,得到如图5所示的测试结果,即,测试模型准确率为91.92%,模型测试准确率为87.32%。
[0086]
在一个或多个实施例中,目标模型包括一度客户模型和多度客户模型,将所述聚集特征参数输入至目标模型中,得到所述信贷客户对应的评分结果,包括:针对目标社群中的每个节点,识别节点对应的度值,在度值为1时,将节点对应的聚集特征参数输入至一度客户模型中,在度值大于1时,将节点对应的聚集特征参数输入至多度客户模型中,分别根据一度客户模型和多度客户模型,获取每个节点对应的信贷客户的评分结果。
[0087]
需要说明的是,一度客户具有较为单纯的金融往来数据,当某节点为一度节点且与其相连的节点为正样本数据时,该节点具有较高的危险性,因此,本技术将一度客户和多度客户进行区分分析,能够更有效的获取风险较高的客户节点。
[0088]
进一步地,多度客户模型可以为多个,例如二度客户模型、三度客户模型等。
[0089]
在一个或多个实施例中,评分结果可为0

1的数值,其中,可设置0

0.5为低风险客户,0.5

07为中风险客户,0.7

1为高风险客户。
[0090]
由此,本技术能够充分利用基础客户信息反应出的社群关系,进而根据社群关系中各节点之间连结程度对具有相似性的社群客户进行进一步的风险评估,从而使得评估结果兼具客户之间的相似性也充分考虑客户之间的差异性,有效提高信贷客户贷中风险评估的准确性。
[0091]
应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。
[0092]
图6为本技术一个实施例提出的信贷客户贷中风险评估装置的方框示意图。
[0093]
如图6所示,信贷客户贷中风险评估装置10,包括:
[0094]
获取模块11,用于获取信贷客户的基础客户信息数据;
[0095]
划分模块12,用于根据基础客户信息数据,确定基础客户信息数据对应的社群关系;
[0096]
特征模块13,用于基于社群关系,确定满足预设条件的目标社群,并获取目标社群中每个信贷客户对应的聚集特征参数;
[0097]
评估模块14,用于将聚集特征参数输入至目标模型中,得到信贷客户对应的评分结果。
[0098]
在一些实施例中,划分模块12,还用于:
[0099]
基于基础客户信息数据,构造基础客户信息数据对应的客户关系网络图;
[0100]
基于图论gn算法,获取针对客户关系网络图的每种社群划分方法对应的模块度值;
[0101]
将模块度值最大的划分方法对应的社群关系,作为基础客户信息数据对应的社群
关系。
[0102]
在一些实施例中,特征模块13,还用于:
[0103]
将社群关系中社群人数大于预设人数的社群作为目标社群;
[0104]
针对目标社群中的每个节点,获取节点对应的度、聚集系数、介数和节点紧密度,度为节点对应的邻居节点的个数,聚集系数为节点与邻居节点之间的紧密程度,节点紧密度为节点与目标社群中其余节点的最短路径之和。
[0105]
在一些实施例中,评估模块14,还用于:
[0106]
针对目标社群中的每个节点,识别节点对应的度值,在度值为1时,将节点对应的聚集特征参数输入至一度客户模型中,在度值大于1时,将节点对应的聚集特征参数输入至多度客户模型中;
[0107]
分别根据一度客户模型和多度客户模型,获取每个节点对应的信贷客户的评分结果。
[0108]
应当理解,信贷客户贷中风险评估装置10中记载的诸单元或模块与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于信贷客户贷中风险评估装置10及其中包含的单元,在此不再赘述。信贷客户贷中风险评估装置10可以预先实现在电子设备的浏览器或其他安全应用中,也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。信贷客户贷中风险评估装置10中的相应单元可以与电子设备中的单元相互配合以实现本技术实施例的方案。
[0109]
在上文详细描述中提及的若干模块或者单元,这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0110]
需要说明的是,本技术实施例的信贷客户贷中风险评估装置中未披露的细节,请参照本技术上述实施例中所披露的细节,这里不再赘述。
[0111]
下面参考图6,图6示出了适于用来实现本技术实施例的电子设备或服务器的计算机系统的结构示意图,
[0112]
如图6所示,计算机系统包括中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram603中,还存储有系统的操作指令所需的各种程序和数据。cpu601、rom602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
[0113]
以下部件连接至i/o接口605;包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
[0114]
特别地,根据本技术的实施例,上文参考流程图图2描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介
质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(cpu)601执行时,执行本技术的系统中限定的上述功能。
[0115]
需要说明的是,本技术所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以为的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0116]
附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作指令。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个连接表示的方框实际上可以基本并行地执行,他们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作指令的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0117]
描述于本技术实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、划分模块、特征模块和评估模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,获取模块,还可以被描述为“获取信贷客户的基础客户信息数据”。
[0118]
作为另一方面,本技术还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中的。上述计算机可读存储介质存储有一个或多个程序,当上述程序被一个或者一个以上的处理器用来执行描述于本技术的信贷客户贷中风险评估方法。
[0119]
以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人
员应当理解,本技术中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其他技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献