一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于图模型的对公信贷评估方法及系统与流程

2022-04-30 08:32:57 来源:中国专利 TAG:


1.本发明属于金融信贷领域,具体涉及一种基于图模型的对公信贷评估方法及系统。


背景技术:

2.信贷业务是商业银行主要的利润来源,占银行资产业务的70%以上。其中,对公信贷在信贷业务中占有的比重最高。2020年1-9月,全部金融机构新增贷款中,企事业单位贷款新增10.56万亿元,占全部新增贷款比重近65%,大幅超过去年56.17%的比重。全国商业银行的对公信贷规模总额超过50万亿,其中六大国有行超过40万亿,9家上市股份行约15.4万亿,21家城商行与农商行合计达5.1万亿。
3.巨大的市场背后是庞大的不良贷款规模,其中包括逾期贷款、呆滞贷款和呆账贷款。在36家上市银行中,22家银行披露了公司贷款不良率,其中10家银行不良率上升,9家银行不良率超过2%,即合计达百亿级的不良资产。不良贷款率的上升,主要原因是银行贷款粗放式经营,风险防范能力不足。
4.风控是商业银行经营业务的核心内容之一。传统的对公金融信贷业务中,商业银行虽然积累了丰富的风控经验,但是依然存在着一些困难,并面临来自外部市场、内部管理和上方监管的三方压力。
5.首先,从外部市场环境看,企业的信用风险呈整体性、连带性、多发性、严重性趋势。一是企业跨地区、跨行业和集团化经营趋势加强,经营层次和股权关系日趋复杂和隐蔽。二是企业通过关联交易、分头融资统一调度、相互担保等隐蔽方式获取银行信贷资金、投资资金或信用背书。复杂的关联关系使得风险传导路径错综复杂,风险传染性增强。
6.其次,从内部管理角度看,需要扩大观察视角,从客户整体关联网络角度立体化评判风险。随着业务过程中客户数据的积累,客户整体关系网络信息量愈发庞大,风险专家管理模式难以管理和评判客户整体风险。风险信息的采集以客户经理尽职调查为主,信息来源涉及多个系统或网站,信息不完整、信息收集费时费力。
7.最后,从上层监管的角度看,银保监会要求提升企业间关联识别能力,减少系统性风险的可能性。近年来银保监会有三大新提出的要求,一是要求商业银行加强对集团客户授信业务的风险管理[2010年《商业银行集团客户授信业务风险管理指引》];二是要求在开展担保圈识别认定基础上,建立担保圈贷款风险防范和化解的长效机制,防范区域性、系统性金融风险;三是要求商业银行报送大额风险暴露。
[0008]
这些都对商业银行信贷风险把控能力提出了更高的要求。


技术实现要素:

[0009]
为了解决上述问题,本发明提出一种基于图模型的对公信贷评估方法及系统,提升了商业银行信贷风险的把控能力。
[0010]
为实现上述目的,本发明的技术方案如下:
[0011]
一种基于图模型的对公信贷评估方法,其特征在于,所述方法包括:
[0012]
根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集;
[0013]
以样本数据集中多个企业、自然人为点,所述企业和自然人之间的关联关系为边,构建图模型;
[0014]
接收业务诉求,根据业务诉求查询所述图模型中的相应字段,对企业信誉进行评估;
[0015]
反馈业务诉求对应的企业信誉评估结果。
[0016]
优选的,所述根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集包括:
[0017]
将模拟自然人和公司之间的相互关系作为样本数据来源,采集样本数据;
[0018]
定义所述样本数据的数据内容,其包括自然人和公司的基本信息,以及自然人之间的亲属关系、自然人在公司中的任职关系和公司之间的持股关系;
[0019]
确定样本数据集规模;其中,所述数据集规模包括:公司信息数量、自然人信息数量,以及关于公司和自然人之间的关系信息数量。
[0020]
进一步地,所述业务诉求包括:识别家族关联企业、识别受益所有人和识别企业集团。
[0021]
优选的,所述接收业务诉求,根据业务诉求查询所述图模型中的相应字段,对企业信誉度进行评估包括:
[0022]
提取业务诉求对应的字段;
[0023]
基于所述字段获取查询语句,根据所述查询语句在图模型中进行查询,并返回查询结果;
[0024]
基于返回的查询结果对查询结果中的对应的用户进行人工审核,将审核不通过的用户标识为影响企业信誉度的关联自然人和公司;
[0025]
其中,所述查询结果企业高管的亲属关系查询结果、股权查询结果以及集团识别查询结果。
[0026]
进一步地,所述根据查询语句在图模型中进行查询包括:若业务诉求为识别家族关联企业,则以查询与指定公司通过家族关系相关联的公司为条件;
[0027]
查询符合条件的公司的高管、股东、法定代表人与该公司的高管、股东、法定代表人存在亲属关系,且满足亲属关系层级在预设关系层级范围内的直系亲属。
[0028]
进一步地,所述根据查询语句在图模型中进行查询还包括:
[0029]
若业务诉求为识别受益所有人,则沿公司的股权路径向上追溯,查询出所有直接或间接控股的自然人;
[0030]
对每条持股路径的持股比例进行连乘,并累加每个自然人在每条持股路径上的持股比例,作为实际持股比例;
[0031]
筛选其中持股比例高于预设比例的自然人作为受益所有人。
[0032]
进一步地,所述根据查询语句在图模型中进行查询还包括:
[0033]
若业务诉求为识别企业集团,则执行鲁汶算法,将图模型中的企业和自然人划分成一个个集团,并获取集团成员id、集团id;
[0034]
查询所述集团成员id对应的自然人或者企业;
[0035]
返回集团id、集团成员名称查询结果。
[0036]
一种基于图模型的对公信贷评估系统,所述系统包括:
[0037]
获取模块,用于根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集;
[0038]
模型构建模块,用于以样本数据集中多个企业、自然人为点,所述企业和自然人之间的关联关系为边,构建图模型;
[0039]
评估模块,用于接收业务诉求,根据业务诉求查询所述图模型中的相应字段,对企业信誉进行评估;
[0040]
反馈模块,用于反馈业务诉求对应的企业信誉评估结果。
附图说明
[0041]
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
[0042]
图1为本发明实施例提供的一种基于图模型的对公信贷评估方法流程图;
[0043]
图2为本发明实施例提供的基于企业关系图模型示意图;
[0044]
图3为本发明实施例提供的查询企业高管的亲属关系查询结果示意图;
[0045]
图4为本发明实施例提供的股权穿透图。
具体实施方式
[0046]
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
[0047]
需要注意的是,除非另有说明,本技术使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
[0048]“互联网 ”时代,数据分析成为企业经营决策背后的重要支撑。资本市场中的企业关系错综复杂,如何厘清企业关系,高效整合、管理企业数据已经成为监管机构日益关注的重点。在该背景下,企业关系图谱能够融合企业基础数据、投资关系、企业专利数据、企业招投标数据、企业招聘数据、企业诉讼数据、企业失信数据、企业新闻数据等,帮助监管和投资人员快速了解企业基本属性、企业规模、企业运营情况、企业系谱图等多维信息,全局把握企业风险等级、高效评估企业信誉。
[0049]
通过关联关系推理,企业关系图谱可在贷前阶段挖掘、识别企业间的集团关系、投资关系、担保关系,以及企业与自然人之间的任职关系和股权控制关系。此时,若某关系节点发生重大事件或暴露金融风险,我们可以通过发生变动的实体的关联关系,实现及时风险预警,降低不良贷款率。
[0050]
未来,银行等金融机构可借助企业关系图谱,深入挖掘企业与企业,企业与自然人之间的关联关系,对企业进行全方位、多维度、深层次的分析,提高银行对公信贷业务的风控能力。
[0051]
基于此,本发明具体实施方式提供一种基于图模型的对公信贷评估方法,所述方
法如图1所示,其包括:
[0052]
s1根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集;
[0053]
s2以样本数据集中多个企业、自然人为点,所述企业和自然人之间的关联关系为边,构建图模型;
[0054]
s3接收业务诉求,根据业务诉求查询所述图模型中的相应字段,对企业信誉进行评估;
[0055]
s4反馈业务诉求对应的企业信誉评估结果。
[0056]
步骤s1中,根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集包括:
[0057]
将模拟自然人和公司之间的相互关系作为样本数据来源,采集样本数据;
[0058]
定义所述样本数据的数据内容,其包括自然人和公司的基本信息,以及自然人之间的亲属关系、自然人在公司中的任职关系和公司之间的持股关系;
[0059]
确定样本数据集规模;其中,所述数据集规模包括:公司信息数量、自然人信息数量,以及关于公司和自然人之间的关系信息数量。
[0060]
样本数据集说明:
[0061]
样本数据来源:模拟自然人和公司之间的相互关系,人工构建样例数据;
[0062]
样本数据集内容:自然人之间的亲属关系、自然人在公司中的任职关系、公司之间的持股关系等;
[0063]
样本数据集规模:样本数据集包含100多条公司信息,30条自然人信息,以及上百条它们之间的关系信息;
[0064]
样本数据集内容详细说明:
[0065]
自然人的基本信息:证件号码、姓名、性别、学历等;
[0066]
公司的基本信息:公司名称、统一社会信用代码、注册时间、注册资本等
[0067]
自然人间的亲属关系:配偶、父母、子女等;
[0068]
自然人与公司间的持股关系:持股比例、出资金额、币种等;
[0069]
自然人与公司间的高管关系:职位类型等;
[0070]
自然人与公司间的法定代表人关系;
[0071]
公司与公司间的持股关系:持股比例、出资金额、币种等;
[0072]
步骤s2中,图模型的构建具体包括:
[0073]
如图2所示,我们以公司、自然人为顶点,以它们之间的相互系为边,创建图模型。自然人可在公司担任高管、法定代表人或股东,自然人之间存在亲属关系,公司之间存在持股关系。
[0074]
图模型说明:
[0075]
图模型中的点类型有:
[0076][0077][0078]
图模型中的边类型有:
[0079][0080]
步骤s3中,接收的业务诉求包括:识别家族关联企业、识别受益所有人和识别企业集团。
[0081]
接收业务诉求,根据业务诉求查询所述图模型中的相应字段,对企业信誉度进行评估包括:
[0082]
提取业务诉求对应的字段;
[0083]
基于所述字段获取查询语句,根据所述查询语句在图模型中进行查询,并返回查询结果;
[0084]
基于返回的查询结果对查询结果中的对应的用户进行人工审核,将审核不通过的用户标识为影响企业信誉度的关联自然人和公司;
[0085]
其中,所述查询结果企业高管的亲属关系查询结果、股权查询结果以及集团识别查询结果。
[0086]
其中,根据查询语句在图模型中进行查询包括:若业务诉求为识别家族关联企业,则以查询与指定公司通过家族关系相关联的公司为条件;
[0087]
查询符合条件的公司的高管、股东、法定代表人与该公司的高管、股东、法定代表人存在亲属关系,且满足亲属关系层级在预设关系层级范围内的直系亲属。
[0088]
根据查询语句在图模型中进行查询还包括:
[0089]
若业务诉求为识别受益所有人,则沿公司的股权路径向上追溯,查询出所有直接或间接控股的自然人;
[0090]
对每条持股路径的持股比例进行连乘,并累加每个自然人在每条持股路径上的持股比例,作为实际持股比例;
[0091]
筛选其中持股比例高于预设比例的自然人作为受益所有人。
[0092]
若业务诉求为识别企业集团,则执行鲁汶算法,将图模型中的企业和自然人划分成一个个集团,并获取集团成员id、集团id;
[0093]
查询所述集团成员id对应的自然人或者企业;
[0094]
返回集团id、集团成员名称查询结果。
[0095]
实施例1:
[0096]
业务诉求1:家族关联企业识别
[0097]
贷款企业为增加实际授信额度,可能会瞒报家庭成员的关联企业,分头融资统一调度,导致信贷资产的营运风险增加。图技术可以通过企业股东、高管、法定代表人之间的亲属关系,发现它们之间隐蔽的关联关系。
[0098]
查询说明:
[0099]
1)例如目标是查询与公司7通过家族关系相关联的公司;
[0100]
2)查询符合条件的公司,要求该公司的高管、股东、法定代表人与公司7 的高管、股东、法定代表人存在亲属关系;
[0101]
3)限定亲属关系层级在1~3级之间,即至多三代以内的直系亲属。
[0102]
查询语句:
[0103]
//查询符合条件的公司,要求该公司的高管、股东、法定代表人与公司7 的高管、股东、法定代表人存在亲属关系,亲属关系层级在1~3级之间
[0104]
match p=(c1:公司{公司名称:'公司7'})-[r1:持股|高管|法定代表人]-(p1:自然人)-[r2:亲属*1..3]-(p2:自然人)-[r3]-(n2:公司)
[0105]
return p
[0106]
查询结果如图3。
[0107]
在图3中可以看出公司8、公司9、公司10与公司7存在家族关联关系。若发现公司7在贷后定期频繁地向其中某家公司转账,即关联方通过关联交易变相挪用公司7的贷款资金,则会引起过度授信风险,需要重点监管。
[0108]
业务诉求2:受益所有人识别
[0109]
受益所有人指直接或间接持有公司25%(即0.25)以上股权或表决权的自然人,披露受益所有人对于识别企业利益集团具有重要意义。根据人行规定,金融机构需对非自然人客户受益所有人进行身份识别并留存相关信息及资料1。通过有效开展非自然人客户的身份识别,提高受益所有人信息透明度,加强风险评估和分类管理,以防范复杂股权或者控制权结构导致的风险。
[0110]
图4展示了一种典型的复杂股权网络结构:
[0111]
//展示公司3的股权穿透图
[0112]
match p=(:自然人)-[:持股*1..10]-》(:公司{公司名称:"公司3"})
[0113]
return p
[0114]
图中的边表示持股关系,边上的小数表示企业的持股比例,例如自然人12 在公司3中的持股比例为0.2(即20%)。
[0115]
查询说明:
[0116]
1)沿公司的股权路径向上追溯,查询出所有直接或间接控股的自然人;
[0117]
2)对每条持股路径的持股比例进行连乘,并累加每个自然人在每条持股路径上的持股比例,作为实际持股比例;
[0118]
3)筛选其中持股比例高于25%的自然人,作为受益所有人。
[0119]
查询语句:
[0120]
//查询公司3的所有股权穿透路径
[0121]
match p=(n0:自然人)-[r1:持股*1..10]-》(n:公司{公司名称:'公司3'})
[0122]
//对每条持股路径的持股比例进行连乘,并累加每个自然人在每条持股路径上的持股比例,作为实际持股比例
[0123]
with n0,sum(reduce(product=1,r in relationships(p)|product*r. 持股比例))as持股比例
[0124]
//筛选其中持股比例高于25%的自然人,作为受益所有人
[0125]
where持股比例》0.25
[0126]
//对受益所有人按实际持股比例倒序排列输出
[0127]
returnn0.姓名as受益所有人,持股比例orderby持股比例desc
[0128]
查询结果如下表:
[0129]
表股权查询结果
[0130]
受益所有人持股比例自然人140.2828
[0131]
即自然人14在公司7中的综合持股比例为28.28%,所以公司7的受益所有人为自然人14。
[0132]
业务诉求3:企业集团识别
[0133]
鲁汶算法(louvain)能将图中的企业和自然人划分成一个个集团,集团内的成员关联较为紧密,集团间的关联较为稀疏或完全无关联。这样便于银行对集团客户进行统一授信管理,或对目标借贷客户的集团内关联企业进行风险传播分析。
[0134]
查询说明:
[0135]
1)执行鲁汶算法,将图中的企业和自然人划分成一个个集团,并获取集团成员id、集团id;
[0136]
2)查询集团成员id对应的自然人或企业;
[0137]
3)返回集团id、集团成员名称(公司名称或关联人姓名)。
[0138]
查询语句:
[0139]
//执行鲁汶算法,将图中的企业和自然人划分成一个个集团,并获取集团成员id、集团id
[0140]
callapoc.algo.louvain()yieldnodeid,communityid
[0141]
//查询集团成员id对应的自然人或企业
[0142]
match(n)whereid(n)=nodeid
[0143]
//返回集团id、集团成员名称(公司名称或关联人姓名)
[0144]
returncommunityid,collect(coalesce(n.公司名称,n.姓名))asmembers
[0145]
orderbycommunityid
[0146]
最后结果返回集团id和集团内成员名称。集团内客户共享授信额度,可以避免分别授信引起的过度授信风险。
[0147]
实施例2:
[0148]
基于同一技术构思,本发明还提供一种基于图模型的对公信贷评估系统,所述系统包括:
[0149]
获取模块,用于根据预先定义的样本数据来源、样本数据集内容和规模,建立样本数据集;
[0150]
模型构建模块,用于以样本数据集中多个企业、自然人为点,所述企业和自然人之间的关联关系为边,构建图模型;
[0151]
评估模块,用于接收业务诉求,根据业务诉求查询所述图模型中的相应字段,对企业信誉进行评估;
[0152]
反馈模块,用于反馈业务诉求对应的企业信誉评估结果。
[0153]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽
管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献