一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

欺诈风险预测方法、装置、设备及存储介质与流程

2021-11-29 13:22:00 来源:中国专利 TAG:


1.本发明涉及人工智能技术领域,尤其涉及一种欺诈风险预测方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.目前,大数据风控中数据的缺失和混乱,撞库、盗账号、盗身份、伪基站等都威胁着各种贷款业务,容易为贷款业务的用户带来经济上的损失。
3.为了解决上述问题,在贷款时,需要执行贷前风控。所述贷前风控是金融机构通过各种途径对要贷款的企业或个人进行全面调查和了解,以达到对企业或个人贷款前的风险预测。
4.但是当前的贷前风控存在如下问题:1、完全依赖征信体系中客户本身征信信息,由于征信系统存在人员信息不完善的情况,且仅是针对当前的客户自身信息进行预测,信息输入量少,对于上述这些情况欺诈风险预测准确率不高;2、征信系统更新时间长,对于变化情况不能及时支撑预测也导致准确率低。因此当前的贷前风控的欺诈风险预测准确率较低。


技术实现要素:

5.本发明提供一种欺诈风险预测方法、装置及计算机可读存储介质,其主要目的在于解决贷前风控的欺诈风险预测准确率低的问题。
6.为实现上述目的,本发明提供的一种欺诈风险预测方法,包括:
7.获取历史客户集的历史客户信息集,从所述历史客户信息集中提取历史客户信息特征集,并根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集;
8.通过所述历史客户信息特征集中每个历史客户信息特征,获取每个所述历史客户的相邻客户,并将每个历史客户与对应的相邻客户相关联;
9.汇总每个历史客户的相邻客户信息得到相邻客户信息特征集;
10.根据所述历史客户信息特征集与所述相邻客户信息特征集构建所述历史客户集的知识图谱;
11.利用预构建的图学习模型对所述知识图谱进行加权及累积操作,生成所述历史客户集的预测分数集;
12.利用损失函数计算所述预测分数集和所述欺诈分数集之间的损失值,根据所述损失值对所述图学习模型进行参数调整,直至所述损失值小于预设的损失阈值,得到训练完成的图学习模型;
13.获取待分析客户的知识图谱,利用所述训练完成的图学习模型对所述待分析客户的知识图谱进行预测,得到待分析客户的预测分数;
14.根据所述待分析客户的预测分数及预设的警戒阈值判断所述客户的欺诈风险。
15.可选地,所述从所述历史客户信息集中提取历史客户信息特征集,包括:
16.对所述历史客户信息集进行分词和词性标注,得到分词及词性标注的结果;
17.根据所述分词及词性标注的结果提取所述分词中的名词及名词短语,并根据所述名词及名词短语,统计得到历史客户信息特征频率集,根据所述历史客户信息特征频率集生成频繁模式树;
18.识别所述频繁模式树中的特征,得到候选历史客户信息特征集;
19.计算所述候选历史客户信息特征集中各个特征的点互信息值,并从所述候选历史客户信息特征集中过滤掉点互信息值小于预设的标准阈值的历史客户信息特征,得到历史客户信息特征集。
20.可选地,所述通过所述历史客户信息特征集中每个历史客户信息特征,获取每个所述历史客户的相邻客户,包括:
21.将所述历史客户信息特征集的分词转化为向量,得到历史客户信息特征向量;
22.从所述历史客户集中逐个选择其中一个客户作为初始历史客户,并从所述历史客户信息特征集中提取所述初始历史客户的历史客户信息特征;
23.将所述初始历史客户的历史客户信息特征转化为对应的向量,得到初始客户信息特征向量;
24.计算所述历史客户信息特征向量与所述初始客户信息特征向量之间的相似度,并根据所述相似度得到所述初始历史客户的相邻客户。
25.可选地,所述根据所述历史客户信息特征集与所述相邻客户信息特征集构建所述历史客户集的知识图谱,包括:
26.从所述历史客户信息特征集与所述相邻客户信息特征集的分词中提取实体词汇及关系词汇;
27.将所述实体词汇及所述关系词汇进行分类,并将所述实体词汇及所述关系词汇的分类结果分别存储到实体词汇库和关系词汇库中;
28.基于所述实体词汇库及所述关系词汇库,构建历史客户集的知识图谱。
29.可选地,所述利用预构建的图学习模型对所述历史客户的知识图谱进行加权及累积操作,生成所述历史客户集的预测分数集,包括:
30.利用预构建图学习模型中的第i卷积层对所述知识图谱进行加权求和操作,得到第i节点表征向量,其中,i=1,2,3

n;
31.将所述第i节点表征向量通过激活函数传递给第(i 1)卷积层进行加权求和,得到第(i 1)节点表征向量,直至i=n

1,得到第n节点表征向量;
32.对所述第n节点表征向量进行分类打分,得到所述历史客户集的预测分数集。
33.可选地,所述将所述第i节点表征向量通过激活函数传递给第(i 1)卷积层进行加权求和,得到第(i 1)节点表征向量,包括:
34.所述将所述第i节点表征向量通过激活函数传递给第(i 1)卷积层进行加权求和,得到第(i 1)节点表征向量,包括:
[0035][0036]
其中,σ()表示激活函数;l表示第l层卷积层,i表示当前节点;r表示节点与节点间
的关系;r表示节点与节点间的所有关系;表示在满足r∈r关系下,与当前节点i具有关系r的所有节点集合;c
i,r
表示正则化常数;表示自循环的权重;表示节点关系r的权重;表示当前节点i在第l层卷积层的特征向量;表示节点j在第l层卷积层的特征向量。
[0037]
可选地,所述根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集,包括:
[0038]
从所述历史客户集中选择其中一个历史客户,并从所述历史客户信息特征集中获取选择的所述历史客户的还贷期数、按时还贷行为数据、提前还贷行为数据、及逾期还款行为数据;
[0039]
分别从所述按时还贷行为数据、提前还贷行为数据及逾期还款行为数据中提取出按时还贷天数、提前还贷天数以及逾期还款天数;
[0040]
根据所述按时还贷天数、提前还贷天数以及逾期还款天数,统计选择的所述历史客户的还款行为天数;
[0041]
通过如下公式计算选择的所述历史客户的历史客户欺诈分数s:
[0042]
s=d
×
f(x)
×
p
[0043][0044]
其中,d表示所述还款行为天数,p表示所述还贷期数,f(x)表示正态分布函数,μ表示所述历史客户信息集的平均数,σ表示所述历史客户信息集的标准差,x预设因子。
[0045]
为了解决上述问题,本发明还提供一种欺诈风险预测装置,所述装置包括:
[0046]
知识图谱构建模块,用于获取历史客户集的历史客户信息集,从所述历史客户信息集中提取历史客户信息特征集,并根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集;通过所述历史客户信息特征集中每个历史客户信息特征,获取每个所述历史客户的相邻客户,并将每个历史客户与对应的相邻客户相关联;汇总每个历史客户的相邻客户信息得到相邻客户信息特征集;根据所述历史客户信息特征集与所述相邻客户信息特征集构建所述历史客户集的知识图谱;
[0047]
分数预测模块,用于利用预构建的图学习模型对所述知识图谱进行加权及累积操作,生成所述历史客户集的预测分数集;利用损失函数计算所述预测分数集和所述欺诈分数集之间的损失值,根据所述损失值对所述图学习模型进行参数调整,直至所述损失值小于预设的损失阈值,得到训练完成的图学习模型;获取待分析客户的知识图谱,利用所述训练完成的图学习模型对所述待分析客户的知识图谱进行预测,得到待分析客户的预测分数;
[0048]
风险决策模块,用于根据所述待分析客户的预测分数及预设的警戒阈值判断所述客户的欺诈风险。
[0049]
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
[0050]
至少一个处理器;以及,
[0051]
与所述至少一个处理器通信连接的存储器;其中,
[0052]
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的欺诈风险预测方法。
[0053]
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的欺诈风险预测方法。
[0054]
本发明实施例从所述历史客户信息集中提取历史客户信息特征集,并根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集,并通过所述历史客户信息特征集关联相邻客户集,通过所述历史客户信息特征集及相邻客户信息特征集构建历史客户集的知识图谱,利用客户信息及相邻客户信息的特征共同构建知识图谱,对客户信息进行补充和完善,从而提升了贷前风控的欺诈风险预测准确率,通过所述知识图谱及所述欺诈分数集训练图学习模型,得到训练好的图学习模型,利用训练好的图学习模型分析客户的知识图谱,得到所述待分析客户的欺诈风险,利用图学习模型,不断训练优化,提高模型预测准确性。因此,本发明提出的欺诈风险预测方法、装置、电子设备及计算机可读存储介质,可以提高对所述待分析客户贷前风控的欺诈风险预测准确率。
附图说明
[0055]
图1为本发明一实施例提供的欺诈风险预测方法的流程示意图;
[0056]
图2为图1所示欺诈风险预测方法中其中一个步骤的详细实施流程示意图;
[0057]
图3为图1所示欺诈风险预测方法中其中一个步骤的详细实施流程示意图;
[0058]
图4为图1所示欺诈风险预测方法中其中一个步骤的详细实施流程示意图;
[0059]
图5为本发明一实施例提供的欺诈风险预测装置的功能模块图;
[0060]
图6为本发明一实施例提供的实现所述欺诈风险预测方法的电子设备的结构示意图。
[0061]
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0062]
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0063]
本技术实施例提供一种欺诈风险预测方法。所述欺诈风险预测方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的该方法的电子设备中的至少一种。换言之,所述欺诈风险预测方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0064]
参照图1所示,为本发明一实施例提供的欺诈风险预测方法的流程示意图。在本实施例中,所述欺诈风险预测方法包括:
[0065]
s1、获取历史客户集的历史客户信息集,从所述历史客户信息集中提取历史客户
信息特征集,并根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集;
[0066]
本发明实施例中所述历史客户信息包括客户的基本信息、行为数据、运营商数据、网络公开信息等,主要来源为征信平台、各个普惠小额贷平台、银行、社交媒体等。
[0067]
本发明实施例中,所述历史客户信息特征是对用户基本属性、信息需求、信息行为、心理状态、环境影响等方面的描述,主要分为身份特质、履约能力、信用历史、人脉关系、行为偏好等维度属性,最终模型根据各个维度信息预测对应客户分数。
[0068]
详细地,请参图2所示,所述从所述历史客户信息集中提取历史客户信息特征集,包括:
[0069]
s11、对所述历史客户信息集进行分词和词性标注,得到分词及词性标注的结果;
[0070]
s12、根据所述分词及词性标注的结果提取所述分词中的名词及名词短语,并根据所述名词及名词短语,统计得到历史客户信息特征频率集,根据所述历史客户信息特征频率集生成频繁模式树;
[0071]
本发明实施例,对所述事务文件进行扫描,统计所述历史客户信息特征在事务文件中出现的频率,对所述历史客户信息特征频率集中所述历史客户信息特征按照频率进行降序排序,得到基于所述历史客户信息特征频率集的频繁模式树。
[0072]
s13、识别所述频繁模式树中的特征,得到候选历史客户信息特征集;
[0073]
本发明实施例中将所述频繁模式树分解为若干条件频繁模式树,对各个条件频繁模式树进行频繁模式挖掘,并过滤掉所述各个条件频繁模式树中低于预设频率的历史客户信息特征,得到候选历史客户信息特征集。
[0074]
s14、计算所述候选历史客户信息特征集中各个特征的点互信息值,并从所述候选历史客户信息特征集中过滤掉点互信息值小于预设的标准阈值的历史客户信息特征,得到历史客户信息特征集。
[0075]
本发明实施例中利用pmi算法所述候选历史客户信息特征集中各个特征的点互信息值,计算公式定义如下:
[0076][0077]
其中所述点互信息值越高,历史客户和特征关联程度越高,当所述点互信息值低于预设的标准阈值时,过滤掉对应的历史客户信息特征;当所述点互信息值高于预设的标准阈值时,保留对应的历史客户信息特征,组合得到所述历史客户信息特征集。
[0078]
进一步地,本发明实施例所述根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集,包括:
[0079]
从所述历史客户集中选择其中一个历史客户,并从所述历史客户信息特征集中获取选择的所述历史客户的还贷期数、按时还贷行为数据、提前还贷行为数据、及逾期还款行为数据;
[0080]
分别从所述按时还贷行为数据、提前还贷行为数据及逾期还款行为数据中提取出按时还贷天数、提前还贷天数以及逾期还款天数;
[0081]
根据所述按时还贷天数、提前还贷天数以及逾期还款天数,统计选择的所述历史客户的还款行为天数;
[0082]
通过如下公式计算选择的所述历史客户的历史客户欺诈分数s:
[0083]
s=d
×
f(x)
×
p
[0084][0085]
其中,d表示所述还款行为天数,p表示所述还贷期数,f(x)表示正态分布函数,μ表示所述历史客户信息集的平均数,σ表示所述历史客户信息集的标准差,x预设因子。
[0086]
本发明实施例中,所述历史客户欺诈分数可直接体现历史客户欺诈风险,欺诈分数越低,欺诈风险越大。
[0087]
s2、通过所述每个历史客户信息特征,获取每个历史客户的相邻客户,并将每个历史客户与对应的相邻客户相关联;
[0088]
详细地,请参图3所示,所述通过所述历史客户信息特征集中每个历史客户信息特征,获取每个所述历史客户的相邻客户,包括:
[0089]
s21、将所述历史客户信息特征集的分词转化为向量,得到历史客户信息特征向量;
[0090]
本发明实施例对所述历史客户信息特征进行分词得到历史客户信息特征词汇,并根据预设的向量转化算法将所述历史客户信息特征词汇转化为历史客户信息特征向量。
[0091]
s22、从所述历史客户集中逐个选择其中一个客户作为初始历史客户,并从所述历史客户信息特征集中提取所述初始历史客户的历史客户信息特征;
[0092]
s23、将所述初始历史客户的历史客户信息特征转化为对应的向量,得到初始客户信息特征向量;
[0093]
s24、计算所述历史客户信息特征向量与所述初始客户信息特征向量之间的相似度,并根据所述相似度得到所述初始历史客户的相邻客户。
[0094]
本发明实施例,根据所述相似度预设阈值τ,判断是否相邻客户;当所述相似度小于所述预设阈值τ,判断为不是所述历史客户的相邻客户;当所述相似度大于等于所述预设阈值τ,判断为是所述历史客户的相邻客户。
[0095]
具体地,利用余铉相似度算法计算所述历史客户信息特征向量与所述初始客户特征向量之间的相似度,计算公式定义如下:
[0096][0097]
其中所述a为历史客户,b为初始客户,a
i
为历史客户信息特征向量,b
i
为初始客户特征向量。当cos(a,b)<τ时,判断为不是所述历史客户的相邻客户;当cos(a,b)≥τ时,判断为是所述历史客户的相邻客户,得到所述历史客户的相邻客户。
[0098]
本发明实施例通过遍历所有历史客户,得到每个历史客户的相邻客户;通过历史客户信息特征关联到相似特征的相邻客户,有利于利用所述相邻客户信息训练得到精确度更高的图学习模型。
[0099]
s3、汇总每个历史客户的相邻客户信息得到相邻客户信息特征集;
[0100]
本发明实施例,所述相邻客户信息包括客户的基本信息、行为数据、运营商数据、网络公开信息等。通过遍历所述历史客户信息集直至最后一个历史客户,参考所述s1提取
相邻客户信息特征,并汇总每个客户的相邻客户信息特征得到相邻客户信息特征集。
[0101]
s4、根据所述历史客户信息特征集与所述相邻客户信息特征集构建所述历史客户集的知识图谱;
[0102]
本发明实施例所述知识图谱为多关系图,是一个具有属性的实体,通过关系连接而成的网状知识图。所述实体是现实世界中的事物,比如历史客户、相邻客户、历史客户公司、相邻客户公司等,所述关系则用来表达不同实体之间的某种联系。所述实体(entity)表达图里的节点、所述关系(relation)表达图里的“边”。例如:“历史客户和相邻客户是朋友关系”,所述历史客户和相邻客户是图里的实体,朋友关系是图里的边。
[0103]
详细地,根据所述历史客户信息特征集与所述相邻客户信息特征集构建历史客户的知识图谱,包括:
[0104]
从所述历史客户信息特征集与所述相邻客户信息特征集的分词中提取实体词汇及关系词汇;
[0105]
将所述实体词汇及所述关系词汇进行分类,并将所述实体词汇及所述关系词汇的分类结果分别存储到实体词汇库和关系词汇库中;
[0106]
基于所述实体词汇库及所述关系词汇库,构建历史客户集的知识图谱。进一步地,所述历史客户的知识图谱表示为:
[0107]
g=(e,r,s)
[0108]
其中e表示节点,r表示关系,s表示e
i
×
r
×
e
j
的三元组。
[0109]
s5、利用预构建的图学习模型对所述知识图谱进行加权及累积操作,生成所述历史客户集的预测分数集;
[0110]
本发明实施例中,所述预构建图学习模型可以为r

gcn(relational graph convolutional network,关系图卷积网络)模型,由多个卷积层组成图卷积网络。例如:包含多个卷积层组成squeezenet网络,所述squeezenet网络为一种轻量级网络,比普通网络具有更加高效地计算能力。
[0111]
详细地,请参图4所示,所述s5,包括:
[0112]
s51、利用预构建图学习模型中的第i卷积层对所述知识图谱进行加权求和操作,得到第i节点表征向量,其中,i=1,2,3

n;
[0113]
具体地,所述利用有构建图学习模型中卷积层对所述历史客户的知识图谱中节点特征、节点的关系进行加权求和得到节点表征向量;例如通过如下公式计算第(i 1)节点表征向量:
[0114][0115]
其中,σ()表示激活函数;l表示第l层卷积层,i表示当前节点;r表示节点与节点间的关系;r表示节点与节点间的所有关系;表示在满足r∈r关系下,与当前节点i具有关系r的所有节点集合;c
i,r
表示正则化常数;表示自循环的权重;表示节点关系r的权重;表示当前节点i在第l层卷积层的特征向量;表示节点j在第l层卷积层的特征
向量。
[0116]
s52、将所述第i节点表征向量通过激活函数传递给第(i 1)卷积层进行加权求和,得到第(i 1)节点表征向量,直至i=n

1,得到第n节点表征向量;
[0117]
本发明实施例中,所述激活函数为relu函数,此函数计算速度快,提升图学习模型的计算速度。relu函数公式如下:
[0118]
relu=max(0,x)
[0119]
s53、对所述第n节点表征向量进行分类打分,得到所述历史客户集的预测分数集。
[0120]
本发明实施例,对所述表征向量进行分类打分得到所述历史客户预测欺诈分数,包括利用如下softmax函数将多个维度的输出,映射到(0,1)区间内,将出现概率理解为分数,从而得到所述历史客户的预测分数。例如:vi表示v中的第i个节点,那么这个节点的softmax值就是:
[0121]
se
i
[0122]
s6、利用损失函数计算所述预测分数集和所述欺诈分数集之间的损失值,根据所述损失值对所述图学习模型进行参数调整,直至所述损失值小于预设的损失阈值,得到训练完成的图学习模型;
[0123]
本发明实施例利用如下损失函数计算所述历史客户的预测分数和历史客户欺诈分数之间的损失值:
[0124]
l(x,y)=

(1

x)*log(1

y)
[0125]
其中,l(x,y)为所述损失值,x为所述历史客户欺诈分数,y为所述历史客户预测分数。
[0126]
详细地,本发明实施例中,所述根据所述损失值对所述图学习模型进行参数调整,得到训练完成的图学习模型,包括:
[0127]
当所述损失函数的损失值大于或等于预设的损失阈值,则利用优化算法对所述图学习模型的参数进行优化;
[0128]
当所述损失函数的损失值小于所述损失阈值,得到训练完成的图学习模型。
[0129]
本发明实施例中,当所述损失函数的损失值大于预设的损失阈值,使用adadelta优化算法对图学习模型的参数进行优化,adadelta优化算法可自适应调节图学习模型训练过程中的学习率,使得图学习模型更加精确,提升欺诈风险预测准确性。
[0130]
s7、获取待分析客户的知识图谱,利用所述训练完成的图学习模型对所述待分析客户的知识图谱进行预测,得到待分析客户的预测分数;
[0131]
本发明实施例中,所述待分析客户知识图谱获取方法参考所述步骤s1、s2、s3、s4。
[0132]
本发明实施例,可利用知识图谱的方式将待分析客户信息特征构建为待分析客户的知识图谱,当获取到待分析客户的知识图谱,将所述待分析客户的知识图谱输入至训练完成的图学习模型进行分析,得到待分析客户的预测分数。
[0133]
s8、根据所述待分析客户的预测分数及预设的警戒阈值判断所述客户的欺诈风险。
[0134]
本发明实施例,当所述待分析客户的预测分数大于等于预设的警戒阈值时,判断所述待分析客户的欺诈风险低,当所述待分析客户的预测分数小于等于预设的警戒阈值时判断所述待分析客户的欺诈风险高。
[0135]
本发明实施例从所述历史客户信息集中提取历史客户信息特征集,并根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集,并通过所述历史客户信息特征集关联相邻客户集,通过所述历史客户信息特征集及相邻客户信息特征集构建历史客户集的知识图谱,利用客户信息及相邻客户信息的特征共同构建知识图谱,对客户信息进行补充和完善,从而提升了贷前风控的欺诈风险预测准确率,通过所述知识图谱及所述欺诈分数集训练图学习模型,得到训练好的图学习模型,利用训练好的图学习模型分析客户的知识图谱,得到所述待分析客户的欺诈风险,利用图学习模型,不断训练优化,提高模型预测准确性。因此,本发明提出的欺诈风险预测方法、装置、电子设备及计算机可读存储介质,可以提高对所述待分析客户贷前风控的欺诈风险预测准确率。
[0136]
如图5所示,是本发明一实施例提供的欺诈风险预测装置的功能模块图。
[0137]
本发明所述欺诈风险预测装置100可以安装于电子设备中。根据实现的功能,所述欺诈风险预测装置100可以包括知识图谱构建模块101、分数预测模块102、风险决策模块103。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
[0138]
在本实施例中,关于各模块/单元的功能如下:
[0139]
知识图谱构建模块101,用于获取历史客户集的历史客户信息集,从所述历史客户信息集中提取历史客户信息特征集,并根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集;通过所述历史客户信息特征集中每个历史客户信息特征,获取每个所述历史客户的相邻客户,并将每个历史客户与对应的相邻客户相关联;汇总每个历史客户的相邻客户信息得到相邻客户信息特征集;根据所述历史客户信息特征集与所述相邻客户信息特征集构建所述历史客户集的知识图谱;
[0140]
分数预测模块102,用于利用预构建的图学习模型对所述知识图谱进行加权及累积操作,生成所述历史客户集的预测分数集;利用损失函数计算所述预测分数集和所述欺诈分数集之间的损失值,根据所述损失值对所述图学习模型进行参数调整,直至所述损失值小于预设的损失阈值,得到训练完成的图学习模型;获取待分析客户的知识图谱,利用所述训练完成的图学习模型对所述待分析客户的知识图谱进行预测,得到待分析客户的预测分数;
[0141]
风险决策模块103,用于根据所述待分析客户的预测分数及预设的警戒阈值判断所述客户的欺诈风险。
[0142]
详细地,本发明实施例中所述欺诈风险预测装置100中所述的各模块在使用时采用与上述图1至图4中所述的欺诈风险预测方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
[0143]
如图6所示,是本发明一实施例提供的实现欺诈风险预测方法的电子设备的结构示意图。
[0144]
所述电子设备1可以包括处理器10、存储器11、通信总线12以及通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如欺诈风险预测程序。
[0145]
其中,所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一
个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(control unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行欺诈风险预测程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
[0146]
所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如欺诈风险预测程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
[0147]
所述通信总线12可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
[0148]
所述通信接口13用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如wi

fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light

emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
[0149]
图6仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图6示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0150]
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、wi

fi模块等,在此不再赘述。
[0151]
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
[0152]
所述电子设备1中的所述存储器11存储的欺诈风险预测程序是多个指令的组合,在所述处理器10中运行时,可以实现:
[0153]
获取历史客户集的历史客户信息集,从所述历史客户信息集中提取历史客户信息
特征集,并根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集;
[0154]
通过所述历史客户信息特征集中每个历史客户信息特征,获取每个所述历史客户的相邻客户,并将每个历史客户与对应的相邻客户相关联;
[0155]
汇总每个历史客户的相邻客户信息得到相邻客户信息特征集;
[0156]
根据所述历史客户信息特征集与所述相邻客户信息特征集构建所述历史客户集的知识图谱;
[0157]
利用预构建的图学习模型对所述知识图谱进行加权及累积操作,生成所述历史客户集的预测分数集;
[0158]
利用损失函数计算所述预测分数集和所述欺诈分数集之间的损失值,根据所述损失值对所述图学习模型进行参数调整,直至所述损失值小于预设的损失阈值,得到训练完成的图学习模型;
[0159]
获取待分析客户的知识图谱,利用所述训练完成的图学习模型对所述待分析客户的知识图谱进行预测,得到待分析客户的预测分数;
[0160]
根据所述待分析客户的预测分数及预设的警戒阈值判断所述客户的欺诈风险。
[0161]
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
[0162]
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read

only memory)。
[0163]
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
[0164]
获取历史客户集的历史客户信息集,从所述历史客户信息集中提取历史客户信息特征集,并根据所述历史客户信息特征集计算对应历史客户集的欺诈分数集;
[0165]
通过所述历史客户信息特征集中每个历史客户信息特征,获取每个所述历史客户的相邻客户,并将每个历史客户与对应的相邻客户相关联;
[0166]
汇总每个历史客户的相邻客户信息得到相邻客户信息特征集;
[0167]
根据所述历史客户信息特征集与所述相邻客户信息特征集构建所述历史客户集的知识图谱;
[0168]
利用预构建的图学习模型对所述知识图谱进行加权及累积操作,生成所述历史客户集的预测分数集;
[0169]
利用损失函数计算所述预测分数集和所述欺诈分数集之间的损失值,根据所述损失值对所述图学习模型进行参数调整,直至所述损失值小于预设的损失阈值,得到训练完成的图学习模型;
[0170]
获取待分析客户的知识图谱,利用所述训练完成的图学习模型对所述待分析客户的知识图谱进行预测,得到待分析客户的预测分数;
[0171]
根据所述待分析客户的预测分数及预设的警戒阈值判断所述客户的欺诈风险。
[0172]
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以
通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0173]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0174]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0175]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
[0176]
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0177]
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0178]
本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
[0179]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
[0180]
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献