一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种用于金融机构拆分洗钱的无监督识别方法

2022-11-12 22:17:11 来源:中国专利 TAG:


1.本发明涉及金融欺诈风险识别领域,更确切地说,它涉及一种用于金融机构拆分洗钱的无监督识别方法。


背景技术:

2.数字经济背景下商业银行业务范围的不断拓展和经营环境的日趋复杂,使得金融风险案件频发且形式多样,包括反洗钱、资金诈骗、非法集资、虚假交易、恶意刷单、套现挪用等多种作案手段。其中,洗钱涉及金额通常较大,一旦发生将给商业银行带来严重的资金损失并产生较负面的社会声誉影响。此外,监管对银行资金的使用规范也日益严格,如《商业银行互联网贷款管理暂行办法》明确表示,贷款资金不得用于购买房产、股票、金融衍生品等。因此,加强对金融风险案件的防控是新形势下银行风险管理的重要内容,有助于更好地保障客户资金的安全和规范信贷资金的用途,使其切实用于企业的经营发展,支持与服务实体经济,具有重要的经济和社会效益。
3.传统基于业务经验以人工方式进行的商业银行反洗钱防控方法,难以发掘越来越复杂的作案手法,原因在于:1)经验规则组合的覆盖范围有限,较难发现全局性、关联性的特征,对团伙这类复杂的欺诈模式识别力度不够;2)现有核查方式多偏向于事后检查,时效性较低,且需耗费大量的人力,难以对风险事件进行及时的管控。


技术实现要素:

4.本发明的目的是克服现有技术中的不足,提供了一种用于金融机构拆分洗钱的无监督识别方法。
5.第一方面,提供了一种用于金融机构拆分洗钱的无监督识别方法,包括:
6.s1、从金融交易数据集中筛选出潜在拆分洗钱的账户信息集合,所述账户信息集合中的每个集合元素为三元组,所述三元组包括:汇出账户、汇入账户和中转账户;并对每个集合元素构建交易矩阵v;
7.s2、基于拆分洗钱的三种行为特征,对s1构建的交易矩阵v进行重新排序;所述三种行为特征包括:中转账户越多,嫌疑越大;内部纯度:中转账户之间的交易越少,越是可疑;外部纯度:与正常账户交易的中转账户越少,越是可疑;
8.s3、对s2的重新排序矩阵进行划分,计算矩阵编码成本和纯度,识别出拆分洗钱涉及的汇出账户、汇入账户和中转账户。
9.作为优选,s1中,所述金融交易数据集为历史交易行为数据集,所述账户信息集合为历史交易记录集合,所述集合元素为历史交易记录;所述交易矩阵v的行表示交易发起方的编号,交易矩阵v的列表示交易接收方的编号,vi.j=1表示账户i和j之间存在交易行为,vi.j=0表示账户i和j之间没有交易行为。
10.作为优选,s1中,筛选标准为汇出账户到汇入账户的中转账户多于2个。
11.作为优选,s2中,若交易矩阵v为包含“拆分洗钱”模式的矩阵,则定义为:
[0012][0013]
其中,n是涉及的交易账户的数量,k是中间账户的数量;对于给定的交易矩阵v,在第j次矩阵重排的迭代时,首先将交易汇出账户、中间账户和汇入账户的索引分别添加到排序列表o中,然后再将v中的行和列按o重新排序,其中,j=1,

,j,j表示最大迭代次数。
[0014]
作为优选,s3包括:
[0015]
s301、将s2的重新排序矩阵划分为4个子矩阵,采用最小描述长度原则计算每个子矩阵的编码成本和压缩率;
[0016]
s302、计算重新排序矩阵的纯度,利用压缩率与纯度计算得到交易矩阵v的异常分数,若该异常分数大于风控专家预设的阈值,则基于交易矩阵v获得涉及拆分洗钱的交易账户信息。
[0017]
作为优选,s301中,具体给定第j次迭代时矩阵v的重新排序矩阵vj和索引信息i,i包括交易汇出账户、中间账户与汇入账户的索引集合,通过迭代j次将矩阵vj划分为四个子矩阵,其中j=1,

,j,将vj涉及的中间账户数量表示为即第j次迭代时交易中间账户的索引数量,起始索引表示为其中|ij′
|表示第j

次迭代时的交易汇出账户、中间账户与汇入账户的索引数量之和,并将重新排序的矩阵vj分成如下四个子矩阵:
[0018]aj
(vj,ij)=vj[rj:rj kj][rj:rj kj]
[0019]bj
(vj,ij)=vj[rj:rj kj][rj kj 1:n]
[0020]cj
(vj,ij)=vj[rj kj 1:n][rj:rj kj]
[0021]
d(vj,ij)=vj[rj kj 1:n][rj kj 1:n]
[0022]
其中,j=1,

,j,ij∈i,子矩阵aj表示通过重新排序分离出来包括潜在的“拆分洗钱”模式子矩阵,子矩阵bj表示中间账户向其他账户汇款信息,子矩阵cj表示中间账户收到其他账户的汇入信息,子矩阵d用来表示没有发现“拆分洗钱”模式的压缩错误。
[0023]
作为优选,s301中,根据内纯度和外纯度的特性,子矩阵a、b、c和d的编码成本计算如下:
[0024][0025][0026][0027][0028]
其中,是一个全为1的矩阵;为编码实数,使用通用代码长度lg
*
(x)≈2lg(x) 1,“拆分洗钱”模式的数量由lg
*
(j)编码,每个交易汇出账户、中间账户和汇入账户的索引都需要lg(n)来编码,总体编码成本可计算如下:
[0029]
cost
t
(vj,ij)=costa(vj,ij) costb(vj,ij) costc(vj,ij) costd(vj,ij) lg
*
(j) |ij|*lg n
[0030]
将原始重新排序矩阵vj和压缩重新排序矩阵的编码成本之差归一化,可得交易矩阵v的压缩率,表示为(c-c

)/c,其中c表示最后一次迭代的编码成本,c

表示当前编码成本。
[0031]
作为优选,s302中,纯度分数ρ可以按以下方式计算:
[0032][0033]
将压缩率乘以纯度,得到一个给定v交易矩阵的最终异常分数,记为s=ρ*(c-c

)/c。
[0034]
第二方面,提供了一种用于金融机构拆分洗钱的无监督识别装置,用于执行第一方面任一所述的用于金融机构拆分洗钱的无监督识别方法,包括:
[0035]
筛选模块,用于从金融交易数据集中筛选出潜在拆分洗钱的账户信息集合,所述账户信息集合中的每个集合元素为三元组,所述三元组包括:汇出账户、汇入账户和中转账户;并对每个集合元素构建交易矩阵v;
[0036]
排序模块,用于基于拆分洗钱的三种行为特征,对筛选模块构建的交易矩阵v进行重新排序;所述三种行为特征包括:中转账户越多,嫌疑越大;内部纯度:中转账户之间的交易越少,越是可疑;外部纯度:与正常账户交易的中转账户越少,越是可疑;
[0037]
划分模块,用于对排序模块的重新排序矩阵进行划分,计算矩阵编码成本和纯度,识别出拆分洗钱涉及的汇出账户、汇入账户和中转账户。
[0038]
本发明的有益效果是:本发明将蕴含业务规律的、跨系统跨主体的数据信息以图的形式进行关联与分析,挖掘出隐含的洗钱风险,实现对金融机构洗钱风险案件的动态精准识别与监测,具有重要的现实意义和应用价值。
附图说明
[0039]
图1为本发明实施例中的一种用于金融机构拆分洗钱的无监督识别方法的流程图;
[0040]
图2为本发明实施例中的交易矩阵异常分数计算流程图;
[0041]
图3为本发明实施例中的一种用于金融机构拆分洗钱的无监督识别装置的结构示意图;
[0042]
图4为本发明实施例中的交易矩阵提取流程图。
具体实施方式
[0043]
下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
[0044]
实施例1:
[0045]
一种用于金融机构拆分洗钱的无监督识别方法,如图1所示,包括:
[0046]
s1、从金融交易数据集中筛选出潜在拆分洗钱的账户信息集合,账户信息集合中的每个集合元素为三元组,三元组包括:汇出账户、汇入账户和中转账户;并对每个集合元素构建交易矩阵v。
[0047]
s2、基于拆分洗钱的三种行为特征,对s1构建的交易矩阵v进行重新排序;三种行为特征包括:中转账户越多,嫌疑越大;内部纯度:中转账户之间的交易越少,越是可疑;外部纯度:与正常账户交易的中转账户越少,越是可疑。
[0048]
s3、对s2的重新排序矩阵进行划分,计算矩阵编码成本和纯度,识别出拆分洗钱涉及的汇出账户、汇入账户和中转账户。
[0049]
s1中,金融交易数据集为历史交易行为数据集,账户信息集合为历史交易记录集合,集合元素为历史交易记录;交易矩阵v的行表示交易发起方的编号,交易矩阵v的列表示交易接收方的编号,v
i.j
=1表示账户i和j之间存在交易行为,v
i.j
=0表示账户i和j之间没有交易行为。
[0050]
此外在s1中,筛选标准为汇出账户到汇入账户的中转账户多于2个。
[0051]
s2中,对s1构建的交易矩阵v进行重新排序,其原理是若交易矩阵v包含“拆分洗钱”模式,在重新排序后,它更容易被压缩。基于上述三种行为特征,若交易矩阵v为包含“拆分洗钱”模式的矩阵,则定义为:
[0052][0053]
其中,n是涉及的交易账户的数量,k是中间账户的数量;对于给定的交易矩阵v,在第j次矩阵重排的迭代时,首先将交易汇出账户、中间账户和汇入账户的索引分别添加到排序列表o中,然后再将v中的行和列按o重新排序,其中,j=1,

,j,j表示最大迭代次数。
[0054]
如图2所示,s3包括:
[0055]
s301、将s2的重新排序矩阵划分为4个子矩阵,采用最小描述长度原则计算每个子矩阵的编码成本和压缩率;
[0056]
s302、计算重新排序矩阵的纯度,利用压缩率与纯度计算得到交易矩阵v的异常分数,若该异常分数大于风控专家预设的阈值,则基于交易矩阵v获得涉及拆分洗钱的交易账户信息。
[0057]
s301中,具体给定第j次迭代时矩阵v的重新排序矩阵vj和索引信息i,i包括交易汇出账户、中间账户与汇入账户的索引集合,通过迭代j次将矩阵vj划分为四个子矩阵,其中j=1,

,j,将vj涉及的中间账户数量表示为即第j次迭代时交易中间账户的索引数量,起始索引表示为其中|ij′
|表示第j

次迭代时的交易汇出账户、中间账户与汇入账户的索引数量之和,并将重新排序的矩阵vj分成如下四个子矩阵:
[0058]aj
(vj,ij)=vj[rj:rj kj][rj:rj kj]
[0059]bj
(vj,ij)=vj[rj:rj kj][rj kj 1:n]
[0060]cj
(vj,ij)=vj[rj kj 1:n][rj:rj kj]
[0061]
d(vj,ij)=vj[rj kj 1:n][rj kj 1:n]
[0062]
其中,j=1,

,j,ij∈i,子矩阵aj表示通过重新排序分离出来包括潜在的“拆分洗钱”模式子矩阵,子矩阵bj表示中间账户向其他账户汇款信息,子矩阵cj表示中间账户收到其他账户的汇入信息,子矩阵d用来表示没有发现“拆分洗钱”模式的压缩错误。
[0063]
s301中,根据内纯度和外纯度的特性,子矩阵a、b、c和d的编码成本计算如下:
[0064][0065][0066][0067][0068]
该编码成本对给定矩阵中的非零元素的位置进行编码。为每个aj减去2kj,原因是不需要出现交易中间账户。为了保证aj、bj和cj中的大多数零元素可以被压缩,子矩阵d应该包含尽可能少的零元素。
[0069]
其中,是一个全为1的矩阵;为编码实数,使用通用代码长度lg
*
(x)≈2lg(x) 1,“拆分洗钱”模式的数量由lg
*
(j)编码,每个交易汇出账户、中间账户和汇入账户的索引都需要lg(n)来编码,总体编码成本可计算如下:
[0070]
cost
t
(vj,ij)=costa(vj,ij) costb(vj,ij) costc(vj,ij) costd(vj,ij) lg
*
(j) |ij|*lgn
[0071]
将原始重新排序矩阵vj和压缩重新排序矩阵的编码成本之差归一化,可得交易矩阵v的压缩率,表示为(c-c

)/c,其中c表示最后一次迭代的编码成本,c

表示当前编码成本。
[0072]
s302中,如果中间账户的数量增加,矩阵的压缩率往往会更高。当只使用压缩率来识别“拆分洗钱”时,有更多中间账户的交易矩阵将有更大的机会被选中,即使其纯度很低。为了解决该问题,还需要考虑交易矩阵的纯度。具体在在迭代j时,纯度分数ρ可以按以下方式计算:
[0073][0074]
将压缩率乘以纯度,得到一个给定v交易矩阵的最终异常分数,记为s=ρ*(c-c

)/c。若该异常分数大于风控专家预设的阈值,则判定交易矩阵v包括涉及拆分洗钱的交易账户信息。
[0075]
实施例2:
[0076]
一种用于金融机构拆分洗钱的无监督识别装置,如图3所示,包括:
[0077]
筛选模块,用于从金融交易数据集中筛选出潜在拆分洗钱的账户信息集合,所述账户信息集合中的每个集合元素为三元组,所述三元组包括:汇出账户、汇入账户和中转账户;并对每个集合元素构建交易矩阵v;
[0078]
排序模块,用于基于拆分洗钱的三种行为特征,对筛选模块构建的交易矩阵v进行重新排序;所述三种行为特征包括:中转账户越多,嫌疑越大;内部纯度:中转账户之间的交易越少,越是可疑;外部纯度:与正常账户交易的中转账户越少,越是可疑;
[0079]
划分模块,用于对排序模块的重新排序矩阵进行划分,计算矩阵编码成本和纯度,识别出拆分洗钱涉及的汇出账户、汇入账户和中转账户。
[0080]
如图4所示,上述用于金融机构拆分洗钱的无监督识别装置首先从多维度的时序会计数据集中提取用户的交易关系图,进而提取出交易信息矩阵,利用“拆分洗钱”的一般行为模式,设计出矩阵重排与评价算法,并从交易矩阵中评价选取出最可能的拆分洗钱行为。
[0081]
实施例3:
[0082]
为评估本发明提出方法的有效性,在一个包括30次拆分洗钱的真实交易数据集上进行有效性验证,一个进行10次测试以确保实验结果的有效性。实验结果表明,本发明的方法识别出的拆分洗钱行为为28次,准确率为93.3%,识别出涉及拆分洗钱的交易账户准确率为87%,该结果表明本方法能有效用于金融结构的拆分洗钱行为识别,而且不需要历史训练样本进行模型训练,具有巨大的商业价值和意义。
[0083]
综上所述,本发明将蕴含业务规律的、跨系统跨主体的数据信息以图的形式进行关联与分析,挖掘出隐含的洗钱风险,实现对金融机构洗钱风险案件的动态精准识别与监测,具有重要的现实意义和应用价值。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献