一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种可解释的欺诈交易识别方法及装置与流程

2022-02-20 00:31:15 来源:中国专利 TAG:


1.本发明属于计算机技术领域,具体涉及一种可解释的欺诈交易识别方法及装置。


背景技术:

2.对于银行来说,客户交易的安全性至关重要。目前,不法分子可以通过木马、嗅探、社工或其他手段窃取客户历史成功交易后缓存到本地设备的生物特征信息(人脸、虹膜、指纹、静脉等图像信息),进而根据客户的生物特征信息进行欺诈交易。
3.针对此类欺诈交易的应对方案,现有技术中大致可以分为两类:一类是基于专家经验的规则识别,有多年欺诈交易识别的专家构造专家规则,从账户的交易流数据中识别特定的欺诈交易,该种方式重度依赖于专家的业务经验,该类方法尽管具有较强的可解释性,但欺诈交易方式日新月异、层出不穷,单纯依靠专家历史经验难以取得较好效果。
4.另一类是基于机器学习模型的欺诈识别方法,随着机器学习技术的普及,很多金融机构将使用交易数据训练的机器学习模型用于检测,并取得了不错的效果。模型能够有效挖掘隐含特征,提升了欺诈识别的准确度。该类方法的代表有招商银行公开的cn108596630a《基于深度学习的欺诈交易识别方法、系统及存储介质》、中国工商银行公开的cn113506109a《欺诈交易识别方法及装置》、阿里巴巴已获得授权的cn108428132b《欺诈交易识别方法、装置、服务器及存储介质》。


技术实现要素:

5.为了解决上述现有技术中存在的问题,本发明提供了一种可解释的欺诈交易识别方法及装置,其目的在于,使该方法不仅能达到其他模型方法同等的精度,并且具有可解释性。
6.本发明采用的技术方案如下:一种可解释的欺诈交易识别方法,其包括如下步骤:步骤1:通过处理器从保存训练样本的集合数据空间中获取训练样本并进行预处理,所述训练样本用于为模型训练和预测所需的数据;步骤2:构建神经网络模型,并在存储介质中新建适用于所述神经网络模型的存储空间,并对所述神经网络模型进行训练,所述神经网络模型用于有效提取客户交易数据的时序特征;步骤3:从神经网络模型的存储空间中提取出所述神经网络模型,使用shap value方法对训练好的神经网络模型进行解释,筛选处训练样本中的重要维度,并在存储介质中构建对应的数组结构用于存储所述重要维度;步骤4:使用筛选出的重要维度,构造维度交叉统计特征,通过计算器统计量包括最大值、最小值、均值、方差以及求和;步骤5:对步骤4构造的交叉统计特征进行筛选和评估,再使用筛选得到的特征来
构建组合策略,进而识别欺诈交易。
7.在该技术方案中,采用用户账户的历史交易数据,通过训练深度神经网络模型,shap value解释神经网络模型,得到的重要维度来构建交叉特征,再使用重要特征维度构建可解释特征的方式,构建出一种可解释的欺诈交易识别方法,使得本方法即能利用神经网络强大得特征提取能力使得欺诈识别效果准确度更高,同时保持特征的可解释性。
8.进一步的,所述步骤1中收集的数据包括客户的历史交易数据以及客户所属的正负样本,其中,正样本是没有发生过欺诈交易的样本,负样本是发生过欺诈交易的样本。
9.进一步的,所述步骤2中的神经网络模型包含输入层,特征嵌入层以及输出层三个子模块。
10.其中,所述输入层由多个全连接网络层构成、用于将输入的特征映射为特定的特征维度,以便输入特征嵌入模块。
11.其中,所述特征嵌入层包括循环神经网络、长短期记忆网络、门控循环单元、时域卷积网络以及transformer等网络结构层,用于对输入的交易历史序列数据进行特征提取。
12.其中,所述输出层由多个全连接层构成,用于将嵌入层提取的特征映射为指定维度的最终输出。
13.在该技术方案中,步骤2中构建的lstm(长短期记忆网络)、gru(门控循环单元)、tcn(时域卷积网络)、transformer多路并行的网络结构,相较于单路的结构多路并行的方式具有更强的表征能力,使神经网络模型能充分提取交易数据中的特征。
14.进一步的,所述步骤3具体为:计算每个训练样本的shap value矩阵,将shap value矩阵中绝对值大于的特征维度确定为重要维度。
15.进一步的,所述步骤5具体为:首先使用步骤1所述的负样本中的欺诈标签计算每一个特征的iv值,剔除掉变量中线性相关性大于0.8的变量,保留iv高的特征,再使用筛选得到的特征来构建组合策略,用于识别欺诈交易。
16.本发明还提供了一种用于上述方法的可解释的欺诈交易识别装置,包括:数据模块,用于获取交易历史数据,并对交易数据进行预处理;训练模块,用于构建模型,并对模型进行训练,获取训练后的参数;解释模块,用于对模型进行归因解释,筛选出重要的特征维度;特征模块,用于构建交叉统计特征,并对交叉特征进行筛选;识别模块,用于跟进构建的有效特征进行欺诈识别。
17.本发明的基本思路是:收集一定数量的客户的历史交易数据,交易账户的历史数据包括一定时间内该账户发生的交易对手方、交易地址、交易场景、支付渠道、交易时间、交易金额等信息,收集的客户样本中包含欺诈交易样本(坏样本),正常交易样本(好样本);使用rnn(循环神经网络)、lstm(长短期记忆网络)、gru(门控循环单元)、tcn(时域卷积网络)等可以提取时间序列特征神经网络结构,构建一个提取交易数据时序特征的神经网络,使用收集到的交易数据训练神经网络;通过shap value等模型解释方法对训练好的模型进行解释分析,筛选出有效的特征维度;使用筛选出的维度构造交叉统计特征,将构造出的预测能力较强的特征构成欺诈识别规则,用于欺诈交易识别。
18.由于采用了上述技术方案,本发明的有益效果是:本方法通过设计lstm、、gru、tcn、transformer多路并行的网络结构保证了交易特
征的充分提取,从而保证了模型的高预测精度,同时独创地运用shap对神经网络进行归因解释的同时构造特征来识别欺诈交易,使其具有可解释性。相对于现有技术中使用深度学习模型预测欺诈概率的方法相比,本发明中的方法能够达到其他模型方法同等的精度,并且更具有可解释性。与现有技术中使用shap来对模型进行解释的方法相比,使用shap对模型进行解释,所得到的解释只能反映模型中各个维度的重要程度,并不能定位到某个直观的特征取值多少,本发明中的方法提供解释性更直观且更有实际意义。
附图说明
19.本发明将通过例子并参照附图的方式说明,其中:图1是本发明中一种可解释的欺诈交易识别方法的流程图;图2是本发明中一种可解释的欺诈交易识别装置的结构图。
具体实施方式
20.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
21.本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
22.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
23.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
24.需要说明的是,本发明的欺诈交易识别方法及装置可用于金融领域,也可以应用于其他技术领域。
25.本发明提供一种可解释的欺诈交易识别方法,通过设计lstm、、gru、tcn、transformer多路并行的网络结构保证了交易特征的充分提取,从而保证了模型的高预测精度,同时独创地运用shap对神经网络进行归因解释的同时构造特征来识别欺诈交易,使其具有可解释性。相对于现有技术中使用深度学习模型预测欺诈概率的方法相比,本发明中的方法能够达到其他模型方法同等的精度,并且更具有可解释性。
26.图1是本发明实施例一种可解释的欺诈交易识别方法的流程图,如图1所示,在本发明一个实施例中,本发明的欺诈交易识别方法包括步骤1至步骤5:步骤1:通过处理器从保存训练样本的集合数据空间中获取训练样本并进行预处
理,所述训练样本用于为模型训练和预测所需的数据,收集的数据包括客户的历史交易数据以及客户所属的正负样本;具体为收集一定数量客户的在一段时间内历史交易数据,主要包括一定时间内该账户发生的交易对手方、交易地址、交易场景、支付渠道、交易时间、交易金额等信息。收集的客户样本应包括一定量的正样本和负样本,其中,正样本是没有发生过欺诈交易的样本,负样本是发生过欺诈交易的样本;其中交易历史数据按照交易发生的时间排序为一个有序的时间序列,每一笔交易构成时间序列的一个时间步。同时收集到数据的类型可能包括非结构化数据(文本、语言等)、结构化数据(表格数据),因此需要对数据进行编码、分箱、截断、标准化、归一化等预处理。
27.步骤2:构建神经网络模型,并在存储介质中新建适用于所述神经网络模型的存储空间,并对所述神经网络模型进行训练,所述神经网络模型用于有效提取客户交易数据的时序特征;进一步的,所述步骤2中的神经网络模型包含输入层,特征嵌入层以及输出层三个子模块;其中第一个子模块是输入层,输入层由多个全连接网络层构成、用于将输入的特征映射为特定的特征维度,以便输入特征嵌入模块;其中第二个子模块是特征嵌入层,特征嵌入层包括rnn(循环神经网络)、lstm(长短期记忆网络)、gru(门控循环单元)、tcn(时域卷积网络)、transformer等网络结构层,用于对输入的交易历史序列数据进行特征提取;其中第三个子模块是输出层,输出层由多个全连接层构成,用于将嵌入层提取的特征映射为指定维度的最终输出;每个模块的网络层数、神经元个数、网络结构类型可根据实际情况进行调节;本步骤构建的lstm(长短期记忆网络)、gru(门控循环单元)、tcn(时域卷积网络)、transformer多路并行的网络结构,相较于单路的结构多路并行的方式具有更强的表征能力,使神经网络模型能充分提取交易数据中的特征。
28.本实施例中,训练神经网络模型具体为:使用步骤1中整理好的交易序列数据x输入给神经网络,再使用神经网络计算的输出与步骤1中样本欺诈标签y计算交叉熵损失函数,使用梯度下降的方法优化神经模型参数,最小化交叉熵损失函数。通过反复迭代,最终得到训练好的神经网络模型。
29.优化的数学描述如下:a)随机初始化的参数,使其满足[-1,1]之间的均匀分布;b)使用初始化的模型输出、客户是否满意标签计算叉熵损失;;其中y指代欺诈标签;指代神经网络输出的概率;指代需要优化的损失函数即交叉熵;c)使用梯度下降方法,优化模型的参数,优化的目标是最小化损失函数 ;d)重复步c的工作,迭代多轮,直至的值不再变小,即得到最优的预测模型;
梯度下降优化举例:假定模型要预测的真实标签为y,优化的目标函数为:;其中y指代欺诈标签;指代神经网络输出的概率;指代需要优化的损失函数即交叉熵;计算目标函数对参数的偏导数:,;其中表示loss对w求偏导,其中表示loss对b求偏导,w和b表示神经网络的参数;更新参数w:,;其中表示参数w更新前的值,表示参数w更新后的值,其中表示参数b更新前的值,表示参数b更新后的值;其中为学习率,多次重复这个过程,直至loss不再变小(收敛),即完成优化过程。
[0030]
步骤3:对神经网络模型进行解释:步骤3:从神经网络模型的存储空间中提取出所述神经网络模型,使用shapvalue方法对训练好的神经网络模型进行解释,筛选处训练样本中的重要维度,并在存储介质中构建对应的数组结构用于存储所述重要维度;具体来说,计算每个训练样本的shapvalue矩阵,将shapvalue矩阵中绝对值大于的特征维度确定为重要维度,的取值可根据不同的数据样本和具体情况来确定。
[0031]
步骤4:使用筛选出的重要维度,构造维度交叉统计特征,通过计算器统计量包括最大值、最小值、均值、方差以及求和;我们通过步骤4筛选出的重要维度有交易时间(可能取值有:凌晨0-6点、早上6-11点)、交易金额(可能取值有:0-1000,1000-2000,2000-10000,10000以上)、交易渠道(pc端、移动端、pos机),那么我们可以构造维度交叉统计变量:客户近30天在凌晨0-6点通过pc端交易金额0-1000交易的平均交易金额、客户近30天在凌晨0-6点通过pc端交易金额0-1000交易次数、客户近30天在凌晨0-6点通过pos端交易金额10000以上交易的最大交易金额等。
[0032]
步骤5:对步骤4构造的交叉统计特征进行筛选和评估,再使用筛选得到的特征来构建组合策略,进而识别欺诈交易。具体为:先使用步骤1所述的欺诈标签(是否为欺诈样本)计算每一个特征的iv值,剔除掉变量中线性相关性大于0.8的变量,保留iv较高的特征。再使用筛选得到的特征来构建组合策略识别欺诈交易。
[0033]
在本发明一个实施例中,参照图2,一种可解释的欺诈交易识别装置,包括:数据模块,用于获取交易历史数据,并对交易数据进行预处理;训练模块,用于构建模型,并对模型进行训练,获取训练后的参数;解释模块,用于对模型进行归因解释,筛选出重要的特征维度;特征模块,用于构建交叉统计特征,并对交叉特征进行筛选;
识别模块,用于跟进构建的有效特征进行欺诈识别。
[0034]
为了实现上述目的,还提供了一种计算机设备。该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
[0035]
处理器可以为中央处理器(central processing unit,cpu)。
[0036]
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
[0037]
存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0038]
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
[0039]
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
[0040]
为了实现上述目的,根据本技术的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述欺诈交易识别方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体(randomaccessmemory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;所述存储介质还可以包括上述种类的存储器的组合。
[0041]
使用本发明中一种可解释的欺诈交易识别方法及桩长的一个具体实施过程如下:收集一些现有客户近段时间工单咨询数据(语音、文本等)、客户近段时间的页面操作行为序列数据、客户使用的产品信息峰,对数据进行编码、标准化、归一化之后,输入训练好的模型,模型输出该客户当前对产品的满意度,参照附图1:1、在系统中收集某个用户一段时间的交易记录包括系统中的交易时间,提取交易双方用户的操作记录:包括操作名称和操作的具体时间。
[0042]
2、选用有欺诈交易记录的用户样本,选取欺诈交易发生时间点之前一段时间t内的交易记录,并按交易的时间顺序进行排序,作为训练集中的负样本。选用没有记录的欺诈交易的时间和用户,随机选取某笔交易发生时间点之前一段时间t内的交易记录,并按交易的时间顺序进行排序,作为训练集中的正样本。
[0043]
3、对数据进行编码、分箱、截断、标准化、归一化等预处理,得到数据d。
[0044]
4、将处理好的数据d输入构建的神经网络模型中,使用梯度下降方法进行训练,得到训练好的模型m。
[0045]
5、在训练集中选取n个样本计算模型m的shap value矩阵s,计算s在n个样本上的平均值并取绝对值,得到矩阵s*。
[0046]
7、选取s*中大于的维度作为重要维度i。
[0047]
8、使用重要维度i构建交叉统计特征,如步骤5中举例的那样。
[0048]
9、计算特征的iv值、相关性,对构造的特征进行评估筛选,选取最有效的特征用于识别欺诈交易。
[0049]
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
[0050]
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献