一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

券商客户账号类别的识别方法、异常账号预警方法及系统与流程

2022-03-22 22:50:18 来源:中国专利 TAG:


1.本发明涉及大数据技术与金融科技领域,具体地说,涉及一种基于券商客户数据而识别出不同账号类别的方法、系统与存储介质,及基于该识别方法所构建的异常账号预警方法与系统。


背景技术:

2.金融公司为了能更好地服务客户及保护客户,通常都会对客户数据进行加工、整理及挖掘,例如公开号为cn111427658a、cn107657524a等专利文献公开了对金融数据进行处理的方法,以更好地为客户提供优质、安全服务。
3.在金融公司中,券商为了能更好地服务客户,不仅开设柜台,还开发终端应用与管理股票社区,以从多个途径为客户提供多角度、立体化的服务;但由此也给数据分析过程带来了许多问题,例如该三者所产生的数据之间通常会存在断层,导致分析结果难以反映券商客户的实际情况。为了解决该技术问题,本技术人申请且公告号为cn112561699a的专利文献中公开了一种券商用户数据的处理方法,其通过融合柜台与终端应用上的账号信息与交易信息,在根据手机号码、资金账号与客户编号之间的关联关系,获取账号实际控制人,从而对每个实际控制人所控制的交易行为进行监控与统计,以能更好地对不同实际控制人的交易活跃程度进行评价,以能更好地对不同客户提供针对性服务。
4.申请人在利用上述方法对客户账号进行处理的过程中,虽然能够对所有账号的控制人进行识别处理,但是在服务过程中存在对同一控制人名下的所有账号进行无区别的服务,例如发送相关推荐信息,会导致无法对账号进行有针对性的服务,从而不能在对不同客户进行区别性、针对性服务的基础上,对不同账号进行区别性、针对性服务。此外,这种区别主控人的服务方式也无法对该主控人名下的账号异常进行监控。


技术实现要素:

5.本发明的主要目的是提供一种基于券商客户数据的客户账号类别的识别方法、系统及存储介质,以通过该识别方法,能更准确地对同一主控人名下的券商客户账号类别进行识别,以便于券商为客户提供更好、更针对性的服务;
6.本发明的另一目的是提供一种基于上述识别结果的异常账号预警方法及系统。
7.为了实现上述主要目的,本发明提供的识别方法用于识别券商客户账号类别,具体地,该识别方法包括以下步骤:
8.指标数据接收步骤,接收目标券商客户数据,该数据包括近度、频度及额度三个维度内的所有指标在所指定的过去一段时间内的指标数据,且每个维度至少具有两个指标;
9.指标数据预处理步骤,对前述数据中的频度与额度两个维度内的指标数据,依据时间价值权重判断矩阵,将每个账号内每个指标按n个均等分时间段数据进行加权平均处理,并将计算得到的加权平均值作为该账号内该指标的数据值;时间价值权重判断矩阵为
成对比较矩阵a;成对比较矩阵a的元素加权系数为矩阵a的最大特征根n对应的归一化特征向量ω={ω1,ω2,...,ωn},且基于前述数据中的近度维度指标数据及经加权平均处理之后的频度与额度两个维度内的指标数据,获取同一客户的多个账号上同一指标数据的算数平均值;若该客户的某一账号内的频度维度与额度维度所对应的指标值大等于对应维度指标算数平均值则对该指标赋值为2,否则赋值为1;若该客户的某一账号内的近度维度所对应的指标值大等于该维度指标算数平均值则对该指标赋值为1,否则赋值为2;从而获取经预处理之后的账号内指标打分分值;
10.维度指标降维步骤,基于降维方法对每个维度里的指标进行降维处理,从而获取用于表征每个维度的单个主指标,并计算每个维度的单个主指标的数值,作为该维度内指标的综合得分;
11.评价模型的构建步骤,基于拼串函数将近度、频度及额度的综合得分拼接起来,获取该账号的评分结果;
12.账号类别评价步骤,基于评分结果,通过查找比对表,从而获取该账号的评价结果。
13.在上述技术方案中,基于本技术人之前申请且已经公开的技术方案或人工归类的技术方案,获取每个客户名下的账户;再基于前述方案,根据不同账号在近一段时间内的表现对每个客户名下的账号进行打分,即按照额度、近度与频度三个维度指标进行打分,从而使打分出来的分值贴近实际情况,从而可以根据不同账户的区分而进行对应服务,以为客户提供更好的服务。
14.具体的方案为前述维度指标降维步骤包括以下步骤:基于经预处理之后的指标数据,利用主成分分析方法对每个维度里的多个指标进行降维处理,从而获取主指标;以第一主成分作为主指标。该技术方案采用主成分分析方法,并只取第一主成分作为主指标,不仅能够有效降低降维的难度,且在后期计算过程中能基于主要信息进行评分。
15.具体的方案为每个维度内的指标数量为两个或三个,且由典型指标r1与典型指标r2表征近度维度,由典型指标f1、典型指标f2与典型指标t表征频度维度,及由典型指标m与典型指标n表征额度维度;其中,典型指标r1表示账号最近一次交易到现在的时间间隔,典型指标r2表示账号最近仅登录不交易的时间到现在的间隔,典型指标f1表示客户在过去一段时间内交易的次数,典型指标f2表示客户在过去一段时间内仅登录不交易的次数,典型指标t表示账号在过去一段时间内的使用的手机流量,典型指标m表示账号在过去一段时间内的交易金额,及典型指标n表示账号在过去一段时间内的交易笔数。该技术方案采用典型指标表征三个维度,从而能够更好地反映该账号的价值。
16.更具体的方案为在维度指标降维步骤中,某一客户的第k个账号的近度这一维度的主指标为r
main
_acck_s=r1r1_acck_flag r2r2_acck_flag;频度这一维度的主指标为f
main
_acck_s=f1f1_acck_flag f2f2_acck_flag f3t_acck_flag;额度这一维度的主指标为m
main
_acck_s=m1m_acck_flag m2n_acck_flag;其中,r1_acck_flag为指标典型r1经预处理之后的数据,r2_acck_flag为典型指标r2经预处理之后的数据,f1_acck_flag、f2_acck_flag、t_acck_flag对应为典型指标f1、典型指标f2及典型指标t经预处理之后的数据,m_
acck_flag和n_acck_flag为为典型指标m和n经预处理之后的数据。
17.优选的方案为过去一段时间为过去的30个交易日,并被均分为6时间段;时间价值权重判断矩阵a的最大特征根n对应的归一化后的特征向量为ω=(0.048,0.095,0.143,0.190,0.238,0.286)
t

18.优选的方案为在账号类别评价步骤中,基于下表对客户账号类别进行评价:
19.序号rfm评分结果类别1高高高222高价值账号2高高低221重点发展账号3高低高212重点维护账号4高低低211新注册账号5低高高122重点挽留账号6低高低121一般价值账号7低低高112存疑型账号8低低低111无价值账号
20.在上述表中,评分结果为由近度、频度及额度的综合得分经由拼串函数将拼接起来。
21.为了实现上述另一目的,本发明提供的券商客户账号类别的识别系统包括处理器与存储器,存储器存储有计算机程序;且该计算机程序被处理器执行时,能够实现上述任一技术方案所描述的识别方法。
22.为了实现上述主要目的,本发明提供的计算机可读存储介质存储有用于对券商客户账号类别进行识别的计算机程序,且该计算机程序被执行时,能实现上述任一技术方案所描述的识别方法。
23.为了实现上述另一目的,本发明提供的异常账号预警方法基于券商客户账号类别识别结果,该异常账号预警方法包括动态监控步骤与警报生成步骤;动态监控步骤包括获取券商客户账号的当前类别识别结果;警报生成步骤包括若有账号的类别从之前的无价值账号变成当前的存疑型账号时,生成预警警报;获取券商客户账号的当前类别识别结果的步骤包括以下步骤:
24.指标数据接收步骤,接收目标券商客户数据,该数据包括近度、频度及额度三个维度内的所有指标在所指定的过去一段时间内的指标数据,且每个维度至少具有两个指标;
25.指标数据预处理步骤,对前述数据中的频度与额度两个维度内的指标数据,依据时间价值权重判断矩阵,将每个账号内每个指标按n个均等分时间段数据进行加权平均处理,并将计算得到的加权平均值作为该账号内该指标的数据值;时间价值权重判断矩阵为成对比较矩阵a;成对比较矩阵a的元素加权系数为矩阵a的最大特征根n对应的归一化特征向量ω={ω1,ω2,...,ωn},且基于前述数据中的近度维度指标数据及经加权平均处理之后的频度与额度两个维度内的指标数据,获取同一客户的多个账号上同一指标数据的算数平均值;若该客户的某一账号内的频度维度与额度维度所对应的指标值大等于对应维度指标算数平均值则对该指标赋值为2,否则赋值为1;若该客
户的某一账号内的近度维度所对应的指标值大等于该维度指标算数平均值则对该指标赋值为1,否则赋值为2;从而获取经预处理之后的账号内指标打分分值;
26.维度指标降维步骤,基于降维方法对每个维度里的指标进行降维处理,从而获取用于表征每个维度的单个主指标,并计算每个维度的单个主指标的数值,作为该维度内指标的综合得分;
27.评价模型的构建步骤,基于拼串函数将近度、频度及额度的综合得分拼接起来,获取该账号的评分结果;
28.账号类别评价步骤,基于评分结果,通过查找如下所示的比对表,从而获取该账号的评价结果;
29.序号rfm评分结果类别1高高高222高价值账号2高高低221重点发展账号3高低高212重点维护账号4高低低211新注册账号5低高高122重点挽留账号6低高低121一般价值账号7低低高112存疑型账号8低低低111无价值账号
30.在上述表中,评分结果为由近度、频度及额度的综合得分经由拼串函数将拼接起来。
31.在上述技术方案中,基于本技术人之前申请且已经公开的技术方案或人工归类的技术方案,获取每个客户名下的账户;再基于前述方案,根据不同账号在近一段时间内的表现对每个客户名下的账号进行打分,即按照额度、近度与频度三个维度指标进行打分,从而使打分出来的分值贴近实际情况;并在账号价值从无价值账号变为存疑型账号时,通常其为违规操作时才出现的情况,而基于此进行账号监控,从而有效地提高对账号异常的监控。
32.为了实现上述另一目的,本发明提供的异常账号预警系统基于券商客户账号类别识别结果,该异常账号预警系统包括处理器及与处理器耦合连接的显示器与存储器,存储器存储有计算机程序,该计算机程序被处理器执行时,能实现动态监控步骤与警报生成步骤;动态监控步骤包括获取券商客户账号的当前类别识别结果;警报生成步骤包括若有账号的类别从之前的无价值账号变成当前的存疑型账号时,生成预警警报内容,并控制显示屏显示预警警报内容,预警警报内容包括异常账号信息;获取券商客户账号的当前类别识别结果的步骤包括以下步骤:
33.指标数据接收步骤,接收目标券商客户数据,该数据包括近度、频度及额度三个维度内的所有指标在所指定的过去一段时间内的指标数据,且每个维度至少具有两个指标;
34.指标数据预处理步骤,对前述数据中的频度与额度两个维度内的指标数据,依据时间价值权重判断矩阵,将每个账号内每个指标按n个均等分时间段数据进行加权平均处理,并将计算得到的加权平均值作为该账号内该指标的数据值;时间价值权重判断矩阵为成对比较矩阵a;成对比较矩阵a的元素加权系数为矩阵a的最大特征
根n对应的归一化特征向量ω={ω1,ω2,...,ωn},且基于前述数据中的近度维度指标数据及经加权平均处理之后的频度与额度两个维度内的指标数据,获取同一客户的多个账号上同一指标数据的算数平均值;若该客户的某一账号内的频度维度与额度维度所对应的指标值大等于对应维度指标算数平均值则对该指标赋值为2,否则赋值为1;若该客户的某一账号内的近度维度所对应的指标值大等于该维度指标算数平均值则对该指标赋值为1,否则赋值为2;从而获取经预处理之后的账号内指标打分分值;
35.维度指标降维步骤,基于降维方法对每个维度里的指标进行降维处理,从而获取用于表征每个维度的单个主指标,并计算每个维度的单个主指标的数值,作为该维度内指标的综合得分;
36.评价模型的构建步骤,基于拼串函数将近度、频度及额度的综合得分拼接起来,获取该账号的评分结果;
37.账号类别评价步骤,基于评分结果,通过查找如下所示的比对表,从而获取该账号的评价结果;
[0038][0039][0040]
在上述表中,评分结果为由近度、频度及额度的综合得分经由拼串函数将拼接起来。
[0041]
在上述技术方案中,基于本技术人之前申请且已经公开的技术方案或人工归类的技术方案,获取每个客户名下的账户;再基于前述方案,根据不同账号在近一段时间内的表
现对每个客户名下的账号进行打分,即按照额度、近度与频度三个维度指标进行打分,从而使打分出来的分值贴近实际情况;并在账号价值从无价值账号变为存疑型账号时,通常其为违规操作时才出现的情况,而基于此进行账号监控,从而有效地提高对账号异常的监控。
[0042]
具体的方案为控制显示屏显示预警警报内容的步骤包括以下步骤:在显示屏上显示异常账号信息的同时,显示近度、频度与额度的指标信息。
附图说明
[0043]
图1为本发明实施例1中券商客户账号类别识别方法的工作流程图;
[0044]
图2为本发明实施例2中异常账号预警方法的工作流程图。
具体实施方式
[0045]
以下结合实施例及其附图对本发明作进一步说明。
[0046]
在下述实施例中,对于每个券商客户名下的相关账号而言,可以根据已有材料进行人为归类而获取,也可以采用本技术人所申请且公开号为cn112561699a的专利文献所公开的技术方案,其内容作为优选方案导入下述实施例的技术方案中,在此不再赘述。
[0047]
实施例1
[0048]
在本实施例中,为了识别出客户账号的类别,所要处理的数据主要包括属于同一券商的终端应用数据与柜台数据,进一步地还可包括用于辅助识别的股票社区数据;在本实施例中,为了识别出不同的客户账号类别,主要是基于近度、频度与额度三个维度指标去识别不同的账号类别;如图1所示,用于识别券商客户账号类别的方法具体包括指标数据接收步骤s1、指标数据预处理步骤s2、维度指标降维步骤s3、评价模型构建步骤s4及账号类别评价步骤s5。
[0049]
指标数据接收步骤s1,通过通讯线路,接收预设指标在预定时间段内的指标数据。其中,“通讯线路”为包括一个或多个被配置在识别系统与数据存储服务器等数据存储装置或/或手机app等数据采集装置之间,用于传送信息数据的数据路线,可以是通讯网络中的电线路、光学线路、无线线路及它们的组合,其还有多种显而易见的变化。
[0050]
在本实施例中,指标数据由属于同一券商的终端应用数据与柜台数据组成。其中,预定时间段是指“过去的n个交易日”,即为“指定的过去一段时间”,通常选用30个工作日或60个工作日。而预设指标由“近度”、“频度”及“额度”三个维度的评价指标组成,为了表征近度、频度及额度该三个维度,在本实施例中为主要根据经验对每个维度列举至少两个表征指标,具体为根据相关经验人员对每个维度里面的典型指标进行列举,再相互讨论出或者根据经验获取其中最具代表性的两个典型指标或三个以上典型指标,用于表征近度、额度和频度这三个维度,在下述描述中,以每个维度两个或三个指标为例。
[0051]
具体地,如下表1所示的内容,基于专家的讨论,以典型指标r1、r2表征近度维度,以典型指标f1、f2、t表征频度维度,及以典型指标m、n表征额度维度,该7个典型指标的具体含义如下表1所示,即在本实施例中基于7个指标进行建模而对券商客户账号的类别进行识别。
[0052]
表1分析指标及其定义
[0053][0054]
[0055]
从上述定义可知,用典型指标r1与r2表征近度维度,用典型指标f1、f2与t表征频度维度,而用典型指标m与n表征额度维度;它们为基于实际需要进行列举,也可以根据实际需要再多列举几个典型指标,例如均为三个以上,且每个维度内部的指标数量无需相等。
[0056]
指标数据预处理步骤s2,基于一致矩阵构造时间价值权重判断矩阵,并利用其对频度维度与额度维度里的所有指标数据按前后不同时间段赋予不同的权重,再进行加权平均计算;并在完成加权平均处理之后,对近度、频度与额度三个维度内的所有指标进行整体分类赋值计算。其中,“整体分类赋值计算”具体为“先对同一客户的多个账号上同一指标数据值进行算数平均值计算;再判断该客户的某一账号内对应指标值大等于该算数平均值,对于频度和额度维度的指标,若判断结果为大于,则将该账号内的该指标值赋值为2,否则赋值为1,对于近度维度的指标,若判断结果为大于,则将该账号内的该指标值赋值为1,否则赋值为2”。
[0057]
获取每个客户每个账号在前述指定的过去一段时间内的该七个典型指标的数据值,并对于频度维度与额度维度内的每个典型指标在指定的过去一段时间内的数据进行加权预处理,以使经预处理之后的数据考虑了时间远近的权重,以更贴近实际的影响。
[0058]
具体为先通过时间分段而构建成对比较矩阵a,通常为将前述过去一段时间平均分成n段,根据具体需要进行设置,将n个交易日等分成n1段,合每段为n2个交易日,具体为采用六段数据模式进行计算处理;对于该成对比较矩阵a,其元素a
ij
表示的是第i个因素相对于第j个因素的比较结果,这个值使用以下表2所示的标度方法给出,因素i与因素j的比较值为a
ij
,因素j与因素i的比较值为a
ji
,且存在以下关系:成对比较矩阵是表示本层所有因素针对上一层某一个因素的相对重要性的比较。
[0059]
表2标度方法
[0060][0061]
[0062]
如上述成对比较矩阵a中每个元素的含义可知,随着时间段相距当前时间越近,该段时间内的权重就越大,且该成对比较矩阵a的元素满足以下条件:
[0063]
(1)a
ii
=1;
[0064][0065]
(3)a
ij
=a
ik
·akj
(i,j,k=1,2,...,n)。
[0066]
从而使一致阵的性质如下:
[0067][0068]
2)a
ij
=a
ik
·akj
(i,j,k=1,2,...,n);
[0069]
3)a
t
也是一致阵;
[0070]
4)a的各行成比例,则a矩阵的秩为1;
[0071]
5)a的最大特征根为λ=n,其余的n-1个特征根均等于0;
[0072]
6)a的任一列(行)都是对应于特征根n的特征向量,aw=nw。
[0073]
在本实施例中,将“过去的n个交易日”设置为常用的30个交易日,即以30个交易日研究对象;以五个交易日为一个时间段而均分为六段时间段,第i个时间段记为pi;并基于此而构建下述成对比较矩阵a:
[0074][0075]
基于前述对成对比较矩阵a的元素定义,可以基于此对两个取值进行比较,并构建本实施例中的时间价值权重判断矩阵如下:
[0076][0077]
在本实施例中,对于一致阵,取前述成对比较举证的最大特征根n的归一化特征向量ω={ω1,ω2,...,ωn}作为权向量,且ωi表示下层第i个因素对上层的某个因素影响权值,也就是不同指标的相对权系数。通过计算得到经赋值之后的该成对比较矩阵a
的λ
max
=6,特征向量为ω=(-0.105,-0.210,-0.314,-0.419,-0.524,-0.629)
t
,归一化后的特征向量为ω=(0.048,0.095,0.143,0.190,0.238,0.286)
t

[0078]
在本实施例中,采用一致矩阵法定量求解不同时间段的权重。由于一致矩阵法不把所有因素放在一起比较,而是两两比较,因此时采用相对尺度,从而可尽可能地减少性质不同的诸因素相互比较的困难,以提高准确性。
[0079]
基于上述所构建出的一致矩阵对指标数据进行预处理,主要是基于时间段远近的影响而赋予对应时间权重,对于上述七个指标,f1、f2、t、m及n该五个指标需要考虑对应时间价值,而r1、r2则已经把时间的价值考虑进去了,因此仅需对f1、f2、t、m及n该五个指标采用上述一致矩阵进行预处理,即基于归一化后的特征向量进行加权平均计算。依据前面的计算结果,各个时间段的权重取ω=(0.048,0.095,0.143,0.190,0.238,0.286)
t
。具体为以客户为分组,计算每个账号下的典型指标r1、r2、f1、f2、t、m及n的得分。
[0080]
假设该客户有k个账号,分别为acc1,acc2,...,acck,具体得分的计算过程包括指标数值的预处理与赋值步骤。
[0081]
(1)频度指标的预处理步骤:
[0082]
(1.1)对典型指标f1的指标数据的预处理与得分计算:
[0083]
第k个账号acck的f1的得分acck_f1_score的计算公式如下:
[0084][0085]
其中,为账号acck第pi阶段的总交易次数,从而有k个账号f1的得分均值为:
[0086][0087]
k个账号中每个账号的f1指标的赋值规则为:
[0088]
f1_acck_flag=if(acck_f1_score>=avg_f1_score,2,1),k=1,2...k
[0089]
即对于频度指标,k个账号中每个账号的f1指标的标记规则为:获取同一客户的每个账号上同一指标数据的算数平均值;若该客户的某一账号内对应指标值大等于该算数平均值则对该指标赋值为2,否则赋值为1,并采用该值表征该账号中的f1指标数值。
[0090]
(1.2)对典型指标f2的指标数据的预处理:
[0091]
同理,有指标f2的得分acck_f2_score的计算公式如下:
[0092][0093]
其中,为账号acck第pi阶段的总的仅登录不交易的次数,从而有k个账号f2的得分均值为:
[0094][0095]
对于k个账号中每个账号的f2指标的赋值规则为:
[0096]
f2_acck_flag=if(acck_f2_score>=avg_f2_score,2,1),k=1,2...k
[0097]
即对于频度指标,k个账号中每个账号的f2指标的标记规则为:获取同一客户的多
个账号上同一指标数据的算数平均值;若该客户的某一账号内对应指标值大等于该算数平均值则对该指标赋值为2,否则赋值为1,并采用该值表征该账号中的f2指标数值。
[0098]
(1.3)对典型指标t的指标数据的预处理与得分计算:
[0099]
对于指标t的得分acck_t_score的计算公式如下:
[0100][0101]
其中,为账号acck第pi阶段的总的使用的手机流量,从而有k个账号指标t的得分均值为:
[0102][0103]
则k个账号中每个账号的t指标的赋值规则为:
[0104]
t_acck_flag=if(acck_t_score>=avg_t_score,2,1),k=1,2...k
[0105]
即对于频度指标,k个账号中每个账号的t指标的标记规则为:获取同一客户的多个账号上同一指标数据的算数平均值;若该客户的某一账号内对应指标值大等于该算数平均值则对该指标赋值为2,否则赋值为1,并采用该值表征该账号中的t指标数值。
[0106]
(2)额度指标的预处理步骤:
[0107]
(2.1)对典型指标m的指标数据的预处理与得分计算:
[0108]
指标m的得分acck_m_score的计算公式如下:
[0109][0110]
其中,为账号acck第pi阶段的总的交易金额,从而有k个账号m的得分均值为:
[0111][0112]
则k个账号中每个账号的指标m的标记规则为:
[0113]
m_acck_flag=if(acck_m_score>=avg_m_score,2,1),k=1,2...k
[0114]
即对于额度指标,k个账号中每个账号的指标m的标记规则为:获取同一客户的多个账号上同一指标数据的算数平均值;若该客户的某一账号内对应指标值大等于该算数平均值则对该指标赋值为2,否则赋值为1,并采用该值表征该账号中的指标m数值。
[0115]
(2.2)对典型指标n的指标数据的预处理与得分计算:
[0116]
指标n的得分acck_n_score的计算公式如下:
[0117][0118]
其中,为账号acck第pi阶段的总的交易笔数,则有k个账号指标n的得分均值为:
[0119][0120]
则k个账号中每个账号的指标n的标记规则为:
[0121]
n_acck_flag=if(acck_n_score>=avg_n_score,2,1),k=1,2...k
[0122]
即对于额度指标,k个账号中每个账号的n指标的标记规则为:获取同一客户的多个账号上同一指标数据的算数平均值;若该客户的某一账号内对应指标值大等于该算数平均值则对该指标赋值为2,否则赋值为1,并采用该值表征该账号中的n指标数值。
[0123]
(3)近度指标的预处理步骤:
[0124]
(3.1)对典型指标r1的指标数据的得分计算:
[0125]
由于典型指标r1、r2该这两个指标已经把时间的价值考虑进去,所以这两个指标的计算不引入时间权重进行预处理,在本实施例中具体为以客户为分组,计算典型指标r1和r2这两个指标的得分,其中,典型指标r1的得分acck_r1_score的计算公式如下:
[0126]
acck_r1_value=min(acck_r1_daysi),i=1,2...
[0127]
其中,acck_r1_days为账号acck发生交易到现在的时间间隔,acck_r1_value为该账号最近一次交易到现在的时间间隔,同一客户k个账号r1的得分均值为:
[0128][0129]
则k个账号中每个账号的r1指标的标记规则为:
[0130]
r1_acck_flag=if(acck_r1_score>=avg_r1_score,1,2),k=1,2...k
[0131]
即对于近度维度内的指标,k个账号中每个账号的r1标的标记规则为:获取同一客户的多个账号上同一指标数据的算数平均值;若该客户的某一账号内对应指标值大等于该算数平均值则对该指标赋值为1,否则赋值为2,并采用该值表征该账号中的r1指标数值。(3.2)对典型指标r2的指标数据的得分计算:
[0132]
同理,对于指标r2的得分而言,其得分acck_r2_score的计算公式如下:
[0133]
acck_r2_value=min(acck_r2_daysi),i=1,2...
[0134]
其中,acck_r2_days为账号acck仅登入但不交易到现在的时间间隔,acck_r2_value为该账号最近一次仅登录不交易的时间到现在的时间间隔,有k个账号r2的得分均值为:
[0135][0136]
则k个账号中每个账号的r2指标的标记规则为:
[0137]
r2_acck_flag=if(acck_r2_score>=avg_r2_score,1,2),k=1,2...k
[0138]
即对于近度维度内的指标,k个账号中每个账号的r2指标的标记规则为:获取同一客户的多个账号上同一指标数据的算数平均值;若该客户的某一账号内对应指标值大等于该算数平均值则对该指标赋值为1,否则赋值为2,并采用该值表征该账号中的r2指标数值。
[0139]
维度指标降维步骤s3,基于降维方法对每个维度里的指标进行降维处理,从而获
取用于表征每个维度的单个主指标。
[0140]
在本实施例中,具体为基于主成分分析法,对每个维度里面的指标进行降维处理,从而获取整合所有信息的主指标;通过主成分分析,并以第一主成分作为大部分信息的主指标,而对其他所存在的主成分进行忽略,以表征该维度。
[0141]
具体分析过程为通过抽样出多个客户作为样本,并对该客户按照下述模型构建步骤中的评价基准进行评分,再利用该评分结果基于每个维度内部的多个指标进行主成分分析,获取第一主成分的表征公式,并以该表征公式作为降维计算公式,对每个维度里面的指标数据进行计算。
[0142]
即在本实施例中,基于主成分分析方法这一降维方法而组合出新的主指标,用于表征对应维度的得分,从而使计算结果更加贴近实际,且能进行综合计算。
[0143]
该降维步骤的具体过程如下:
[0144]
(1)近度维度指标的降维处理步骤:
[0145]rmain
_acck_s=r1r1_acck_flag r2r2_acck_flag
[0146]
通过主成分分析法,在具体的样本观测值中算出系数r1和r2的值;
[0147]
r_acck_s=if(|r
main
_acck_s-1|>|r
main
_acck_s-2|,2,1)
[0148]
所得r_acck_s值可直接用于拼串函数的计算。
[0149]
(2)频度维度指标的降维处理步骤:
[0150]fmain
_acck_s=f1f1_acck_flag f2f2_acck_flag f3t_acck_flag
[0151]
通过主成分分析法,在具体的样本观测值中算出系数f1,f2和f3的值;
[0152]
f_acck_s=if(|f
main
_acck_s-1|>|f
main
_acck_s-2|,2,1)
[0153]
所得f_acck_s值可直接用于拼串函数的计算。
[0154]
(3)额度维度指标的降维处理步骤:
[0155]mmain
_acck_s=m1m_acck_flag m2n_acck_flag
[0156]
通过主成分分析法,在具体的样本观测值中算出系数m1和m2的值;
[0157]
m_acck_s=if(|m
main
_acck_s-1|>|m
main
_acck_s-2|,2,1)
[0158]
所得m_acck_s值可直接用于拼串函数的计算。
[0159]
模型构建步骤s4,基于实际比重,使用拼串函数将r、f、m的综合得分拼接起来,作为对每个客户的各个账号的评分模型,基于该评分结果获取对应的评分值。
[0160]
基于上述指标的计算结果,构建本实施例中的识别模型,即使用拼串函数将近度维度、频度维度及额度维度的综合得分拼接起来,作为对每个客户的评价模型,该拼串函数用法为:concat(a,b)表示将a和b拼起来,例如concat(1,1,0,0,1)=11001。以客户为分组,把客户的每个账号的近度、频度及额度三个维度指标的综合得分拼接起来。
[0161]
账号计算分类步骤s5,基于前述所构建的,对每个客户的各个账号的具体得分进行计算,对于任一客户账号k的得分计算如下:
[0162]
concat(r,f,m)k=concat(r_acck_s,f_acck_s,m_acck_s)
[0163]
根据计算结果对账号进行分类,账号的分类表如下表3所示:
[0164]
表3账号分类表
[0165]
序号rfm得分计算类别1高高高222高价值账号
2高高低221重点发展账号3高低高212重点维护账号4高低低211新注册账号5低高高122重点挽留账号6低高低121一般价值账号7低低高112存疑型账号8低低低111无价值账号
[0166]
对于上述8类账号的分类,基于指标rfm对它们的解释如下:
[0167]
(1)高价值账号:登录和交易次数多,交易金额大,最近一次的登录时间距离现在近,说明这个账号的表现良好,很活跃,这样的账号一般是作为客户的主账号,价值很高。
[0168]
(2)重点维护账号:交易金额大,最近一次的登录时间距离现在比较近,但是登录和交易次数比较少,这类账号的价值比较高但近期又不够活跃,需要重点去维护来提高账号的活跃度。
[0169]
(3)新注册账号:交易金额小,最近一次的登录时间距离现在比较近,登录和交易次数比较少,这类账号一般是新注册账号,最近才开始使用,由于历史记录很少,所以交易金额、登录和交易次数较少。
[0170]
(4)重点挽留账号:登录和交易次数多而且交易金额大,但是最近一次的登录时间距离现在比较久远,说明这个账号的历史记录表现良好,但是最近不活跃,这样的账号需要重点挽留。这个账号极有可能是曾经作为客户的主账号。
[0171]
(5)一般价值账号:登录和交易次数多但交易金额小,而且最近一次的登录时间距离现在比较久远,说明这个账号的价值比较小,而且客户的使用意愿不强,因此认为是一般价值账号。
[0172]
(6)存疑型账号:登录和交易次数少,最近一次的登录时间距离现在比较久远,但是交易金额较大,这样的账号极有可能存在异常交易,因此被认为是存疑型账号。
[0173]
(7)重点发展账号:登录和交易次数多,最近一次的登录时间距离现在比较近,但是交易金额小,说明这个账号的表现比较活跃,但是目前来说价值不高,需要重点发展和挖掘。
[0174]
(8)无价值账号:登录和交易次数少,最近一次的登录时间距离现在比较久远,而且交易金额也比较小,这样的账号价值很小,可能会被客户逐渐弃用。
[0175]
实施例2
[0176]
作为对本发明实施例2的说明,以下仅对与上述实施例1不同的地方进行说明,即为在上述识别结果的基础上,利用该识别结果的动态过程,对异常账号进行预警。
[0177]
如图2所示,该异常账号预警方法包括动态监控步骤s21与警报生成步骤s22,具体过程如下:
[0178]
动态监控步骤s21,获取券商客户账号的当前类别识别结果。该步骤由实施例1中的识别方法所完成,在此不再追溯。
[0179]
警报生成步骤s22,若有账号的类别从之前的无价值账号变成当前的存疑型账号时,生成预警警报。
[0180]
基于前述三个维度近度、频度及额度的指标定义可知,若有账号的类别从之前的
无价值账号变成当前的存疑型账号时,该账号大概率为异常账号。
[0181]
具体地,为了便于操作人员对异常账号的监控,在本实施例中,在显示屏显示预警警报内容,该预警警报内容包括前述异常账号信息,同时,显示近度、频度与额度的指标信息,以便于操作人员根据自己的经验判断该异常是否由于指标设定所引起。
[0182]
在上述实施例中,对于异常账号预警系统与识别系统,均包含处理器与存储器,且该存储器内存储有计算机程序,并在该计算机程序被处理器执行时,能实现上述对应方法的步骤,对于每个步骤里面的内容,在此不再赘述。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献