一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于滑动窗口快速挖掘疑似关联账单的方法、装置和存储介质与流程

2022-02-23 00:17:19 来源:中国专利 TAG:


1.本发明涉及账单数据处理领域,具体涉及一种基于滑动窗口快速挖掘疑似关联账单的方法、装置和存储介质。


背景技术:

2.账单流水的数据完整性对账单分析提供有力的支持,而实际情况中会由于各类原因导致获取到的账单流水可能存在各种各样的缺陷,比如转账交易的对手为空。有反侦查意识的分析对象会借助中间人进行中转交易,例如网捷贷套现使用或者行受贿行为。此类情况不仅会导致关键信息的丢失,导致无法知晓这笔资金的来源或者去向,失去下一步的研判方向。同时在一些资金追踪等深度研判方法上也会由于关键信息的不全或未掌握中间人,导致分析的偏差。
3.现有对交易对手标记主要是通过查找金额一致、时间相近的交易对手来补全其中一条交易对手为空的情况,不够系统也无法集中管理;除了人工识别手动以外以外,部分借助计算并表的比对也会有时间复杂度为o(n2)的问题,受限于只能在少数据量情况的自动分析,当分析对象较多时,合并后的流水可能就会达到几十上百万,此时的性能就无法满足快速分析的目的。


技术实现要素:

4.为解决现有技术所存在的无法系统识别交易对手为空和存在中间人交易的情况且时间复杂度高的问题,本发明的实施例中提出了如下的技术方案:
5.一种基于滑动窗口快速挖掘疑似关联账单的方法,包括:
6.s1:过滤筛选出多个账单中交易金额不为空并且非现金存取的借出或贷入数据,并按交易时间排序生成借出组账单集合fl和贷入组账单集合tl;
7.s2:通过滑动时间窗口在所述集合fl上获取前后交易时间差不超过时间范围t的借出记录集合wfl,并标记最早时间和最晚时间;通过滑动窗口在所述集合tl上获取交易时间在所述最早时间到所述最晚时间 t内的贷入记录集合wtl;
8.s3:循环遍历所述集合wfl,获取借出操作的交易记录fromrecord;循环遍历所述集合wtl,获取贷入操作的交易记录torecord;
9.s4:对比所述交易记录fromrecord和所述交易记录torecord,响应于匹配规则,将符合所述匹配规则的交易记录记入结果集合r。
10.更进一步的,当所述交易记录torecord的交易时间超过所述交易记录fromrecord的交易时间并达到限值t时,停止循环遍历所述集合wtl,将所述集合wtl的起始下标更新为当前交易记录torecord的下标。
11.更进一步的,所述匹配规则包括:同时满足本方卡号不同、交易金额一致、交易时间时分秒不全为0、前后交易的时间差在t范围内且torecord的时间大于或等于fromrecord
的时间的条件。
12.更进一步的,所述符合匹配规则的交易记录包括交易时间、转出记录id和转入记录id。
13.更进一步的,所述结果集合r以关系图的方式展示。
14.本发明还提出了一种基于滑动窗口快速挖掘疑似关联账单的装置,该装置使用如前所述的挖掘方法,包括:
15.数据获取单元:配置用于过滤筛选出多个账单中交易金额不为空并且非现金存取的借出或贷入数据,并按交易时间排序生成借出组账单集合fl和贷入组账单集合tl;
16.滑动窗口分析单元:配置用于通过滑动时间窗口在所述集合fl上获取前后交易时间差不超过时间范围t的借出记录集合wfl,并标记最早时间和最晚时间;通过滑动窗口在所述集合tl上获取交易时间在所述最早时间到所述最晚时间 t内的贷入记录集合wtl;
17.循环遍历单元:配置用于循环遍历所述集合wfl,获取借出操作的交易记录fromrecord;循环遍历所述集合wtl,获取贷入操作的交易记录torecord;
18.检测单元:配置用于对比所述交易记录fromrecord和所述交易记录torecord,响应于匹配规则,将符合所述匹配规则的交易记录记入结果集合r;
19.更新单元:配置用于当所述交易记录torecord的交易时间超过所述交易记录fromrecord的交易时间并达到限值t时,停止循环遍历所述集合wtl,将所述集合wtl的起始下标更新为当前借出操作的交易记录torecord的下标;
20.展示单元:配置用于将所述结果集合r展示给用户,由用户进行二次确认后标记为原始记录。
21.更进一步的,所述装置执行的匹配规则包括:同时满足本方卡号不同、交易金额一致、交易时间时分秒不全为0、前后交易的时间差在t范围内且torecord的时间大于或等于fromrecord的时间的条件。
22.更进一步的,所述符合匹配规则的交易记录包括交易时间、转出记录id和转入记录id。
23.更进一步的,所述结果集合r以关系图的方式展示。
24.本发明还提出了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被执行时执行如权利要求1-5任一项所述的检测方法。
25.本发明的技术效果为:本方案基于滑动窗口的方式,交叉比对交易明细,能够挖掘出疑似缺失交易对手的数据,也能挖掘出疑似存在中间人的可疑行为,同时使计算时间大大降低,分析效率高,为账单分析的数据完善和资金追踪提供了支撑。
附图说明
26.包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。附图的元件不一定是相互按照比例的。同样的附图标记指代对应的类似部件。
27.图1为根据本发明的一种基于滑动窗口快速挖掘疑似关联账单的方法的结果展示示例图;
28.图2为根据本发明的一种基于滑动窗口快速挖掘疑似关联账单的方法的结果进行疑似账单判断的示例图;
29.图3为根据本发明的实施例的一种基于滑动窗口快速挖掘疑似关联账单的方法的流程图;
30.图4为根据本发明的实施例的一种基于滑动窗口快速挖掘疑似关联账单的装置的结构图;
具体实施方式
31.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
32.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
33.首先介绍本发明的基本原理,这有助于理解本发明的基于滑动窗口快速挖掘疑似关联账单的方法。
34.针对限定范围内的多个分析对象间的交易流水数据,利用滑动窗口的方法快速比对分析,挖掘出实际对手是同案件中其他分析对象,但是数据中缺少交易对手或者存在中间交易人的记录。
35.对同一批次中所有的银行流水按贷方和借方进行划分,然后两层循环进行比对,符合匹配规则的一对记录保存到结果集中。最后再以关系图的形式直观展示疑似关联的流水记录,由用户进行二次确认后标记原始记录,并应用到各分析应用。
36.具体的账单挖掘流程的操作步骤示例如下:
37.基于一个案件中有多个分析对象,如a、b、c三张卡的交易流水。
38.1、过滤出交易金额不为空、非现金存取的转出记录,按交易时间排序后,得到集合定义为借出组fl。
39.2、过滤出交易金额不为空、非现金存取的转入记录,按交易时间排序后,得到集合定义为贷入组tl。
40.借出组fl数据内容如下:
41.序号交易时间本方卡号对方卡号借贷金额12021-01-01 01:11:016228480000000162284800000002借出100022021-01-01 01:21:016228480000000162284800000002借出200032021-01-01 01:31:0162284800000001 借出300042021-01-01 01:41:0162284800000001 借出400052021-01-01 01:51:0162284800000001 借出500062021-01-01 03:11:016228480000000162284800000003借出600072021-01-01 03:21:016228480000000262284800000004借出700082021-01-01 04:31:0162284800000002 借出8000
42.贷入组tl数据内容如下:
43.序号交易时间本方卡号对方卡号借贷金额
112021-01-01 01:11:016228480000000262284800000001贷入1000122021-01-01 01:21:0162284800000002 贷入2000132021-01-01 01:31:016228480000000262284800000001贷入3000142021-01-01 01:41:0162284800000002 贷入4000152021-01-01 01:51:1062284800000002 贷入5000162021-01-01 03:11:016228480000000262284800000003贷入6000172021-01-01 03:21:016228480000000162284800000005贷入7000182021-01-01 05:31:0162284800000001 贷入9000
44.数据说明如下:
45.序号1和11,干扰数据,属于正常数据;
46.序号2和12,异常数据,贷入方流水没有对手信息,实际为同一笔;
47.序号3和13,异常数据,借出方流水没有对手信息,实际为同一笔;
48.序号4和14,异常数据,都没有对手信息,交易时间一致,实际为同一笔;
49.序号5和15,异常数据,都没有对手信息,交易时间差10秒,实际为同一笔;
50.序号6和16,可疑数据,借助中间人尾号0003进行资金中转;
51.序号7和17,异常数据,借助中间人尾号0004、0005进行资金中转;
52.序号8和18,干扰数据。
53.3、借出组滑动窗口定义为,与前后交易记录交易时间差不超过时间范围t的记录集合。定义为wfl,并记录最早时间startt ime,最晚时间endt ime。
54.4、贷入组的滑动窗口定义为,交易时间为最早时间startt ime开始到最晚时间endt ime 时间范围t的记录集合,定义为wtl。
55.序号借出组滑动窗口wfl 序号贷入组滑动窗口wtl12021-01-01 01:11:01 112021-01-01 01:11:0122021-01-01 01:21:01 122021-01-01 01:21:0132021-01-01 01:31:01 132021-01-01 01:31:0142021-01-01 01:41:01 142021-01-01 01:41:0152021-01-01 01:51:01 152021-01-01 01:51:10
56.5、第一层循环遍历wfl,获取借出操作的交易记录fromrecord。
57.6、第二层循环遍历wtl,获取贷入操作的交易记录torecord。
58.7、对比fromrecord和torecord,判断同时符合以下匹配规则的记为结果:
59.本方卡号不同。因为不存在同一张卡互转的情况。
60.交易金额一致。因为同一笔交易金额一定相同。
61.交易时间时分秒不能全为0,如:2021-01-0100:00:00。因为要排除掉交易时间只到日期的记录。
62.时间相差在一定范围内,且torecord的时间大于等于fromrecord。因为接收时间要晚于发送时间。
63.8、针对符合匹配规则的,将交易时间、转出记录id、转入记录i d增加到结果集中,
结果集定义为r。
64.9、当torecord交易时间超过fromrecord交易时间达到限定值t时,停止第二层循环,即跳出当前wtl集合的循环。并设置第二层循环的起始下标为当前torecord的下标,减少无效遍历。
65.10、移动滑动窗口获取新的wfl和wtl,重复步骤5到步骤9
66.11、分析结果以关系图的形式直观展示疑似关联的流水记录,由用户进行二次确认后标记原始记录。
67.结果展示如图1所示。疑似关联账单判断结果如图2所示。
68.图3为根据本发明的一个实施例的一种基于滑动窗口快速挖掘疑似关联账单的方法的流程图。该方法包括:
69.s1:过滤筛选出多个账单中交易金额不为空并且非现金存取的借出或贷入数据,并按交易时间排序生成借出组账单集合fl和贷入组账单集合tl;
70.s2:通过滑动时间窗口在所述集合fl上获取前后交易时间差不超过时间范围t的借出记录集合wfl,并标记最早时间和最晚时间;通过滑动窗口在所述集合tl上获取交易时间在所述最早时间到所述最晚时间 t内的贷入记录集合wtl;
71.s3:循环遍历所述集合wfl,获取借出操作的交易记录fromrecord;循环遍历所述集合wtl,获取贷入操作的交易记录torecord;
72.s4:对比所述交易记录fromrecord和所述交易记录torecord,响应于匹配规则,将符合所述匹配规则的交易记录记入结果集合r。
73.通过上述账单数据挖掘方法,基于滑动窗口的方式,交叉比对借出和贷入的交易明细,能够挖掘出两种情况的疑似关联账单流水。一种是由于数据本身的原因出现一方或者双方交易对手都为空的情况,只要金额一致且交易时间差在限定范围内,能够通过本方法挖掘得到;另一种数据本身没有问题,分析对象有意通过单个或者多个中间人中转,只要金额一致且交易时间差在限定范围内,也能够通过本方法挖掘得到。
74.在多分析对象的账单流水合并挖掘的情况下,双层循环遍历,时间复杂度是o(n2),本方法借助滑动窗口,限制每次参与分析的数据量n,最大限度的降低了n的大小,使计算时间大大降低,分析效率高。
75.同时可以根据应用场景调整限定条件,如果是挖掘缺失交易对手的,可以调低时间限定值,10分钟或者30分钟内的交易流水是比较少的;如果是挖掘中间人时,限定时间可能会设置为几天,此时流水就会比较多,可以通过限定交易金额大小,控制流水数量。
76.在本发明的一个具体实施方式中,当所述交易记录torecord的交易时间超过所述交易记录fromrecord的交易时间并达到限值t时,停止循环遍历所述集合wtl,将所述集合wtl的起始下标更新为当前交易记录torecord的下标。这样减少了无效的遍历,可以节约分析时间,提高分析效率。
77.在本发明的一个具体实施方式中,所述匹配规则包括:同时满足本方卡号不同、交易金额一致、交易时间时分秒不全为0、前后交易的时间差在t范围内且torecord的时间大于或等于fromrecord的时间的条件。
78.在本发明的一个具体实施方式中,所述符合匹配规则的交易记录包括交易时间、转出记录id和转入记录id。
79.在本发明的一个具体实施方式中,所述结果集合r以关系图的方式展示。展示结果简单直观,便于客户选择判断。
80.进一步参考图4,作为对上述图3所述方法的实现,本技术还提供了一种基于滑动窗口快速挖掘疑似关联账单的装置的一个实施例,该实施例与图3所述方法的实施例相对应,该装置具体可以包含在各种电子设备中。
81.一种基于滑动窗口快速挖掘疑似关联账单的装置,包括:
82.数据获取单元1:配置用于过滤筛选出多个账单中交易金额不为空并且非现金存取的借出或贷入数据,并按交易时间排序生成借出组账单集合fl和贷入组账单集合tl;
83.滑动窗口分析单元2:配置用于通过滑动时间窗口在所述集合fl上获取前后交易时间差不超过时间范围t的借出记录集合wfl,并标记最早时间和最晚时间;通过滑动窗口在所述集合tl上获取交易时间在所述最早时间到所述最晚时间 t内的贷入记录集合wtl;
84.循环遍历单元3:配置用于循环遍历所述集合wfl,获取借出操作的交易记录fromrecord;循环遍历所述集合wtl,获取贷入操作的交易记录torecord;
85.检测单元4:配置用于对比所述交易记录fromrecord和所述交易记录torecord,响应于匹配规则,将符合所述匹配规则的交易记录记入结果集合r;
86.更新单元5:配置用于当所述交易记录torecord的交易时间超过所述交易记录fromrecord的交易时间并达到限值t时,停止循环遍历所述集合wtl,将所述集合wtl的起始下标更新为当前借出操作的交易记录torecord的下标;
87.展示单元6:配置用于将所述结果集合r展示给用户,由用户进行二次确认后标记为原始记录。
88.在本发明一种基于滑动窗口快速挖掘疑似关联账单的装置里的一个具体的实施方式中,所述装置执行的匹配规则包括:同时满足本方卡号不同、交易金额一致、交易时间时分秒不全为0、前后交易的时间差在t范围内且torecord的时间大于或等于fromrecord的时间的条件。
89.在本发明一种基于滑动窗口快速挖掘疑似关联账单的装置里的一个具体的实施方式中,所述符合匹配规则的交易记录包括交易时间、转出记录id和转入记录id。
90.在本发明一种基于滑动窗口快速挖掘疑似关联账单的装置里的一个具体的实施方式中,所述结果集合r以关系图的方式展示。
91.为了描述的方便,描述以上系统时以功能分为各种单元分别描述。当然,在实施本技术时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
92.通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例或者实施例的某些部分所述的方法。
93.根据本发明的一种基于滑动窗口快速挖掘疑似关联账单的方法、装置和可读存储介质,基于滑动窗口的方式,交叉比对交易明细,能够挖掘出疑似缺失交易对手的数据,也能挖掘出疑似存在中间人的可疑行为,同时使计算时间大大降低,分析效率高,为账单分析
的数据完善和资金追踪提供了支撑。可以作为现有分析方法的一种补充。应用前景广泛。
94.最后所应说明的是:以上实施例仅以说明而非限制本发明的技术方案,尽管参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何修改或局部替换,其均应涵盖在本发明的权利要求范围当中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献