一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

诈骗数据深度分析方法及系统与流程

2022-06-05 21:31:53 来源:中国专利 TAG:


1.本发明涉及信息处理技术领域,尤其涉及一种诈骗数据深度分析方法及系统。


背景技术:

2.知识图谱(knowledge graph)是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论,它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。
3.然而现有技术中,存储有诈骗案件源数据的系统大多数为案件管理系统,仅提供案件检索和案件导出功能,少部分案件管理系统可基于关系数据库实现线索关联分析,但仍存在可视度差,分析效率慢的缺点。知识图谱作为一种语义网络的知识库,能够用可视化技术描述知识资源及其载体,并挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。基于此,如何基于知识图谱对诈骗案件源数据进行深度分析,以提高案件分析效率和案件数据的可视度,成为一个亟待解决的问题。
4.上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。


技术实现要素:

5.本发明的主要目的在于提供了一种诈骗数据深度分析方法及系统,旨在解决如何基于知识图谱对诈骗案件源数据进行深度分析,以提高案件分析效率和案件数据的可视度的技术问题。
6.为实现上述目的,本发明提供了一种诈骗数据深度分析方法,所述诈骗数据深度分析方法包括:
7.对获取到的诈骗案件源数据进行数据转换,获得结构化数据;
8.根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中;
9.根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
10.优选地,所述对获取到的诈骗案件源数据进行数据转换,获得结构化数据的步骤,具体包括:
11.对获取到的诈骗案件源数据进行数据清洗,获得清洗后的诈骗案件源数据;
12.对所述清洗后的诈骗案件源数据进行分词处理,获得分词数据;
13.根据预设结构化规则对所述分词数据进行知识抽取处理,获得结构化数据。
14.优选地,所述根据预设结构化规则对所述分词数据进行知识抽取处理,获得结构化数据的步骤,具体包括:
15.根据预设结构化规则对所述分词数据进行实体抽取,获得实体数据;
16.根据预设结构化规则对所述分词数据进行关系抽取,获取关系数据;
17.基于所述实体数据和所述关系数据生成结构化数据
18.优选地,所述根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中的步骤,具体包括:
19.将所述结构化数据进行数据整合,获得三元组,并将所述三元组输入至图数据库中;
20.根据所述图数据库中的所述三元组和预设知识图谱框架,生成对应的诈骗分析知识图谱;
21.将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中。
22.优选地,所述诈骗分析知识图谱包括案件知识图谱、资金流知识图谱以及话单知识图谱;
23.相应地,所述根据所述图数据库中的所述三元组和预设知识图谱框架,生成对应的诈骗分析知识图谱的步骤,具体包括:
24.根据所述图数据库中的案件知识图谱框架从所述三元组中提取对应的案件结构数据进行数据补充,生成对应的案件知识图谱;
25.根据所述图数据库中的资金流知识图谱框架从所述三元组中提取对应的资金流结构数据进行数据补充,生成对应的资金流知识图谱;
26.根据所述图数据库中的话单知识图谱框架从所述三元组中提取对应的话单结构数据进行数据补充,生成对应的话单知识图谱;
27.相应地,所述将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中的步骤,具体包括:
28.将所述案件知识图谱嵌入至对应的诈骗分析模型中;
29.将所述资金流知识图谱嵌入至对应的诈骗分析模型中;
30.将所述话单知识图谱嵌入至对应的诈骗分析模型中。
31.优选地,所述根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果的步骤,具体包括:
32.根据所述案件知识图谱中在所述图数据库中查找强关联案件数据和/或弱关联案件数据;
33.将查找到的所述强关联案件数据和/或所述弱关联案件数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
34.优选地,所述根据所述案件知识图谱中在所述图数据库中查找强关联案件数据和弱关联案件数据的步骤之前,还包括:
35.根据所述案件知识图谱提取目标问答映射关系,并基于所述目标问答映射关系建立对应的问答模板;
36.根据所述问答模板和所述目标问答映射关系生成办案插件,并将所述办案插件融合进所述诈骗分析模型中。
37.优选地,所述从所述诈骗分析知识图谱中提取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果的步骤,具体包括:
38.从所述资金流知识图谱中查找历史资金流低于预设最低资金流的目标账户;
39.在检测到所述目标账户入账大于预设交易资金流的目标资金时,将与所述目标资金对应的流水记录发送至所述诈骗分析模型中,以获得诈骗分析结果。
40.优选地,所述从所述诈骗分析知识图谱中提取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果的步骤,具体包括:
41.从所述话单知识图谱获取话单数据的发起位置,并统计各发起位置的话单数;
42.在检测到存在话单数大于预设话单数的目标发起位置时,将所述目标发起位置输入至所述诈骗分析模型中,以获得诈骗分析结果。
43.优选地,所述将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中的步骤,具体包括:
44.根据所述诈骗分析知识图谱构建嵌入表示模板,并基于所述嵌入表示模板建立对应的模型搜索库;
45.在所述模型搜索库中搜索所述诈骗分析知识图谱所对应的初阶模型;
46.根据所述诈骗分析知识图谱对所述初阶模型进行训练,以获得对应的诈骗分析模型。
47.优选地,所述根据所述诈骗分析知识图谱对所述初阶模型进行训练,以获得对应的诈骗分析模型的步骤,具体包括:
48.从所述诈骗分析知识图谱中提取各诈骗指标项,并根据预设评分规则计算各诈骗指标项的评分结果;
49.将所述诈骗特征数据作为所述初阶模型的输入结果,将所述评分结果作为初阶模型的输出结果;
50.根据所述输入结果和所述输出结果对所述初阶模型进行训练,以获得对应的诈骗分析模型。
51.优选地,所述根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果的步骤,具体包括:
52.根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,获得所述诈骗特征数据对应的评分结果;
53.将所述评分结果按照从高到低的排序方式进行排序,获得评分排序结果;
54.基于排序第一顺位的评分结果生成诈骗分析结果。
55.此外,为实现上述目的,本发明还提出一种诈骗数据深度分析系统,所述诈骗数据深度分析系统包括:
56.数据结构化模块,用于对获取到的诈骗案件源数据进行数据转换,获得结构化数据;
57.模型嵌入模块,用于根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中;
58.诈骗分析模块,用于根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
59.所述数据结构化模块,还用于对获取到的诈骗案件源数据进行数据清洗,获得清洗后的诈骗案件源数据;
60.所述数据结构化模块,还用于对所述清洗后的诈骗案件源数据进行分词处理,获得分词数据;
61.所述数据结构化模块,还用于根据预设结构化规则对所述分词数据进行知识抽取处理,获得结构化数据。
62.优选地,所述模型嵌入模块,还用于将所述结构化数据进行数据整合,获得三元组,并将所述三元组输入至图数据库中;
63.所述模型嵌入模块,还用于根据所述图数据库中的所述三元组和预设知识图谱框架,生成对应的诈骗分析知识图谱。
64.优选地,所述模型嵌入模块,还用于根据所述图数据库中的案件知识图谱框架从所述三元组中提取对应的案件结构数据进行数据补充,生成对应的案件知识图谱;
65.所述模型嵌入模块,还用于根据所述图数据库中的资金流知识图谱框架从所述三元组中提取对应的资金流结构数据进行数据补充,生成对应的资金流知识图谱;
66.所述模型嵌入模块,还用于根据所述图数据库中的话单知识图谱框架从所述三元组中提取对应的话单结构数据进行数据补充,生成对应的话单知识图谱。
67.优选地,所述诈骗分析模块,还用于根据所述案件知识图谱中在所述图数据库中查找强关联案件数据和/或弱关联案件数据;
68.所述诈骗分析模块,还用于将查找到的所述强关联案件数据和/或所述弱关联案件数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
69.优选地,所述诈骗分析模块,还用于根据所述案件知识图谱提取目标问答映射关系,并基于所述目标问答映射关系建立对应的问答模板;
70.所述诈骗分析模块,还用于根据所述问答模板和所述目标问答映射关系生成办案插件,并将所述办案插件融合进所述诈骗分析模型中。
71.优选地,所述诈骗分析模块,还用于从所述资金流知识图谱中查找历史资金流低于预设最低资金流的目标账户;
72.所述诈骗分析模块,还用于在检测到所述目标账户入账大于预设交易资金流的目标资金时,将与所述目标资金对应的流水记录发送至所述诈骗分析模型中,以获得诈骗分析结果。
73.优选地,所述诈骗分析模块,还用于从所述话单知识图谱获取话单数据的发起位置,并统计各发起位置的话单数;
74.所述诈骗分析模块,还用于在检测到存在话单数大于预设话单数的目标发起位置时,将所述目标发起位置输入至所述诈骗分析模型中,以获得诈骗分析结果。
75.本发明中,对获取到的诈骗案件源数据进行数据转换,获得结构化数据,根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中,根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果。有别于现有技术中,仅对案件提供案件检索和案件导出功能,或简单的线索关联分析,但仍存在可视度差,分析效率慢的缺点,本发明基于诈骗案件源数据构建诈骗分析知识图谱,并将诈骗分析知识图谱嵌入对应的诈骗分析模型中,以基于诈骗分析模型实现对诈骗案件源数据的深度分析,提高案件分析效率和案件数据的可视度。
附图说明
76.图1为本发明诈骗数据深度分析方法第一实施例的流程示意图;
77.图2为本发明诈骗数据深度分析方法第二实施例的流程示意图;
78.图3为本发明诈骗数据深度分析方法第三实施例的流程示意图;
79.图4为本发明诈骗数据深度分析方法第四实施例的流程示意图;
80.图5是本发明诈骗数据深度分析系统第一实施例的结构框图。
81.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
82.应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
83.本发明实施例提供了一种诈骗数据深度分析方法,参照图1,图1为本发明诈骗数据深度分析方法第一实施例的流程示意图。
84.本实施例中,所述诈骗数据深度分析方法包括以下步骤:
85.步骤s10:对获取到的诈骗案件源数据进行数据转换,获得结构化数据;
86.需要说明的是,为了获得结构化的诈骗案件源数据,以便于构建对应的知识图谱,在获得诈骗案件源数据(包括但不限于案件数据库、资金流数据库、话单数据库、涉案数据excel表、案件卷宗、txt文本、涉案磁盘、内存设备等存储介质中所存储的数据)后,可对诈骗案件源数据进行数据清洗,获得清洗后的诈骗案件源数据,所谓数据清洗,可理解为发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等;然后,对清洗后的诈骗案件源数据进行分词处理,获得分词数据,所谓分词处理,可理解为在根据用户提交查询的关键词串进行对应的查询处理后,根据关键词串进行分词;接着,根据预设结构化规则对所述分词数据进行知识抽取处理,获得结构化数据,所述预设结构化规则包括但不限于业务原则(business principle)、效率原则(efficiency principle)、分析原则(analytics principle)以及冗余原则(redundancy principle)。其中,所谓知识抽取处理,可理解为根据预设结构化规则对所述分词数据进行实体抽取(也称为命名实体识别,此处的实体是知识图谱的基本单元,也是本文中承载信息的重要语言单位,包括概念,人物,组织,地名,时间等等),获得实体数据,根据预设结构化规则对所述分词数据进行关系抽取(可理解为识别实体和实体之间的语义关系,获得文本中的关键知识),获取关系数据,再基于所述实体数据和所述关系数据生成结构化数据。此外,在获得实体数据和关系数据后,还可进行属性抽取(可理解为抽取实体与实体之间关系的权重,也就是实体的属性信息,和关系比较类似,关系反映实体的外部联系,属性体现实体的内部特征),获得属性数据,并将实体数据、关系数据以及属性数据作为结构化数据。
87.步骤s20:根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中;
88.在具体实现中,为了获得诈骗分析知识图谱,以实现基于知识图谱对诈骗案件源数据进行深度分析,提高案件分析效率和案件数据的可视度,可将所述结构化数据进行数据整合,获得三元组,三元组的基本形式包括但不限于:实体1-关系-实体2和实体-属性-属性值,然后,将所述三元组输入至图数据库中,所谓图数据库,包括节点、边以及属性,所谓节点,可用于表示实体、事件等对象,可类比于关系数据库中的记录,例如人物、地点、电影
等;所谓边,可理解为图中连接节点的有向线条,可用于表示不同节点之间的关系,例如夫妻关系、同事关系等;所谓属性,可用于描述节点或者边的特性,例如姓名、夫妻关系的起止时间等。然后,根据所述图数据库中的所述三元组和预设知识图谱框架,生成对应的诈骗分析知识图谱,所述预设知识图谱框架,可理解为知识图谱的模式层中用来描述概念与概念(如实体与实体)之间的关系的一种可用来填充数据的框架,如案件知识图谱框架、资金流知识图谱框架、话单知识图谱框架等,即可从三元组中提取案件知识图谱框架所需的案件结构数据进行数据补充,以生成对应的案件知识图谱;从三元组中提取资金流知识图谱框架所需的资金流结构数据进行数据补充,以生成对应的资金流知识图谱;从三元组中提取话单知识图谱框架对应的话单结构数据进行数据补充,以生成对应的话单知识图谱。
89.进一步地,为了获得诈骗分析模型,以基于诈骗分析模型对诈骗案件源数据进行深度分析,进一步提高案件分析效率,在获得诈骗分析知识图谱后,可根据所述诈骗分析知识图谱构建嵌入表示模板,所述嵌入表示模板可理解为一种图谱的统一表示形式,然后,基于所述嵌入表示模板建立对应的模型搜索库,所述模型搜索库可理解为存储有与模型嵌入模板适配度大于预设适配度的多种模型的数据库,所述预设适配度可根据实际需求进行设置,本实施例对此不加以限制,接着,可在所述模型搜索库中搜索所述诈骗分析知识图谱所对应的初阶模型,再根据所述诈骗分析知识图谱对所述初阶模型进行训练,以获得对应的诈骗分析模型,在训练过程中,可从所述诈骗分析知识图谱中提取各诈骗指标项,并根据预设评分规则计算各诈骗指标项的评分结果,然后,将所述诈骗特征数据作为所述初阶模型的输入结果,将所述评分结果作为初阶模型的输出结果,根据所述输入结果和所述输出结果对所述初阶模型进行训练,以获得对应的诈骗分析模型。
90.步骤s30:根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
91.易于理解的是,为了进一步提高案件数据的可视度,可根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,获得所述诈骗特征数据对应的评分结果,所述诈骗特征数据,可理解为每种知识图谱所对应的诈骗指标项,然后,将所述评分结果按照从高到低的排序方式进行排序,获得评分排序结果,再基于排序第一顺位的评分结果生成诈骗分析结果,如,在对案件嫌疑犯进行锁定时,可将各嫌疑犯的各类诈骗指标项所对应的指数相加,获得各嫌疑犯的嫌疑指数评分,并对嫌疑指数评分进行排序,获得评分排序结果,则评分排序结果中第一顺位的嫌疑犯就是嫌疑程度最高的嫌疑犯,再将所述诈骗分析结果进行展示,如,可将排序第一顺位的嫌疑犯进行高亮展示,并展示其他嫌疑犯与该嫌疑犯的关系,具体展示方式可根据实际需求进行设置,如图文形式、语音提醒方式等,本实施例对此不加以限制。
92.本实施例中,对获取到的诈骗案件源数据进行数据转换,获得结构化数据,根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中,根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果。有别于现有技术中,仅对案件提供案件检索和案件导出功能,或简单的线索关联分析,但仍存在可视度差,分析效率慢的缺点,本实施例基于诈骗案件源数据构建诈骗分析知识图谱,并将诈骗分析知识图谱嵌入对应的诈骗分析模型中,以基于诈骗分析模型实现对诈骗案件源数据的深度分析,提高案件分析效率
和案件数据的可视度。
93.参考图2,图2为本发明诈骗数据深度分析方法第二实施例的流程示意图。
94.基于上述第一实施例,在本实施例中,所述步骤s20包括:
95.步骤s201:将所述结构化数据进行数据整合,获得三元组,并将所述三元组输入至图数据库中;
96.步骤s202:根据所述图数据库中的案件知识图谱框架从所述三元组中提取对应的案件结构数据进行数据补充,生成对应的案件知识图谱;
97.步骤s203:将所述案件知识图谱嵌入至对应的诈骗分析模型中。
98.需要说明的是,在获得结构化数据后,可将所述结构化数据进行数据整合,获得三元组,所述三元组的基本形式包括但不限于:实体1-关系-实体2和实体-属性-属性值,然后,将所述三元组输入至图数据库中,所谓图数据库,包括节点、边以及属性,所谓节点,可用于表示实体、事件等对象,可类比于关系数据库中的记录,例如人物、地点、电影等;所谓边,可理解为图中连接节点的有向线条,可用于表示不同节点之间的关系,例如夫妻关系、同事关系等;所谓属性,可用于描述节点或者边的特性,例如姓名、夫妻关系的起止时间等。然后,根据所述图数据库中的所述三元组和案件知识图谱框架,生成对应的案件知识图谱,所述案件知识图谱框架,可理解为知识图谱的模式层中用来描述概念与概念(如实体与实体)之间的关系的一种可用来填充数据的框架,即可从三元组中提取案件知识图谱框架所需的案件结构数据进行数据补充,以生成对应的案件知识图谱。
99.易于理解的是,在获得案件知识图谱后,可将案件知识图谱嵌入至对应的诈骗分析模型中,以基于诈骗分析模型对诈骗案件源数据进行深度分析,进一步提高案件分析效率,即可根据所述案件知识图谱构建嵌入表示模板,所述嵌入表示模板可理解为一种图谱的统一表示形式,然后,基于所述嵌入表示模板建立对应的模型搜索库,所述模型搜索库可理解为存储有与模型嵌入模板适配度大于预设适配度的多种模型的数据库,所述预设适配度可根据实际需求进行设置,本实施例对此不加以限制,接着,可在所述模型搜索库中搜索所述案件知识图谱所对应的初阶模型,再根据所述诈骗分析知识图谱对所述初阶模型进行训练,以获得对应的诈骗分析模型,在训练过程中,可从所述案件知识图谱中提取各诈骗指标项,并根据预设评分规则计算各诈骗指标项的评分结果,然后,将所述诈骗特征数据作为所述初阶模型的输入结果,将所述评分结果作为初阶模型的输出结果,根据所述输入结果和所述输出结果对所述初阶模型进行训练,以获得对应的诈骗分析模型。
100.相应地,所述步骤s30包括:
101.步骤s301:根据所述案件知识图谱中在所述图数据库中查找强关联案件数据和/或弱关联案件数据;
102.步骤s302:将查找到的所述强关联案件数据和/或所述弱关联案件数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
103.需要说明的是,为了基于案件知识图谱实现对诈骗案件源数据的深度分析,提高案件分析效率和案件数据的可视度,在获得案件知识图谱后,可根据所述案件知识图谱中在所述图数据库中查找强关联案件数据和/或弱关联案件数据,将查找到的所述强关联案件数据和/或所述弱关联案件数据输入至所述诈骗分析模型中,以获得诈骗分析结果。所述强关联案件数据,可理解为在案件知识图谱的图数据库中查找所得的两个或两个以上具有
强关联关系的案件数据,如相同的嫌疑人、相同的一级账户、相同的电话号码、相同的mac地址等。所述弱关联案件数据,可理解为在案件知识图谱的图数据库中查找所得的两个或两个以上具有弱关联关系的案件数据,如相同时间段、相同发案地、相同ip地址、相同基站号、相同小区号、相同受害人(姓名、证件类型、证件号码等)、相同嫌疑人社交账号、简要案情的相似度、相同蜂窝号、相同开户机构(嫌疑人开户时所在单位、住址、邮箱等)等。在诈骗分析结果的获得过程中,可将获得的强关联案件数据和/或弱关联案件数据输入至诈骗分析模型中,获得强关联案件数据和/或弱关联案件数据中各诈骗指标项对应的评分结果,并将所述评分结果按照从高到低的排序方式进行排序,获得评分排序结果,再基于排序第一顺位的评分结果生成诈骗分析结果,最后,将所述诈骗分析结果进行展示,具体展示方式可根据实际需求进行设置,如图文形式、语音提醒方式等,本实施例对此不加以限制。
104.在具体实现中,为了进一步提高案件数据的可视度,还可根据所述案件知识图谱提取目标问答映射关系,所述目标问答映射关系,可理解为问句模板和答案之间的映射关系,并基于所述目标问答映射关系建立对应的问答模板(如一般疑问句模板及其答案模板、比较句模板及其回复模板),再根据所述问答模板和所述目标问答映射关系生成办案插件,并将所述办案插件融合进所述诈骗分析模型中,以实现诈骗分析结果的多元化展示。
105.本实施例中,将所述结构化数据进行数据整合,获得三元组,并将所述三元组输入至图数据库中,根据所述图数据库中的案件知识图谱框架从所述三元组中提取对应的案件结构数据进行数据补充,生成对应的案件知识图谱,将所述案件知识图谱嵌入至对应的诈骗分析模型中,根据所述案件知识图谱中在所述图数据库中查找强关联案件数据和/或弱关联案件数据,将查找到的所述强关联案件数据和/或所述弱关联案件数据输入至所述诈骗分析模型中,以获得诈骗分析结果。通过基于生成的案件知识图谱在图数据库中查找强关联案件数据和/或弱关联案件数据,并将查找到的强关联案件数据和/或弱关联案件数据输入至诈骗分析模型中,获得诈骗分析结果,以基于案件知识图谱实现对诈骗案件源数据的深度分析,进一步提高案件分析效率和案件数据的可视度,并通过建立问答模板,且将基于问答模板建立的办案助手融合进诈骗分析模型中,以实现诈骗分析结果的多元化展示。
106.参考图3,图3为本发明诈骗数据深度分析方法第三实施例的流程示意图。
107.基于上述第一实施例,在本实施例中,所述步骤s20包括:
108.步骤s211:将所述结构化数据进行数据整合,获得三元组,并将所述三元组输入至图数据库中;
109.步骤s212:根据所述图数据库中的资金流知识图谱框架从所述三元组中提取对应的资金流结构数据进行数据补充,生成对应的资金流知识图谱;
110.步骤s213:将所述资金流知识图谱嵌入至对应的诈骗分析模型中。
111.需要说明的是,在获得结构化数据后,可将所述结构化数据进行数据整合,获得三元组,所述三元组的基本形式包括但不限于:实体1-关系-实体2和实体-属性-属性值,然后,将所述三元组输入至图数据库中,所谓图数据库,包括节点、边以及属性,所谓节点,可用于表示实体、事件等对象,可类比于关系数据库中的记录,例如人物、地点、电影等;所谓边,可理解为图中连接节点的有向线条,可用于表示不同节点之间的关系,例如夫妻关系、同事关系等;所谓属性,可用于描述节点或者边的特性,例如姓名、夫妻关系的起止时间等。然后,根据所述图数据库中的所述三元组和资金流知识图谱框架,生成对应的资金流知识
图谱,所述资金流知识图谱框架,可理解为知识图谱的模式层中用来描述概念与概念(如实体与实体)之间的关系的一种可用来填充数据的框架,即可从三元组中提取资金流知识图谱框架所需的案件结构数据进行数据补充,以生成对应的资金流知识图谱。
112.易于理解的是,在获得资金流知识图谱后,可将资金流知识图谱嵌入至对应的诈骗分析模型中,以基于诈骗分析模型对诈骗案件源数据进行深度分析,进一步提高案件分析效率,即可根据所述资金流知识图谱构建嵌入表示模板,所述嵌入表示模板可理解为一种图谱的统一表示形式,然后,基于所述嵌入表示模板建立对应的模型搜索库,所述模型搜索库可理解为存储有与模型嵌入模板适配度大于预设适配度的多种模型的数据库,所述预设适配度可根据实际需求进行设置,本实施例对此不加以限制,接着,可在所述模型搜索库中搜索所述资金流知识图谱所对应的初阶模型,再根据所述资金流知识图谱对所述初阶模型进行训练,以获得对应的诈骗分析模型,在训练过程中,可从所述资金流知识图谱中提取各诈骗指标项,并根据预设评分规则计算各诈骗指标项的评分结果,然后,将所述诈骗特征数据作为所述初阶模型的输入结果,将所述评分结果作为初阶模型的输出结果,根据所述输入结果和所述输出结果对所述初阶模型进行训练,以获得对应的诈骗分析模型。
113.相应地,所述步骤s30包括:
114.步骤s311:从所述资金流知识图谱中查找历史资金流低于预设最低资金流的目标账户;
115.步骤s312:在检测到所述目标账户入账大于预设交易资金流的目标资金时,将与所述目标资金对应的流水记录发送至所述诈骗分析模型中,以获得诈骗分析结果。
116.需要说明的是,为了基于资金流知识图谱实现对诈骗案件源数据的深度分析,提高案件分析效率和案件数据的可视度,在获得资金流知识图谱后,可从所述资金流知识图谱中查找历史资金流低于预设最低资金流的目标账户,所述预设最低资金流可根据实际需求进行设置,如100万元,本实施例对此不加以限制。在检测到所述目标账户入账大于预设交易资金流的目标资金时,将与所述目标资金对应的流水记录发送至所述诈骗分析模型中,以获得诈骗分析结果,所述预设交易资金流可根据实际需求进行设置,如100万元,本实施例对此不加以限制,在具体实现中,为了进一步提高检索精度,还可加入时间等信息作为检索指标项,如检测预设时间段内目标账户是否入账大于预设交易资金流的目标资金,检索指标项可根据实际需求进行设置,本实施对此不加以限制。在诈骗分析结果的获得过程中,可将获得的流水记录输入至诈骗分析模型中,获得流水记录所对应的各诈骗指标项对应的评分结果,并将所述评分结果按照从高到低的排序方式进行排序,获得评分排序结果,再基于排序第一顺位的评分结果生成诈骗分析结果,最后,将所述诈骗分析结果进行展示,具体展示方式可根据实际需求进行设置,如图文形式、语音提醒方式等,本实施例对此不加以限制。
117.本实施例中,将所述结构化数据进行数据整合,获得三元组,并将所述三元组输入至图数据库中,根据所述图数据库中的资金流知识图谱框架从所述三元组中提取对应的资金流结构数据进行数据补充,生成对应的资金流知识图谱,将所述资金流知识图谱嵌入至对应的诈骗分析模型中,从所述资金流知识图谱中查找历史资金流低于预设最低资金流的目标账户,在检测到所述目标账户入账大于预设交易资金流的目标资金时,将与所述目标资金对应的流水记录发送至所述诈骗分析模型中,以获得诈骗分析结果。通过基于生成的
资金流知识图谱实现对异常资金流的实时监控,并根据资金流知识图谱建立对应的诈骗分析模型以实现对诈骗案件源数据的深度分析,进一步提高案件分析效率和案件数据的可视度。
118.参考图4,图4为本发明诈骗数据深度分析方法第四实施例的流程示意图。
119.基于上述第一实施例,在本实施例中,所述步骤s20包括:
120.步骤s221:将所述结构化数据进行数据整合,获得三元组,并将所述三元组输入至图数据库中;
121.步骤s222:根据所述图数据库中的话单知识图谱框架从所述三元组中提取对应的话单结构数据进行数据补充,生成对应的话单知识图谱;
122.步骤s223:将所述话单知识图谱嵌入至对应的诈骗分析模型中。
123.需要说明的是,在获得结构化数据后,可将所述结构化数据进行数据整合,获得三元组,所述三元组的基本形式包括但不限于:实体1-关系-实体2和实体-属性-属性值,然后,将所述三元组输入至图数据库中,所谓图数据库,包括节点、边以及属性,所谓节点,可用于表示实体、事件等对象,可类比于关系数据库中的记录,例如人物、地点、电影等;所谓边,可理解为图中连接节点的有向线条,可用于表示不同节点之间的关系,例如夫妻关系、同事关系等;所谓属性,可用于描述节点或者边的特性,例如姓名、夫妻关系的起止时间等。然后,根据所述图数据库中的所述三元组和话单知识图谱框架,生成对应的话单知识图谱,所述话单知识图谱框架,可理解为知识图谱的模式层中用来描述概念与概念(如实体与实体)之间的关系的一种可用来填充数据的框架,即可从三元组中提取话单知识图谱框架所需的案件结构数据进行数据补充,以生成对应的话单知识图谱。
124.易于理解的是,在获得话单知识图谱后,可将话单知识图谱嵌入至对应的诈骗分析模型中,以基于诈骗分析模型对诈骗案件源数据进行深度分析,进一步提高案件分析效率,即可根据所述话单知识图谱构建嵌入表示模板,所述嵌入表示模板可理解为一种图谱的统一表示形式,然后,基于所述嵌入表示模板建立对应的模型搜索库,所述模型搜索库可理解为存储有与模型嵌入模板适配度大于预设适配度的多种模型的数据库,所述预设适配度可根据实际需求进行设置,本实施例对此不加以限制,接着,可在所述模型搜索库中搜索所述话单知识图谱所对应的初阶模型,再根据所述话单知识图谱对所述初阶模型进行训练,以获得对应的诈骗分析模型,在训练过程中,可从所述话单知识图谱中提取各诈骗指标项,并根据预设评分规则计算各诈骗指标项的评分结果,然后,将所述诈骗特征数据作为所述初阶模型的输入结果,将所述评分结果作为初阶模型的输出结果,根据所述输入结果和所述输出结果对所述初阶模型进行训练,以获得对应的诈骗分析模型。
125.相应地,所述步骤s30包括:
126.步骤s321:从所述话单知识图谱获取话单数据的发起位置,并统计各发起位置的话单数;
127.步骤s322:在检测到存在话单数大于预设话单数的目标发起位置时,将所述目标发起位置输入至所述诈骗分析模型中,以获得诈骗分析结果。
128.需要说明的是,为了基于话单知识图谱实现对诈骗案件源数据的深度分析,提高案件分析效率和案件数据的可视度,在获得话单知识图谱后,可从所述话单知识图谱获取话单数据的发起位置,并统计各发起位置的话单数,在检测到存在话单数大于预设话单数
的目标发起位置时,将所述目标发起位置输入至所述诈骗分析模型中,以获得诈骗分析结果。所述预设话单数可根据实际需求进行设置,如100,本实施例对此不加以限制,在具体实现中,为了进一步提高检索精度,还可加入时间等信息作为检索指标项,如检测预设时间段内某一位置是否拨出电话大于预设话单数,在预设话单数为100时,即在检测到某一位置在一个星期内拨出电话超过100通,则可将该位置视为可疑位置,检索指标项可根据实际需求进行设置,本实施对此不加以限制。在诈骗分析结果的获得过程中,可将获得的目标发起位置输入至诈骗分析模型中,获得目标发起位置所对应的各诈骗指标项对应的评分结果,并将所述评分结果按照从高到低的排序方式进行排序,获得评分排序结果,再基于排序第一顺位的评分结果生成诈骗分析结果,最后,将所述诈骗分析结果进行展示,具体展示方式可根据实际需求进行设置,如图文形式、语音提醒方式等,本实施例对此不加以限制。
129.本实施例中,将所述结构化数据进行数据整合,获得三元组,并将所述三元组输入至图数据库中,根据所述图数据库中的话单知识图谱框架从所述三元组中提取对应的话单结构数据进行数据补充,生成对应的话单知识图谱,将所述话单知识图谱嵌入至对应的诈骗分析模型中,从所述话单知识图谱获取话单数据的发起位置,并统计各发起位置的话单数,在检测到存在话单数大于预设话单数的目标发起位置时,将所述目标发起位置输入至所述诈骗分析模型中,以获得诈骗分析结果。通过基于生成的话单知识图谱实现对话单窝点的有效排查,并根据话单知识图谱建立对应的诈骗分析模型以实现对诈骗案件源数据的深度分析,进一步提高案件分析效率和案件数据的可视度。
130.参照图5,图5为本发明诈骗数据深度分析系统第一实施例的结构框图。
131.如图5所示,本发明实施例提出的诈骗数据深度分析系统包括:
132.数据结构化模块10,用于对获取到的诈骗案件源数据进行数据转换,获得结构化数据;
133.模型嵌入模块20,用于根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中;
134.诈骗分析模块30,用于根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
135.本实施例中,对获取到的诈骗案件源数据进行数据转换,获得结构化数据,根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中,根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果。有别于现有技术中,仅对案件提供案件检索和案件导出功能,或简单的线索关联分析,但仍存在可视度差,分析效率慢的缺点,本实施例基于诈骗案件源数据构建诈骗分析知识图谱,并将诈骗分析知识图谱嵌入对应的诈骗分析模型中,以基于诈骗分析模型实现对诈骗案件源数据的深度分析,提高案件分析效率和案件数据的可视度。
136.本发明诈骗数据深度分析系统的其他实施例或具体实现方式可参照上述各方法实施例,此处不再赘述。
137.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有
的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
138.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
139.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器/随机存取存储器、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
140.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
141.本发明公开了a1、一种诈骗数据深度分析方法,所述诈骗数据深度分析方法包括:
142.对获取到的诈骗案件源数据进行数据转换,获得结构化数据;
143.根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中;
144.根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
145.a2、如a1所述的诈骗数据深度分析方法,所述对获取到的诈骗案件源数据进行数据转换,获得结构化数据的步骤,具体包括:
146.对获取到的诈骗案件源数据进行数据清洗,获得清洗后的诈骗案件源数据;
147.对所述清洗后的诈骗案件源数据进行分词处理,获得分词数据;
148.根据预设结构化规则对所述分词数据进行知识抽取处理,获得结构化数据。
149.a3、如a2所述的诈骗数据深度分析方法,所述根据预设结构化规则对所述分词数据进行知识抽取处理,获得结构化数据的步骤,具体包括:
150.根据预设结构化规则对所述分词数据进行实体抽取,获得实体数据;
151.根据预设结构化规则对所述分词数据进行关系抽取,获取关系数据;
152.基于所述实体数据和所述关系数据生成结构化数据。
153.a4、如a1~a3中任一项所述的诈骗数据深度分析方法,所述根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中的步骤,具体包括:
154.将所述结构化数据进行数据整合,获得三元组,并将所述三元组输入至图数据库中;
155.根据所述图数据库中的所述三元组和预设知识图谱框架,生成对应的诈骗分析知识图谱;
156.将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中。
157.a5、如a4所述的诈骗数据深度分析方法,所述诈骗分析知识图谱包括案件知识图谱、资金流知识图谱以及话单知识图谱;
158.相应地,所述根据所述图数据库中的所述三元组和预设知识图谱框架,生成对应
的诈骗分析知识图谱的步骤,具体包括:
159.根据所述图数据库中的案件知识图谱框架从所述三元组中提取对应的案件结构数据进行数据补充,生成对应的案件知识图谱;
160.根据所述图数据库中的资金流知识图谱框架从所述三元组中提取对应的资金流结构数据进行数据补充,生成对应的资金流知识图谱;
161.根据所述图数据库中的话单知识图谱框架从所述三元组中提取对应的话单结构数据进行数据补充,生成对应的话单知识图谱;
162.相应地,所述将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中的步骤,具体包括:
163.将所述案件知识图谱嵌入至对应的诈骗分析模型中;
164.将所述资金流知识图谱嵌入至对应的诈骗分析模型中;
165.将所述话单知识图谱嵌入至对应的诈骗分析模型中。
166.a6、如a5所述的诈骗数据深度分析方法,所述根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果的步骤,具体包括:
167.根据所述案件知识图谱中在所述图数据库中查找强关联案件数据和/或弱关联案件数据;
168.将查找到的所述强关联案件数据和/或所述弱关联案件数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
169.a7、如a6所述的诈骗数据深度分析方法,所述根据所述案件知识图谱中在所述图数据库中查找强关联案件数据和弱关联案件数据的步骤之前,还包括:
170.根据所述案件知识图谱提取目标问答映射关系,并基于所述目标问答映射关系建立对应的问答模板;
171.根据所述问答模板和所述目标问答映射关系生成办案插件,并将所述办案插件融合进所述诈骗分析模型中。
172.a8、如a5所述的诈骗数据深度分析方法,所述从所述诈骗分析知识图谱中提取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果的步骤,具体包括:
173.从所述资金流知识图谱中查找历史资金流低于预设最低资金流的目标账户;
174.在检测到所述目标账户入账大于预设交易资金流的目标资金时,将与所述目标资金对应的流水记录发送至所述诈骗分析模型中,以获得诈骗分析结果。
175.a9、如a5所述的诈骗数据深度分析方法,所述从所述诈骗分析知识图谱中提取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果的步骤,具体包括:
176.从所述话单知识图谱获取话单数据的发起位置,并统计各发起位置的话单数;
177.在检测到存在话单数大于预设话单数的目标发起位置时,将所述目标发起位置输入至所述诈骗分析模型中,以获得诈骗分析结果。
178.a10、如a1~a9中任一项所述的诈骗数据深度分析方法,所述将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中的步骤,具体包括:
179.根据所述诈骗分析知识图谱构建嵌入表示模板,并基于所述嵌入表示模板建立对应的模型搜索库;
180.在所述模型搜索库中搜索所述诈骗分析知识图谱所对应的初阶模型;
181.根据所述诈骗分析知识图谱对所述初阶模型进行训练,以获得对应的诈骗分析模型。
182.a11、如a10所述的诈骗数据深度分析方法,所述根据所述诈骗分析知识图谱对所述初阶模型进行训练,以获得对应的诈骗分析模型的步骤,具体包括:
183.从所述诈骗分析知识图谱中提取各诈骗指标项,并根据预设评分规则计算各诈骗指标项的评分结果;
184.将所述诈骗特征数据作为所述初阶模型的输入结果,将所述评分结果作为初阶模型的输出结果;
185.根据所述输入结果和所述输出结果对所述初阶模型进行训练,以获得对应的诈骗分析模型。
186.a12、如a11所述的诈骗数据深度分析方法,所述根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果的步骤,具体包括:
187.根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,获得所述诈骗特征数据对应的评分结果;
188.将所述评分结果按照从高到低的排序方式进行排序,获得评分排序结果;
189.基于排序第一顺位的评分结果生成诈骗分析结果。
190.本发明还公开了b13、一种诈骗数据深度分析系统,所述诈骗数据深度分析系统包括:
191.数据结构化模块,用于对获取到的诈骗案件源数据进行数据转换,获得结构化数据;
192.模型嵌入模块,用于根据所述结构化数据构建诈骗分析知识图谱,并将所述诈骗分析知识图谱嵌入至对应的诈骗分析模型中;
193.诈骗分析模块,用于根据所述诈骗分析知识图谱获取对应的诈骗特征数据,并将所述诈骗特征数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
194.b14、如b13所述的诈骗数据深度分析系统,所述数据结构化模块,还用于对获取到的诈骗案件源数据进行数据清洗,获得清洗后的诈骗案件源数据;
195.所述数据结构化模块,还用于对所述清洗后的诈骗案件源数据进行分词处理,获得分词数据;
196.所述数据结构化模块,还用于根据预设结构化规则对所述分词数据进行知识抽取处理,获得结构化数据。
197.b15、如b13所述的诈骗数据深度分析系统,所述模型嵌入模块,还用于将所述结构化数据进行数据整合,获得三元组,并将所述三元组输入至图数据库中;
198.所述模型嵌入模块,还用于根据所述图数据库中的所述三元组和预设知识图谱框架,生成对应的诈骗分析知识图谱。
199.b16、如b15所述的诈骗数据深度分析系统,所述模型嵌入模块,还用于根据所述图
数据库中的案件知识图谱框架从所述三元组中提取对应的案件结构数据进行数据补充,生成对应的案件知识图谱;
200.所述模型嵌入模块,还用于根据所述图数据库中的资金流知识图谱框架从所述三元组中提取对应的资金流结构数据进行数据补充,生成对应的资金流知识图谱;
201.所述模型嵌入模块,还用于根据所述图数据库中的话单知识图谱框架从所述三元组中提取对应的话单结构数据进行数据补充,生成对应的话单知识图谱。
202.b17、如b16所述的诈骗数据深度分析系统,所述诈骗分析模块,还用于根据所述案件知识图谱中在所述图数据库中查找强关联案件数据和/或弱关联案件数据;
203.所述诈骗分析模块,还用于将查找到的所述强关联案件数据和/或所述弱关联案件数据输入至所述诈骗分析模型中,以获得诈骗分析结果。
204.b18、如b17所述的诈骗数据深度分析系统,所述诈骗分析模块,还用于根据所述案件知识图谱提取目标问答映射关系,并基于所述目标问答映射关系建立对应的问答模板;
205.所述诈骗分析模块,还用于根据所述问答模板和所述目标问答映射关系生成办案插件,并将所述办案插件融合进所述诈骗分析模型中。
206.b19、如b16所述的诈骗数据深度分析系统,所述诈骗分析模块,还用于从所述资金流知识图谱中查找历史资金流低于预设最低资金流的目标账户;
207.所述诈骗分析模块,还用于在检测到所述目标账户入账大于预设交易资金流的目标资金时,将与所述目标资金对应的流水记录发送至所述诈骗分析模型中,以获得诈骗分析结果。
208.b20、如b16所述的诈骗数据深度分析系统,所述诈骗分析模块,还用于从所述话单知识图谱获取话单数据的发起位置,并统计各发起位置的话单数;
209.所述诈骗分析模块,还用于在检测到存在话单数大于预设话单数的目标发起位置时,将所述目标发起位置输入至所述诈骗分析模型中,以获得诈骗分析结果。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献