一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于安平系统的图数据库系统、构建方法、设备及介质与流程

2022-02-22 07:54:56 来源:中国专利 TAG:


1.本发明涉及图数据库技术领域,尤其是一种基于安平系统的图数据库系统、构建方法、设备及介质。


背景技术:

2.随着互联网技术的广泛应用,各个行业生成的数据规模呈现爆炸式增长。现如今,数据已成为一种重要的信息资源,安平系统领域也不例外,同样具有大量且非常有价值的知识数据。造成数据潜在价值没有被有效利用的原因是,这些数据之间缺少良好的关联形式以及友好直观的可视化展现给用户,因此阻断了数据进一步挖掘和应用。且就目前而言,家族式犯罪还未能引起相关部门的足够重视,而安平系统知识数据涵盖了大量的人员信息,基于安平系统知识数据对人员关系信息的挖掘和分析显得迫在眉睫。


技术实现要素:

3.针对现有技术中的缺陷,本发明提供了一种基于安平系统的图数据库系统、构建方法、设备及介质,实现基于安平系统知识图谱对特定人员的人物关系进行挖掘。
4.第一方面
5.本发明提供了一种基于安平系统的图数据库系统,包括:
6.信息获取模块,用于获取特定群体的背景信息;所述背景信息包括案件信息、轨迹信息和基础信息;所述基础信息包括姓名信息、年龄信息、性别信息、籍贯信息、亲属信息、工作单位信息和人脸图像信息;
7.人物关系提取模块,用于对所述背景信息进行关系特征提取,构建人物关系图;
8.图数据库模块,用于存储所述背景信息和人物关系图。
9.优选地,还包括更新模块,用于当所述特定群体的背景信息发生变化时,完成图数据库模块的更新。
10.优选地,还包括检索模块;所述检索模块包括第一检索单元;
11.所述第一检索单元用于:
12.获取待处理的图片;
13.将所述图片与图数据库模块中存储的人脸图像信息进行比对,计算相似度值,将相似度值从大到小进行排序;
14.输出排名前n的相似度值及对应的人脸图像信息、对应的人物关系图;其中,n为自然数。
15.优选地,将所述图片与图数据库模块中存储的人脸图像信息进行比对具体为:
16.对所述图片进行预处理;
17.对经过预处理后的图片进行灰度处理,得到灰度图片;
18.对所述灰度图片进行特征提取,得到特征信息;
19.将所述特征信息与图数据库模块中存储的人脸图像信息进行比对。
20.优选地,所述检索模块还包括第二检索单元;
21.所述第二检索单元用于:
22.获取若干个人员的姓名;
23.对所述若干个人员的姓名进行分词处理;
24.在图数据库中进行分片检索;
25.输出所述若干人员的背景信息及对应的人物关系图。
26.优选地,还包括显示模块,用于以图表的形式显示所述第一检索单元和第二检索单元的输出结果。
27.第二方面
28.本发明提供了一种基于安平系统的图数据库系统的构建方法,包括以下步骤:
29.获取特定群体的背景信息;所述背景信息包括案件信息、轨迹信息和基础信息;所述基础信息包括姓名信息、年龄信息、性别信息、籍贯信息、亲属信息、工作单位信息和人脸图像信息;所述亲属信息通过社交网络获取;
30.对所述背景信息进行关系特征提取,构建人物关系图;
31.存储所述背景信息和人物关系图至图数据库。
32.第三方面
33.本发明提供了一种基于安平系统的图数据库系统的构建设备,包括存储器和处理器;所述存储器用于存储可执行程序代码;
34.所述处理器用于读取所述存储器中存储的可执行程序代码,以执行第二方面中所述的基于安平系统的图数据库系统的构建方法。
35.第四方面
36.本发明提供了一种存储介质,所述存储介质存储有第三方面所述的可执行程序代码。
37.本发明的有益效果为:
38.可获取特定人群的背景信息,通过人物关系提取模块,推断出相应的人物关系图。安平系统工作人员通过对人员姓名或者图片进行检索,可获得对应的背景信息和人物关系图,开阔案件分析的视角,进而挖掘出潜在线索,发现潜在的违法关系人,方便理清办案思路,提高办案效率。
附图说明
39.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
40.图1为本发明实施例一的结构框图;
41.图2为本发明实施例二的流程示意图;
42.图3为本发明实施例五的硬件架构图。
具体实施方式
43.下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于
更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
44.需要注意的是,除非另有说明,本技术使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
45.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
46.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
47.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
48.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/ 或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
49.实施例一
50.本发明实施例提供了一种基于安平系统的图数据库系统,如图1所示,包括:
51.信息获取模块,用于获取特定群体的背景信息;其中,背景信息包括案件信息、轨迹信息和基础信息;基础信息包括姓名信息、年龄信息、性别信息、籍贯信息、亲属信息、工作单位信息和人脸图像信息;
52.人物关系提取模块,用于对背景信息进行关系特征提取,构建人物关系图;
53.图数据库模块,用于存储背景信息和人物关系图;
54.更新模块,用于当特定群体的背景信息发生变化时,完成图数据库模块的更新。
55.背景信息可通过安平系统内网数据和互联网数据得到。其中安平系统内网数据包括案件笔录等文本数据、人员出行轨迹、车辆轨迹、酒店住宿、案件信息、民航、铁路、交管和民政信息等。互联网数据包括搜索平台及短信息、微信、qq等网络社交平台信息。
56.人物关系提取模块包括知识抽取模块和知识融合模块。知识抽取模块用于从海量多源异构数据中进行实体、属性及关系提取。比如,某新闻报道中“昨日晚10点,25岁的李女士在xx路与47岁的张先生发生了一起追尾事故,具体信息为xxx,所幸未造成人员伤亡”。该非结构化文本提供的直接信息中,可提取出两个实体人“李女士”和“张先生”以及“汽车追尾”的相互关系。若进一步关联,还可抽取出两者的实体车及“车与实体人车主所属”的关联关系。当然还可抽取出“25岁”和“47岁”描述实体人特征的属性信息。本发明实施例中,知识抽取模块利用实体识别的nlp算法,并结合机器学习、规则引擎,可以准确识别人名、地名、组织机构名、身份证号、手机号等。知识融合模块用于将知识抽取模块抽取的实体、属性及关系进行整合,包括实体消歧义、共指消解、实体对齐、实体属性值判定等功能。其中,实体消歧指的是同样的词汇可能表示不同的实体,需要基于语义从上下文推测出哪个词代表哪个实体。比如,两个同名为张三的人可以根据其申请证或者年龄属性来判别。共指消解是指同一个代词指代哪一个对象,也可以通过上下文语义来进行推测。实体对齐指的是如何将
同一实体的不同描述指向同一实体,比如将“齐天大圣”和“美猴王”映射到“孙悟空”;实体的属性值判定指同一个实体从多个来源得到的属性描述差异,通过知识源的置信度确定。
57.本发明实施例中,图数据库模块底层采用hbase、elasticsearch及phoenix 二级索引于一体的优化混合存储技术,存储层和计算层都使用分布式架构设计,提高了图数据库模块的横向扩展性,可轻松通过增加节点的方式提升系统存储和计算性能,便于图数据库模块的快速更新。
58.本发明实施例中,安平系统工作人员获取特定人群的背景信息,通过人物关系提取模块,推断出相应的人物关系图。通过对人物关系图的分析,能够开阔案件分析的视角,进而挖掘出潜在线索,发现潜在的违法关系人。
59.本发明实施例还包括检索模块;检索模块包括第一检索单元;
60.第一检索单元用于:
61.获取待处理的图片;
62.将图片与图数据库模块中存储的人脸图像信息进行比对,计算相似度值,将相似度值从大到小进行排序;
63.输出排名前n的相似度值及对应的人脸图像信息、对应的人物关系图;其中,n为自然数。
64.其中,将图片与图数据库模块中存储的人脸图像信息进行比对具体为:
65.对图片进行预处理;
66.对经过预处理后的图片进行灰度处理,得到灰度图片;
67.对灰度图片进行特征提取,得到特征信息;
68.将特征信息与图数据库模块中存储的人脸图像信息进行比对。
69.本发明实施例中,输出排名前10的相似度值及对应的人脸图像信息、对应的人物关系图,进行人工分析和对比,最终锁定目标,避免遗漏;且相似度值为多次计算的平均值,提高了准确率。在其他实施例中,可预先设置阈值,当相似度值大于阈值时,将对应的人脸图像信息存储至嫌疑目标库,再对嫌疑目标库存储的信息进行人工分析和对比,最终锁定目标。
70.检索模块还包括第二检索单元;
71.第二检索单元用于:
72.获取若干个人员的姓名;
73.对若干个人员的姓名进行分词处理;
74.在图数据库中进行分片检索;
75.输出若干人员的背景信息及对应的人物关系图。
76.通过第二检索单元获取要检索的人的姓名,将背景信息和人物关系图直观展现在用户面前,方便理清办案思路,提高办案效率。
77.本发明实施例还包括显示模块,用于以图表的形式显示第一检索单元和第二检索单元的输出结果。
78.实施例二
79.本发明实施例提供了一种基于安平系统的图数据库系统的构建方法,如图 2所示,包括以下步骤:
80.获取特定群体的背景信息;背景信息包括案件信息、轨迹信息和基础信息;基础信息包括姓名信息、年龄信息、性别信息、籍贯信息、亲属信息、工作单位信息和人脸图像信息;
81.对背景信息进行关系特征提取,构建人物关系图;
82.存储背景信息和人物关系图至图数据库。
83.当特定群体的背景信息发生变化时,对图数据库进行更新。
84.背景信息可通过安平系统内网数据和互联网数据得到。其中安平系统内网数据包括案件笔录等文本数据、人员出行轨迹、车辆轨迹、酒店住宿、案件信息、民航、铁路、交管和民政信息等。互联网数据包括搜索平台及短信息、微信、qq等网络社交平台信息。人物关系提取模块包括知识抽取模块和知识融合模块。知识抽取模块用于从海量多源异构数据中进行实体、属性及关系提取。人物关系提取模块包括知识抽取模块和知识融合模块。知识抽取模块用于从海量多源异构数据中进行实体、属性及关系提取。图数据库底层采用hbase、elasticsearch及phoenix二级索引于一体的优化混合存储技术,存储层和计算层都使用分布式架构设计,提高了图数据库的横向扩展性,可轻松通过增加节点的方式提升系统存储和计算性能,便于图数据库模块的快速更新。
85.实施例三
86.本发明实施例提供了一种基于安平系统的图数据库系统的检索方法,包括以下步骤:
87.获取待处理的图片;
88.将图片与图数据库模块中存储的人脸图像信息进行比对,计算相似度值,将相似度值从大到小进行排序;
89.输出排名前n的相似度值及对应的人脸图像信息、对应的人物关系图;其中,n为自然数。
90.其中,将图片与图数据库模块中存储的人脸图像信息进行比对具体为:
91.对图片进行预处理;
92.对经过预处理后的图片进行灰度处理,得到灰度图片;
93.对灰度图片进行特征提取,得到特征信息;
94.将特征信息与图数据库模块中存储的人脸图像信息进行比对。
95.本发明实施例中,输出排名前10的相似度值及对应的人脸图像信息、对应的人物关系图,进行人工分析和对比,最终锁定目标,避免遗漏;且相似度值为多次计算的平均值,提高准确率。在其他实施例中,可预先设置阈值,当相似度值大于阈值时,将对应的人脸图像信息存储至嫌疑目标库,再对嫌疑目标库存储的信息进行人工分析和对比,最终锁定目标。
96.实施例四
97.本发明实施例提供了一种基于安平系统的图数据库系统的检索方法,包括以下步骤:
98.获取若干个人员的姓名;
99.对若干个人员的姓名进行分词处理;
100.在图数据库中进行分片检索;
101.输出若干人员的背景信息及对应的人物关系图。
102.通过第二检索单元获取要检索的人的姓名,将背景信息和人物关系图直观展现在用户面前,方便理清办案思路,提高办案效率。
103.实施例五
104.本发明实施例提供了一种基于安平系统的图数据库系统的构建设备,图3 为本发明实施例基于安平系统的图数据库系统的构建设备的硬件架构图,包括输入设备、输入接口、中央处理器、存储器、输出接口和输出设备。其中,输入接口、中央处理器、存储器及输出接口通过总线相互连接,输入设备和输出设备分别通过输入接口和输出接口与总线连接,进而与设备的其他组件连接。具体地,输入设备接收来自外部的输入信息,并通过输入接口将输入信息传送到中央处理器。中央处理器基于存储器存储的计算机可执行程序代码对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器中,然后通过输出接口将输出信息传送到输出设备,输出设备将输出信息输出到设备的外部供用户使用。
105.实施例六
106.本发明实施例提供了一种存储介质,存储有以上的可执行程序代码。该可执行程序代码被处理器执行时实现上述基于安平系统的图数据库系统的构建方法。本实施例中,存储介质可以是计算机能够读取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。其中,可用介质可以是磁性介质(如软盘、硬盘、磁带)、光介质(如dvd)、或者半导体介质(如固态硬盘ssd)等。进一步地,计算机可读存储介质还可以既包括系统的内部存储单元也包括外部存储设备。计算机可读存储介质用于存储计算机程序以及系统所需的其他程序和数据。计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
107.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
108.本发明实施例提供的一种基于安平系统的图数据库系统、构建方法、设备及介质,可获取特定人群的背景信息,通过人物关系提取模块,推断出相应的人物关系图。安平系统工作人员通过对人员姓名或者图片进行检索,可获得对应的背景信息和人物关系图,开阔案件分析的视角,进而挖掘出潜在线索,发现潜在的违法关系人,方便理清办案思路,提高办案效率。
109.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献