一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

串并事件确定方法、装置、计算机设备和存储介质与流程

2022-07-02 14:52:46 来源:中国专利 TAG:


1.本技术涉及智能图谱领域,特别是涉及一种串并事件确定方法、装置、计算机设备和存储介质。


背景技术:

2.伴随着人工智能、大数据的成熟,快速而廉价的算力,知识图谱为构建一种支撑快速部署数据驱动模型的高性能存储技术和更广泛的大数据应用场景提供了可能,而知识图谱通过建立数据之间的关联链接,将碎片化的数据有机组织起来,让数据更加容易被人和机器理解和处理,从而将不同的事件、警情之间关系关联起来。
3.目前,对于串并事件的主要方法是,通过自然语言处理技术提取出事件中的结构化的信息,并将该结构化信息作为事件特征,计算不同事件之间的特征相似度,通过特征相似度构建事件知识图谱,从而再通过知识图谱的连通性确定串并案,该方法构建的事件知识图谱只是事件之间相关度,而一些事件要素的之间隐含多跳隐含关系从未在图谱中进行体现,从而导致串并案结果差。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种串并事件确定方法、装置、计算机设备和存储介质。
5.第一方面,本发明实施例提出一种串并事件确定方法,包括:
6.基于待处理事件中的要素、要素之间的关联关系与档案信息库,构建事件要素关系图谱;
7.基于所述事件要素关系图谱,得到待处理事件在所述事件要素关系图谱中的表征向量,并基于所述表征向量确定是否为相似事件;
8.当所述相似事件在所述事件要素关系图谱中存在关联路径时,确定所述相似事件为可串并事件。
9.在一实施例中,所述基于待处理事件中的要素、要素之间的关联关系与档案信息库,构建事件要素关系图谱包括:
10.确定所述档案信息库中已有的图谱关系中是否存在与所述待处理事件中的要素相对应的实体;
11.若存在则将要素之间的关联关系与已有的图谱关系中对应实体的关系进行比较,如果不同,则将要素之间的关联关系并入到已有的图谱关系中,如果相同,则不进行合并;若不存在,则将待处理事件中的要素添加到已有的图谱关系中,并将要素之间的关联关系添加到已有的图谱关系中。
12.在一实施例中,所述基于所述事件要素关系图谱,得到待处理事件在所述事件要素关系图谱中的表征向量,并基于所述表征向量确定是否为相似事件包括:
13.计算所述待处理事件所对应的表征向量之间的距离;
14.当所述距离小于设定阈值时,确定为相似事件。
15.在一实施例中,所述当所述相似事件在所述事件要素关系图谱中存在关联路径时,确定所述相似事件为可串并事件包括:
16.利用节点路径挖掘算法,确定所述相似事件在所述事件要素关系图谱中是否存在关联路径;
17.当存在关联路径时,确定所述相似事件为可串并事件。
18.第二方面,本发明实施例提出一种串并事件确定装置,包括:
19.图谱构建模块,用于基于待处理事件中的要素、要素之间的关联关系与档案信息库,构建事件要素关系图谱;
20.第一确定模块,用于基于所述事件要素关系图谱,得到待处理事件在所述事件要素关系图谱中的表征向量,并基于所述表征向量确定是否为相似事件;
21.第二确定模块,用于当所述相似事件在所述事件要素关系图谱中存在关联路径时,确定所述相似事件为可串并事件。
22.在一实施例中,所述图谱构建模块包括:
23.第三确定模块,用于确定所述档案信息库中已有的图谱关系中是否存在与所述待处理事件中的要素相对应的实体;
24.合并模块,用于若存在则将要素之间的关联关系与已有的图谱关系中对应实体的关系进行比较,如果不同,则将要素之间的关联关系并入到已有的图谱关系中,如果相同,则不进行合并;若不存在,则将待处理事件中的要素添加到已有的图谱关系中,并将要素之间的关联关系添加到已有的图谱关系中。
25.在一实施例中,所述第一确定模块包括:
26.计算模块,用于计算所述待处理事件所对应的表征向量之间的距离;
27.第四确定模块,用于当所述距离小于设定阈值时,确定为相似事件。
28.在一实施例中,所述第二确定模块包括:
29.路径获取模块,用于利用节点路径挖掘算法,确定所述相似事件在所述事件要素关系图谱中是否存在关联路径;
30.第五确定模块,用于当存在关联路径时,确定所述相似事件为可串并事件。
31.第三方面,本发明实施例提出一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行第一方面所述的步骤。
32.第四方面,本发明实施例提出一种计算机可读存储介质,其上存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面所述的步骤。
33.上述方法、装置、计算机设备和存储介质,基于待处理事件中的要素、要素之间的关联关系与档案信息库,构建事件要素关系图谱;基于所述事件要素关系图谱,得到待处理事件在所述事件要素关系图谱中的表征向量,并基于所述表征向量确定是否为相似事件;当所述相似事件在所述事件要素关系图谱中存在关联路径时,确定所述相似事件为可串并事件。本发明能够对串并事件更快速准确的判断。
附图说明
34.图1为一个实施例串并事件确定方法的应用环境示意图;
35.图2为一个实施例中串并事件确定方法的流程示意图;
36.图3为一个实施例中相似事件确定方法的流程示意图;
37.图4为一个实施例中可串并事件确定方法的流程示意图;
38.图5为一个实施例中可串并事件确定装置的流程示意图;
39.图6为一个实施例中计算机设备的结构示意图。
具体实施方式
40.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本技术,并不用于限定本技术。
41.本技术提供的串并事件确定方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102首先基于待处理事件中的要素、要素之间的关联关系与档案信息库,构建事件要素关系图谱,基于所述事件要素关系图谱,得到待处理事件在所述事件要素关系图谱中的表征向量,并基于所述表征向量确定是否为相似事件,当所述相似事件在所述事件要素关系图谱中存在关联路径时,确定所述相似事件为可串并事件,终端102再将确定结果发送到服务器104。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
42.在一实施例中,如图2所示,提供了一种串并事件确定方法,以该方法应用于图1中的系统为例进行说明,包括以下步骤:
43.s202:基于待处理事件中的要素、要素之间的关联关系与档案信息库,构建事件要素关系图谱。
44.其中,待处理事件中的要素包括:姓名、身份证号、案发时间、案发地址、作案工具、车辆、事件关联金额、手机号、银行卡号、等,但不限于以上几种,只要跟待处理事件相关的都可提取。
45.其中,要素之间的关联关系包括:事件嫌疑人、事件受害者、人车关系、人亲属关系、人手机关系、人银行卡关系等,但不限于以上几种,可以根据要素建立对应的预设关联关系。
46.其中,档案信息库为已有的外部数据档案库,其中包含已有的图谱关系。
47.s204:基于所述事件要素关系图谱,得到待处理事件在所述事件要素关系图谱中的表征向量,并基于所述表征向量确定是否为相似事件。
48.采用知识图谱嵌入表示技术,如图卷积神经网络gcn、图注意力网络gat技术,但不限于以上技术,对事件要素关系图谱中的节点和关系进行嵌入表示,从而学习节点的表征向量。
49.s206:当所述相似事件在所述事件要素关系图谱中存在关联路径时,确定所述相似事件为可串并事件。
50.在本实施例中,手电,基于待处理事件中的要素以及要素之间的关联关系构建事件要素关系图谱,相比于仅利用要素构建的事件要素关系图谱,记载了更多的信息,因此对于可串并事件的确定更加的准确。其次,通过与现有的档案信息库进行关联融合,可增加数
据之间关联性,从而实现对一些隐含关联事件进行串并案分析;最后,利用相似事件在所述事件要素关系图谱中的关联路径,能够高效的确定所述相似事件是否为可串并事件。
51.在一实施例中,使用ner方法提取待处理事件中的要素,其中ner方法主要包括bert crt算法模型和bilstm crf算法模型,但又限于以上两种。如“事件编号:0001,事件描述:2016年1月12日16时00分,事主姓名:**(身份证号码:******************,性别:男),接到一个号码***********的电话,对方称自己是交警称他交通违法需要交纳罚款,让其给(账号:*******************;账户名:***)转账500元,事主转账后发现对方是骗子,遂报警。”使用bert crf算法模型提取出要素,姓名:“**”、身份证号:“******************”、性别:“男”、电话:“***********”、银行卡:“*******************”、姓名:“***”、案发时间:“2016年1月12日16时00分”。
52.在一实施例中,结合上述提取出来的要素,使用nre方法对事件中的要素关系进行提取,其中nre方法主要包括bilstm attention算法模型和bert算法模型,但又限于以上两种。对于上述示例,最终提取要素之间的关系如下:《事件编号:0001,事件嫌疑人,***》,《事件编号:0001,事件受害人,**》,《***,电话,***********》,《***,银行卡,*******************》。
53.在一实施例中,基于待处理事件中的要素、要素之间的关联关系与档案信息库,构建事件要素关系图谱包括:
54.确定所述档案信息库中已有的图谱关系中是否存在与所述待处理事件中的要素相对应的实体;若存在则将要素之间的关联关系与已有的图谱关系中对应实体的关系进行比较,如果不同,则将要素之间的关联关系并入到已有的图谱关系中,如果相同,则不进行合并;若不存在,则将待处理事件中的要素添加到已有的图谱关系中,并将要素之间的关联关系添加到已有的图谱关系中。
55.通过将待处理事件中的要素、要素之间的关联关系与待处理事件中的要素、要素之间的关联关系进行对齐,从而实现与现有的档案信息库进行关联融合,可增加数据之间关联性,从而实现对一些隐含关联事件进行串并案分析。
56.在一实施例中,如图3所示,所述基于所述事件要素关系图谱,得到待处理事件在所述事件要素关系图谱中的表征向量,并基于所述表征向量确定是否为相似事件包括以下步骤:
57.s302:计算所述待处理事件所对应的表征向量之间的距离;
58.首先,对融合后的事件要素关系图谱中的节点和关系进行向量表示,可使用图嵌入表示技术,如图卷积神经网络gcn、图注意力网络gat技术,但不限于以上技术,可得到所有事件节点向量化表示,如事件n1={x1,x2,x3,x4,x5,x6,

x
t
},事件n2={y1,y2,y3,y4,y5,y6,
…yt
}。
59.然后,采用相似性度量方法,如欧式距离,余弦夹角距离等,分别计算事件节点之间的距离,距离越小说明事件越相似;如待处理事件n1和待处理事件n2的相似度使用余弦夹角距离计算如下:
[0060][0061]
s304:当所述距离小于设定阈值时,确定为相似事件。
[0062]
设置阈值θ,如果相似度s1大于该阈值,则认为待处理事件n1和待处理n2为相似事件。
[0063]
在本实施例中,利用待处理事件在所述事件要素关系图谱中的表征向量计算相似度,并基于相似度能够准确的确定是否为相似事件。
[0064]
在一实施例中,如图4所示,当所述相似事件在所述事件要素关系图谱中存在关联路径时,确定所述相似事件为可串并事件包括以下步骤:
[0065]
s402:利用节点路径挖掘算法,确定所述相似事件在所述事件要素关系图谱中是否存在关联路径;
[0066]
s404:当存在关联路径时,确定所述相似事件为可串并事件。
[0067]
对于相似事件,在利用图计算节点路径挖掘技术图深度优先遍历方法,在已经构建好的事件要素关系图谱中查找相似事件之间是否存在关联路径,如果存在该关联路径,可说明两个相似事件之间有间接关联关系,而该关联路径则是间接关联关系的证明,能够快速准确的确定所述相似事件是否为可串并事件,从而完成相似事件的串并。
[0068]
应该理解的是,上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0069]
在一实施例中,如图5所示,本发明提供了一种串并事件确定装置,包括:
[0070]
图谱构建模块502,用于基于待处理事件中的要素、要素之间的关联关系与档案信息库,构建事件要素关系图谱;
[0071]
第一确定模块504,用于基于所述事件要素关系图谱,得到待处理事件在所述事件要素关系图谱中的表征向量,并基于所述表征向量确定是否为相似事件;
[0072]
第二确定模块506,用于当所述相似事件在所述事件要素关系图谱中存在关联路径时,确定所述相似事件为可串并事件。
[0073]
在一实施例中,所述图谱构建模块包括:
[0074]
第三确定模块,用于确定所述档案信息库中已有的图谱关系中是否存在与所述待处理事件中的要素相对应的实体;
[0075]
合并模块,用于若存在则将要素之间的关联关系与已有的图谱关系中对应实体的关系进行比较,如果不同,则将要素之间的关联关系并入到已有的图谱关系中,如果相同,则不进行合并;若不存在,则将待处理事件中的要素添加到已有的图谱关系中,并将要素之间的关联关系添加到已有的图谱关系中。
[0076]
在一实施例中,所述第一确定模块包括:
[0077]
计算模块,用于计算所述待处理事件所对应的表征向量之间的距离;
[0078]
第四确定模块,用于当所述距离小于设定阈值时,确定为相似事件。
[0079]
在一实施例中,所述第二确定模块包括:
[0080]
路径获取模块,用于利用节点路径挖掘算法,确定所述相似事件在所述事件要素关系图谱中是否存在关联路径;
[0081]
第五确定模块,用于当存在关联路径时,确定所述相似事件为可串并事件。
[0082]
关于串并事件确定装置的具体限定可以参见上文中对于串并事件确定方法的限定,在此不再赘述。上述串并事件确定装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0083]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储动作检测数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述任一项智能运维异常监测方法实施例中的步骤。
[0084]
本领域技术人员可以理解,图6中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0085]
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述任一项智能运维异常监测方法实施例中的步骤。
[0086]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一项智能运维异常监测方法实施例中的步骤。
[0087]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
[0088]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛
盾,都应当认为是本说明书记载的范围。
[0089]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献