一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种事件内容完备性质量评估方法和计算机与流程

2022-11-12 11:44:33 来源:中国专利 TAG:


1.本发明涉及公安管理领域,特别是涉及一种事件内容完备性质量评估方法和计算机。


背景技术:

2.事件内容完备性质量评估,即事件文本的内容完整性检查。判断一个事件文本内容是否完整的依据例如可以是否包含七何要素,且每种要素的具体内容信息是否完整。所谓的七何是事件内容的构成要素,包括何人、何物、何地、何事、何因、何果。这里的事件内容可以是警情内容。
3.现有的评估方法,一类是基于规则的,在事件文本中抽取的要素结果,进行七何要素类型比对,最终根据比对出的缺失程度给出最终的评估结果,该方法主要靠人工梳理规则,无法穷举所有可能,而且鲁棒性差。另一类基于逻辑回归模型的,主要做法是直接对警情文本内容进行编码,然后通过回归函数得出一个分值,该方法的缺点是无法获取文本内容中的要素结构化表示信息,最终的评估效果可信度低。


技术实现要素:

4.本发明的目的是克服现有技术中的不足之处,提供一种评估效果可信度高的事件内容完备性质量评估方法和计算机。
5.为实现上述目的,本发明一方面提供一种事件内容完备性质量评估方法,包括:
6.构建事件概念体系树,所述事件概念体系树由事件的固有属性形成的树状节点形成;
7.从待评估的事件内容文本中抽取与事件概念体系树对应的文本要素;
8.将待评估的事件内容文本的文本要素抽取结果与事件概念体系树进行注意力计算,得到文本完备性语义信息表示;
9.将事件概念体系树与待评估的事件内容文本形成的概念体系树实例进行注意力计算,得到要素结构化实例完备性表示;
10.根据所述文本完备性语义信息表示和要素结构化实例完备性表示,生成综合完备性信息表达;
11.基于综合完备性信息表达,评估所述待评估的事件内容文本的完备性质量。
12.在一个优选的方式中,所述构建事件概念体系树包括:为每种事件类型,分别构建对应的事件概念体系树。
13.在一个优选的方式中,该方法还包括:
14.对待评估的事件内容文本进行文本分类操作,确定事件内容文本对应的事件类型;
15.所述将待评估的事件内容文本的文本要素抽取结果与事件概念体系树进行注意力计算包括:将待评估的事件内容文本的文本要素抽取结果与该事件的类型对应的事件概
念体系树进行注意力计算;
16.所述将事件概念体系树与待评估的事件内容文本形成的概念体系树实例进行注意力计算包括:将该事件的类型对应的事件概念体系树与待评估的事件内容文本形成的概念体系树实例进行注意力计算。
17.在一个优选的方式中,所述待评估的事件内容文本形成的概念体系树实例,是基于待评估的事件内容文本的文本要素抽取结果与事件概念体系树形成的。
18.在一个优选的方式中,所述将待评估的事件内容文本的文本要素抽取结果与事件概念体系树进行注意力计算包括:
19.利用时间预测序列预测算法,对待评估的事件内容文本的文本要素抽取结果进行处理,得到事件文本序列向量表示;
20.利用基于树结构的序列预测算法,对事件概念体系树进行处理,得到事件概念体系树的向量表示;
21.基于所述事件文本序列向量表示和事件概念体系树的向量表示,进行注意力计算,得到文本完备性语义信息表示。
22.在一个优选的方式中,所述将事件概念体系树与待评估的事件内容文本形成的概念体系树实例进行注意力计算包括:
23.利用基于树结构的序列预测算法,对事件概念体系树进行处理,得到事件概念体系树的向量表示;
24.利用基于树结构的序列预测算法,对概念体系树实例进行处理,得到概念体系树实例的向量表示;
25.基于所述事件概念体系树的向量表示和概念体系树实例的向量表示进行注意力计算,得到要素结构化实例完备性表示。
26.在一个优选的方式中,所述基于综合完备性信息表达,评估所述待评估的事件内容文本的完备性质量包括:
27.将所述综合完备性信息表达作为激活函数输入,输出预定区间内的连续分布的完备性质量评分。
28.在一个优选的方式中,根据所述文本完备性语义信息表示和要素结构化实例完备性表示,生成综合完备性信息表达包括:
29.将文本完备性语义信息表示和要素结构化实例完备性表示进行拼接操作,得到综合完备性信息表达。
30.在一个优选的方式中,所述事件的固有属性包括:
31.事件涉及的人、物、时间、地点、事件、原因、和/或结果。
32.本发明另一方面还提供一种计算机,包括:处理器和存储器,所述处理器用于执行存储器中的代码,以执行上述事件内容完备性质量评估方法。
33.本发明结合了事件的概念体系树,将事件内容文本中的要素提取出来并结构化形成概念体系树的实例,最终从文本和结构化知识两个维度,并结合概念体系树进行完备性信息学习,从而更好的获取警情内容中的关键信息,继而与概念体系树的一致性匹配,得出一个可信度较高的完备性质量评分。
34.本发明的其他有益效果将在说明书中进行进一步说明。
附图说明
35.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
36.图1为本发明实施例提供的一种事件内容完备性质量评估方法的流程图;
37.图2是一种事件概念体系树的结构图;
38.图3是一种概念体系树实例的示意图;
39.图4是是本发明实施例中事件内容完备性质量评估方法的模型架构示意图;
40.图5是以事件内容文本为一条警情内容文本为例说明事件内容完备性质量进行评估的过程的示意图。
具体实施方式
41.为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描述。附图中给出了本发明的较佳实施方式。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本发明的公开内容理解的更加透彻全面。
42.本发明实施例提出一种事件内容完备性质量评估模型,结合了事件的概念体系树,将事件内容文本中的要素提取出来并结构化形成概念体系树的实例,最终从文本和结构化知识两个维度,并结合概念体系树进行完备性信息学习,从而更好的获取警情内容中的关键信息,继而与概念体系树的一致性匹配,得出一个可信度较高的完备性质量评分。
43.以下具体说明详细实现。
44.图1示出了本发明实施例提供的一种事件内容完备性质量评估方法的流程图,该方法包括如下步骤:
45.步骤s101:构建事件概念体系树,该事件概念体系树由事件的固有属性形成的树状节点形成。
46.事件概念体系树由事件的固有属性归纳而成,该固有属性可以具有层级从属结构,因此对应数据结构中的树状结构。为此可以树形结构构建该体系,即事件概念体系树。该树中每个节点为一个固有属性,子节点对应的属性是其父节点属性的下位属性。例如表示“报告人”属性的节点可以是表示“人”的节点的子节点,而表示“报告人姓名”属性的节点又进一步是“报告人”属性节点的子节点。
47.图2示出了一种事件概念体系树的结构图,本领域技术人员应该能够理解该结构仅仅是一种示例,实际中可以根据需要选择其中一部分或者增加其他部分。在图2示出的示例中,事件概念体系树主要包括人、物、时间、地点、事件、原因、和结果等几个方面的属性节点。
48.其中人的属性节点的子节点中包括报告人、事件对象人、事件疑似发起人的属性节点。作为示例,报告人属性节点下方展开示出关于人的常见属性的节点,例如姓名、性别、暂住地等。应该能够理解,在事件对象人和事件疑似发起人属性节点下也可以做类似子节点的展开设置。
49.物的属性节点的子节点中包括标的物、事件工具、和其他物品的属性节点。其中标的物的属性节点的子节点包括数量、型号、价值等属性节点。应该能够理解,在事件工具、其他物品的属性节点中也可做类似子节点的展开设置。
50.时间的属性节点的子节点中包括报告时间、事件发生时间、和其他时间的属性节点。地点的属性节点的子节点中包括报告地点、事件发生地点、和其他地点的属性节点。
51.事件的属性节点的子节点中包括事件性质和事件经过的属性节点。原因的属性节点的子节点主要包括事件起因的属性节点。结果的属性节点的子节点主要包括人员损失和财产损失属性的节点。
52.为了体现不同类型事件的属性特点,在一种优选的方式中,可以为每种事件类型,分别构建对应的事件概念体系树,不同类型事件的事件概念体系树内容可以不同,例如不同类型事件的固有属性类别或者固定属性名称常常不同,由此构建的事件概念体系树的节点数量、节点架构、以及节点名称可能不同。
53.在图2中的事件概念体系树特别标注为“事件类型a”的事件概念体系树。
54.步骤s102:从待评估的事件内容文本中抽取与事件概念体系树对应的文本要素。
55.利用步骤s101中构建好的事件概念树,借助要素抽取模型,可以从待评估的事件内容文本中自动提取与事件概念体系树对应的文本要素。
56.要素抽取模型可以采用bert lstm crf模型。
57.需要说明的是,如步骤s101中为每种类型事件分别构建相应的事件概念体系树,则在步骤s102前可以对待评估的事件内容文本进行文本分类操作,确定事件内容文本对应的事件类型。文本分类操作可以借助,如textcnn、dcnn、rcnn、bert等文本分类算法实现。在优选的实施例中,可以使用基于bert预训练模型的文本分类算法,如bert 线性层 softmax。
58.在确定事件内容文本对应的事件类型后,步骤s102中从待评估的事件内容文本中抽取与事件概念体系树对应的文本要素具体实现为:从待评估的事件内容文本中抽取与该事件类型的事件概念体系树对应的文本要素。
59.例如当事件内容文本为“2020年12月12日9时许,张三(男,13812345678,苏州工业园区**花园)报告称:...”。经过文本分配确定该事件类型为类型b(如盗窃),然后将从该事件内容文本中抽取类型b的事件概念体系树对应的文本要素。
60.文本要素抽取结果可以以带要素标记的事件内容文本的形式呈现。例如将要素抽取模型的结果通过标记符的形式,在事件内容文本原文中标记出各个要素的位置,可以更好的让模型学习到文本中的关键要素信息。
61.可以将文本要素抽取结果挂载在该事件类型对应的事件概念体系树上,形成概念体系树实例。例如图3示出一种概念体系树实例的示意图。
62.步骤s103:将待评估的事件内容文本的文本要素抽取结果与事件概念体系树进行注意力计算,得到文本完备性语义信息表示;将事件概念体系树与待评估的事件内容文本形成的概念体系树实例进行注意力计算,得到要素结构化实例完备性表示。
63.注意力计算可以是采用attention机制的算法。
64.将待评估的事件内容文本的文本要素抽取结果与事件概念体系树进行注意力计算,得到文本完备性语义信息表示,可以更好地保留事件内容文本原文中要素间的先后语
序信息。
65.将待评估的事件内容文本的文本要素抽取结果与事件概念体系树进行注意力计算可以包括如下步骤:
66.步骤a.1:利用时间预测序列预测算法,对待评估的事件内容文本的文本要素抽取结果进行处理,得到事件文本序列向量表示;
67.步骤a.2:利用基于树结构的序列预测算法,对事件概念体系树进行处理,得到事件概念体系树的向量表示;
68.步骤a.3:基于所述事件文本序列向量表示和事件概念体系树的向量表示,进行注意力计算,得到文本完备性语义信息表示。
69.以注意力计算为attention算法为例,详细说明上述步骤a.1-a.3的具体实现。
70.步骤a.1中的时间预测序列预测算法可以是bi-lstm算法,利用bi-lstm算法对待评估的事件内容文本的文本要素抽取结果进行处理,得到事件内容文本序列向量表示为[h0,h1,...,h
t
,...,h
l
],其中,l为文本长度,h
t
为第t个字符的向量表示,h
t
=[h
lt
,h
rt
],h
lt
为前向lstm得到的向量表示,h
rt
为后向lstm的向量表示,最终二者拼接得到最终的向量表示h
t

[0071]
步骤a.2中的基于树结构的序列预测算法可以是tree-lstm算法,利用tree-lstm算法对事件概念体系树进行处理,得到事件概念体系树的向量表示hc。
[0072]
步骤a.3中对事件文本序列向量表示和事件概念体系树的向量表示,进行注意力计算,具体可以采用如下公式进行:
[0073][0074]
c=σiα
ihi
[0075]
其中c即为最终得到文本完备性语义信息表示,这里以向量形式表示。
[0076]
将事件概念体系树与待评估的事件内容文本形成的概念体系树实例进行注意力计算,得到要素结构化实例完备性表示。可以更好地表达要素间层级关系信息。
[0077]
将事件概念体系树与待评估的事件内容文本形成的概念体系树实例进行注意力计算可以包括如下步骤:
[0078]
步骤b.1:利用基于树结构的序列预测算法,对事件概念体系树进行处理,得到事件概念体系树的向量表示;
[0079]
步骤b.2:利用基于树结构的序列预测算法,对概念体系树实例进行处理,得到概念体系树实例的向量表示;
[0080]
步骤b.3:基于事件概念体系树的向量表示和概念体系树实例的向量表示进行注意力计算,得到要素结构化实例完备性表示。
[0081]
以注意力计算为attention算法为例,详细说明上述步骤b.1-b.3的具体实现。
[0082]
步骤b.1中的基于树结构的序列预测算法可以是tree-lstm算法,利用tree-lstm算法对事件概念体系树进行处理,得到事件概念体系树的向量表示hc。
[0083]
步骤b.2中的基于树结构的序列预测算法可以是tree-lstm算法,利用tree-lstm算法对概念体系树实例进行处理,得到要素结构化实例向量表示为[h0,h1,...,h
t
,...,hk],其中,k为要素实例个数。
[0084]
步骤b.3具体可以利用attention算法采用如下公式得到要素结构化实例完备性语义信息表示c

,这里采用向量信息。
[0085][0086]c′
=σiα
ihi
[0087]
需要说明的是,步骤b.1与上述步骤a.2实现可以相同,为此这两个步骤可以省略其一,将事件概念体系树的向量表示的获得过程只执行一次即可。
[0088]
步骤s104:根据文本完备性语义信息表示和要素结构化实例完备性表示,生成综合完备性信息表达。
[0089]
这里生成综合完备性信息表达的方式具体可以是将文本完备性语义信息表示和要素结构化实例完备性表示进行拼接操作。
[0090]
步骤s105:基于综合完备性信息表达,评估所述待评估的事件内容文本的完备性质量。
[0091]
这里可以经过例如sigmoid函数等激活函数,以步骤s104中得到的综合完备性信息表达作为输入,输出预定区间内的连续分布的完备性质量评分,例如得出一个0-1之间的分值,分值越高代表当前警情内容文本完备性越高。
[0092]
图4示出了本发明实施例中事件内容完备性质量评估方法的模型架构示意图,其中模型左侧借助bi-lstm算法处理事件内容文本和中间借助tree-lstm算法处理事件概念体系树,并利用attention计算得出文本完备性语义信息表示。模型右侧借助tree-lstm算法处理概念体系树实例和中间借助tree-lstm算法处理事件概念体系树,并利用attention计算得出要素结构化实例完备性表示。
[0093]
图5示出了以事件内容文本为一条警情内容文本、事件概念体系树为七何要素概念树为例,说明本发明实施例对该事件内容完备性质量进行评估的过程。
[0094]
本发明实施例提出的事件内容文本完备性质量评估方法,结合了事件概念体系树,将文本中的要素提取出来并结构化形成概念树实例,最终从文本和结构化知识两个维度,并结合概念树进行完备性信息学习,从而可以更好的获取警情内容中的关键信息,继而与概念树的一致性匹配,最终得出一个可信度较高的完备性质量评分。
[0095]
本发明另一实施例还提供一种计算机,包括:处理器和存储器,所述处理器用于执行存储器中的代码,以执行上述实施例中事件内容完备性质量评估方法中的步骤。
[0096]
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程系统。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以
是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘(solid state disk,ssd))等。
[0097]
本技术实施例中所描述的各种说明性的逻辑单元和电路可以通过通用处理器,数字信号处理器,专用集成电路(asic),现场可编程门阵列(fpga)或其它可编程逻辑系统,离散门或晶体管逻辑,离散硬件部件,或上述任何组合的设计来实现或操作所描述的功能。通用处理器可以为微处理器,可选地,该通用处理器也可以为任何传统的处理器、控制器、微控制器或状态机。处理器也可以通过计算系统的组合来实现,例如数字信号处理器和微处理器,多个微处理器,一个或多个微处理器联合一个数字信号处理器核,或任何其它类似的配置来实现。
[0098]
本技术实施例中所描述的方法或算法的步骤可以直接嵌入硬件、处理器执行的软件单元、或者这两者的结合。软件单元可以存储于ra存储器、闪存、ro存储器、epro存储器、eepro存储器、寄存器、硬盘、可移动磁盘、cd ro或本领域中其它任意形式的存储媒介中。示例性地,存储媒介可以与处理器连接,以使得处理器可以从存储媒介中读取信息,并可以向存储媒介存写信息。可选地,存储媒介还可以集成到处理器中。处理器和存储媒介可以设置于asic中,asic可以设置于终端中。可选地,处理器和存储媒介也可以设置于终端中的不同的部件中。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0099]
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献