一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

事件关系识别方法、装置、计算机设备以及存储介质与流程

2022-06-22 22:10:24 来源:中国专利 TAG:


1.本公开涉及自然语言处理领域,具体而言,涉及一种事件关系识别方法、装置、计算机设备以及存储介质。


背景技术:

2.在自然语言处理领域中,可以通过提取文本中事件之间的关系,完成许多智能任务。例如,在机器阅读理解技术中,可以通过抽取文本之间的事件关系自动完成文本批阅任务。然而,现有的事件关系识别方法中通常利用人工设计的启发式规则来构建事件图,并通过确定该事件图中连边关系来确定事件关系,从而使识别到的文本中各事件之间的事件关系容易受到较多主观因素的干扰,进而影响了事件关系识别的准确性。


技术实现要素:

3.本公开实施例至少提供一种事件关系识别方法、装置、计算机设备以及存储介质。
4.第一方面,本公开实施例提供了一种事件关系识别方法,该方法包括:获取待处理文本数据,并在所述待处理文本数据中确定多个目标事件;基于所述多个目标事件构建至少一个事件组,其中,每个所述事件组包含至少两个目标事件;基于所述至少一个事件组构建目标事件关系图;所述目标事件关系图用于指示各事件组中包含相同目标事件的事件组之间的关联关系;基于所述目标事件关系图识别所述待处理文本数据中各目标事件之间的事件关系。
5.通过上述描述可知,在获取到待处理文本数据之后,可以先在待处理文本数据中确定多个目标事件,并基于该多个目标事件构建至少一个事件组。之后,可以基于该至少一个事件组构建目标事件关系图,并基于该目标事件关系图识别待处理文本数据中各目标事件之间的事件关系。上述实施方式中,可以基于事件组构建目标事件关系图,从而可以基于该目标事件关系图识别到任意两个目标事件之间的事件关系,同时,还可以识别到事件组之间的事件关系,从而可以识别到多个目标事件之间的事件关系,进而可以得到更加丰富、全面的各目标事件之间的事件关系。
6.一种可选的实施方式中,所述基于所述至少一个事件组构建目标事件关系图,包括:在所述至少一个事件组的数量为多个的情况下,基于多个所述事件组构建事件对节点,得到多个事件对节点,其中,每个事件组对应一个事件对节点;建立任意两个所述事件对节点之间的节点关联关系,得到初始事件关系图;获取各事件对节点之间的节点约束条件,并删除所述初始事件关系图中不满足所述节点约束条件的节点关联关系,得到所述目标事件关系图。
7.上述实施方式中,可以在基于至少一个事件组的数量为多个的情况下,基于多个事件组构建事件对节点,得到多个事件对节点,并通过建立任意两个事件对节点之间的节点关联关系,得到初始事件关系图,从而可以使得到的初始事件关系图不依赖于人工设定的启发式规则,进而可以在事件关系识别的时候避免引入不必要的噪声,进而避免影响事
件关系识别的准确性。同时,上述实施方式中,还可以通过获取各事件对节点之间的节点约束条件,并删除初始事件关系图中不满足该节点约束条件的节点关联关系,得到目标事件关系图的方式,可以简化基于目标事件关系图识别各目标事件之间的事件关系的复杂度,进而可以提高识别效率。
8.一种可选的实施方式中,所述基于所述目标事件关系图识别所述待处理文本数据中各目标事件之间的事件关系,包括:获取目标事件关系识别模型;将所述目标事件关系图输入至所述目标事件关系识别模型中进行识别处理,得到所述待处理文本数据中各目标事件之间的事件关系,其中,所述事件关系包含:每个所述事件组中所包含目标事件之间的第一事件关系,和/或,各事件组之间的第二事件关系得到所述待处理文本数据中各目标事件之间的事件关系。
9.上述实施方式中,可以先获取目标事件关系识别模型,并通过将目标事件关系图输入至该目标事件关系识别模型中进行识别,得到待处理文本数据中各目标事件之间的事件关系的方式,可以实现待处理文本数据中事件关系的自动、高效识别。同时,上述实施方式中还可以识别得到每个事件组所包含目标事件之间的事件关系以及得到各事件组之间的事件关系,从而可以得到待处理文本数据中更全面、丰富的事件关系,进而提高了事件关系识别方法的有效性。
10.一种可选的实施方式中,所述方法还包括:获取训练数据集;其中,所述训练数据集中包含多个训练样本和训练标签,每个所述训练样本包含待训练事件关系图,每个所述训练样本的训练标签包含相对应待训练事件关系图中每个待训练事件组中所包含事件的事件关系的关系标签和/或各事件组之间的事件关系的关系标签;基于所述训练数据集对待训练的事件关系识别模型进行训练,得到所述目标事件关系识别模型。
11.一种可选的实施方式中,所述基于所述训练数据集对待训练的事件关系识别模型进行训练,得到所述目标事件关系识别模型,包括:将所述训练数据集输入至所述待训练的事件关系识别模型中进行训练,得到每个所述训练样本的初始训练结果;其中,所述初始训练结果用于指示所述待训练事件关系图中每个待训练事件组中所包含事件的事件关系的预测结果和/或各事件组之间事件关系的预测结果;确定所述初始训练结果中的目标训练结果,其中,所述目标训练结果为与对应的训练标签不相同的训练结果;基于所述目标训练结果调整焦点损失函数的计算权重,并基于调整之后的计算权重,确定焦点损失函数的函数值;基于所述焦点损失函数的函数值调整所述待训练的事件关系识别模型的模型参数,直至得到满足训练要求的所述待训练的事件关系识别模型,并将满足训练要求的所述待训练的事件关系识别模型确定为所述目标事件关系识别模型。
12.上述实施方式中,可以基于训练数据集训练对待训练的事件关系识别模型进行训练,并且可以基于目标训练结果调整焦点损失函数的计算权重,从而可以使待训练的事件关系识别模型更关注识别错误的训练样本,从而可以缓解待训练的事件关系识别模型的假阳性预测问题,进而可以提高得到的目标事件关系识别模型的识别精度。
13.一种可选的实施方式中,所述基于所述多个目标事件构建至少一个事件组,包括:为所述多个目标事件中的每个目标事件生成对应的事件表示标识,得到多个事件表示标识;基于所述多个事件表示标识构建所述至少一个事件组,其中,每个所述事件组中包含该事件组所对应目标事件的事件表示标识。
14.一种可选的实施方式中,所述为所述多个目标事件中的每个目标事件生成对应的事件表示标识,包括:获取所述多个目标事件中每个目标事件的文本信息;对所述文本信息进行编码,得到编码结果,并基于所述编码结果确定对应目标事件的事件表示标识。
15.上述实施方式中,可以在获取每个目标事件的文本信息之后,对该文本信息进行编码得到编码结果,并基于该编码结果确定每个目标事件的事件表示标识,从而可以将待处理文本数据中的多个目标事件转化为目标事件关系识别模型可以识别的事件表示标识的形式,从而可以更好的利用目标事件关系识别模型识别待处理文本数据中各目标事件之间的事件关系。之后,基于多个目标事件对应的多个事件表示标识构建至少一个事件组的方式,可以降低目标事件关系识别模型识别目标事件之间的事件关系的复杂度,进而提高了事件关系识别的效率。
16.一种可选的实施方式中,所述基于所述编码结果确定对应目标事件的事件表示标识,包括:在所述编码结果为多个的情况下,确定多个所述编码结果的总和,得到目标编码结果;将所述目标编码结果与所述编码结果的数量进行求平均值计算,得到该目标事件的事件表示标识。
17.上述实施方式中,可以在针对每个目标事件的编码结果为多个的情况下,可以对该多个编码结果进行汇总并求平均值的方式得到每个目标事件的唯一事件表示标识,从而可以降低事件关系识别方法的误差,避免引入不必要的噪声,进而可以提高事件关系识别方法的准确度。
18.一种可选的实施方式中,所述在所述待处理文本数据中确定多个目标事件,包括:确定动态窗口的窗口参数;所述动态窗口为用于对所述待处理文本数据中进行遍历的窗口;确定当前时刻所述待处理文本数据中位于所述动态窗口内的目标文本数据,并在所述目标文本数据中识别事件识别标识;基于所述事件识别标识在所述目标文本数据中识别对应事件的文本信息,得到至少一个初始事件,并基于所述至少一个初始事件确定所述目标事件。
19.上述实施方式中,可以通过动态窗口遍历待处理文本数据,得到多个目标事件,从而可以在待处理文本数据较长的情况下利用动态窗口将待处理文本数据进行分块,并可以同时进行目标事件的识别,从而提高了确定待处理文本数据中多个目标事件的效率,进而提高了事件关系识别的效率。同时,还可以通过事件识别标识对待处理文本数据中的事件进行准确定位,进而可以提高确定待处理文本数据中目标事件的准确性,进而提高事件关系识别的准确性。
20.一种可选的实施方式中,所述基于所述至少一个初始事件确定所述目标事件,包括:在所述至少一个初始事件的事件数量为多个的情况下,对多个所述初始事件进行事件去重处理,并基于去重之后的初始事件确定所述目标事件。
21.上述实施方式中,可以在初始事件的事件数量为多个的情况下对该多个初始事件进行去重处理,从而降低了在事件关系识别的过程中的干扰,从而提高了事件关系识别的准确度。
22.第二方面,本公开实施例还提供一种事件关系识别装置,包括:获取单元,用于获取待处理文本数据,并在所述待处理文本数据中确定多个目标事件;第一构建单元,用于基于所述多个目标事件构建至少一个事件组,其中,每个所述事件组包含至少两个目标事件;
第二构建单元,用于基于所述至少一个事件组构建目标事件关系图;所述目标事件关系图用于指示各事件组中包含相同目标事件的事件组之间的关联关系;识别单元,用于基于所述目标事件关系图识别所述待处理文本数据中各目标事件之间的事件关系。
23.第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
24.第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
25.为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
26.为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
27.图1示出了本公开实施例所提供的一种事件关系识别方法的流程图;
28.图2示出了本公开实施例所提供的一种目标事件关系图的示意图;
29.图3示出了本公开实施例所提供的另一种目标事件关系图的示意图;
30.图4示出了本公开实施例所提供的基于至少一个事件组构建目标事件关系图方法的流程图;
31.图5示出了本公开实施例所提供的一种得到目标事件关系识别模型方法的流程图;
32.图6示出了本公开实施例所提供的一种事件关系识别装置的示意图;
33.图7示出了本公开实施例所提供的一种计算机设备的示意图。
具体实施方式
34.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
35.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
36.本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
37.经研究发现,在自然语言处理领域中,可以通过提取文本中事件之间的关系,完成许多智能任务。例如,在机器阅读理解技术中,可以通过抽取文本之间的事件关系自动完成文本批阅任务。然而,现有的事件关系识别方法中通常利用人工设计的启发式规则来构建事件图,并通过确定该事件图中连边关系来确定事件关系,从而使识别到的文本中各事件之间的事件关系容易受到较多主观因素的干扰,进而影响了事件关系识别的准确性。
38.基于上述研究,本公开提供了一种事件关系识别方法。通过上述描述可知,在获取到待处理文本数据之后,可以先在待处理文本数据中确定多个目标事件,并基于该多个目标事件构建至少一个事件组。之后,可以基于该至少一个事件组构建目标事件关系图,并基于该目标事件关系图识别待处理文本数据中各目标事件之间的事件关系。上述实施方式中,可以基于事件组构建目标事件关系图,从而可以基于该目标事件关系图识别到任意两个目标事件之间的事件关系,同时,还可以识别到事件组之间的事件关系,从而可以识别到多个目标事件之间的事件关系,进而可以得到更加丰富、全面的各目标事件之间的事件关系。
39.为便于对本实施例进行理解,首先对本公开实施例所公开的一种事件关系识别方法进行详细介绍,本公开实施例所提供的事件关系识别方法的执行主体一般为具有一定计算能力的计算机设备。
40.在本公开实施例所公开的事件关系识别方法可以识别到的事件关系可以为时间上的关系(例如时间先后关系)、因果关系、子事件的关系、共指关系等。本公开对该事件关系的类型不作具体限定。
41.参见图1所示,为本公开实施例提供的一种事件关系识别方法的流程图,所述方法包括步骤s101~s107,其中:
42.s101:获取待处理文本数据,并在所述待处理文本数据中确定多个目标事件。
43.在本公开实施例中,上述待处理文本数据可以为包含多个句子的文本数据,也可以为包含单个句子的文本数据。其中,文本数据的大小可以为包含512个字符的文档,也可以为包含2048个字符的文档,本公开对待处理文本数据的大小不作限定,以满足实际需要为准。此外,待处理文本数据的内容可以为故事,也可以为报道,本公开对待处理文本数据的内容也不作限定,以满足实际需要为准。
44.在本公开实施例中,上述待处理文本数据可以为中文,也可以为英文,本公开对该待处理文本数据的语言类型不作限定,以能实现为准。
45.在本公开实施例中,一个目标事件中可以包含主语、谓语、宾语,或者一个目标事件中可以包含主语和宾语,或者一个目标事件中还可以只包含主语等,此处不再一一列举,本公开对该目标事件中包含的内容不作具体限定,以满足实际需要为准。
46.s103:基于所述多个目标事件构建至少一个事件组,其中,每个所述事件组包含至少两个目标事件。
47.在本公开实施例中,在待处理文本数据中确定出多个目标事件之后,可以基于该
多个目标事件构建至少一个事件组。
48.具体实施时,假设,在待处理文本数据中确定出来的多个目标事件的数量为5的情况下,可以基于该5个目标事件构建至少一个事件组。
49.假设,上述5个目标事件分别为:1、2、3、4、5。在每个事件组中包含2个目标事件的情况下,可以基于该5个目标事件构建得到10个事件组。此时,可以用字母e
ij
代表事件组,其中,i和j分别代表了不同的目标事件。此时,该10个事件组可以为:e
12
、e
13
、e
14
、e
15
、e
23
、e
24
、e
25
、e
34
、e
35
、e
45

50.s105:基于所述至少一个事件组构建目标事件关系图;所述目标事件关系图用于指示各事件组中包含相同目标事件的事件组之间的关联关系。
51.这里,目标事件关系图中可以包含事件对节点和节点关联关系(也即,连边)。此时,可以将一个事件组确定为该目标事件关系图中的一个事件对节点,将各事件组之间的关联关系确定为连边。
52.在本公开实施例中,目标事件关系图可以用于指示各事件组中包含相同事件的事件组之间的关联关系,此时,可以将包含相同目标事件的事件组进行连边,建立包含相同目标事件的事件组之间的关联关系,进而构建得到目标事件关系图。
53.例如,在至少一个事件组为上述10个事件组的情况下,基于该10个事件组构建的目标事件关系图可以为如图2所示的目标事件关系图,在该图2中,即以事件组e
13
为中心所构建的目标事件关系图。其中,灰色部分即不包含对应的节点关联关系。
54.除此之外,基于至少一个事件组构建目标事件关系图的方式还可以为:将至少一个事件组中任意两个事件组进行关联,得到目标事件关系图。此时,该目标事件关系图可以指示各事件组之间的关联关系。
55.例如,在至少一个事件组为上述10个事件组的情况下,按照上述方式构建的目标事件关系图可以为如图3所示的目标事件关系图,在该图3中,即以事件组e
13
为中心所构建的目标事件关系图。
56.s107:基于所述目标事件关系图识别所述待处理文本数据中各目标事件之间的事件关系。
57.在本公开实施例中,在得到目标事件关系图之后,可以基于该目标事件关系图识别待处理文本数据中各目标事件之间的事件关系。其中,待处理文本数据中各目标事件之间的事件关系可以通过确定目标事件关系图中每个事件对节点对应的事件关系来确定。
58.例如,在目标事件关系图为如图2所示的目标事件关系图的情况下,在确定出如图2所示的目标事件关系图中事件对节点e
12
对应的事件关系为因果关系的情况下,可以确定该事件对节点e
12
对应的事件组中目标事件1和2之间的事件关系为因果关系。
59.此外,在本公开实施例中,还可以通过确定目标事件关系图中每个节点关联关系对应的事件关系来确定多个目标事件之间事件关系。
60.例如,在目标事件关系图为如图2所示的目标事件关系图的情况下,在确定出如图2所示的目标事件关系图中事件对节点e
12
和事件对节点e
13
之间的节点关联关系对应的事件关系为因果关系的情况下,可以确定事件对节点e
12
和事件对节点e
13
之间的关联关系为因果关系,此时可以确定目标事件1和3之间的事件关系也为因果关系。
61.通过上述描述可知,在获取到待处理文本数据之后,可以先在待处理文本数据中
确定多个目标事件,并基于该多个目标事件构建至少一个事件组。之后,可以基于该至少一个事件组构建目标事件关系图,并基于该目标事件关系图识别待处理文本数据中各目标事件之间的事件关系。上述实施方式中,可以基于事件组构建目标事件关系图,从而可以基于该目标事件关系图识别到任意两个目标事件之间的事件关系,同时,还可以识别到事件组之间的事件关系,从而可以识别到多个目标事件之间的事件关系,进而可以得到更加丰富、全面的各目标事件之间的事件关系。
62.在一个可选的实施方式中,如图4所示,针对s105:基于所述至少一个事件组构建目标事件关系图,具体包括如下步骤:
63.步骤s21:在所述至少一个事件组的数量为多个的情况下,基于多个所述事件组构建事件对节点,得到多个事件对节点,其中,每个事件组对应一个事件对节点;
64.步骤s22:建立任意两个所述事件对节点之间的节点关联关系,得到初始事件关系图;
65.步骤s23:获取各事件对节点之间的节点约束条件,并删除所述初始事件关系图中不满足所述节点约束条件的节点关联关系,得到所述目标事件关系图。
66.在本公开实施例中,建立任意两个事件对节点之间的节点关联关系时,可以通过将该两个事件对节点进行连边,建立起该两个事件对节点之间的关联关系。
67.其中,节点约束条件可以用于指示在建立任意两个事件对节点之间的关联关系时,该两个事件对节点需要满足的要求。
68.例如,在目标事件关系图用于指示各事件组中包含相同目标事件的事件组之间的关联关系的情况下,上述节点约束条件可以为:具有相同的目标事件。
69.在本公开实施例中,在得到至少一个事件组,并基于该至少一个事件组构建事件对节点之后,可以先建立任意两个事件对节点之间的节点关联关系,得到初始事件关系图,例如,如图3所示的事件关系图。之后可以获取节点约束条件,并按照该节点约束条件删除初始事件关系图中不满足该节点约束条件的节点关联关系,并将删除之后的事件关系图确定为目标事件关系图,例如,如图2所示的事件关系图。
70.上述实施方式中,可以在基于至少一个事件组的数量为多个的情况下,基于多个事件组构建事件对节点,得到多个事件对节点,并通过建立任意两个事件对节点之间的节点关联关系,得到初始事件关系图,从而可以使得到的初始事件关系图不依赖于人工设定的启发式规则,进而可以在事件关系识别的时候避免引入不必要的噪声,进而避免影响事件关系识别的准确性。同时,上述实施方式中,还可以通过获取各事件对节点之间的节点约束条件,并删除初始事件关系图中不满足该节点约束条件的节点关联关系,得到目标事件关系图的方式,可以简化基于目标事件关系图识别各目标事件之间的事件关系的复杂度,进而可以提高识别效率。
71.在一个可选的实施方式中,针对s1017:基于所述目标事件关系图识别所述待处理文本数据中各目标事件之间的事件关系,具体包括如下步骤:
72.步骤s31:获取目标事件关系识别模型;
73.步骤s32:将所述目标事件关系图输入至所述目标事件关系识别模型中进行识别处理,得到所述待处理文本数据中各目标事件之间的事件关系,其中,所述事件关系包含:每个所述事件组中所包含目标事件之间的第一事件关系,和/或,各事件组之间的第二事件
关系得到所述待处理文本数据中各目标事件之间的事件关系。
74.这里,目标事件关系识别模型可以为一种网络模型,基于该网络模型可以识别目标事件关系图中每个事件对节点的类型以及识别每个节点关联关系的类型。例如,该目标事件关系识别模型可以为图变换网络(graph transformer network,gtn)。
75.在本公开实施例中,将目标事件关系图输入至上述目标事件关系识别模型进行识别处理之后,可以得到待处理文本数据中各事件之间的事件关系。其中,第一事件关系可以理解为目标事件图中每个事件对节点所对应的事件组中所包含事件之间的事件关系;第二事件关系可以理解为目标事件图中每个节点关联关系所对应的两个事件组中所包含事件之间的事件关系。
76.上述实施方式中,可以先获取目标事件关系识别模型,并通过将目标事件关系图输入至该目标事件关系识别模型中进行识别,得到待处理文本数据中各目标事件之间的事件关系的方式,可以实现待处理文本数据中事件关系的自动、高效识别。同时,上述实施方式中还可以识别得到每个事件组所包含目标事件之间的事件关系以及得到各事件组之间的事件关系,从而可以得到待处理文本数据中更全面、丰富的事件关系,进而提高了事件关系识别方法的有效性。
77.在一个可选的实施方式中,如图5所示,针对上述步骤s31~s32,本公开方法还包括如下步骤:
78.步骤s41:获取训练数据集;其中,所述训练数据集中包含多个训练样本和训练标签,每个所述训练样本包含待训练事件关系图,每个所述训练样本的训练标签包含相对应待训练事件关系图中每个待训练事件组中所包含事件的事件关系的关系标签和/或各事件组之间的事件关系的关系标签;
79.步骤s42:基于所述训练数据集对待训练的事件关系识别模型进行训练,得到所述目标事件关系识别模型。
80.在本公开实施例中,上述用于识别目标事件关系图的目标事件关系识别模型可以通过训练得到。具体实施时,可以先获取训练数据集,并基于该训练数据集对待训练的事件关系识别模型进行训练得到上述目标事件关系识别模型。
81.具体实施时,针对上述:基于训练数据集对待训练的事件关系识别模型进行训练,得到目标事件关系识别模型,具体包括如下过程:
82.(1)、将所述训练数据集输入至所述待训练的事件关系识别模型中进行训练,得到每个所述训练样本的初始训练结果;其中,所述初始训练结果用于指示所述待训练事件关系图中每个待训练事件组中所包含事件的事件关系的预测结果和/或各事件组之间事件关系的预测结果;
83.(2)、确定所述初始训练结果中的目标训练结果,其中,所述目标训练结果为与对应的训练标签不相同的训练结果;
84.(3)、基于所述目标训练结果调整焦点损失函数的计算权重,并基于调整之后的计算权重,确定焦点损失函数的函数值;
85.(4)、基于所述焦点损失函数的函数值调整所述待训练的事件关系识别模型的模型参数,直至得到满足训练要求的所述待训练的事件关系识别模型,并将满足训练要求的所述待训练的事件关系识别模型确定为所述目标事件关系识别模型。
86.在本公开实施例中,每个训练样本的初始训练结果中可以包含待训练事件关系图中每个待训练事件组中所包含事件的事件关系的预测结果和/或各事件组之间事件关系的预测结果。其中,上述预测结果可以用于指示每个待训练事件组中所包含事件的事件关系和/或各事件组之间事件关系是否满足预先设定的待训练的事件关系识别模型所识别的事件关系。
87.例如,在待训练的事件关系识别模型用于识别的事件关系为因果关系的情况下,在每个待训练事件组中所包含事件的事件关系和/或各事件组之间事件关系为因果关系的情况下,该预测结果可以为“是”或者“yes”;在每个待训练事件组中所包含事件的事件关系和/或各事件组之间事件关系不是因果关系的情况下,该预测结果可以为“否”或者“no”。
88.之后,可以基于得到的初始训练结果确定出该初始训练结果中与对应的训练标签不相同的训练结果(也即事件关系识别错误的结果),得到目标训练结果。之后,可以基于该目标训练结果调整焦点损失函数的计算权重,并基于调整之后的计算权重,确定焦点损失函数的函数值。
89.在本公开实施例中,在确定出焦点损失函数的函数值之后,就可以基于该焦点损失函数的函数值调整待训练模型的事件关系识别模型的模型参数。在得到满足训练要求的待训练的事件关系识别模型之后,可以将该满足训练要求的待训练的事件关系识别模型确定为上述目标事件关系识别模型。
90.其中,满足训练要求可以为:焦点损失函数的函数值收敛,或者,待训练的事件关系识别模型的训练精度满足预设要求,本公开对该满足训练要求不作具体限定,以能实现为准。
91.在本公开实施例中,在得到满足训练要求的待训练的事件关系识别模型的情况下,该焦点损失函数的计算权重中的权重参数gamma的数值可以为2,alpha的数值可以为0.6(本公开对该alpha的数值不作具体限定,以最终调整结果为准)。
92.上述实施方式中,可以基于训练数据集训练对待训练的事件关系识别模型进行训练,并且可以基于目标训练结果调整焦点损失函数的计算权重,从而可以使待训练的事件关系识别模型更关注识别错误的训练样本,从而可以缓解待训练的事件关系识别模型的假阳性预测问题,进而可以提高得到的目标事件关系识别模型的识别精度。
93.在一个可选的实施方式中,针对s105:基于所述多个目标事件构建至少一个事件组,具体包括如下步骤:
94.步骤s51:为所述多个目标事件中的每个目标事件生成对应的事件表示标识,得到多个事件表示标识;
95.步骤s52:基于所述多个事件表示标识构建所述至少一个事件组,其中,每个所述事件组中包含该事件组所对应目标事件的事件表示标识。
96.在本公开实施例中,事件表示标识可以理解为目标事件所对应的特征向量。
97.在本公开实施例中,上述为所述多个目标事件中的每个目标事件生成对应的事件表示标识,具体可以包括如下步骤:
98.步骤s61:获取所述多个目标事件中每个目标事件的文本信息;
99.步骤s62:对所述文本信息进行编码,得到编码结果,并基于所述编码结果确定对应目标事件的事件表示标识。
100.在本公开实施例中,每个目标事件的文本信息可以待处理文本数据中与该目标事件相对应的文本数据。
101.在本公开实施例中,可以在获取待处理文本数据所包含多个目标事件中的每个目标事件所对应的文本信息之后,可以对每个目标事件对应的文本信息进行编码,得到编码结果。
102.具体实施时,可以将获取得到的每个目标事件的文本信息输入至预训练的语言模型中进行编码,得到编码结果。
103.在本公开实施例中,上述预训练的语言模型可以为bert(bidirectional encoder representations from transformers,双向transformer的encoder)模型和longformer(the long-document transformer,长文档transformer)模型的结合,从而可以在保证编码文本信息准确定的同时,还可以采用高效的局部和全局的注意力模式,进而使该预训练的语言模型可以更好的处理长文本信息。
104.此外,上述预训练的语言模型也可以仅为longformer模型,或者,也可以仅为bert模型。本公开对该预训练的语言模型不作具体限定,以能实现为准。
105.在本公开实施例中,在得到每个目标事件对应的编码结果之后,在每个目标事件对应的编码结果的数量为1个的情况下,可以该目标事件对应的编码结果确定为该目标事件的事件表示标识。
106.在此需要说明的是,针对相同的目标事件进行编码,得到的编码结果也相同。
107.上述实施方式中,可以在获取每个目标事件的文本信息之后,对该文本信息进行编码得到编码结果,并基于该编码结果确定每个目标事件的事件表示标识,从而可以将待处理文本数据中的多个目标事件转化为目标事件关系识别模型可以识别的事件表示标识的形式,从而可以更好的利用目标事件关系识别模型识别待处理文本数据中各目标事件之间的事件关系。之后,基于多个目标事件对应的多个事件表示标识构建至少一个事件组的方式,可以降低目标事件关系识别模型识别目标事件之间的事件关系的复杂度,进而提高了事件关系识别的效率。
108.在一个可选的实施方式中,针对上述基于所述编码结果确定对应目标事件的事件表示标识,具体还包括如下步骤:
109.步骤s71:在所述编码结果为多个的情况下,确定多个所述编码结果的总和,得到目标编码结果;
110.步骤s72:将所述目标编码结果与所述编码结果的数量进行求平均值计算,得到该目标事件的事件表示标识。
111.具体实施时,在目标事件对应的编码结果为多个的情况下,可以将该多个编码结果中对应位置处进行求和计算,得到该多个编码结果的总和。之后,可以将编码结果的总和与该多个编码结果对应的数量进行求平均值计算,并将得到的计算结果确定为该目标事件的事件表示标识。
112.上述实施方式中,可以在针对每个目标事件的编码结果为多个的情况下,可以对该多个编码结果进行汇总并求平均值的方式得到每个目标事件的唯一事件表示标识,从而可以避免降低事件关系识别方法的误差,避免引入不必要的噪声,进而可以提高事件关系识别方法的准确度。
113.在一个可选的实施方式中,针对s101:在所述待处理文本数据中确定多个目标事件,具体包括如下步骤:
114.步骤s81:确定动态窗口的窗口参数;所述动态窗口为用于对所述待处理文本数据中进行遍历的窗口;
115.步骤s82:确定当前时刻所述待处理文本数据中位于所述动态窗口内的目标文本数据,并在所述目标文本数据中识别事件识别标识;
116.步骤s83:基于所述事件识别标识在所述目标文本数据中识别对应事件的文本信息,得到至少一个初始事件,并基于所述至少一个初始事件确定所述目标事件。
117.在本公开实施例中,动态窗口的窗口参数可以包含至少以下信息:动态窗口的大小,动态窗口的数量。其中,动态窗口的大小可以为512个字符的大小,也可以为256个字符的大小,本公开对上述动态窗口的大小不作限定,以满足实际需要为准。其中,动态窗口的数量可以理解为用于遍历待处理文本数据的动态窗口的数量,例如,该动态窗口的数量可以为9个,也可以为8个,本公开对该动态窗口的数量不作具体限定,以满足实际需要为准。
118.其中,该动态窗口的窗口参数可以基于待处理文本数据的大小来确定,例如,可以使动态窗口的窗口参数中动态窗口的大小对应的数值与动态窗口的数量对应的数值的乘积大于或者等于待处理文本数据的大小。例如,在待处理文本数据的大小为2048个字符的情况下,可以确定动态窗口的窗口参数为:动态窗口的大小为512个字符,动态窗口的数量为4个,或者,还可以确定该动态窗口的窗口参数为:动态窗口的大小为512个字符,动态窗口的数量为5个。
119.此外,上述动态窗口的窗口参数可以为预先设定的数值,并且该动态窗口的窗口参数中动态窗口的大小对应的数值与动态窗口的数量对应的数值的乘积大于一般情况下的待处理文本数据的大小。
120.示例性的,假设,在待处理文本数据的大小一般小于或者等于2048个字符的情况下,可以预先设定上述动态窗口的窗口参数为:动态窗口的大小为512个字符,动态窗口的数量为6个,或者,可以预先设定上述动态窗口的窗口参数为:动态窗口的大小为512个字符,动态窗口的数量为9个。本公开对上述动态窗口的窗口参数不作具体限定,以满足实际需要为准。
121.在本公开实施例中,在确定出动态窗口的窗口参数之后,可以基于该动态窗口遍历待处理文本数据。之后。可以确定当前时刻在待处理文本数据中位于上述动态窗口内的目标文本数据,并在该目标文本数据中识别事件识别标识。
122.其中,事件识别标识可以理解为待处理文本数据中用于定位事件的特殊符号。例如,该特殊符号可以为《t》和《/t》,或者,该特殊符号也可以为《s》和《/s》。本公开对该事件识别标识不作具体限定,以满足实际需要为准。
123.其中,特殊符号《t》可以为事件的起始符号,特殊符号《/t》可以为事件的终止符号。此外,还可以确定特殊符号《/t》为事件的起始符号,特殊符号《t》为事件的终止符号。本公开对此不作限定,以能实现为准。
124.在目标文本数据中识别到事件识别标识之后,可以基于该事件识别标识在目标文本数据中识别对应事件的文本信息,得到至少一个初始事件,并基于该至少一个初始事件确定目标事件。
125.在得到的至少一个初始事件的数量为一个的情况下,可以将该初始事件确定为目标事件。
126.上述实施方式中,可以通过动态窗口遍历待处理文本数据,得到多个目标事件,从而可以在待处理文本数据较长的情况下利用动态窗口将待处理文本数据进行分块,并可以同时进行目标事件的识别,从而提高了确定待处理文本数据中多个目标事件的效率,进而提高了事件关系识别的效率。同时,还可以通过事件识别标识对待处理文本数据中的事件进行准确定位,进而可以提高确定待处理文本数据中目标事件的准确性,进而提高事件关系识别的准确性。
127.在一个可选的实施方式中,在所述至少一个初始事件的事件数量为多个的情况下,对多个所述初始事件进行事件去重处理,并基于去重之后的初始事件确定所述目标事件。
128.其中,上述去重处理可以为如上述步骤s71~步骤s72所述的通过求平均值的方式进行去重,或者,还可以通过删除该至少一个初始事件中多余的初始事件只保留一个初始事件的方式进行去重,本公开对该去重处理的方法不作限定,以能实现为准。
129.之后,可以将去重之后的初始事件确定为上述目标事件。
130.上述实施方式中,可以在初始事件的事件数量为多个的情况下对该多个初始事件进行去重处理,从而降低了在事件关系识别的过程中的干扰,从而提高了事件关系识别的准确度。
131.本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
132.基于同一发明构思,本公开实施例中还提供了与事件关系识别方法对应的事件关系识别装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述事件关系识别方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
133.参照图6所示,为本公开实施例提供的一种事件关系识别装置的示意图,所述装置包括:获取单元61、第一构建单元62、第二构建单元63、识别单元64;其中,
134.获取单元61,用于获取待处理文本数据,并在所述待处理文本数据中确定多个目标事件;
135.第一构建单元62,用于基于所述多个目标事件构建至少一个事件组,其中,每个所述事件组包含至少两个目标事件;
136.第二构建单元63,用于基于所述至少一个事件组构建目标事件关系图;所述目标事件关系图用于指示各事件组中包含相同目标事件的事件组之间的关联关系;
137.识别单元64,用于基于所述目标事件关系图识别所述待处理文本数据中各目标事件之间的事件关系。
138.通过上述描述可知,在获取到待处理文本数据之后,可以先在待处理文本数据中确定多个目标事件,并基于该多个目标事件构建至少一个事件组。之后,可以基于该至少一个事件组构建目标事件关系图,并基于该目标事件关系图识别待处理文本数据中各目标事件之间的事件关系。上述实施方式中,可以基于事件组构建目标事件关系图,从而可以基于该目标事件关系图识别到任意两个目标事件之间的事件关系,同时,还可以识别到事件组
之间的事件关系,从而可以识别到多个目标事件之间的事件关系,进而可以得到更加丰富、全面的各目标事件之间的事件关系。
139.一种可能的实施方式中,第二构建单元,还用于:在所述至少一个事件组的数量为多个的情况下,基于多个所述事件组构建事件对节点,得到多个事件对节点,其中,每个事件组对应一个事件对节点;建立任意两个所述事件对节点之间的节点关联关系,得到初始事件关系图;获取各事件对节点之间的节点约束条件,并删除所述初始事件关系图中不满足所述节点约束条件的节点关联关系,得到所述目标事件关系图。
140.一种可能的实施方式中,识别单元,还用于:获取目标事件关系识别模型;将所述目标事件关系图输入至所述目标事件关系识别模型中进行识别处理,得到所述待处理文本数据中各目标事件之间的事件关系,其中,所述事件关系包含:每个所述事件组中所包含目标事件之间的第一事件关系,和/或,各事件组之间的第二事件关系得到所述待处理文本数据中各目标事件之间的事件关系。
141.一种可能的实施方式中,识别单元,还用于:获取训练数据集;其中,所述训练数据集中包含多个训练样本和训练标签,每个所述训练样本包含待训练事件关系图,每个所述训练样本的训练标签包含相对应待训练事件关系图中每个待训练事件组中所包含事件的事件关系的关系标签和/或各事件组之间的事件关系的关系标签;基于所述训练数据集对待训练的事件关系识别模型进行训练,得到所述目标事件关系识别模型。
142.一种可能的实施方式中,识别单元,还用于:将所述训练数据集输入至所述待训练的事件关系识别模型中进行训练,得到每个所述训练样本的初始训练结果;其中,所述初始训练结果用于指示所述待训练事件关系图中每个待训练事件组中所包含事件的事件关系的预测结果和/或各事件组之间事件关系的预测结果;确定所述初始训练结果中的目标训练结果,其中,所述目标训练结果为与对应的训练标签不相同的训练结果;基于所述目标训练结果调整焦点损失函数的计算权重,并基于调整之后的计算权重,确定焦点损失函数的函数值;基于所述焦点损失函数的函数值调整所述待训练的事件关系识别模型的模型参数,直至得到满足训练要求的所述待训练的事件关系识别模型,并将满足训练要求的所述待训练的事件关系识别模型确定为所述目标事件关系识别模型。
143.一种可能的实施方式中,第一构建单元,还用于:为所述多个目标事件中的每个目标事件生成对应的事件表示标识,得到多个事件表示标识;
144.基于所述多个事件表示标识构建所述至少一个事件组,其中,每个所述事件组中包含该事件组所对应目标事件的事件表示标识。
145.一种可能的实施方式中,第一构建单元,还用于:获取所述多个目标事件中每个目标事件的文本信息;对所述文本信息进行编码,得到编码结果,并基于所述编码结果确定对应目标事件的事件表示标识。
146.一种可能的实施方式中,第一构建单元,还用于:在所述编码结果为多个的情况下,确定多个所述编码结果的总和,得到目标编码结果;将所述目标编码结果与所述编码结果的数量进行求平均值计算,得到该目标事件的事件表示标识。
147.一种可能的实施方式中,获取单元,还用于:确定动态窗口的窗口参数;所述动态窗口为用于对所述待处理文本数据中进行遍历的窗口;确定当前时刻所述待处理文本数据中位于所述动态窗口内的目标文本数据,并在所述目标文本数据中识别事件识别标识;基
于所述事件识别标识在所述目标文本数据中识别对应事件的文本信息,得到至少一个初始事件,并基于所述至少一个初始事件确定所述目标事件。
148.一种可能的实施方式中,获取单元,还用于:在所述至少一个初始事件的事件数量为多个的情况下,对多个所述初始事件进行事件去重处理,并基于去重之后的初始事件确定所述目标事件。
149.关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
150.对应于图1中的事件关系识别方法,本公开实施例还提供了一种计算机设备700,如图7所示,为本公开实施例提供的计算机设备700结构示意图,包括:
151.处理器71、存储器72、和总线73;存储器72用于存储执行指令,包括内存721和外部存储器722;这里的内存721也称内存储器,用于暂时存放处理器71中的运算数据,以及与硬盘等外部存储器722交换的数据,处理器71通过内存721与外部存储器722进行数据交换,当所述计算机设备700运行时,所述处理器71与所述存储器72之间通过总线73通信,使得所述处理器71执行以下指令:
152.获取待处理文本数据,并在所述待处理文本数据中确定多个目标事件;
153.基于所述多个目标事件构建至少一个事件组,其中,每个所述事件组包含至少两个目标事件;
154.基于所述至少一个事件组构建目标事件关系图;所述目标事件关系图用于指示各事件组中包含相同目标事件的事件组之间的关联关系;
155.基于所述目标事件关系图识别所述待处理文本数据中各目标事件之间的事件关系。
156.本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的事件关系识别方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
157.本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的事件关系识别方法的步骤,具体可参见上述方法实施例,在此不再赘述。
158.其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(software development kit,sdk)等等。
159.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
160.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
161.另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
162.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
163.最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献