一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种问答方法、知识图谱补全方法和相关装置与流程

2023-02-01 22:10:29 来源:中国专利 TAG:


1.本技术涉及知识图谱技术领域,特别是涉及一种问答方法、知识图谱补全方法和相关装置。


背景技术:

2.知识图谱的核心是大规模的语义网络,而语义网络是一种基于有向图结构的知识表示形式,其中节点代表文本实体、概念,边表示各种文本语义关系。知识图谱中,一条知识可以以三元组的形式存在,包括头文本实体、文本关系和尾文本实体,表示头文本实体和尾文本实体之间存在文本关系。例如,a公司、职员、b,表示b是a公司的职员。
3.知识图谱可以用于作为知识库,用于对待解答的问题进行解答,也就是从知识图谱中查找待解答问题的答案。知识图谱的问答任务流程包括,给定一个知识图谱和问题,基于问题从知识图谱中查找答案。例如,利用知识图谱对“a公司职员包括哪些”这一问题进行解答。在利用已有知识构建得到的知识图谱中,包含若干文本实体和文本关系,但是知识图谱文本实体之间的关联关系并不一定完整,这会导致解答问题时得到的答案不够准确。


技术实现要素:

4.本技术主要解决的技术问题是提供一种问答方法、知识图谱补全方法和相关装置,能够提高知识图谱问答的准确性。
5.为解决上述技术问题,本技术采用的一个技术方案是:提供一种问答方法,该方法包括:利用目标知识图谱中待补充尾实体的第一头文本实体和第一文本关系的表示,预测得到若干尾实体预测表示;基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体,并利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识;获取待解答问题;基于待解答问题的问题表示,从经知识补充的目标知识图谱中查找出与待解答问题匹配的知识;基于待解答问题匹配的知识得到待解答问题的答案。
6.其中,基于待解答问题的问题表示,从经知识补充的目标知识图谱中查找出与待解答问题匹配的知识,包括:利用目标知识图谱中各文本实体的表示,查找到与待解答问题中的目标文本实体相关的关联文本实体;获取目标知识图谱中包含关联文本实体的至少一条知识,作为与待解答问题匹配的知识。
7.为解决上述技术问题,本技术采用的一个技术方案是:提供一种知识图谱补全方法,该方法包括:从目标知识图谱中确定待补充尾实体的第一头文本实体和第一文本关系;利用第一头文本实体的实体表示和第一文本关系的关系表示,确定尾实体统一表示;基于尾实体统一表示预测得到若干尾实体预测表示;基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体,并利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识。
8.其中,利用第一头文本实体的实体表示和第一文本关系的关系表示,确定尾实体统一表示,包括:对第一文本关系的关系表示进行语义扩展,得到扩展后的关系表示;融合
第一头文本实体的实体表示与扩展后的关系表示,得到尾实体统一表示。
9.其中,对第一文本关系的关系表示进行语义扩展,得到扩展后的关系表示包括:利用关系语义扩展矩阵对关系表示进行扩展处理,得到扩展后的关系表示。
10.其中,融合第一头文本实体的实体表示与扩展后的关系表示,得到尾实体统一表示,包括:将第一头文本实体的实体表示与扩展后的关系表示相乘,得到尾实体统一表示。
11.其中,基于尾实体统一表示预测得到若干尾实体预测表示,包括:利用多通道映射参数对尾实体统一表示进行多通道映射,得到若干尾实体预测表示。
12.其中,基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体,包括:对于每个尾实体预测表示,获取尾实体预测表示与目标知识图谱的各文本实体的实体表示之间的第一相似度;以及从目标知识图谱中选出第一相似度满足相似度要求的文本实体,作为与尾实体预测表示对应的目标尾文本实体。
13.其中,利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识,包括:响应于目标知识图谱中不存在包含第一头文本实体、第一文本关系与目标尾文本实体的知识,利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识。
14.其中,知识图谱补全方法通过补全模型实现,方法还包括如下步骤以对补全模型进行训练:基于目标知识图谱中第二头文本实体的实体表示和第二文本关系的关系表示进行预测,得到若干样本尾实体预测表示,目标知识图谱包含尾文本实体标注信息,尾文本实体标注信息用于标注出目标知识图谱中与第二头文本实体、第二文本关系组成知识的至少一个真实尾文本实体;基于若干样本尾实体预测表示以及尾文本实体标注信息,确定目标损失;利用目标损失对补全模型的参数进行调整,补全模型的参数包括与目标知识图谱中实体的实体表示和关系的关系表示相关的参数。
15.其中,基于若干样本尾实体预测表示以及尾文本实体标注信息,确定目标损失包括:对于每个样本尾实体预测表示,获取样本尾实体预测表示分别与目标知识图谱中各文本实体的实体表示之间的第二相似度;从目标知识图谱中选出第二相似度满足相似度要求的文本实体,作为与样本尾实体预测表示对应的预测尾文本实体;基于预测尾文本实体以及尾文本实体标注信息,确定目标损失。
16.为解决上述技术问题,本技术采用的一个技术方案是:提供一种问答装置,包括:预测模块、补全模块、获取模块、匹配模块和问答模块,其中,预测模块用于利用目标知识图谱中待补充尾实体的第一头文本实体和第一文本关系的表示,预测得到若干尾实体预测表示,补全模块用于基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体,并利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识,获取模块用于获取待解答问题,匹配模块用于基于待解答问题的问题表示,从经知识补充的目标知识图谱中查找出与待解答问题匹配的知识,问答模块用于基于待解答问题匹配的知识得到待解答问题的答案。
17.为解决上述技术问题,本技术采用的另一个技术方案是:提供一种知识图谱补全装置,包括:确定模块、表示模块、预测模块和补全模块,确定模块用于从目标知识图谱中确定待补充尾实体的第一头文本实体和第一文本关系;表示模块用于利用第一头文本实体的实体表示和第一文本关系的关系表示,确定尾实体统一表示;预测模块用于基于尾实体统
一表示预测得到若干尾实体预测表示;补全模块用于基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体,并利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识。
18.为解决上述技术问题,本技术采用的另一个技术方案是:提供一种电子设备,包括相互耦接的存储器和处理器,处理器用于执行存储器中存储的程序指令,以实现上述任一问答方法或者知识图谱补全方法。
19.为解决上述技术问题,本技术采用的另一个技术方案是:提供一种计算机可读存储介质,其上存储有程序指令,程序指令被处理器执行时实现上述任一问答方法或者知识图谱补全方法。
20.上述方案,利用第一头文本实体的实体表示和第一文本关系的关系表示预测得到若干尾实体预测表示,从而基于若干尾实体预测表示可以确定目标知识图谱中能够与第一头文本实体和第一文本关系构成知识的目标尾文本实体,对目标知识图谱进行补全,而后对待解答问题,从目标知识图谱中查找与待解答问题匹配的知识,以得到待解答问题的答案,通过上述方式,对目标知识图谱进行补全后再对待解答问题进行解答,能够提高知识图谱问答的准确性。
附图说明
21.图1是本技术知识图谱补全方法一实施例的流程示意图;
22.图2是本技术步骤s120另一实施例的流程示意图;
23.图3是本技术步骤s140另一实施例的流程示意图;
24.图4是本技术知识图谱补全方法另一实施例的流程示意图;
25.图5是本技术知识图谱补全方法中补全模型一实施例的示意图;
26.图6是本技术问答方法一实施例的流程示意图;
27.图7是本技术知识图谱补全装置一实施例的框架示意图;
28.图8是本技术问答装置一实施例的框架示意图;
29.图9是本技术电子设备一实施例的框架示意图;
30.图10是本技术计算机可读存储介质一实施例的框架示意图。
具体实施方式
31.为使本技术的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本技术进一步详细说明。以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本技术。
32.本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
33.可以理解的是,本技术中的知识图谱补全方法可以由一电子设备执行,该电子设
备可以是具有处理能力的任意设备,例如,手机、计算机、平板电脑等。
34.需要说明的是,知识图谱可以作为知识库,用于从中检索待解答问题对应的答案,从而实现利用知识图谱对待解答问题进行解答。由于知识图谱中的文本实体的关联关系可能是不完整的,故不完整的知识图谱对问答的准确性可能产生影响,故在利用目标知识图谱解答待解答问题之前,首先对目标知识图谱进行补全,以提高问答准确性。
35.在一具体的应用场景中,目标知识图谱中包含文本实体a公司、人物a和人物b,目标知识图谱中仅存在包含a公司、职员和a的知识,但是a和b均是a公司职员,此时目标知识图谱中即缺少了包含a公司、职员和b的知识。那么若待解答问题是a公司的职员有哪些,那么利用未进行补全的目标知识图谱仅能够得到a这一答案,缺失b这一答案。在对待解答问题进行解答之前,若首先对目标知识图谱进行补全,得到包含a公司、职员和b的补充知识,那么利用补全后的目标知识图谱对待解答问题进行解答则可以得到a和b两个答案,提高了知识图谱问答的准确性。
36.以下首先对知识图谱补全进行说明,请参阅图1,图1是本技术知识图谱补全方法一实施例的流程示意图。具体而言,该方法可以包括如下步骤:
37.步骤s110:从目标知识图谱中确定待补充尾实体的第一头文本实体和第一文本关系。
38.其中,目标知识图谱为需要进行补全的知识图谱,进行一次补全可以是基于目标知识图谱中的某一文本实体和某一文本关系(如上例中的a公司和职员),查找目标知识图谱中是否存在文本实体(如上例中的b)能够作为尾文本实体通过文本关系与上述文本实体关联起来。从而可以利用查找到的文本实体作为尾文本实体与上述文本实体和文本关系构成目标知识图谱中当前不存在的补充知识,实现对目标知识图谱进行补全。
39.在一些实施例中,第一头文本实体可以为目标知识图谱中的任意文本实体,第一文本关系可以是目标知识图谱中的任意文本关系。
40.在一些实施例中,第一头文本实体也可以为目标知识图谱中的任意头文本实体。
41.需要说明的是,知识图谱中的知识包括头文本实体、文本关系和尾文本实体,用于表示文本实体、关系实体之间的文本语义关系。文本实体可以以文本形式而存在,或者也可以以其他能够表示文本含义的形式而存在,同理,文本关系可以以文本的形式而存在,或者也可以以其他能够表示文本含义的形式而存在。
42.步骤s120:利用第一头文本实体的实体表示和第一文本关系的关系表示,确定尾实体统一表示。
43.需要说明的是,一个头文本实体和一个文本关系可以与一个或多个尾文本实体对应。例如,头文本实体“a公司”与关系“员工”可以对应有多个尾文本实体“a”、“b”、“c”,表示a、b、c均是a公司的员工。在某一维度上,一个头文本实体和一个关系对应的若干尾文本实体可以用一个统一的表示进行表示,该若干尾文本实体的统一的表示可以利用上述头文本实体的实体表示以及文本关系的关系表示而确定。
44.基于一条知识中,头文本实体的实体表示、文本关系的关系表示和尾文本实体的实体表示之间的关系,为了对第一头文本实体和第一文本关系对应的尾文本实体进行预测,通过第一头文本实体的实体表示和第一文本关系的关系表示可以确定尾实体统一表示。第一头文本实体和第一文本关系可以对应有若干目标尾文本实体,通过上述方式可以
确定第一头文本实体和第一文本关系对应的若干目标尾文本实体的尾实体统一表示,以用于确定上述若干尾文本实体。
45.步骤s130:基于尾实体统一表示预测得到若干尾实体预测表示。
46.基于尾实体统一表示进行预测,可以得到若干尾实体预测表示。基于该尾实体预测表示可以进一步确定目标尾文本实体。其中,不同的尾实体预测表示可以对应不同的目标尾文本实体或者也可以对应同一目标尾文本实体。
47.一些实施例中,基于尾实体统一表示预测得到若干尾实体预测表示可以通过如下步骤实现:利用多通道映射参数对尾实体统一表示进行多通道映射,得到若干尾实体预测表示。
48.在一具体的应用场景中,利用多通道映射参数对尾实体统一表示进行多通道映射可以通过如下步骤实现:利用多通道矩阵与尾实体统一表示相乘,得到若干尾实体预测表示。
49.一些实施例中,还可以通过其他多通道映射方法对尾实体统一表示进行处理以得到若干尾实体预测表示。
50.步骤s140:基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体,并利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识。
51.其中,对于每个尾实体预测表示分别进行处理,从目标知识图谱中查找与该尾实体预测表示对应的目标尾文本实体。目标尾文本实体可以表示基于尾实体预测表示查找到的目标知识图谱中能够通过第一文本关系与第一头文本实体关联的文本实体,从而目标尾文本实体可以用于与第一头文本实体和第一文本关系构成一条知识。
52.需要说明的是,不同的尾实体预测表示可以与目标知识图谱中的不同文本实体对应,不同的尾实体预测表示也可以与目标知识图谱中的同一文本实体对应。并且,从目标知识图谱中查找出的目标尾文本实体可以包括目标知识图谱中所有与第一头文本实体和第一文本关系能够对应的文本实体,其中可以包括目标知识图谱中与第一头文本实体和第一文本关系属于同一条知识中的尾文本实体,也包括目标知识图谱中没有与第一头文本实体和第一文本关系构成知识的文本实体。在查找出目标知识图谱中各尾实体预测表示分别对应的目标尾文本实体后,可以利用第一头文本实体、第一文本关系和目标尾文本实体生成补充知识,以用于补全目标知识图谱。
53.本实施例中相关步骤用于进行一次补全,对目标知识图谱中第一头文本实体和第一文本关系能够关联的尾文本实体进行查找,以用于生成补全知识。进行补全时,也可以选择不同的第一头文本实体和第一文本关系,多次重复上述步骤。
54.上述方案,利用第一头文本实体的实体表示和第一文本关系的关系表示确定尾实体统一表示,基于尾实体统一表示预测得到若干尾实体预测表示,从而基于若干尾实体预测表示可以确定目标知识图谱中能够与第一头文本实体和第一文本关系构成知识的目标尾文本实体,通过上述方式,利用目标尾文本实体在某一维度上的表示统一的性质,能够实现同时预测得到若干实体预测表示,进而快速获取目标知识图谱中的若干实体作为目标尾文本实体,提高知识图谱补全的效率。
55.请参阅图2,图2是本技术步骤s120另一实施例的流程示意图。具体而言,步骤s120可以包括如下步骤:
56.步骤s221:对第一文本关系的关系表示进行语义扩展,得到扩展后的关系表示。
57.其中,对第一文本关系的关系表示进行语义扩展,得到扩展后的关系表示,在之后的计算过程中利用扩展后的关系表示。对关系表示进行语义扩展使得关系表示的含义更为丰富,用于获取尾实体统一表示,使得尾实体统一表示能够包含若干目标尾文本实体的丰富信息,更为准确地统一表示若干尾文本实体。
58.本技术中的知识图谱补全方法可以通过一补全模型而实现,其中,第一文本关系的关系表示是该模型的输入数据,在模型运行时对关系表示进行语义扩展,使得关系表示能够表示丰富含义的前提下,也能够简化模型的输入参数。
59.一些实施例中,对第一文本关系的关系表示进行语义扩展,得到扩展后的关系表示可以通过如下步骤实现:利用关系语义扩展矩阵对关系表示进行扩展处理,得到扩展后的关系表示。
60.一些实施例中,还可以通过其他数据扩展方法对第一文本关系的关系表示进行扩展,不限于利用关于语义扩展矩阵进行语义扩展。
61.步骤s222:融合第一头文本实体的实体表示与扩展后的关系表示,得到尾实体统一表示。
62.一些实施例中,融合第一头文本实体的实体表示与扩展后的关系表示,得到尾实体统一表示可以通过如下步骤而实现:将第一头文本实体的实体表示与扩展后的关系表示相乘,得到尾实体统一表示。
63.一些实施例中,融合第一头文本实体的实体表示与扩展后的关系表示可以包括但不限于相乘,还可以包括其他方式,例如,相加、加权求和等。
64.请参阅图3,图3是本技术步骤s140另一实施例的流程示意图。具体而言,步骤s140可以包括如下步骤:
65.步骤s341:获取尾实体预测表示与目标知识图谱的各文本实体的实体表示之间的第一相似度。
66.其中,基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体可以通过步骤s341和步骤s342来实现。在步骤s341和步骤s342中,对每个尾实体预测表示分别进行处理,分别获取每个尾实体预测表示与目标知识图谱中各文本实体的实体表示之间的第一相似度。
67.步骤s342:从目标知识图谱中选出第一相似度满足相似度要求的文本实体,作为与尾实体预测表示对应的目标尾文本实体。
68.对于每个尾实体预测表示来说,利用其与各文本实体的实体表示之间的第一相似度,选择第一相似度满足相似度要求的文本实体,作为与该尾实体预测表示对应的目标尾文本实体。
69.在一具体的应用场景中,共有尾实体预测表示a、b、c,以尾实体预测表示a为例进行说明,目标知识图谱中包含文本实体a、b、c,获取尾实体预测表示a与文本实体a、b、c的各自实体表示之间的第一相似度,得到尾实体预测表示a与文本实体a、b、c各自的实体表示的第一相似度,从中选择第一相似度满足要求的文本实体a作为该尾实体预测表示a对应的目标尾文本实体。对尾实体预测表示b、c做相同处理,分别得到尾实体预测表示b、c对应的目标尾文本实体。
70.一些实施例中,相似度要求可以是相似度最高。相似度要求可以根据用户实际需要进行调整。
71.具体地,对一个尾实体预测表示来说,可以通过将该尾实体预测表示与目标知识图谱的实体表示矩阵进行相乘,实体表示矩阵是目标知识图谱中所有实体表示构成的矩阵,通过相乘的结果可以反映出该尾实体预测表示与各实体表示之间的第一相似度,基于相乘的结果可以选择出该尾实体预测表示对应的目标尾文本实体。
72.需要说明的是,不同的尾实体预测表示可以对应不同目标尾文本实体,也可以对应同一目标尾文本实体。
73.步骤s343:响应于目标知识图谱中不存在包含第一头文本实体、第一文本关系与目标尾文本实体的知识,利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识。
74.其中,利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识可以通过步骤s343来实现。
75.可以理解的是,目标知识图谱中可以包括有若干条知识,其中包含第一头文本实体和第一文本关系和对应的尾文本实体。目标尾文本实体可以包括上述若干条知识中的尾文本实体,还包括目标知识图谱中不包含于上述若干条知识中的文本实体。那么由于目标知识图谱中已经包含了上述若干条知识,也就无需再利用第一头文本实体、第一文本关系和前一部分目标尾文本实体生成补充知识,仅需要就后者生成补充知识。故在生成补充知识时,可以对目标知识图谱中是否存在包含第一头文本实体、第一文本关系与目标尾文本实体的知识进行判断,在判断结果为不存在的情况下,利用第一头文本实体、第一文本关系和目标尾文本实体生成补充知识。
76.在一具体的应用场景中,第一头文本实体为a公司,第一文本关系为职员,基于第一头文本实体和第一文本关系得到目标尾文本实体a和b。由于目标知识图谱中已经存在包含a公司、职员和a的知识,故仅需要就a公司、职员和b生成补充知识。
77.上述方案,利用目标尾文本实体在某一维度上的表示统一的性质,能够实现同时预测得到若干实体预测表示,进而快速获取目标知识图谱中的若干实体作为目标尾文本实体,提高知识图谱补全的效率。
78.进一步来说,由于对于一个文本实体和文本关系来说,知识图谱中可能存在若干可以与之对应的真实尾文本实体。相比于进行一次补全得到一个尾文本实体的方式来说,一次训练使用的真实尾文本实体标签是固定的,若目标知识图谱中包含两个真实尾文本实体,当前预测得到的是第二真实尾文本实体,但是由于此时使用的真实标签是第一真实尾文本实体,真实标签与预测结果实际上是不对应的,那么也会认为该次预测结果不够准确,这是不合理的。本技术中的方案在进行训练时,能够将所有真实尾文本实体同时作为真实标注,避免了前述的真实标签和预测结果不对应的情况,在同时预测得到多个目标尾文本实体提高效率的前提下,也提高了查找目标尾文本实体的准确性。
79.请参阅图4,图4是本技术知识图谱补全方法另一实施例的流程示意图。具体而言,该方法可以包括如下步骤:
80.步骤s410:基于目标知识图谱中第二头文本实体的实体表示和第二文本关系的关系表示进行预测,得到若干样本尾实体预测表示。
81.可以理解的是,本技术中的知识图谱补全方法通过补全模型实现,该知识图谱补全方法还可以包括对补全模型进行训练的相关步骤,本实施例中包括步骤s410-步骤s430,在补全模型训练完成之后,利用该补全模型可以对目标知识图谱进行补全,相关步骤可以参考前述实施例中的相关内容,例如,步骤s120-步骤s130。
82.一些实施例中,补全模型可以用于基于头文本实体的实体表示和关系的关系表示预测得到若干尾实体预测表示。
83.一些实施例中,补全模型可以用于基于头文本实体的实体表示和关系的关系表示预测得到若干尾实体预测表示,以及分别对每个尾实体预测表示确定对应的目标尾文本实体。
84.其中,第二头文本实体和第二文本关系归属于目标知识图谱中的同一条知识,目标知识图谱包含尾文本实体标注信息,尾文本实体标注信息用于标注出目标知识图谱中与第二头文本实体、第二文本关系组成知识的至少一个真实尾文本实体。
85.目标知识图谱中任意一条知识中包含的头文本实体和关系可以分别作为第二头文本实体和第二文本关系,与该第二头文本实体和第二文本关系对应的真实尾文本实体也可以有若干个。
86.在一具体的应用场景中,目标知识图谱中存在包含头文本实体a、文本关系b和尾文本实体c的知识,包含头文本实体a、文本关系b和尾文本实体d的知识,包含头文本实体a、文本关系e和尾文本实体f的知识。将头文本实体a作为第二头文本实体,那么文本关系b可以作为第二文本关系,尾文本实体标注信息用于标注出尾文本实体c和尾文本实体d作为真实尾文本实体。另外,头文本实体a作为第二头文本实体,文本关系e也可以作为第二文本关系,尾文本实体标注信息用于标注出尾文本实体f作为真实尾文本实体。
87.其中,第二头文本实体的实体表示和第二文本关系的关系表示在开始训练之前是经随机初始化得到的。
88.在一具体的应用场景中,采用随机初始化参数的方式获得目标知识图谱中的所有文本实体的实体表示,进一步来说,初始化参数符合(0,1)的正态分布。采用随机初始化参数的方式获得目标知识图谱中所有文本关系的关系表示,进一步来说,初始化参数符合(0,1)的正态分布。从所有文本实体的实体表示中选择出第二头文本实体的实体表示,从所有文本关系的关系表示中选择出第二文本关系的关系表示,以用于进行一次训练。
89.具体地,基于目标知识图谱中第二头文本实体的实体表示和第二文本关系的关系表示进行预测,得到若干样本尾实体预测表示的具体步骤与基于第一头文本实体的实体表示和第一文本关系的关系表示得到若干尾实体预测表示相同,可以参考前述实施例中的相关内容。在一些实施例中,可以包括对第二文本关系的关系表示进行语义扩展,得到扩展后的关系表示,融合第二头文本实体的实体表示与扩展后的关系表示,得到尾实体统一表示,利用多通道映射参数对尾实体统一表示进行多通道映射,得到若干样本尾实体预测表示。
90.步骤s420:基于若干样本尾实体预测表示以及尾文本实体标注信息,确定目标损失。
91.其中,若干样本尾实体预测表示是该次训练过程中补全模型得到的,尾文本实体标注信息是目标知识图谱标注的真实信息,将两者进行比较,从而能够用于确定目标损失,以用于调整补全模型的参数。
92.具体来说,以补全模型输出预测尾文本实体为例进行说明。对于每个样本尾实体预测表示分别进行处理,对获取样本尾实体预测表示分别与目标知识图谱中各文本实体的实体表示之间的第二相似度,从目标知识图谱中选出第二相似度满足相似度要求的文本实体,作为与样本尾实体预测表示对应的预测尾文本实体。预测尾文本实体即为补全模型输出的预测结果,尾文本实体标注信息是目标知识图谱标注的真实信息,利用预测结果与真实信息进行比较可以得到目标损失。
93.一些实施例中,目标损失可以采用包括但不限于交叉熵损失函数计算得到。
94.一些实施例中,相似度要求可以为相似度最高。相似度要求也可以根据用户实际需要而进行调整。
95.在一具体的应用场景中,基于目标知识图谱中第二头文本实体的实体表示和第二文本关系的关系表示进行预测,得到若干样本尾实体预测表示。对于每个样本尾实体预测表示,计算其与目标知识图谱中各文本实体的第二相似度,选择第二相似度最高的文本实体作为该样本尾实体预测表示对应的预测尾文本实体。基于预测尾文本实体与尾文本实体标注信息之间的差异,利用交叉熵损失函数计算目标损失。若预测尾文本实体不是真实尾文本实体,则基于该预测尾文本实体得到的损失较大,若预测尾文本实体是真实尾文本实体,则基于该预测尾文本实体得到的损失较小。
96.步骤s430:利用目标损失对补全模型的参数进行调整。
97.其中,补全模型的参数包括与目标知识图谱中文本实体的实体表示和文本关系的关系表示相关的参数。
98.在一具体的应用场景中,利用目标损失对与目标知识图谱中文本实体的实体表示和文本关系的关系表示相关的参数进行调整,从而调整目标知识图谱的实体表示以及关系表示。
99.进一步地,补全模型的参数还包括对实体表示和关系表示计算过程中使用的参数,例如,关系语义扩展矩阵,多通道映射参数等。
100.需要说明的是,上述步骤为进行一次训练的相关步骤,对补全模型的训练过程中可以进行若干次训练,直到补全模型符合要求即可以认为训练完成。补全模型训练的过程中,对目标知识图谱中的实体表示和关系表示从随机初始化参数进行调整,模型训练完成之后,实体表示和关系表示也就能够准确表示目标知识图谱中的文本实体和文本关系。
101.在一具体的应用场景中,为了对目标知识图谱中所有的文本实体和文本关系进行准确表示,在进行训练时,对于目标知识图谱中每一条知识中的头文本实体均作为第二头文本实体,该条知识中的关系均作为第二文本关系,用于对补全模型进行训练。
102.在完成了补全模型的训练之后,可以利用该补全模型对目标知识图谱进行补全。一些实施例中,利用补全模型进行补全可以包括,将第一头文本实体的实体表示和第一文本关系的关系表示输入补全模型中,补全模型利用第一头文本实体的实体表示和第一文本关系的关系表示得到若干尾实体预测表示,并且基于若干尾实体预测表示从目标知识图谱中查找到目标尾文本实体作为补全模型的输出,以用于利用目标尾文本实体生成补全知识。
103.一些实施例中,补全模型的输出也可以为若干尾实体预测,进一步地利用若干尾实体预测查找到目标尾文本实体以及生成补全知识。
104.一些实施例中,对补全模型的训练步骤和利用补全模型进行补全可以是由同一设备执行,也可以由两个设备先后执行。
105.请参阅图5,图5是本技术知识图谱补全方法中补全模型一实施例的示意图。
106.本实施例中,目标知识图谱中包括m个文本实体,对于一个文本实体来说,利用h(1,hd)表示该文本实体的实体表示,hd表示文本实体的编码维度。对于一个文本关系来说,利用r(1,rd)表示该文本关系的关系表示,rd表示文本关系的编码维度。目标知识图谱中所有实体表示构成实体表示矩阵,所有关系表示构成关系表示矩阵,从中分别选择一个实体表示和一个关系表示输入补全模型中。对模型进行训练之前,实体表示矩阵和关系表示矩阵是基于随机初始化得到,对模型进行训练过程中对实体表示矩阵和关系表示矩阵进行调整,使得能够准确表示文本实体/文本关系。模型训练完成之后,也就得到了能够准确表示的实体表示矩阵和关系表示矩阵,在进行补全时,从实体表示矩阵和关系表示矩阵中分别选择一个实体表示和一个关系表示,以用于进行一次补全。
107.补全模型利用关系语义扩展矩阵mr(rd,hd×
hd)与关系表示r相乘,实现对关系表示的语义扩展,得到扩展后的语义表示r

(1,hd×
hd),如下式:
108.r

=r
×
mrꢀꢀꢀꢀꢀ
(1)
109.本实施例中,在得到扩展后的语义表示r

之后,为了便于后续计算,还包括对扩展后的语义表示转换为re矩阵(hd,hd),如下式:
110.re=reshape(r

)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
111.而后利用语义表示re与头文本实体的实体表示h相乘,得到尾实体统一表示t

(1,hd),如下式:
112.t

=h
×
reꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
113.而后利用多通道矩阵m
t
(n,hd,hd)对尾实体统一表示进行多通道映射,得到n个映射结果,也就是n个尾实体预测表示,n是补全模型的超参数,决定了目标尾文本实体的上限数量,如下式:
114.t=t
′×mt
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
115.其中,t={t1,t2,t3,

,tn},ti表示尾实体预测表示,t表示尾实体预测表示的集合。不同的尾实体预测表示可以对应不同的目标尾文本实体,也可以对应同一目标尾文本实体。
116.一些实施例中,在得到n个尾实体预测表示之后,补全模型还可以将n个尾实体预测表示分别与目标知识图谱的实体表示矩阵进行相乘,将乘积结果通过最大池化层为每个尾实体预测表示选择对应的目标尾文本实体,也就得到了目标知识图谱中与输入的文本实体和文本关系能够构成知识的所有尾文本实体,可以用于生成补全知识。
117.请参阅图6,图6是本技术问答方法一实施例的流程示意图。具体而言,该方法可以包括如下步骤:
118.步骤s610:利用目标知识图谱中待补充尾实体的第一头文本实体和第一文本关系的表示,预测得到若干尾实体预测表示。
119.步骤s620:基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体,并利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识。
120.生成补充知识也就是对目标知识图谱进行补全的步骤,对目标知识图谱进行补全
可以通过前述知识图谱补全方法实现,具体可以参考前述实施例中的相关内容,在此不做赘述。
121.步骤s630:获取待解答问题。
122.步骤s640:基于待解答问题的问题表示,从经知识补充的目标知识图谱中查找出与待解答问题匹配的知识。
123.通过对待解答问题进行理解,能够得到待解答问题的问题表示,例如可以通过文本处理模型对待解答问题进行处理,得到问题表示。文本处理模型可以包括但不限于bert模型等。
124.一些实施例中,步骤s640可以通过如下步骤来实现:
125.利用目标知识图谱中各文本实体的表示,查找到与待解决问题中的目标实体相关的关联实体,获取目标知识图谱中包含关联实体的至少一条知识,作为与待解答问题匹配的知识。
126.待解答问题中包含目标实体,待解答问题的答案与目标实体关联,举例来说,待解答问题“a公司的职工有哪些”中包含知识实体“a公司”,也就可以作为目标实体。问题表示中可以包括目标实体的表示,利用目标实体的表示和目标知识图谱中各文本实体的表示进行比较,也就能够找到目标知识图谱中各文本实体中与目标实体匹配的关联实体,从而包含关联实体的知识可以作为与待解答问题匹配的知识,以用于得到问题的答案。
127.在一具体的应用场景中,从目标知识图谱中查找到与目标实体“a公司”匹配的关联实体“a公司”,从而目标知识图谱中包含“a公司”的知识作为与待解答问题匹配的知识,例如,包含a公司、职员、b的知识,包含a公司、职员、a的知识,包含a公司、注册资本、100万的知识等。
128.一些实施例中,目标实体和关联实体可以相同,例如,目标实体和关联实体均为“a公司”。一些实施例中,目标实体和关联实体可以存在一定差异,但是两者表示相同含义,例如目标实体为“a公司”,关联实体为“a股份有限公司”,两者文本上虽然存在一定差异,但是两者含义相同。
129.步骤s650:基于待解答问题匹配的知识得到待解答问题的答案。
130.在一具体的应用场景中,待解答问题为“a公司的职员有谁”。在进行补全之前,目标知识图谱中存在包含a公司、职员和a的知识,在进行补全后,目标知识图谱中存在包含a公司、职员和a的知识和包含a公司、职员和b的知识。若在补全之前利用目标知识图谱进行解答,只能够得到a作为答案,在补全之后利用目标知识图谱进行解答则能够得到a和b作为答案。
131.通过对目标知识图谱进行补全,能够对目标知识图谱中缺失的关系进行补全,从而能够更为准确地得到知识图谱问答的结果,提高知识图谱问答的准确性。
132.上述方案,利用目标尾文本实体在某一维度上的表示统一的性质,能够实现同时预测得到若干实体预测表示,进而快速获取目标知识图谱中的若干实体作为目标尾文本实体,提高知识图谱补全的效率,进一步能够提高问答的准确性和效率。并且本技术中补全方法也能够提高知识图谱补全的准确性,进一步也提高了利用补全后知识图谱进行问答的准确性。
133.请参阅图7,图7是本技术知识图谱补全装置一实施例的框架示意图。
134.本实施例中,知识图谱补全装置70包括确定模块71、表示模块72、预测模块73和补全模块74,其中,确定模块71用于从目标知识图谱中确定待补充尾实体的第一头文本实体和第一文本关系;表示模块72用于利用第一头文本实体的实体表示和第一文本关系的关系表示,确定尾实体统一表示;预测模块73用于基于尾实体统一表示预测得到若干尾实体预测表示;补全模块74用于基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体,并利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识。
135.其中,表示模块72包括扩展子模块和融合子模块,其中,扩展子模块用于对第一文本关系的关系表示进行语义扩展,得到扩展后的关系表示;融合子模块用于融合第一头文本实体的实体表示与扩展后的关系表示,得到尾实体统一表示。
136.其中,扩展子模块用于对第一文本关系的关系表示进行语义扩展,得到扩展后的关系表示,具体包括:利用关系语义扩展矩阵对关系表示进行扩展处理,得到扩展后的关系表示。
137.其中,融合子模块用于融合第一头文本实体的实体表示与扩展后的关系表示,得到尾实体统一表示,具体包括:将第一头文本实体的实体表示与扩展后的关系表示相乘,得到尾实体统一表示。
138.其中,预测模块73用于基于尾实体统一表示预测得到若干尾实体预测表示,具体包括:利用多通道映射参数对尾实体统一表示进行多通道映射,得到若干尾实体预测表示。
139.其中,补全模块74包括查找子模块,用于基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体,具体包括:对于每个尾实体预测表示,获取尾实体预测表示与目标知识图谱的各实体的实体表示之间的第一相似度;以及从目标知识图谱中选出第一相似度满足相似度要求的实体,作为与尾实体预测表示对应的目标尾文本实体。
140.其中,补全模块74包括生成子模块,用于利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识,具体包括:响应于目标知识图谱中不存在包含第一头文本实体、第一文本关系与目标尾文本实体的知识,利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识。
141.其中,知识图谱补全方法通过补全模型实现,知识图谱补全装置还包括如下训练模块,用于对补全模型进行训练,训练模块具体用于基于目标知识图谱中第二头文本实体的实体表示和第二文本关系的关系表示进行预测,得到若干样本尾实体预测表示,目标知识图谱包含尾文本实体标注信息,尾文本实体标注信息用于标注出目标知识图谱中与第二头文本实体、第二文本关系组成知识的至少一个真实尾文本实体;基于若干样本尾实体预测表示以及尾文本实体标注信息,确定目标损失;利用目标损失对补全模型的参数进行调整,补全模型的参数包括与目标知识图谱中实体的实体表示和关系的关系表示相关的参数。
142.其中,基于若干样本尾实体预测表示以及尾文本实体标注信息,确定目标损失包括:对于每个样本尾实体预测表示,获取样本尾实体预测表示分别与目标知识图谱中各实体的实体表示之间的第二相似度;从目标知识图谱中选出第二相似度满足相似度要求的实体,作为与样本尾实体预测表示对应的预测尾文本实体;基于预测尾文本实体以及尾文本实体标注信息,确定目标损失。
143.请参阅图8,图8是本技术问答装置一实施例的框架示意图。
144.本实施例中,问答装置80包括预测模块81、补全模块82、获取模块83、匹配模块84和问答模块85。
145.其中,预测模块81用于利用目标知识图谱中待补充尾实体的第一头文本实体和第一文本关系的表示,预测得到若干尾实体预测表示,补全模块82用于基于若干尾实体预测表示从目标知识图谱中查找出目标尾文本实体,并利用第一头文本实体、第一文本关系与目标尾文本实体生成目标知识图谱的补充知识,获取模块83用于获取待解答问题,匹配模块84用于基于待解答问题的问题表示,从经知识补充的目标知识图谱中查找出与待解答问题匹配的知识,问答模块85用于基于待解答问题匹配的知识得到待解答问题的答案。
146.其中,匹配模块84用于基于待解答问题的问题表示,从经知识补充的目标知识图谱中查找出与待解答问题匹配的知识,具体包括:
147.利用目标知识图谱中各文本实体的表示,查找到与待解答问题中的目标文本实体相关的关联文本实体;获取目标知识图谱中包含关联文本实体的至少一条知识,作为与待解答问题匹配的知识。
148.请参阅图9,图9是本技术电子设备一实施例的框架示意图。
149.本实施例中,电子设备90包括存储器91、处理器92,其中存储器91耦接处理器92。具体地,电子设备90的各个组件可通过总线耦合在一起,或者电子设备90的处理器92分别与其他组件一一连接。该电子设备90可以为具有处理能力的任意设备,例如计算机、平板电脑、手机等。
150.存储器91用于存储处理器92执行的程序数据以及处理器92在处理过程中的数据等。例如,实体表示、关系表示、尾实体预测表示等。其中,该存储器91包括非易失性存储部分,用于存储上述程序数据。
151.处理器92控制电子设备90的操作,处理器92还可以称为cpu(central processing unit,中央处理单元)。处理器92可能是一种集成电路芯片,具有信号的处理能力。处理器92还可以是通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。另外,处理器92可以由多个成电路芯片共同实现。
152.处理器92通过调用存储器91存储的程序数据,用于执行指令以实现上述任一知识图谱补全方法或者问答方法。
153.请参阅图10,图10是本技术计算机可读存储介质一实施例的框架示意图。
154.本实施例中,该计算机可读存储介质100存储有处理器可运行的程序数据101,该程序数据能够被执行,用以实现上述任一知识图谱补全方法或者问答方法。
155.该计算机可读存储介质100具体可以为u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等可以存储程序数据的介质,或者也可以为存储有该程序数据的服务器,该服务器可将存储的程序数据发送给其他设备运行,或者也可以自运行该存储的程序数据。
156.在一些实施例中,计算机可读存储介质100还可以为如图9所示的存储器。
157.以上所述仅为本技术的实施方式,并非因此限制本技术的专利范围,凡是利用本
申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献