一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

针对问答系统的问题关系图谱构建方法、问答方法及装置与流程

2022-06-29 16:16:41 来源:中国专利 TAG:


1.本发明涉及计算机技术领域,特别是涉及一种针对问答系统的问题关系图谱构建方法、问答方法及装置。


背景技术:

2.问答系统(question answering system,qa)是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。
3.目前,问答系统的问答处理方式包括如下三种:第一种,强依赖问答模板的问答系统,通过构建具有逻辑结构的问答模板来回答用户提出的问题。此种问答系统强依赖问答模板,需要配置大量问答模板,且后期问答模板维护工作较为困难。第二种,依赖深度模型的问答系统,通过构建深度学习模型来回答用户提出的问题。此种问答系统往往需要大量的问答数据支撑,且开发和使用复杂的深度学习模型,硬件成本和开发成本高,难以落地实现。第三种,基于知识图谱的问答系统,通过问答模板对问题和知识图谱进行建模,学习从自然语言到知识图谱子结构的映射关系。但是,此种也依赖于问答模板,学习从自然语言到知识图谱子结构的映射关系需要依赖语义关联,语义关联建立较为困难。
4.可见,现有的问答系统存在强依赖于问答模板、问答数据量、语义关联的缺陷。


技术实现要素:

5.有鉴于此,本发明提出了一种针对问答系统的问题关系图谱构建方法、问答方法及装置,主要目的在于降低问答系统对问答模板、问答数据量、语义关联的依赖。
6.为了达到上述目的,本发明主要提供了如下技术方案:
7.第一方面,本发明提供了一种针对问答系统的问题关系图谱构建方法,该方法包括:
8.获取多个问题实体以及各所述问题实体各自具有的属性;
9.根据各所述问题实体的属性,确定问题实体两两之间的相关性度量;
10.根据问题实体两两之间的相关性度量,确定在预设坐标空间中各所述问题实体之间的位置关系;
11.基于各所述问题实体之间的位置关系构建问题关系图谱。
12.第二方面,本发明提供了一种针对问答系统的问答方法,应用于问答系统,其中,所述问答系统中的问题实体以问题关系图谱形式存在,各所述问题实体各自具有关联的至少一个目标实体,各所述问题实体在所述问题关系图谱之间的位置关系基于问题实体两两之间的相关性度量建立,所述方法包括:
13.从所述问答系统的各问题实体中选取与目标问题相关的第一问题实体,其中,所述第一问题实体与所述目标问题的相似度最高;
14.基于所述问题关系谱图中各所述问题实体之间的位置关系,选取与所述第一问题实体相关的第二问题实体,其中,所述第二问题实体与所述第一问题实体之间的距离小于
距离阈值;
15.基于所述第一问题实体相关的至少一个目标实体以及所述第二问题相关的至少一个目标实体,生成针对所述目标问题的答案。
16.第三方面,本发明提供了一种针对问答系统的问题关系图谱构建装置,所述装置包括:
17.获取单元,用于获取多个问题实体以及各所述问题实体各自具有的属性;
18.第一确定单元,用于根据各所述问题实体的属性,确定问题实体两两之间的相关性度量;
19.第二确定单元,用于根据问题实体两两之间的相关性度量,确定在预设坐标空间中各所述问题实体之间的位置关系;
20.构建单元,用于基于各所述问题实体之间的位置关系构建问题关系图谱。
21.第四方面,本发明提供了一种针对问答系统的问答装置,应用于问答系统,其中,所述问答系统中的问题实体以问题关系图谱形式存在,各所述问题实体各自具有关联的至少一个目标实体,各所述问题实体在所述问题关系图谱之间的位置关系基于问题实体两两之间的相关性度量建立,所述装置包括:
22.第一选取单元,用于从所述问答系统的各问题实体中选取与目标问题相关的第一问题实体,其中,所述第一问题实体与所述目标问题的相似度最高;
23.第二选取单元,用于基于所述问题关系谱图中各所述问题实体之间的位置关系,选取与所述第一问题实体相关的第二问题实体,其中,所述第二问题实体与所述第一问题实体之间的距离小于距离阈值;
24.生成单元,用于基于所述第一问题实体相关的至少一个目标实体以及所述第二问题相关的至少一个目标实体,生成针对所述目标问题的答案。
25.第五方面,本发明提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第一方面所述的针对问答系统的问题关系图谱构建方法,和/或,执行第二方面所述的针对问答系统的问答方法。
26.第六方面,本发明提供了一种电子设备,所述电子设备包括:
27.存储器,用于存储程序;
28.处理器,耦合至所述存储器,用于运行所述程序以执行第一方面所述的针对问答系统的问题关系图谱构建方法,和/或,执行第二方面所述的针对问答系统的问答方法。
29.借由上述技术方案,本发明提供的针对问答系统的问题关系图谱构建方法、问答方法及装置,在存在构建问题关系图谱的需求时,首先获取多个问题实体以及各问题实体各自具有的属性。然后根据各问题实体的属性,确定问题实体两两之间的相关性度量,并根据问题实体两两之间的相关性度量,确定在预设坐标空间中各问题实体之间的位置关系。最后基于各问题实体之间的位置关系构建问题关系图谱。可见,本发明提供的方案中问题关系图谱中的问题实体之间的位置关系基于问题实体之间的相关性度量建立,因此问题关系图谱可以反映出各问题实体之间的相关性。因此在基于问题关系图谱进行问答处理时,基于问题实体之间的位置关系便可推理出满足用户问题的答案,整个问答过程中不用强依赖于问答模板、问答数据量、语义关联。因此本发明实施例能够降低问答系统对问答模板、问答数据量、语义关联的依赖。
30.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
31.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
32.图1示出了本发明一个实施例提供的一种针对问答系统的问题关系图谱构建方法的流程图;
33.图2示出了本发明一个实施例提供的一种问题关系图谱构建过程示意图;
34.图3示出了本发明一个实施例提供的一种针对问答系统的问答方法的流程图;
35.图4示出了本发明一个实施例提供的一种针对问答系统的问题关系图谱构建装置的结构示意图;
36.图5示出了本发明另一个实施例提供的一种针对问答系统的问题关系图谱构建装置的结构示意图;
37.图6示出了本发明一个实施例提供的一种针对问答系统的问答装置的结构示意图。
具体实施方式
38.下面将参照附图更加详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
39.问答系统(question answering system,qa)是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题。
40.目前,问答系统的问答处理方式包括如下三种:第一种,强依赖问答模板的问答系统,通过构建具有逻辑结构的问答模板来回答用户提出的问题。此种问答系统强依赖问答模板,需要配置大量问答模板,且后期问答模板维护工作较为困难。第二种,依赖深度模型的问答系统,通过构建深度学习模型来回答用户提出的问题。此种问答系统往往需要大量的问答数据支撑,且开发和使用复杂的深度学习模型,硬件成本和开发成本高,难以落地实现。第三种,基于知识图谱的问答系统,通过问答模板对问题和知识图谱进行建模,学习从自然语言到知识图谱子结构的映射关系。但是,此种也依赖于问答模板,学习从自然语言到知识图谱子结构的映射关系需要依赖语义关联,语义关联建立较为困难。
41.可见,现有的问答系统存在强依赖于问答模板、问答数据量、语义关联。为了克服上述缺陷,本发明实施例提供了一种针对问答系统的问题关系图谱构建方法、问答方法及装置,以使问答系统不再强依赖于问答模板、问答数据量和语义关联,在存在用户提供出的问题时,通过问题关系图谱中问题实体之间的位置关系便可提取到答案,对问题进行回答。
42.本发明实施例提供的针对问答系统的问题关系图谱构建方法、问答方法及装置可以应用在任一知识领域的问答系统的构建过程中,下面对本发明实施例提供的针对问答系统的问题关系图谱构建方法、问答方法及装置进行具体说明。
43.如图1所示,本发明实施例提供了一种针对问答系统的问题关系图谱构建方法,该方法主要包括:
44.101、获取多个问题实体以及各问题实体各自具有的属性。
45.问题实体是构建问题关系图谱的基础。为了提高问答系统输出的问答结果的准确性,所获取的问题实体均来源于问答系统对应的知识领域。问题实体的来源途径包括如下几种:一是,问题实体从问答系统的指定知识文档中提取;二是,问题实体从问答系统接收到的用户所提的问题数据中提取;三是,问题实体从人工客服积累的用户所提问题的问题积累文档中提取。在实际应用中可以基于具体业务需求选择上述途径中的一种或多种来获取问题实体。
46.为了便于评定各问题实体之间的关联性,在获取问题实体的同时,需要获取问题实体所具有的属性。每一个问题实体均具有其各自的属性,属性是对问题实体的具体描述。问题实体的属性可以包括如下中的至少一种:中心词、主题、事件标签、关键词、高频词、url、时间、内容即content。
47.102、根据各问题实体的属性,确定问题实体两两之间的相关性度量。
48.属性是对问题实体的具体描述,可将问题实体的属性作为建立问题实体关联的依据,因此根据各问题实体的属性确定问题实体两两之间的相关性度量,以基于问题实体两两之间的相关性度量确定各问题实体之间的关联。
49.下面对根据各问题实体的属性确定问题实体两两之间的相关性度量进行说明。问题实体两两之间的相关性度量的确定过程基本相同,因此针对任意两个问题实体均可通过如下步骤一至步骤二进行相关性度量的确定:
50.步骤一,基于两个问题实体各自具有的属性,确定两个问题实体之间的至少一种关联值。
51.两个问题实体各自具体的属性能够体现出两个问题实体之间的属性关联程度、互斥程度以及语义关联程度,因此基于两个问题实体各自具有的属性确定两个问题实体之间的关联值可以具体业务需求灵活选取如下中的至少一种:属性关联值、互斥关联值、语义关联值。其中,属性关联值体现两个问题实体之间的属性关联程度,互斥关联值体现两个问题实体之间的互斥程度,语义关联程度体现两个问题实体之间的语义关联程度。
52.下面对确定两个问题实体之间的属性关联值、互斥关联值、语义关联值的方法进行分别说明:
53.一,确定两个问题实体之间的属性关联值。
54.属性关联值表示两个问题实体之间的交集程度。在确定两个问题实体之间的属性关联值时,首先确定两个问题实体具有的所有属性的总数量以及具有的相同属性的总数量,然后将相同属性的总数量与所有属性的总数量的比值,确定为两个问题实体之间的属性关联值。
55.示例性,问题实体1的属性包括属性1、属性2和属性3。问题实体2的属性包括属性1、属性2、属性4、属性5、属性6。可见,问题实体1和问题实体2这两个问题实体具有的所有属
性的总数量为8。具有的相同属性包括属性1和属性2,具有的相同属性的总数量为2。因此,问题实体1和问题实体2这两个问题实体之间的属性关联值为2/8,为0.25。
56.二,确定两个问题实体之间的互斥关联值。
57.互斥关联值表示两个问题实体之间的互斥程度,在确定两个问题实体之间的互斥关联值时,首先获取两个问题实体的属性之间的互斥程度。然后基于所获取的互斥程度,确定两个问题实体之间的互斥关联值。
58.对于任意两个属性来说,二者之间的互斥程度是先验知识,在需要获取二者之间的互斥程度时,直接从先验知识存储点提取即可。在获取两个问题实体的属性之间的互斥程度时,为了全面评估二者之间的互斥程度,则需要获取一个问题实体的每一个属性与另一个问题实体的每一个属性之间的互斥程度。
59.在获取到两个问题实体的属性之间的互斥程度,可根据所获取的互斥程度确定两个问题实体之间的互斥关联值。互斥关联值的具体确定过程为:将所获取的互斥程度的加和确定为两个问题实际之间的互斥关联值。
60.示例性,问题实体1的属性包括属性1、属性2和属性3。问题实体2的属性包括属性1、属性4。在获取互斥程度时,需要获取的互斥程度包括:属性1与属性1之间的互斥程度、属性1与属性4之间的互斥程度、属性2与属性1之间的互斥程度、属性2与属性4之间的互斥程度、属性3与属性1之间的互斥程度、属性3与属性4之间的互斥程度。将上述获取的6个互斥程度的加和确定为问题实体1和问题实体2之间的互斥关联值。
61.三,确定两个问题实体之间的语义关联值。
62.语义关联值表示两个问题实体之间的语义相似程度。在确定两个问题实体之间的语义关联值,首先通过语义训练模型获取两个问题实体各自对应的语义向量,然后基于所获取的语义向量确定两个问题实体之间的语义关联值。
63.语义训练模型可将问题实体表示为语义向量的模型,其具体类型本实施例不做具体限定。示例性的,语义训练模型为labse模型(language-agnostic bert sentence embedding,多语言bert嵌入)。在通过语义训练模型获取两个问题实体各自对应的语义向量,将所获取的两个语义向量的乘积确定为两个问题实体之间的语义关联值。
64.需要说明的是,为了减少计算成本,可在确定问题实体两两之间的相关性度量之间,通过语义训练模型获取两个问题实体各自对应的语义向量,并组织所有语义向量为相似度矩阵,其中,相似度矩阵中的所有元素即为问题实体两两之间的语义关联值。组织所有语义向量为相似度的过程为:组织所有语义向量为第一矩阵以及组织所有语义向量为第二矩阵,其中,第一矩阵中所有语义向量组成一行,第二矩阵中所有语义向量组成一列。
65.第一矩阵和第二矩阵的乘积即为相似度矩阵。
66.步骤二,基于所述至少一种关联值确定两个问题实体之间的相关性度量。
67.确定两个问题实体之间的相关性度量所选用的关联值的种类可基于业务需求从属性关联值、互斥关联值、语义关联值中选取。为了更为全面的评估两个问题实体之间的相关性,可选用属性关联值、互斥关联值、语义关联值三者共同确定两个问题实体之间的相关性度量。
68.下面对基于属性关联值、互斥关联值、语义关联值,确定两个问题实体之间的相关性度量的过程进行具体说明,该过程包括:首先基于两个问题实体的属性之间的感知强度
确定两个问题实体之间的感知度,然后基于属性关联值校正语义关联值以及基于感知度分别校正属性关联值和互斥关联值。最后基于校正后的属性关联值、互斥关联值、语义关联值,确定两个问题实体之间的相关性度量。
69.基于两个问题实体的相同属性决定着二者之间的相关性,因此在确定两个问题实体属性之间的感知强度时,仅确定两个问题实体的相同属性的感知强度。示例性,问题实体1的属性包括属性1、属性2和属性3。问题实体2的属性包括属性1、属性4。在确定感知强度时,则仅确定属性1的感知强度。需要说明的是,对于任意一个属性来说,其感知强度是先验知识,在需要获取其的感知强度时,直接从先验知识存储点提取即可。
70.在两个问题实体的属性之间的感知强度之后,可通过如下公式确定两个问题实体之间的感知度:
71.m
ij
=g(∑i(xn))
72.其中,m
ij
为问题实体i和问题实体j之间的感知度;g为有界单递增函数;i(xn)为问题实体i和问题实体j具有的第n个目标属性之间的感知强度,其中,目标属性为问题实体i和问题实体j具有的相同属性。
73.g为有界单递增函数,感知度的计算公式可基于有界单递增函数其具体形式发生简单变动。示例性的,g选用凹曲线函数,则
[0074][0075]
其中,x
best
为所获取的感知强度中最大的感知强度。
[0076]
由于属性关联值和互斥关联值在一定程度上不能全面描述两个问题实体之间的相关性,因此在确定感知度之后,可基于感知度分别校正属性关联值和互斥关联值。校正方法为:通过感知度与属性关联值相乘的方式校正属性关联值,通过感知度与互斥关联值相乘的方式校正互斥关联值。
[0077]
属性关联值表示两个问题实体之间的交集程度,语义关联值表示两个问题实体之间的语义相似程度,在一些情况下出现两个问题实体之间语义关联程度较大,但其属性关联程度较小的情况,语义关联值和属性关联值均不能正确表示两个问题实体之间的相关性,因此需要基于属性关联值校正语义关联值。校正方法为:通过属性关联值与语义关联值相乘的方式校正语义关联值。
[0078]
在进行上述校正处理后,可基于校正后的属性关联值、互斥关联值、语义关联值,确定两个问题实体之间的相关性度量。可通过如下公式确定所述两个问题实体之间的相关性度量;
[0079][0080]
其中,为问题实体i和问题实体j之间的相关性度量;m
ij
为问题实体i和问题实体j之间的感知度;r
ij
为问题实体i和问题实体j之间的属性关联值;f
ij
为问题实体i和问题实体j之间的互斥关联值;为问题实体i和问题实体j之间的语义关联值;k1为第一常数;k2为第二常数。
[0081]
语义关联值和属性关联值均表示两个问题实体之间的关联程度,因此在公式中与二者相关的k1m
ijrij
和k2φ
ijrij
需要进行加和。而互斥关联值表示两个问题实体之间的互斥程度,因此在公式中与其相关的f
ijmij
需要被减除。
[0082]
上述公式k1和k2均为先验而得的常数,设置其的目的是将两个问题实体之间的相关性度量控制在一定范围内,以便在预设坐标空间中确定各问题实体之间的位置关系。也就是说,第一常数和第二常数的具体数值可基于预设坐标空间涉及的坐标范围进行设定。
[0083]
103、根据问题实体两两之间的相关性度量,确定在预设坐标空间中各所述问题实体之间的位置关系。
[0084]
在确定各问题实体中问题实体两两之间的相关性度量之后,需要确定各问题实体之间在预设坐标空间中的位置关系。下面对根据问题实体两两之间的相关性度量,确定在预设坐标空间中各问题实体之间的位置关系的具体过程进行说明,该过程包括如下步骤一至步骤二:
[0085]
步骤一,确定所述多个问题实体中的一个问题实体在预设坐标空间中对应的网格点。
[0086]
预设坐标空间为自组织各问题实体之间位置关系的坐标空间,其具体类型和大小均可以基于业务需求选定,本实例不做具体限定。示例性的,预设坐标空间为二维坐标空间,x轴的坐标范围为0-100,同样的,y轴的坐标范围为0-100。
[0087]
为了便于确定各问题实体在预设坐标空间内的位置,则预设坐标空间被划分为多个网格点。需要说明的是,为了保证各问题实体之间位置关系准确,网格点是均匀划分的,也就是各网格点之间的具体是相同的,一个网格点对应预设坐标空间中的一个坐标点。
[0088]
在选定预设坐标空间之后,需要从各问题实体中选定一个问题实体作为首个确定网格点的问题实体。所选定的问题实体为各问题实体中的任意一个问题实体,其可以在各问题实体中随机选取,其在预设坐标空间对应的网格点可以为在预设坐标空间中任意一个网格点,但是为了便于预设坐标空间的使用,可将预设坐标空间中的中心位置的网格点设定为其在预设坐标空间中对应的网格点。
[0089]
步骤二,依次将所述多个问题实体中的其余问题作为当前问题实体执行:基于当前问题实体与已确定网格点的问题实体之间的相关性度量,确定所述当前问题实体在所述预设坐标空间对应的网格点。
[0090]
在确定首个问题实体在预设坐标空间中对应的网格点之后,需要将其余问题实体依次作为当前问题实体,确定其在预设坐标空间中对应的网格点。
[0091]
下面对基于当前问题实体与已确定网格点的问题实体之间的相关性度量,确定当前问题实体在所述预设坐标空间对应的网格点的具体过程进行说明,该过程包括:
[0092]
首先,针对每一个已确定网格点的问题实体均执行:确定已确定网格点的问题实体对应的圆,其中,圆以已确定网格点的问题实体的网格点为中心,以当前问题实体与已确定网格点的问题实体之间的相关性度量为半径。
[0093]
对于任意一个当前问题实体来说,其与预设坐标空间中已确定网格点的问题实体之间均存在相关性度量,因此可根据这些相关性度量来确定当前问题实体的网格点。
[0094]
当一个当前问题实体待确定网格点时,确定预设坐标空间中已确定网格点的问题实体,并基于当前问题实体与已确定网格点的问题实体之间的相关性度量,确定每一个已
确定网格点的问题实体对应的圆。对于任意一个已确定网格点的问题实体来说,其对应的圆以已确定网格点的问题实体的网格点为中心,以当前问题实体与已确定网格点的问题实体之间的相关性度量为半径。
[0095]
示例性,如图2,问题实体3为当前问题实体,当问题实体3待确定网格点时,确定预设坐标空间中已确定网格点的问题实体为“问题实体1和问题实体2”,基于当前问题实体“问题实体3”与已确定网格点的问题实体“问题实体1”之间的相关性度量确定已确定网格点的问题实体“问题实体1”对应的圆a,圆a的半径为圆心为“问题实体1”的网格点a1。基于当前问题实体“问题实体3”与已确定网格点的问题实体“问题实体2”之间的相关性度量确定已确定网格点的问题实体“问题实体2”对应的圆b,圆b的半径为圆心为“问题实体b”的网格点b1。
[0096]
其次,确定目标区域,其中,目标区域为各已确定网格点的问题实体对应的圆之间的相交区域,且所述目标区域涉及的圆的数量在所述预设坐标空间的所有相交区域中最多。
[0097]
在确定各已确定网格点的问题实体的圆之后,需要确定目标区域,目标区域为各已确定网格点的问题实体对应的圆之间的相交区域,且目标区域涉及的圆的数量在预设坐标空间的所有相交区域中最多。目标区域为当前问题实体与已确定网格点的问题实体相关性最高的区域,因此可基于该目标区域的网格点确定当前问题实体对应的网格点。
[0098]
示例性,如图2,基于当前问题实体“问题实体3”与已确定网格点的问题实体“问题实体1”之间的相关性度量确定已确定网格点的问题实体“问题实体1”对应的圆a。基于当前问题实体“问题实体3”与已确定网格点的问题实体“问题实体2”之间的相关性度量确定已确定网格点的问题实体“问题实体2”对应的圆b。两个圆的相交区域为f,且预设坐标空间中不存在其他相交区域,因此将f选取为目标区域。
[0099]
需要说明的是,若当前问题实体为第二个确定网格点的问题实体。由于预设坐标空间中仅存在第一个问题实体对应的圆,不存在其他的圆,因此可将第一个问题实体对应的圆上的任意一点确定为当前问题实体对应的网格点。
[0100]
最后,将所述目标区域中的一个网格点确定为所述当前问题实体对应的网格点。
[0101]
目标区域为当前问题实体与已确定网格点的问题实体相关性最高的区域,因此可基于该目标区域的网格点确定当前问题实体对应的网格点。比如,将目标区域中的任意一个网格点或位于中心的网格点确定为当前问题实体对应的网格点。
[0102]
示例性,如图2,将f区域中的网格点c1选取为问题实体3的网格点。
[0103]
步骤三,基于各问题实体对应的网格点,确定各问题实体之间的位置关系。
[0104]
在确定出各问题实体对应的网格点之后,可基于网格点确定出各问题实体在预设坐标空间中的坐标点。基于各问题实体的坐标点,确定问题实体两两之间的距离。所确定出的距离即为问题实体之间的位置关系。
[0105]
104、基于各问题实体之间的位置关系构建问题关系图谱。
[0106]
在得到各问题实体之间的位置关系,即可基于各问题实体之间的位置关系构建问题关系图谱,该构建过程为采用问题实体之间的距离表示各问题实体之间的相关度。
[0107]
示例性的,问题实体1、问题实体2和问题实体3。其中,问题实体1和问题实体2之间距离为2,问题实体1和问题实体3之间距离为5,问题实体2和问题实体3之间距离为6,则构建的问题关系图谱可以表示为:
[0108]
[问题实体1,问题实体2,2],[问题实体1,问题实体3,5]
[0109]
[问题实体2,问题实体3,6]
[0110]
在构建出问题关系图谱之后,可基于该问题关系图谱构建问答系统。在构建问答系统时,确定问题关系图谱中每一个问题实体对应的至少一个目标实体,然后建立至少一个目标实体与其对应的问题实体之间的关联关系。所述至少一个目标实体的类型基于问答系统所对应的知识领域确定,示例性的,所述至少一个目标实体包括如下中的至少一种:资源、产品、部门、人物。另外,需要说明的是,与问题实体建立关联的至少一个目标实体间也可以存在关联关系。
[0111]
问题关系图谱中量化了各问题实体之间的相关程度,当用户向问答系统发起用户问题时,从问答系统的各问题实体中选取与用户问题相关最高的第一问题实体,并基于问题关系谱图中各问题实体之间的位置关系,选取与第一问题实体相关的第二问题实体。最后基于第一问题实体相关的目标实体以及第二问题相关的目标实体,生成针对目标问题的答案。可见,这种依赖问题关系图谱中的方式,在进行问答处理时,无需依赖大量的问答模板,仅需依据问题实体之间的关联关系,便可以推理出满足用户问题的答案。
[0112]
本发明实施例提供的针对问答系统的问题关系图谱构建方法,在存在构建问题关系图谱的需求时,首先获取多个问题实体以及各问题实体各自具有的属性。然后根据各问题实体的属性,确定问题实体两两之间的相关性度量,并根据问题实体两两之间的相关性度量,确定在预设坐标空间中各所述问题实体之间的位置关系。最后基于各问题实体之间的位置关系构建问题关系图谱。可见,本发明实施例提供的方案中问题关系图谱中的问题实体之间的位置关系基于问题实体之间的相关性度量建立,因此问题关系图谱可以反映出各问题实体之间的相关性。因此在基于问题关系图谱进行问答处理时,基于问题实体之间的位置关系便可推理出满足用户问题的答案,整个问答过程中不用强依赖于问答模板、问答数据量、语义关联。因此本发明实施例能够降低问答系统对问答模板、问答数据量、语义关联的依赖。
[0113]
如图3所示,本发明实施例提供了一种针对问答系统的问答方法,该方法应用于问答系统,其中,问答系统中的问题实体以问题关系图谱形式存在,各问题实体各自具有关联的至少一个目标实体,各问题实体在问题关系图谱之间的位置关系基于问题实体两两之间的相关性度量建立,方法包括:
[0114]
301、从问答系统的各问题实体中选取与目标问题相关的第一问题实体,其中,第一问题实体与目标问题的相似度最高。
[0115]
目标问题为用户向问答系统发起的问题,问答系统需要确定目标问题的答案并进行回复。在确定目标问题之后,即可将问题关系图谱中与目标问题相似度最高的问题实体确定为与目标问题相关的第一问题实体。
[0116]
第一问题实体的确定过程可以包括如下两种:第一种,确定与目标问题对应的问答模板,将问答模块所涉及到的问题实体确定为第一问题实体。第二种,确定各问题实体与目标问题之间的相似度,将相似度最高的问题实体确定为与目标问题相关的第一问题实
体。
[0117]
302、基于问题关系谱图中各问题实体之间的位置关系,选取与第一问题实体相关的第二问题实体,其中,第二问题实体与第一问题实体之间的距离小于距离阈值。
[0118]
问答系统中的问题实体以问题关系图谱形式存在,各问题实体在问题关系图谱之间的位置关系基于问题实体两两之间的相关性度量建立。问题关系图谱中各问题实体之间的位置关系决定了各问题实体之间的相关性,因此,在任一问题实体被确定为目标问题的相关时,基于该问题实体在问题关系谱图中的位置,便可推理出其他与目标问题相关的问题实体。
[0119]
在确定第一问题实体之间,确定第一问题实体与其他问题实体之间的距离,将距离小于距离阈值的问题实体选取为第二问题实体。距离小于距离阈值说明其与第一问题实体相关度较高,可以与第一问题实体一起作为确定目标问题的答案的问题实体使用。
[0120]
需要说明的是,由于本实施例中在确定出与目标问题相关的第一问题实体之后,基于问题关系图谱中各问题实体之间的位置关系,便可推理出其他与目标问题的相关的问题实体。因此,在进行问答处理时,无需依赖大量的问答模板,仅需依据问题实体之间的关联关系,便可以推理出满足用户问题的答案,从而降低问答系统对问答模板的依赖。
[0121]
303、基于第一问题实体相关的至少一个目标实体以及第二问题相关的至少一个目标实体,生成针对目标问题的答案。
[0122]
问题关系图谱中每一个问题实体均关联至少一个目标实体,所述至少一个目标实体的类型基于问答系统所对应的知识领域确定,示例性的,所述至少一个目标实体包括如下中的至少一种:资源、产品、部门、人物。另外,需要说明的是,与问题实体建立关联的至少一个目标实体间也可以存在关联关系。
[0123]
在确定出第一问题实体和第二问题实体之后,便可基于第一问题实体相关的至少一个目标实体以及第二问题相关的至少一个目标实体,生成针对目标问题的答案。由于基于关联的多个问题实体来得到目标问题答案,因此能够提高搜索问题答案的准确度。
[0124]
本发明实施例提供的针对问答系统的问答方法,问题关系图谱中的问题实体之间的位置关系基于问题实体之间的相关性度量建立,因此问题关系图谱可以反映出各问题实体之间的相关性。因此在基于问题关系图谱进行问答处理时,基于问题实体之间的位置关系便可推理出满足用户问题的答案,整个问答过程中不用强依赖于问答模板、问答数据量、语义关联。因此本发明实施例能够降低问答系统对问答模板、问答数据量、语义关联的依赖。
[0125]
进一步的,依据上述方法实施例,本发明的另一个实施例还提供了一种针对问答系统的问题关系图谱构建装置,如图4所示,所述装置包括:
[0126]
获取单元41,用于获取多个问题实体以及各所述问题实体各自具有的属性;
[0127]
第一确定单元42,用于根据各所述问题实体的属性,确定问题实体两两之间的相关性度量;
[0128]
第二确定单元43,用于根据问题实体两两之间的相关性度量,确定在预设坐标空间中各所述问题实体之间的位置关系;
[0129]
构建单元44,用于基于各所述问题实体之间的位置关系构建问题关系图谱。
[0130]
本发明实施例提供的针对问答系统的问题关系图谱构建装置,在存在构建问题关
系图谱的需求时,首先获取多个问题实体以及各问题实体各自具有的属性。然后根据各问题实体的属性,确定问题实体两两之间的相关性度量,并根据问题实体两两之间的相关性度量,确定在预设坐标空间中各所述问题实体之间的位置关系。最后基于各问题实体之间的位置关系构建问题关系图谱。可见,本发明实施例提供的方案中问题关系图谱中的问题实体之间的位置关系基于问题实体之间的相关性度量建立,因此问题关系图谱可以反映出各问题实体之间的相关性。因此在基于问题关系图谱进行问答处理时,基于问题实体之间的位置关系便可推理出满足用户问题的答案,整个问答过程中不用强依赖于问答模板、问答数据量、语义关联。因此本发明实施例能够降低问答系统对问答模板、问答数据量、语义关联的依赖。
[0131]
可选的,如图5所示,所述第二确定单元43包括:
[0132]
设定模块431,用于确定所述多个问题实体中的一个问题实体在所述预设坐标空间中对应的网格点,其中,所述预设坐标空间被划分为多个网格点;
[0133]
第一确定模块432,用于依次将所述多个问题实体中的其余问题实体作为当前问题实体执行:基于当前问题实体与所述预设坐标空间中已确定网格点的问题实体之间的相关性度量,确定所述当前问题实体在所述预设坐标空间对应的网格点;
[0134]
第二确定模块433,用于基于各所述问题实体对应的网格点,确定各所述问题实体之间的位置关系。
[0135]
可选的,如图5所示,第一确定模块432包括:
[0136]
第一确定子模块4321,用于针对每一个已确定网格点的问题实体均执行:确定所述已确定网格点的问题实体对应的圆,其中,所述圆以所述已确定网格点的问题实体的网格点为中心,以所述当前问题实体与所述已确定网格点的问题实体之间的相关性度量为半径;
[0137]
第二确定子模块4322,用于确定目标区域,其中,所述目标区域为各所述已确定网格点的问题实体对应的圆之间的相交区域,且所述目标区域涉及的圆的数量在所述预设坐标空间的所有相交区域中最多;
[0138]
第三确定子模块4323,用于将所述目标区域中的一个网格点确定为所述当前问题实体对应的网格点。
[0139]
可选的,如图5所示,第一确定单元42,具体用于针对任意两个问题实体均执行:基于所述两个问题实体各自具有的属性,确定所述两个问题实体之间的至少一种关联值,基于所述至少一种关联值确定所述两个问题实体之间的相关性度量,其中,所述至少一种关联值为如下中的至少一种:属性关联值、互斥关联值、语义关联值。
[0140]
可选的,如图5所示,第一确定单元42包括:
[0141]
第三确定模块421,用于确定所述两个问题实体具有的所有属性的总数量以及具有的相同属性的总数量;将所述相同属性的总数量与所述所有属性的总数量的比值,确定为所述两个问题实体之间的属性关联值。
[0142]
可选的,如图5所示,第一确定单元42包括:
[0143]
第四确定模块422,用于获取所述两个问题实体的属性之间的互斥程度;基于所获取的互斥程度,确定所述两个问题实体之间的互斥关联值。
[0144]
可选的,如图5所示,第一确定单元42包括:
[0145]
第五确定模块423,用于通过语义训练模型获取所述两个问题实体各自对应的语义向量;基于所获取的语义向量确定所述两个问题实体之间的语义关联值。
[0146]
可选的,如图5所示,第五确定模块423包括:
[0147]
第四确定子模块4231,用于基于所述两个问题实体的属性之间的感知强度,确定所述两个问题实体之间的感知度;
[0148]
第五确定子模块4232,用于基于所述属性关联值校正所述语义关联值以及基于所述感知度分别校正所述属性关联值和所述互斥关联值;
[0149]
第六确定子模块4233,用于基于校正后的属性关联值、互斥关联值、语义关联值,确定所述两个问题实体之间的相关性度量。
[0150]
可选的,如图5所示,第六确定子模块4233,具体用于通过如下公式确定所述两个问题实体之间的相关性度量;
[0151][0152]
其中,为问题实体i和问题实体j之间的相关性度量;m
ij
为问题实体i和问题实体j之间的感知度;r
ij
为问题实体i和问题实体j之间的属性关联值;f
ij
为问题实体i和问题实体j之间的互斥关联值;为问题实体i和问题实体j之间的语义关联值;k1为第一常数;k2为第二常数。
[0153]
可选的,如图5所示,第四确定子模块4231,具体用于通过如下公式确定所述两个问题实体之间的感知度;
[0154]mij
=g(∑i(xn))
[0155]
其中,m
ij
为问题实体i和问题实体j之间的感知度;g为有界单递增函数;i(xn)为问题实体i和问题实体j具有的第n个目标属性之间的感知强度,其中,所述目标属性为问题实体i和问题实体j具有的相同属性。
[0156]
本发明实施例提供的针对问答系统的问题关系图谱构建装置中,各个功能模块运行过程中所采用的方法详解可以参见图1-图2方法实施例的对应方法详解,在此不再赘述。
[0157]
进一步的,依据上述方法实施例,本发明的另一个实施例还提供了一种针对问答系统的问答装置,该装置应用于问答系统,其中,所述问答系统中的问题实体以问题关系图谱形式存在,各所述问题实体各自具有关联的至少一个目标实体,各所述问题实体在所述问题关系图谱之间的位置关系基于问题实体两两之间的相关性度量建立,如图6所示,所述装置包括:
[0158]
第一选取单元51,用于从所述问答系统的各问题实体中选取与目标问题相关的第一问题实体,其中,所述第一问题实体与所述目标问题的相似度最高;
[0159]
第二选取单元52,用于基于所述问题关系谱图中各所述问题实体之间的位置关系,选取与所述第一问题实体相关的第二问题实体,其中,所述第二问题实体与所述第一问题实体之间的距离小于距离阈值;
[0160]
生成单元53,用于基于所述第一问题实体相关的至少一个目标实体以及所述第二问题相关的至少一个目标实体,生成针对所述目标问题的答案。
[0161]
本发明实施例提供的针对问答系统的问答装置,问题关系图谱中的问题实体之间
的位置关系基于问题实体之间的相关性度量建立,因此问题关系图谱可以反映出各问题实体之间的相关性。因此在基于问题关系图谱进行问答处理时,基于问题实体之间的位置关系便可推理出满足用户问题的答案,整个问答过程中不用强依赖于问答模板、问答数据量、语义关联。因此本发明实施例能够降低问答系统对问答模板、问答数据量、语义关联的依赖。
[0162]
本发明实施例提供的针对问答系统的问答装置中,各个功能模块运行过程中所采用的方法详解可以参见图3方法实施例的对应方法详解,在此不再赘述。
[0163]
进一步的,依据上述实施例,本发明的另一个实施例还提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行图1所述的针对问答系统的问题关系图谱构建方法,和/或,执行图3所述的针对问答系统的问答方法。
[0164]
进一步的,依据上述实施例,本发明的另一个实施例还提供了一种电子设备,所述电子设备包括:
[0165]
存储器,用于存储程序;
[0166]
处理器,耦合至所述存储器,用于运行所述程序以执行图1所述的针对问答系统的问题关系图谱构建方法,和/或,执行图3所述的针对问答系统的问答方法。
[0167]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0168]
可以理解的是,上述方法及装置中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
[0169]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0170]
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0171]
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0172]
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0173]
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的深度神经网络模型的运行方法、装置及框架中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算
机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0174]
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之间的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献