一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种目标答案确定方法、装置、设备及介质与流程

2021-12-15 02:14:00 来源:中国专利 TAG:


1.本技术涉及问答系统技术领域,尤其涉及一种目标答案确定方法、装置、设备及介质。


背景技术:

2.随着互联网技术的不断发展,问答系统(question

and

answer,qa系统)在诸如智能客服、机器人领域等方面都取得了很大的进展。
3.现有问答系统通常是基于两种方式进行的。一种方式是:先通过语义模型解析用户的问句(获取问句的语义),并将解析出的问句与问答知识库中的样本问句进行匹配,基于问答知识库中保存的样本问句与样本答案的对应关系(为方便描述,称为问答对),将问答知识库中与该问句匹配度最高的样本问句对应的样本答案作为该问句的目标答案。这种方式的优点是:通过语义模型可以获取用户的问句中的隐藏信息,确定的目标答案的准确率较高。然而这种方式的缺点是:问答知识库中的问答对需要人工配置,需要消耗大量的人力,且问答对必须严格遵循“一问对一答”的形式,在海量知识场景下,问答知识库中的数据量呈指数倍增长,确定目标答案的效率较低。
4.另一种方式是:确定用户输入的问句中包含的实体,将该实体与已有知识图谱做匹配从而确定目标答案。这种方式的优点是:相比问答知识库,知识图谱的数据量相对较少。然而这种方式的缺点是:对用户的问句的解析度不够全面,无法获取用户的问句中的隐藏信息,确定的目标答案的准确率可能不太高。
5.因此亟需一种可以既快捷又准确的确定目标答案的技术方案。


技术实现要素:

6.本技术提供了一种目标答案确定方法、装置、设备及介质,用以既快捷又准确的确定目标答案。
7.第一方面,本技术提供了一种目标答案确定方法,所述方法包括:
8.确定接收到的用户输入的问句中包含的实体,若所述实体存在于保存的知识图谱中,则根据所述知识图谱中,包括所述实体对应的节点在内的设定数量跳内的每个原节点及每个原边,确定第一子图谱;
9.针对所述第一子图谱中包含的每个原边,获取该原边及对应的原头节点的实体与原尾节点的实体所对应的关系语句;将所述问句以及每个所述关系语句,分别输入预先训练完成的语义模型,根据所述语义模型的输出结果,分别确定所述问句的第一语义特征向量以及每个所述关系语句的第二语义特征向量;
10.针对每个原边所属的关系语句,确定该原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的第一关联度;
11.基于所述第一子图谱中,第一关联度高于预设的关联度阈值的关系语句的原尾节点的实体,确定所述问句的目标答案。
12.第二方面,本技术提供了一种目标答案确定装置,所述装置包括:
13.接收模块,用于接收用户输入的问句;
14.子图谱确定模块,用于确定接收到的用户输入的所述问句中包含的实体,若所述实体存在于保存的知识图谱中,则根据所述知识图谱中,包括所述实体对应的节点在内的设定数量跳内的每个原节点及每个原边,确定第一子图谱;
15.语义确定模块,用于针对所述第一子图谱中包含的每个原边,获取该原边及对应的原头节点的实体与原尾节点的实体所对应的关系语句;将所述问句以及每个所述关系语句,分别输入预先训练完成的语义模型,根据所述语义模型的输出结果,分别确定所述问句的第一语义特征向量以及每个所述关系语句的第二语义特征向量;
16.语句关联度确定模块,用于针对每个原边所属的关系语句,确定该原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的第一关联度;
17.目标答案确定模块,用于基于所述第一子图谱中,第一关联度高于预设的关联度阈值的关系语句的原尾节点的实体,确定所述问句的目标答案。
18.第三方面,本技术提供了一种电子设备,所述电子设备至少包括处理器和存储器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述一种目标答案确定方法的步骤。
19.第四方面,本技术提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一所述一种目标答案确定方法的步骤。
20.由于本技术不仅可以基于语义模型,确定问句的第一语义特征向量,获取用户的问句中的隐藏信息;还可以先根据知识图谱中,包括问句中的实体对应的节点在内的设定数量跳内的每个原节点及每个原边,确定第一子图谱,然后针对第一子图谱中包含的每个原边,获取该原边及对应的原头节点的实体与原尾节点的实体所对应的关系语句,确定每个关系语句的第二语义特征向量与问句的第一语义特征向量之间的第一关联度,基于第一关联度高于预设的关联度阈值的关系句子的原尾节点的实体,确定问句的目标答案,从而可以既快捷又准确的确定目标答案。
附图说明
21.为了更清楚地说明本技术实施例或相关技术中的实施方式,下面将对实施例或相关技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
22.图1示出了一些实施例提供的第一种目标答案确定过程示意图;
23.图2示出了一些实施例提供的第二种目标答案确定过程示意图;
24.图3示出了一些实施例提供的节点示意图;
25.图4示出了一些实施例提供的第一子图谱示意图;
26.图5a示出了一些实施例提供的第一关联度区间的拆分子图谱示意图;
27.图5b示出了一些实施例提供的第二关联度区间的拆分子图谱示意图;
28.图5c示出了一些实施例提供的第三关联度区间的拆分子图谱示意图;
29.图6a示出了一些实施例提供的第一关联度区间的新拆分子图谱示意图;
30.图6b示出了一些实施例提供的第二关联度区间的新拆分子图谱示意图;
31.图6c示出了一些实施例提供的第三关联度区间的新拆分子图谱示意图;
32.图7示出了一些实施例提供的第三种目标答案确定过程示意图;
33.图8示出了一些实施例提供的第四种目标答案确定过程示意图;
34.图9示出了一些实施例提供的一种目标答案确定装置结构示意图;
35.图10示出了一些实施例提供的一种电子设备结构示意图。
具体实施方式
36.为了既快捷又准确的确定目标答案,本技术提供了一种确定目标答案的方法、装置、设备及介质。
37.为使本技术的目的和实施方式更加清楚,下面将结合本技术示例性实施例中的附图,对本技术示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本技术一部分实施例,而不是全部的实施例。
38.本技术中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
39.术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
40.最后应说明的是:以上各实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述各实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。
41.实施例1:
42.图1示出了一些实施例提供的第一种目标答案确定过程示意图,如图1所示,该过程包括以下步骤:
43.s101:确定接收到的用户输入的问句中包含的实体,若所述实体存在于保存的知识图谱中,则根据所述知识图谱中,包括所述实体对应的节点在内的设定数量跳内的每个原节点及每个原边,确定第一子图谱。
44.本技术实施例提供的目标答案确定方法应用于电子设备,该电子设备可以是pc、移动终端等设备,也可以是服务器。
45.在一种可能的实施方式中,用户可以向电子设备输入问句,电子设备可以接收用户输入的问句。其中,电子设备可以基于现有技术接收用户输入的问句,在此不再赘述。接收到用户输入的问句后,为了确定接收到的问句的答案(为方便描述,称为目标答案),电子设备可以先确定接收到的问句中包含的实体。在一种可能的实施方式中,问句中包含的实体可以为现实世界中的任一事物,示例性的,可以为人名、地名、公司、电话、动物、时间、医疗保险产品等任一事物。
46.确定了用户输入的问句中包含的实体后,可以判断问句中包含的实体是否存在于电子设备自身保存的知识图谱中。在一种可能的实施方式中,如果用户输入的问句中包含的每个实体均不存在于保存的知识图谱中时,则可以认为当前尚不能确定用户输入的问句
的目标答案,为了提示用户,可以输出预设的提示信息。示例性的,可以输出问句暂无答案的提示信息。
47.在一种可能的实施方式中,如果用户输入的问句中包含的任一实体存在于保存的知识图谱中,则可以认为可以基于该知识图谱确定该问句的目标答案。在一种可能的实施方式中,为了快捷的确定目标答案,可以基于知识图谱中的一部分知识图谱(为方便描述,称为第一子图谱),确定目标答案。确定第一子图谱时,电子设备可以先根据知识图谱中,包括问句中包含的实体对应的节点在内的设定数量跳内的每个节点(为方便描述,称为原节点)和每个边(为方便描述,称为原边),确定第一子图谱。示例性的,可以先以知识图谱中问句中包含的实体对应的节点(为方便描述,称为问句节点)为基准,按照知识图谱中,包括问句节点在内的设定数量跳内的每个原节点和每个原边,确定第一子图谱。其中,设定数量可以根据需求灵活设置,本技术对此不做具体限定。示例性的,设定数量可以为3、5等。如果设定数量为5,则可以按照知识图谱中,包括问句节点在内的五跳内的每个原节点和每个原边,确定第一子图谱。
48.s102:针对所述第一子图谱中包含的每个原边,获取该原边及对应的原头节点的实体与原尾节点的实体所对应的关系语句;将所述问句以及每个所述关系语句,分别输入预先训练完成的语义模型,根据所述语义模型的输出结果,分别确定所述问句的第一语义特征向量以及每个所述关系语句的第二语义特征向量。
49.确定了第一子图谱后,针对第一子图谱中包含的每个原边,电子设备可以获取由该原边、该原边对应的头节点(为方便描述,称为原头节点)的实体、该原边对应的尾节点(为方便描述,称为原尾节点)的实体所对应的语句(为方便描述,称为关系语句)。示例性的,如果原头节点的实体为“冠心病”、原尾节点的实体为“大蒜”、原边代表的关系为“不能吃”,则该原边、原头节点的实体、原尾节点的实体(三元组)所对应的关系语句则为“冠心病不能吃大蒜”。该原边“不能吃”所属的关系语句即为“冠心病不能吃大蒜”。
50.在一种可能的实施方式中,为了准确的确定目标答案,可以将用户输入的问句输入预先训练完成的语义模型,根据语义模型的输出结果,确定问句的语义特征向量(为方便描述,称为第一语义特征向量)。另外,还可以将每个原边所属的关系语句分别输入预先训练完成的语义模型,根据语义模型的输出结果,分别确定每个关系语句的语义特征向量(为方便描述,称为第二语义特征向量)。
51.在一种可能的实施方式中,训练所述语义模型的过程包括:
52.获取样本集中任一样本语句,其中,所述样本语句为样本问句或样本关系语句;所述样本语句对应有样本语义特征向量标签,其中所述样本语义特征向量标签用于标识该样本语句的样本语义特征向量;
53.通过原始语义模型,确定所述样本语句的识别语义特征向量标签;
54.根据所述样本语义特征向量标签和所述识别语义特征向量标签,对原始语义模型进行训练,得到训练完成的语义模型。
55.在本技术实施例中,可以通过预先训练完成的语义模型,确定问句或关系语句的语义特征向量。在训练语义模型时,样本集中包含多个样本语句,其中,样本语句可以为样本问句或样本关系语句。样本集中的每个样本语句均对应有样本语义特征向量标签,该样本语义特征向量标签用于标识样本语句的样本语义特征向量。在一种可能的实施方式中,
可以基于人工对样本语句的样本语义特征向量标签进行标注。
56.在对原始语义模型进行训练时,可以获取样本集中任一样本语句,该样本语句对应有样本语义特征向量标签。将该获取到的任一样本语句输入原始语义模型,通过原始语义模型,获取该样本语句对应的识别语义特征向量标签。
57.具体实施中,确定了输入的样本语句的识别语义特征向量标签后,因为预先保存了该样本语句的样本语义特征向量标签,因此可以根据样本语义特征向量标签与识别语义特征向量标签是否一致,确定该语义模型的识别结果是否准确。具体实施中,若不一致,说明该语义模型的识别结果不准确,则需要对该语义模型的参数进行调整,从而对语义模型进行训练。
58.具体实施中,对语义模型中的参数进行调整时,可以采用梯度下降算法,对语义模型的参数的梯度进行反向传播,从而对语义模型进行训练。
59.在一种可能的实施方式中,可以对样本集中的每个样本语句都进行上述操作,当满足预设的收敛条件时,确定该语义模型训练完成。
60.其中,满足预设的收敛条件可以为样本集中的样本语句通过该原始语义模型,被正确识别的样本语句的个数大于设定数量,或对语义模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以灵活进行设置,在此不做具体限定。
61.在一种可能的实施方式中,在进行原始语义模型训练时,可以把样本集中的样本语句分为训练样本语句和测试样本语句,先基于训练样本语句对原始语义模型进行训练,再基于测试样本语句对上述已训练的语义模型的可靠程度进行验证。
62.s103:针对每个原边所属的关系语句,确定该原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的第一关联度。
63.确定了问句的第一语义特征向量以及每个关系语句的第二语义特征向量后,可以针对每个关系语句,确定该关系语句的第二语义特征向量与第一语义特征向量之间的关联度(为方便描述,称为第一关联度)。示例性的,可以基于余弦相似度判断公式,计算(确定)关系语句的第二语义特征向量与第一语义特征向量之间的第一关联度。也可以将第二语义特征向量和第一语义特征向量输入预先训练完成的全连接神经网络模型,根据全连接神经网络模型的输出结果,确定第二语义特征向量与第一语义特征向量之间的第一关联度。
64.在一种可能的实施方式中,训练所述全连接神经网络模型的过程包括:
65.获取样本集中任两个样本语义特征向量,其中,所述任两个样本语义特征向量对应有第一样本关联度标签,所述第一样本关联度标签用于标识该任两个样本语义特征向量之间的样本关联度;
66.通过原始全连接神经网络模型,确定所述任两个样本语义特征向量之间的第一识别关联度标签;
67.根据所述第一样本关联度标签和所述第一识别关联度标签,对原始全连接神经网络模型进行训练,得到训练完成的全连接神经网络模型。
68.在本技术实施例中,可以通过预先训练完成的全连接神经网络模型,确定两个语义特征向量之间的关联度。训练全连接神经网络模型时,样本集中可以包含多个样本语义特征向量,样本语义特征向量可以为问句的语义特征向量,也可以为关系语句的语义特征向量。样本集中的任两个样本语义特征向量对应有一个第一样本关联度标签,该第一样本
关联度标签用于标识两个样本语义特征向量之间的样本关联度。在一种可能的实施方式中,可以基于人工对第一样本关联度标签进行标注。
69.在对原始全连接神经网络模型进行训练时,可以获取样本集中任两个样本语义特征向量,该任两个样本语义特征向量对应有第一样本关联度标签。将该获取到的任两个样本语义特征向量输入原始全连接神经网络模型,通过原始全连接神经网络模型,获取该任两个样本语义特征向量对应的第一识别关联度标签。
70.具体实施中,确定了输入的任两个样本语义特征向量的第一识别关联度标签后,因为预先保存了该任两个样本语义特征向量的第一样本关联度标签,因此可以根据第一样本关联度标签与第一识别关联度标签是否一致,确定该全连接神经网络模型的识别结果是否准确。具体实施中,若不一致,说明该全连接神经网络模型的识别结果不准确,则需要对该全连接神经网络模型的参数进行调整,从而对全连接神经网络模型进行训练。
71.具体实施中,对全连接神经网络模型中的参数进行调整时,可以采用梯度下降算法,对全连接神经网络模型的参数的梯度进行反向传播,从而对全连接神经网络模型进行训练。
72.在一种可能的实施方式中,可以对样本集中的样本语义特征向量都进行上述操作,当满足预设的收敛条件时,确定该全连接神经网络模型训练完成。
73.其中,满足预设的收敛条件可以为样本集中的样本语义特征向量通过该原始全连接神经网络模型,被正确识别的样本语义特征向量的个数大于设定数量,或对全连接神经网络模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以灵活进行设置,在此不做具体限定。
74.在一种可能的实施方式中,在进行原始全连接神经网络模型进行训练时,可以把样本集中的样本语义特征向量分为训练样本语义特征向量和测试样本语义特征向量,先基于训练样本语义特征向量对原始全连接神经网络模型进行训练,再基于测试样本语义特征向量对上述已训练的全连接神经网络模型的可靠程度进行验证。
75.s104:基于所述第一子图谱中,第一关联度高于预设的关联度阈值的关系语句的原尾节点的实体,确定所述问句的目标答案。
76.在一种可能的实施方式中,考虑到通常情况下,第一关联度越高,基于该第一关联度的关系语句的尾节点的实体确定问句的目标答案时,确定的目标答案的准确性越高。为了准确的确定目标答案,针对第一子图谱中包含的每个原边所属的关系语句,可以基于第一关联度高于预设的关联度阈值的关系语句的原尾节点的实体,确定问句的目标答案。其中,预设的关联度阈值可以根据需求灵活设置,本技术对此不做具体限定。
77.在一种可能的实施方式中,在基于原尾节点的实体,确定目标答案时,可以基于预设的答案模板,确定问句的目标答案。示例性的,如果问句为“冠心病和痛风不能吃什么”,第一关联度高于预设的关联度阈值的关系语句的原尾节点的实体分别为“大蒜”、“大葱”、“花生”和“红酒”,则基于预设的答案模板,确定的问句的目标答案可以为“您好,如果您患有冠心病和痛风,不推荐食用大蒜、大葱、花生等,不推荐喝红酒等。”。
78.由于本技术不仅可以基于语义模型,确定问句的第一语义特征向量,获取用户的问句中的隐藏信息;还可以先根据知识图谱中,包括问句中的实体对应的节点在内的设定数量跳内的每个原节点及每个原边,确定第一子图谱,然后针对第一子图谱中包含的每个
原边,获取该原边及对应的原头节点的实体与原尾节点的实体所对应的关系语句,确定每个关系语句的第二语义特征向量与问句的第一语义特征向量之间的第一关联度,基于第一关联度高于预设的关联度阈值的关系句子的原尾节点的实体,确定问句的目标答案,从而可以既快捷又准确的确定目标答案。
79.实施例2:
80.为了提高确定的目标答案的准确性,在上述实施例的基础上,在本技术实施例中,所述针对每个原边所属的关系语句,确定该原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的第一关联度之后,所述基于所述第一子图谱中,第一关联度高于预设的关联度阈值的关系语句的原尾节点的实体,确定所述问句的目标答案之前,所述方法还包括:
81.将每个原边对应有原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的所述第一关联度的子图谱确定为第二子图谱,将所述第二子图谱输入预先训练完成的图神经网络模型;
82.根据所述图神经网络模型的输出结果,确定每个原边对应的第二关联度;根据所述第二关联度,对所述第一关联度进行更新,基于更新后的第一关联度进行后续步骤。
83.在一种可能的实施方式中,确定了第一子图谱中包含的每个原边所属的关系语句的第二语义特征向量与问句的第一语义特征向量之间的第一关联度之后,可以认为确定了每个原边对应的第一关联度。考虑到确定的每个原边对应的第一关联度是基于每个关系语句和问句进行的,并未从知识图谱整体全局出发分析每个原边对应的头节点的实体和尾节点的实体等与问句之间的关联度,在一种可能的实施方式中,为了准确的确定第一子图谱中包含的每个原边对应的关联度,可以基于图神经网络模型,对每个原边对应的第一关联度进行修正(确定)。
84.在一种可能的实施方式中,为方便描述,可以将每个原边对应有第一关联度的子图谱,称为(确定为)第二子图谱。基于图神经网络模型,对每个原边对应的第一关联度进行修正时,可以将第二子图谱输入预先训练完成的图神经网络模型,使图神经网络模型对每个原边对应的第一关联度进行修正。具体的,可以根据图神经网络模型的输出结果,确定每个原边对应的第二关联度,然后根据第二关联度,对第一关联度进行更新,从而完成对每个原边对应的第一关联度的修正。
85.在一种可能的实施方式中,根据第二关联度,对第一关联度进行更新后,可以确定更新后的第一关联度高于预设的关联度阈值的边(边所属的关系语句)对应的原尾节点的实体,确定问句的目标答案。
86.在一种可能的实施方式中,图神经网络模型可以是引入注意力机制的图神经网络模型。示例性的,图神经网络模型可以是gat网络。
87.在一种可能的实施方式中,训练所述图神经网络模型的过程包括:
88.获取样本集中任一样本知识图谱,其中,所述样本知识图谱的每个边对应有初始关联度以及第二样本关联度标签,所述第二样本关联度标签用于标识对应边的关联度;
89.通过原始图神经网络模型,确定所述样本知识图谱的每个边对应的第二识别关联度标签;
90.根据所述第二样本关联度标签和所述第二识别关联度标签,对原始图神经网络模
型进行训练,得到训练完成的图神经网络模型。
91.在本技术实施例中,可以通过预先训练完成的图神经网络模型,对每个原边对应的第一关联度的修正。训练图神经网络模型时,样本集中可以包含多个样本知识图谱,样本知识图谱的每个原边对应有初始关联度以及第二样本关联度标签,其中,可以认为第二样本关联度标签即为对初始关联度进行修正的关联度。在一种可能的实施方式中,可以基于人工对第二样本关联度标签进行标注。
92.在对原始图神经网络模型进行训练时,可以获取样本集中任一样本知识图谱,将该获取到的样本知识图谱输入原始图神经网络模型,通过原始图神经网络模型,获取该样本知识图谱的每个边对应的第二识别关联度标签。
93.具体实施中,确定了输入的样本知识图谱的每个边对应的第二识别关联度标签后,因为预先保存了该样本知识图谱的每个边对应的第二样本关联度标签,因此可以根据第二样本关联度标签与第二识别关联度标签是否一致,确定该图神经网络模型的识别结果是否准确。具体实施中,若不一致,说明该图神经网络模型的识别结果不准确,则需要对该图神经网络模型的参数进行调整,从而对图神经网络模型进行训练。
94.具体实施中,对图神经网络模型中的参数进行调整时,可以采用梯度下降算法,对图神经网络模型的参数的梯度进行反向传播,从而对图神经网络模型进行训练。
95.在一种可能的实施方式中,可以对样本集中的每个样本知识图谱都进行上述操作,当满足预设的收敛条件时,确定该图神经网络模型训练完成。
96.其中,满足预设的收敛条件可以为样本集中的样本知识图谱通过该原始图神经网络模型,被正确识别的样本知识图谱的个数大于设定数量,或对图神经网络模型进行训练的迭代次数达到设置的最大迭代次数等。具体实施中可以灵活进行设置,在此不做具体限定。
97.在一种可能的实施方式中,在进行原始图神经网络模型进行训练时,可以把样本集中的样本知识图谱分为训练样本知识图谱和测试样本知识图谱,先基于训练样本知识图谱对原始图神经网络模型进行训练,再基于测试样本知识图谱对上述已训练的图神经网络模型的可靠程度进行验证。
98.由于本技术可以基于图神经网络模型,确定每个原边对应的第二关联度,根据第二关联度,对第一关联度进行更新(修正),从而可以进一步提高确定的目标答案的准确性。
99.实施例3:
100.为了进一步提高确定的目标答案的准确性,在上述各实施例的基础上,在本技术实施例中,所述针对每个原边所属的关系语句,确定该原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的第一关联度之后,所述将所述第二子图谱输入预先训练完成的图神经网络模型之前,所述方法还包括:
101.基于每个原边所属的关系语句的第二语义特征向量,分别确定每个原边对应的原头节点的实体的词语义特征向量以及原尾节点的实体的词语义特征向量,并分别确定每个词语义特征向量与所述第一语义特征向量之间的第三关联度;
102.针对第一子图谱中所述问句中包含的实体的原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度、预设关联度中的至少一种,确定该原节点的第四关联度;针对第一子图谱中除所述问句中包含的实体
的原节点之外的每个原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度中的至少一种,确定该原节点的第四关联度;
103.针对每个原节点,根据该原节点中的实体的词语义特征向量,对该原节点中的实体进行更新;将所述问句的第一语义特征向量作为新节点,将所述新节点与该原节点通过新边进行连接,形成第三子图谱;其中,针对每个新边,该新边的关联度为该新边对应的原节点的第四关联度;根据所述第三子图谱对所述第二子图谱进行更新,基于更新后的第二子图谱进行后续步骤。
104.在一种可能的实施方式中,考虑到输入到图神经网络模型中的子图谱的节点中如果没有包含问句时,图神经网络模型可能不能从问句出发准确的确定子图谱中包含的每个边的对应的关联度,影响确定的边的关联度的准确性。为了准确的确定每个边的关联度,在一种可能的实施方式中,可以将问句也作为子图谱中的一个节点,将问句融入到子图谱中。
105.在一种可能的实施方式中,考虑到输入图神经网络模型的子图谱中的每个边需要携带(对应)有关联度(初始关联度),因此,在将问句作为节点融入子图谱中时,需要确定问句涉及的边的关联度。在一种可能的实施方式中,可以基于与问句连接的原节点的关联度,确定对应的边的关联度。
106.在一种可能的实施方式中,为了准确确定原节点的关联度,可以先基于每个原边所属的关系语句的第二语义特征向量,分别确定每个原边对应的原头节点的实体的词语义特征向量以及原尾节点的实体的词语义特征向量。在一种可能的实施方式中,在确定任一原边对应的原头节点的实体的词语义特征向量时,可以根据该原边所属的关系语句的第二语义特征向量中,该原头节点的实体涉及到的每个字的字语义特征向量,确定该原头节点的实体的词语义特征向量。示例性的,可以将该原头节点的实体涉及到的每个字的字语义特征向量进行加权平均,从而得到该原头节点的实体的词语义特征向量。
107.在一种可能的实施方式中,在确定任一原边对应的原尾节点的实体的词语义特征向量时,可以根据该原边所属的关系语句的第二语义特征向量中,该原尾节点的实体涉及到的每个字的字语义特征向量,确定该原尾节点的实体的词语义特征向量。示例性的,可以将该原尾节点的实体涉及到的每个字的字语义特征向量进行加权平均,从而得到该原尾节点的实体的词语义特征向量。
108.在一种可能的实施方式中,确定了每个节点的实体的词语义特征向量后,可以根据确定每个词语义特征向量与问句的第一语义特征向量之间的关联度(为方便描述,称为第三关联度)。在一种可能的实施方式中,与确定第一关联度类似,可以基于余弦相似度判断公式,计算(确定)关系语句的第二语义特征向量与第一语义特征向量之间的第三关联度。也可以将词语义特征向量和第一语义特征向量输入预先训练完成的全连接神经网络模型,根据全连接神经网络模型的输出结果,确定词语义特征向量与第一语义特征向量之间的第三关联度。在此不再赘述。
109.在一种可能的实施方式中,针对第一子图谱中问句中包含的实体的原节点(问句节点),确定原节点的关联度时,可以基于原节点(问句节点)所属的关系语句与第一语义特征向量之间的第一关联度、原节点(问句节点)的实体的词语义特征向量与第一语义特征向量之间的第三关联度、预设关联度中的至少一种,确定原节点的关联度(为方便描述,称为第四关联度)。其中,预设关联度可以根据需求灵活设置,本技术对此不做具体限定。示例性
的,预设关联度可以是1等。在一种可能的实施方式中,可以将第一关联度与第二关联度的乘积,确定为原节点的第四关联度。也可以将第一关联度、第二关联度或预设关联度,确定为原节点的第四关联度。示例性的,针对“冠心病”这个问句节点,如果该问句节点所属的关系语句与问句的第一语义特征向量之间的第一关联度为0.9,该问句节点的实体的词语义特征向量与问句的第一语义特征向量之间的第三关联度为0.8,则可以将0.72确定为该问句节点的第四关联度。再示例性的,如果预设关联度为1,也可以直接将1确定为该问句节点的第四关联度,从而简化计算第四关联度的过程。
110.在一种可能的实施方式中,针对第一子图谱中除问句节点之外的每个原节点(为方便描述,称为其他原节点),确定其他原节点的关联度时,可以基于原节点(其他原节点)所属的关系语句与第一语义特征向量之间的第一关联度、原节点(其他原节点)的实体的词语义特征向量与第一语义特征向量之间的第三关联度中的至少一种,确定原节点(其他原节点)的关联度(为方便描述,称为第四关联度)。
111.在一种可能的实施方式中,与确定问句节点的第四关联度相同,可以将第一关联度与第二关联度的乘积,确定为其他原节点的第四关联度。也可以将第一关联度或第二关联度,确定为其他原节点的第四关联度。示例性的,针对“大蒜”这个原节点,如果该原节点所属的关系语句与问句的第一语义特征向量之间的第一关联度为0.9,该问句节点的实体的词语义特征向量与问句的第一语义特征向量之间的第三关联度为0.9,则可以将0.81确定为该原节点的第四关联度。另外,该原节点的第四关联度也可以是0.9,在此不再赘述。
112.确定了每个原节点的第四关联度之后,可以将第四关联度作为将问句的语义特征向量融入知识图谱(子图谱)的桥梁,可以进行将问句的语义特征向量作为节点融入子图谱(第二子图谱)的步骤。在一种可能的实施方式中,考虑到第二子图谱中原节点均为实体,为了将问句的语义特征向量作为节点融入到第二子图谱中,可以先针对第二子图谱中的每个原节点,根据该原节点中的实体的词语义特征向量,对该原节点中的实体进行更新,即每个原节点对应的是实体的词语义特征向量,而非实体。然后,可以将问句的第一语义特征向量作为新节点,将该新节点分别与每个原节点通过一个新边进行连接,实现将问句融入到第二子图谱的步骤。其中,为方便描述,将融入问句的语义特征向量的子图谱称为第三子图谱,第三子图谱中每个节点均为语义特征向量。其中,将第三子图谱中问句的第一语义特征向量的节点称为新节点,该新节点与任一原节点之间通过新边进行连接,该新边的关联度为该新边对应的原节点的第四关联度。示例性的,“大蒜”这个原节点的第四关联度为0.81,新节点与“大蒜”这个原节点之间的新边的关联度即为0.81。可以理解的,第三子图谱中的每个原边对应关联度仍为第一关联度。这样,第三子图谱中无论是新边还是原边,每个边均对应有关联度。
113.确定了第三子图谱后,可以根据第三子图谱对第二子图谱进行更新,即将第二子图谱更新为第三子图谱,然后将更新后的第二子图谱(即第三子图谱)输入预先训练完成的图神经网络模型;根据图神经网络模型的输出结果,确定更新后的第二子图谱中每个原边对应的第二关联度;然后,根据第二关联度,对每个原边的第一关联度进行更新,从而完成对每个原边对应的第一关联度的修正。然后,可以基于更新后的第一关联度高于预设的关联度阈值的原边(原边所属的关系语句)对应的原尾节点的实体,确定问句的目标答案,在此不再赘述。
114.为方便理解,下面通过一个具体实施例对本技术提供的确定目标答案的过程进行说明。图2示出了一些实施例提供的第二种目标答案确定过程示意图,如图2所示,该过程包括以下步骤:
115.s201:确定接收到的用户输入的问句中包含的实体,若该实体存在于保存的知识图谱中,则根据知识图谱中,包括该实体对应的节点在内的设定数量跳内的每个原节点及每个原边,确定第一子图谱。
116.s202:针对第一子图谱中包含的每个原边,获取该原边及对应的原头节点的实体与原尾节点的实体所对应的关系语句;将问句以及每个关系语句,分别输入预先训练完成的语义模型,根据语义模型的输出结果,分别确定问句的第一语义特征向量以及每个关系语句的第二语义特征向量。
117.s203:针对每个原边所属的关系语句,确定该原边所属的关系语句的第二语义特征向量与第一语义特征向量之间的第一关联度。
118.s204:将每个原边对应有原边所属的关系语句的第二语义特征向量与第一语义特征向量之间的第一关联度的子图谱确定为第二子图谱;
119.基于每个原边所属的关系语句的第二语义特征向量,分别确定每个原边对应的原头节点的实体的词语义特征向量以及原尾节点的实体的词语义特征向量,并分别确定每个词语义特征向量与所述第一语义特征向量之间的第三关联度;
120.针对第一子图谱中问句中包含的实体的原节点,基于该原节点所属的关系语句的第一关联度、该原节点的实体的词语义特征向量的第三关联度、预设关联度中的至少一种,确定该原节点的第四关联度;针对第一子图谱中除问句中包含的实体的原节点之外的每个原节点,基于该原节点所属的关系语句的第一关联度、该原节点的实体的词语义特征向量的第三关联度中的至少一种,确定该原节点的第四关联度;
121.针对每个原节点,根据该原节点中的实体的词语义特征向量,对该原节点中的实体进行更新;将问句的第一语义特征向量作为新节点,将新节点与该原节点通过新边进行连接,形成第三子图谱;其中,针对每个新边,该新边的关联度为该新边对应的原节点的第四关联度;根据第三子图谱对第二子图谱进行更新。
122.s205:将更新后的第二子图谱输入预先训练完成的图神经网络模型。
123.s206:根据图神经网络模型的输出结果,确定每个原边对应的第二关联度;根据第二关联度,对第一关联度进行更新,基于更新后的第一子图谱中,第一关联度高于预设的关联度阈值的关系语句的原尾节点的实体,确定问句的目标答案。
124.由于本技术可以将问句的语义特征向量作为新节点融入子图谱中,将融入问句的语义特征向量的子图谱输入图神经网络模型,基于图神经网络模型,确定的每个原边对应的第二关联度的准确性更高,根据该第二关联度,对第一关联度进行更新(修正)后,可以进一步提高确定的目标答案的准确性。
125.实施例4:
126.为了进一步快捷的确定目标答案,在上述各实施例的基础上,在本技术实施例中,所述针对每个原边所属的关系语句,确定该原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的第一关联度之后,所述基于所述第一子图谱中,第一关联度高于预设的关联度阈值的关系语句的尾节点的实体,确定所述问句的目标答案之前,所述方
法还包括:
127.基于每个原边所属的关系语句的第二语义特征向量,分别确定每个原边对应的原头节点的实体的词语义特征向量以及原尾节点的实体的词语义特征向量,并分别确定每个词语义特征向量与所述第一语义特征向量之间的第三关联度;针对第一子图谱中所述问句中包含的实体的原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度、预设关联度中的至少一种,确定该原节点的第四关联度;针对第一子图谱中除所述问句中包含的实体的原节点之外的每个原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度中的至少一种,确定该原节点的第四关联度;
128.基于所述问句中包含的实体的第一数量以及所述第一子图谱中包含的所有节点的第二数量,确定分段数;将预设的关联度取值范围均匀的划分为所述分段数个关联度区间;
129.针对每个关联度区间,确定第四关联度位于该关联度区间内的除所述问句中包含的实体的原节点之外的每个关联原节点;基于所述第一子图谱中包含的每个原节点及每个原边,确定由该关联度区间的每个关联原节点、所述问句中包含的实体的原节点、以及每个关联原节点与所述问句中包含的实体的原节点之间的原边组成的拆分子图谱;其中,所述拆分子图谱中的每个原边对应有第一关联度;
130.针对每个拆分子图谱,根据该拆分子图谱中的每个原节点的实体的词语义特征向量,对该原节点中的实体进行更新;将所述问句的第一语义特征向量作为新节点,将所述新节点分别与该拆分子图谱中的每个原节点通过新边进行连接,形成新拆分子图谱;其中,针对每个新边,该新边的关联度为该新边对应原节点的第四关联度;
131.针对每个新拆分子图谱,将该新拆分子图谱输入预先训练完成的图神经网络模型,根据所述图神经网络模型的输出结果,确定该新拆分子图谱包含的每个边对应的第五关联度;
132.将每个新拆分子图谱中的每个所述原节点及原边均分别添加到空图谱中,得到重组子图谱,其中所述重组子图谱中的每个边均携带有所述第五关联度;
133.根据所述重组子图谱,对所述第一子图谱进行更新,并基于更新后的第一子图谱进行后续步骤。
134.在一种可能的实施方式中,考虑到将节点数和边数较多的子图谱输入图神经网络模型,基于图神经网络对每个原边的第一关联度进行修正时,可能耗时比较长。而将节点数和边数较少的子图谱输入图神经网络模型,基于图神经网络对每个原边的第一关联度进行修正时,耗时则会相对较少。为了进一步快捷的确定目标答案,提高确定目标答案的效率,可以将第一子图谱拆分为多个子图谱(为方便描述,称为拆分子图谱),然后将问句的语义特征向量作为新节点融入每一个拆分子图谱中,将融入问句的语义特征向量的拆分子图谱(为方便描述,称为新拆分子图谱)输入图神经网络模型,由于相对第三子图谱,新拆分子图谱的节点数和边数均较少,从而可以减少耗时,提高确定目标答案的效率。
135.具体的,在一种可能的实施方式中,可以基于每个原节点的第四关联度,将第一子图谱拆分为多个拆分子图谱。其中,确定每个原节点的第四关联度的过程与上述实施例中确定第四关联度的过程相同,在此不再赘述。
136.在一种可能的实施方式中,在将第一子图谱拆分为多个拆分子图谱时,可以先确定拆分子图谱的总数量。在确定拆分子图谱的总数量时,可以基于问句中包含的实体的数量(为方便描述,称为第一数量)以及第一子图谱中包含的所有节点的数量(为方便描述,称为第二数量),确定拆分子图谱的总数量(为方便描述,称为分段数)。
137.在一种可能的实施方式中,在基于第一数量以及第二数量,确定分段数时,可以基于第二数量与第一数量的比值,确定分段数。在一种可能的实施方式中,可以将第二数量与第一数量的比值向上取整得到的整数,确定为分段数。示例性的,如果第一数量为2,第二数量为5,则分段数可以为3。
138.确定了分段数后,可以将预设的关联度取值范围均匀的划分为分段数个关联度区间。示例性的,如果预设的关联度取值范围为[0,1],分段数为3,则划分的3个关联度区间可以分别为:[0,0.333],(0.333,0.666],(0.666,1]。
[0139]
确定了每个关联度区间后,针对每个关联度区间,可以确定第四关联度位于该关联度区间内的除问句中包含的实体的原节点(问句节点)之外的每个原节点(为方便描述,称为关联原节点)。示例性的,图3示出了一些实施例提供的节点示意图,如图3所示,如果第一子图谱中包含的每个原节点分别为“冠心病”、“痛风”、“大蒜”、“土豆”、“苹果”。其中问句中包含的实体的原节点(问句节点)为“冠心病”和“痛风”,由于“冠心病”和“痛风”为问句中包含的实体的原节点,可以作为公用节点。
[0140]
第一子图谱中包含的原节点中除问句节点之外的原节点分别为“苹果”、“土豆”、“大蒜”。其中,“苹果”的第四关联度为0.2593,“土豆”的第四关联度为0.5316,“大蒜”的第四关联度为0.9132。则“苹果”为位于图3中的区域1,[0,0.333]这个关联度区间(为方便描述,称为第一关联度区间)的关联原节点,“土豆”为位于图3中的区域2,(0.333,0.666]这个关联度区间(为方便描述,称为第二关联度区间)的关联原节点,“大蒜”为位于图3中的区域3,(0.666,1]这个关联度区间(为方便描述,称为第三关联度区间)的关联原节点。
[0141]
针对每个关联度区间,可以基于第一子图谱中包含的每个原节点及每个原边,确定由该关联度区间的每个关联原节点、问句中包含的实体的原节点、以及每个关联原节点与问句中包含的实体的原节点之间的原边组成的拆分子图谱。
[0142]
为方便理解,下面通过一个具体实施例对本技术提供的确定拆分子图谱的过程进行说明。图4示出了一些实施例提供的第一子图谱示意图,该第一子图谱中包含5个原节点和5个原边,其中,5个原节点中包含2个问句节点:“冠心病”、“痛风”,包含3个其他原节点:“苹果”、“土豆”、“大蒜”。5个原边分别为“冠心病”和“苹果”之间的边、“痛风”和“苹果”之间的边、“痛风”和“土豆”之间的边、“冠心病”和“大蒜”之间的边、“痛风”和“大蒜”之间的边。
[0143]
如果“苹果”为位于第一关联度区间的关联原节点,“土豆”为位于第二关联度区间的关联原节点,“大蒜”为位于第三关联度区间的关联原节点。
[0144]
图5a示出了一些实施例提供的第一关联度区间的拆分子图谱示意图,如图5a所示,第一关联度区间的拆分子图谱中包含3个原节点和2个原边,其中,3个原节点中包含2个问句节点:“冠心病”、“痛风”,包含1个其他原节点“苹果”。2个原边分别为“冠心病”和“苹果”之间的边、“痛风”和“苹果”之间的边。
[0145]
图5b示出了一些实施例提供的第二关联度区间的拆分子图谱示意图,如图5b所示,第二关联度区间的拆分子图谱中包含3个原节点和1个原边,其中,3个原节点中包含2个
问句节点:“冠心病”、“痛风”,包含1个其他原节点“土豆”。1个原边为“痛风”和“土豆”之间的边。
[0146]
图5c示出了一些实施例提供的第三关联度区间的拆分子图谱示意图,如图5c所示,第二关联度区间的拆分子图谱中包含3个原节点和2个原边,其中,3个原节点中包含2个问句节点:“冠心病”、“痛风”,包含1个其他原节点“大蒜”。2个原边为“冠心病”和“大蒜”之间的边、“痛风”和“大蒜”之间的边。
[0147]
其中,每个拆分子图谱中的每个原边均对应有第一关联度。
[0148]
将第一子图谱拆分为多个拆分子图谱后,可以进行将问句的语义特征向量作为新节点,融入每个拆分子图谱的步骤。具体的,为了将问句的语义特征向量作为新节点融入拆分子图谱,针对每个拆分子图谱,可以根据该拆分子图谱中的每个原节点的实体的词语义特征向量,对该原节点中的实体进行更新。然后将问句的第一语义特征向量作为新节点,将新节点分别与该拆分子图谱中的每个原节点通过新边进行连接,形成新拆分子图谱。与上述实施例相同,新拆分子图谱中每个新边的关联度为每个新边对应的原节点的第四关联度。
[0149]
图6a示出了一些实施例提供的第一关联度区间的新拆分子图谱示意图,如图6a所示,第一关联度区间的新拆分子图谱中包含3个原节点、1个新节点、2个原边和3个新边,其中,3个原节点中包含2个问句节点:“冠心病”的词语义特征向量、“痛风”的词语义特征向量,包含1个其他原节点“苹果”的词语义特征向量。2个原边分别为“冠心病”的词语义特征向量和“苹果”的词语义特征向量之间的边、“痛风”的词语义特征向量和“苹果”的词语义特征向量之间的边。1个新节点为“问句”的第一语义特征向量,3个新边分别为“问句”的第一语义特征向量与“冠心病”的词语义特征向量之间的边、“问句”的第一语义特征向量与“痛风”的词语义特征向量之间的边、“问句”的第一语义特征向量与“苹果”的词语义特征向量之间的边。
[0150]
图6b示出了一些实施例提供的第二关联度区间的新拆分子图谱示意图,如图6b所示,第二关联度区间的新拆分子图谱中包含3个原节点、1个新节点、1个原边和3个新边,其中,3个原节点中包含2个问句节点:“冠心病”的词语义特征向量、“痛风”的词语义特征向量,包含1个其他原节点“土豆”的词语义特征向量。1个原边为“痛风”的词语义特征向量和“土豆”的词语义特征向量之间的边。1个新节点为“问句”的第一语义特征向量,3个新边分别为“问句”的第一语义特征向量与“冠心病”的词语义特征向量之间的边、“问句”的第一语义特征向量与“痛风”的词语义特征向量之间的边、“问句”的第一语义特征向量与“土豆”的词语义特征向量之间的边。
[0151]
图6c示出了一些实施例提供的第三关联度区间的新拆分子图谱示意图,如图6c所示,第三关联度区间的新拆分子图谱中包含3个原节点、1个新节点、2个原边和3个新边,其中,3个原节点中包含2个问句节点:“冠心病”的词语义特征向量、“痛风”的词语义特征向量,包含1个其他原节点“大蒜”的词语义特征向量。2个原边为“冠心病”的词语义特征向量和“大蒜”的词语义特征向量之间的边、“痛风”的词语义特征向量和“大蒜”的词语义特征向量之间的边。1个新节点为“问句”的第一语义特征向量,3个新边分别为“问句”的第一语义特征向量与“冠心病”的词语义特征向量之间的边、“问句”的第一语义特征向量与“痛风”的词语义特征向量之间的边、“问句”的第一语义特征向量与“大蒜”的词语义特征向量之间的
边。
[0152]
确定(形成)了每个新拆分子图谱后,可以将每个新拆分子图谱均分别输入预先训练完成的图神经网络模型,根据图神经网络模型的输出结果,确定每个新拆分子图谱包含的每个边对应的关联度(为方便描述,称为第五关联度)。
[0153]
在一种可能的实施方式中,如果拆分子图谱的总数量偏小,即分段数偏小,则新拆分子图谱相对较复杂,耗时相对较长,效率较低;如果拆分子图谱的总数量偏大,即分段数偏大,则新拆分子图谱相对太简单,影响图神经网络模型确定的第五关联度的准确性以及后续确定的目标答案的准确性。因此,通过基于问句中包含的实体的第一数量以及第一子图谱中包含的所有节点的第二数量,合理确定分段数,可以在保证可以提高确定目标答案的效率的同时,还可以保证确定的目标答案的准确性。
[0154]
在一种可能的实施方式中,确定了每个新拆分子图谱中每个边(尤其是每个原边)对应的关联度之后,可以将多个新拆分子图谱中的每个原节点和每个原边重新组合在一起,形成一个总的子图谱(为方便描述,称为重组子图谱),从而可以基于该重组子图谱,确定目标答案。
[0155]
具体的,在将多个新拆分子图谱中的每个原节点和每个原边重新组合在一起,形成一个重组子图谱时,可以先新建一个空图谱,然后依次分别将每个新拆分子图谱中的每个原节点及每个原边均分别添加到空图谱中,从而得到重组子图谱。可以理解的,由于每个原边携带(对应)有第五关联度,所以得到的重组子图谱中的每个边也均携带有第五关联度。
[0156]
示例性的,仍以上述实施例为例,可以先将图6a第一关联度区间的新拆分子图谱中的3个原节点(“冠心病”、“苹果”和“痛风”的词语义特征向量)和2个原边(“冠心病”的词语义特征向量和“苹果”的词语义特征向量之间的边、“痛风”的词语义特征向量和“苹果”的词语义特征向量之间的边)均分别添加到空图谱中。然后,再将图6b第二关联度区间的新拆分子图谱中的3个原节点(“冠心病”、“土豆”和“痛风”的词语义特征向量)添加进去,添加时,由于当前空图谱中已经存在“冠心病”和“痛风”的词语义特征向量,则可以不用重复将“冠心病”和“痛风”的词语义特征向量添加进去,而只将当前空图谱中不存在的节点“土豆”的词语义特征向量添加进去即可,另外,由于当前图谱中也不存在“土豆”的词语义特征向量与“痛风”的词语义特征向量之间的边,则也可以将图6b中的1个原边(“痛风”的词语义特征向量和“土豆”的词语义特征向量之间的边)添加到空图谱中。最后,可以将图6c第三关联度区间的新拆分子图谱中的3个原节点(“冠心病”、“大蒜”和“痛风”的词语义特征向量)添加进去,添加时,由于当前空图谱中已经存在“冠心病”和“痛风”的词语义特征向量,则可以不用重复将“冠心病”和“痛风”的词语义特征向量添加进去,而只将当前空图谱中不存在的节点“大蒜”的词语义特征向量添加进去即可,另外,由于当前图谱中也不存在“大蒜”的词语义特征向量与“痛风”的词语义特征向量之间的边以及“大蒜”的词语义特征向量与“冠心病”的词语义特征向量之间的边,则也可以将图6c中的2个原边(“冠心病”的词语义特征向量和“大蒜”的词语义特征向量之间的边、“痛风”的词语义特征向量和“大蒜”的词语义特征向量之间的边)添加到空图谱中,从而得到重组子图谱。该重组子图谱中的每个边对应(携带)的关联度为第五关联度。
[0157]
在一种可能的实施方式中,得到重组子图谱后,可以根据重组子图谱,对第一子图
谱进行更新,基于更新后的第一子图谱(即重组子图谱)中,第一关联度(即重组子图谱中的每个边对应的第五关联度)高于预设的关联度阈值的关系语句的尾节点的实体,确定问句的目标答案。
[0158]
由于本技术可以先将第一子图谱拆分为多个拆分子图谱,然后将问句的语义特征向量作为新节点融入每个拆分子图谱,形成每个新拆分子图谱,再将每个新拆分子图谱输入预先训练完成的图神经网络模型,得到每个新拆分子图谱中包含的每个边对应的第五关联度,然后,在将多个新拆分子图谱中的每个原节点和原边进行重组,得到重组子图谱,并根据重组子图谱对第一子图谱进行更新,基于更新后的第一子图谱确定目标答案,从而可以实现既快捷又准确的确定目标答案的目的。
[0159]
为方便理解,下面通过一个具体实施例对本技术提供的目标答案确定过程进行举例说明。图7示出了一些实施例提供的第三种目标答案确定过程示意图,如图7所示,该过程包括以下步骤:
[0160]
s701:确定接收到的用户输入的问句中包含的实体,若所述实体存在于保存的知识图谱中,则根据所述知识图谱中,包括所述实体对应的节点在内的设定数量跳内的每个原节点及每个原边,确定第一子图谱。
[0161]
s702:针对所述第一子图谱中包含的每个原边,获取该原边及对应的原头节点的实体与原尾节点的实体所对应的关系语句;将所述问句以及每个所述关系语句,分别输入预先训练完成的语义模型,根据所述语义模型的输出结果,分别确定所述问句的第一语义特征向量以及每个所述关系语句的第二语义特征向量。
[0162]
s703:针对每个原边所属的关系语句,确定该原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的第一关联度。
[0163]
s704:基于每个原边所属的关系语句的第二语义特征向量,分别确定每个原边对应的原头节点的实体的词语义特征向量以及原尾节点的实体的词语义特征向量,并分别确定每个词语义特征向量与所述第一语义特征向量之间的第三关联度;针对第一子图谱中所述问句中包含的实体的原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度、预设关联度中的至少一种,确定该原节点的第四关联度;针对第一子图谱中除所述问句中包含的实体的原节点之外的每个原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度中的至少一种,确定该原节点的第四关联度。
[0164]
s705:基于所述问句中包含的实体的第一数量以及所述第一子图谱中包含的所有节点的第二数量,确定分段数;将预设的关联度取值范围均匀的划分为所述分段数个关联度区间。
[0165]
s706:针对每个关联度区间,确定第四关联度位于该关联度区间内的除所述问句中包含的实体的原节点之外的每个关联原节点;基于所述第一子图谱中包含的每个原节点及每个原边,确定由该关联度区间的每个关联原节点、所述问句中包含的实体的原节点、以及每个关联原节点与所述问句中包含的实体的原节点之间的原边组成的拆分子图谱;其中,所述拆分子图谱中的每个原边对应有第一关联度。
[0166]
s707:针对每个拆分子图谱,根据该拆分子图谱中的每个原节点的实体的词语义特征向量,对该原节点中的实体进行更新;将所述问句的第一语义特征向量作为新节点,将
所述新节点分别与该拆分子图谱中的每个原节点通过新边进行连接,形成新拆分子图谱;其中,针对每个新边,该新边的关联度为该新边对应原节点的第四关联度。
[0167]
s708:针对每个新拆分子图谱,将该新拆分子图谱输入预先训练完成的图神经网络模型,根据所述图神经网络模型的输出结果,确定该新拆分子图谱包含的每个边对应的第五关联度。
[0168]
s709:将每个新拆分子图谱中的每个所述原节点及原边均分别添加到空图谱中,得到重组子图谱,其中所述重组子图谱中的每个边均携带有所述第五关联度。
[0169]
s710:根据所述重组子图谱,对所述第一子图谱进行更新,并基于更新后的第一子图谱中,第一关联度(即第五关联度)高于预设的关联度阈值的关系语句的原尾节点的实体,确定所述问句的目标答案。
[0170]
为方便理解,下面再通过一个具体实施例对本技术提供的目标答案确定过程进行举例说明。图8示出了一些实施例提供的第四种目标答案确定过程示意图,如图8所示,该过程包括以下步骤:
[0171]
s801:用户通过电子设备的前端界面(web页面、应用程序、app等)输入问句q。
[0172]
s802:电子设备确定接收到的用户输入的问句中包含的实体,若该实体存在于保存的知识图谱中,则根据知识图谱中,包括该实体对应的节点在内的五跳以内的每个原节点及每个原边,确定第一子图谱g。
[0173]
为方便理解,下面以用户输入的问句为“患了冠心病和痛风,我不能吃什么”为例进行说明。其中,用户输入的问句中包含的实体可以为“冠心病”和“痛风”。
[0174]
s803:针对第一子图谱g中包含的每个原边,获取该原边及对应的原头节点的实体与原尾节点的实体所对应的关系语句k;
[0175]
将问句q以及每个关系语句k,分别输入预先训练完成的语义模型,根据语义模型的输出结果,分别确定问句的第一语义特征向量以及每个关系语句的第二语义特征向量;
[0176]
针对每个原边所属的关系语句,确定该原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的第一关联度;
[0177]
基于每个原边所属的关系语句的第二语义特征向量,分别确定每个原边对应的原头节点的实体的词语义特征向量以及原尾节点的实体的词语义特征向量,并分别确定每个词语义特征向量与所述第一语义特征向量之间的第三关联度;
[0178]
针对第一子图谱中问句q中包含的实体的原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度、预设关联度中的至少一种,确定该原节点的第四关联度;
[0179]
针对第一子图谱中除问句q中包含的实体的原节点之外的每个原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度中的至少一种,确定该原节点的第四关联度。
[0180]
示例性的,用户输入的问句的第一语义特征向量可以为768维的句向量v
q
,v
q
=[0.4929,0.3551,...,

0.4668]。第一子图谱中包含的“大蒜”节点的词语义特征向量为[0.3821,0.1253,....,

0.5937],根据余弦相似度判断公司计算的“大蒜”的词语义特征向量与第一语义特征向量v
q
之间的第三关联度可以为0.624。
[0181]
s804:基于所述问句q中包含的实体的第一数量以及所述第一子图谱g中包含的所
有节点的第二数量,确定分段数;将预设的关联度取值范围均匀的划分为所述分段数个关联度区间;
[0182]
针对每个关联度区间,确定第四关联度位于该关联度区间内的除所述问句中包含的实体的原节点之外的每个关联原节点;基于所述第一子图谱中包含的每个原节点及每个原边,确定由该关联度区间的每个关联原节点、所述问句中包含的实体的原节点、以及每个关联原节点与所述问句中包含的实体的原节点之间的原边组成的拆分子图谱g1,g2,...,g
n
;其中,所述拆分子图谱中的每个原边对应有第一关联度。
[0183]
示例性的,如果分段数为33,则可以形成33个拆分子图谱g1,g2,...,g
33

[0184]
s805:针对每个拆分子图谱,根据该拆分子图谱中的每个原节点的实体的词语义特征向量,对该原节点中的实体进行更新;将所述问句的第一语义特征向量作为新节点,将所述新节点分别与该拆分子图谱中的每个原节点通过新边进行连接,形成新拆分子图谱
[0185]
其中,针对每个新边,该新边的关联度为该新边对应原节点的第四关联度。
[0186]
示例性的,如果分段数为33,则可以形成33个新拆分子图谱
[0187]
s806:针对每个新拆分子图谱,将该新拆分子图谱输入预先训练完成的图神经网络模型,根据所述图神经网络模型的输出结果,确定该新拆分子图谱包含的每个边对应的第五关联度。
[0188]
在一种可能的实施方式中,可以将多个新拆分子图谱并行的分别输入参数相同的多个图神经网络模型,通过并行计算完成算法加速,提高计算效率。
[0189]
s807:将每个新拆分子图谱中的每个所述原节点及原边均分别添加到空图谱中,得到重组子图谱其中重组子图谱中的每个边均携带有第五关联度。
[0190]
其中,可以去除新拆分子图谱中的新节点和新边,只将新拆分子图谱中的原节点和原边添加到空图谱中。
[0191]
s808:根据重组子图谱,对第一子图谱进行更新,并基于更新后的第一子图谱中,第一关联度高于预设的关联度阈值的关系语句的原尾节点的实体,确定问句的目标答案。
[0192]
示例性的,如果预设的关联度阈值为0.9,第一关联度高于预设的关联度阈值的关系语句的原尾节点的实体分别为“大蒜”(其中大蒜所属的关系语句的第一关联度为0.9132)、“大葱”(其中大葱所属的关系语句的第一关联度为0.9567)、“花生”(其中花生所属的关系语句的第一关联度为0.9421)、“红酒”(其中红酒所属的关系语句的第一关联度为0.9625),则可以基于这些实体,确定问句的目标答案。在一种可能的实施方式中,确定的目标答案可以为“您好,如果您患有冠心病和痛风,不推荐食用大蒜、大葱、花生等,不推荐喝红酒等”。
[0193]
s809:将确定的目标答案输出。
[0194]
其中,可以将确定的目标答案输出至电子设备的前端界面或对应的api接口等,在此不再赘述。
[0195]
实施例5:
[0196]
基于相同的技术构思,本技术提供了一种目标答案确定装置,图9示出了一些实施例提供的一种目标答案确定装置结构示意图,如图9所示,该装置包括:
[0197]
接收模块91,用于接收用户输入的问句;
[0198]
子图谱确定模块92,用于确定接收到的用户输入的所述问句中包含的实体,若所述实体存在于保存的知识图谱中,则根据所述知识图谱中,包括所述实体对应的节点在内的设定数量跳内的每个原节点及每个原边,确定第一子图谱;
[0199]
语义确定模块93,用于针对所述第一子图谱中包含的每个原边,获取该原边及对应的原头节点的实体与原尾节点的实体所对应的关系语句;将所述问句以及每个所述关系语句,分别输入预先训练完成的语义模型,根据所述语义模型的输出结果,分别确定所述问句的第一语义特征向量以及每个所述关系语句的第二语义特征向量;
[0200]
语句关联度确定模块94,用于针对每个原边所属的关系语句,确定该原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的第一关联度;
[0201]
目标答案确定模块95,用于基于所述第一子图谱中,第一关联度高于预设的关联度阈值的关系语句的原尾节点的实体,确定所述问句的目标答案。
[0202]
在一种可能的实施方式中,所述装置还包括:
[0203]
第一修正模块,用于将每个原边对应有原边所属的关系语句的第二语义特征向量与所述第一语义特征向量之间的所述第一关联度的子图谱确定为第二子图谱,将所述第二子图谱输入预先训练完成的图神经网络模型;根据所述图神经网络模型的输出结果,确定每个原边对应的第二关联度;根据所述第二关联度,对所述第一关联度进行更新。
[0204]
在一种可能的实施方式中,所述装置还包括:
[0205]
节点关联度确定模块,用于基于每个原边所属的关系语句的第二语义特征向量,分别确定每个原边对应的原头节点的实体的词语义特征向量以及原尾节点的实体的词语义特征向量,并分别确定每个词语义特征向量与所述第一语义特征向量之间的第三关联度;针对第一子图谱中所述问句中包含的实体的原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度、预设关联度中的至少一种,确定该原节点的第四关联度;针对第一子图谱中除所述问句中包含的实体的原节点之外的每个原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度中的至少一种,确定该原节点的第四关联度;
[0206]
所述第一修正模块,还用于针对每个原节点,根据该原节点中的实体的词语义特征向量,对该原节点中的实体进行更新;将所述问句的第一语义特征向量作为新节点,将所述新节点与该原节点通过新边进行连接,形成第三子图谱;其中,针对每个新边,该新边的关联度为该新边对应的原节点的第四关联度;根据所述第三子图谱对所述第二子图谱进行更新,基于更新后的第二子图谱进行将更新后的第二子图谱输入预先训练完成的图神经网络模型;根据所述图神经网络模型的输出结果,确定每个原边对应的第二关联度;根据所述第二关联度,对所述第一关联度进行更新的步骤。
[0207]
在一种可能的实施方式中,所述装置还包括:
[0208]
节点关联度确定模块,用于基于每个原边所属的关系语句的第二语义特征向量,分别确定每个原边对应的原头节点的实体的词语义特征向量以及原尾节点的实体的词语义特征向量,并分别确定每个词语义特征向量与所述第一语义特征向量之间的第三关联度;针对第一子图谱中所述问句中包含的实体的原节点,基于该原节点所属的关系语句的所述第一关联度、该原节点的实体的词语义特征向量的所述第三关联度、预设关联度中的至少一种,确定该原节点的第四关联度;针对第一子图谱中除所述问句中包含的实体的原
architecture,eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0224]
通信接口102用于上述电子设备与其他设备之间的通信。
[0225]
存储器可以包括随机存取存储器(random access memory,ram),也可以包括非易失性存储器(non

volatile memory,nvm),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
[0226]
上述处理器可以是通用处理器,包括中央处理器、网络处理器(network processor,np)等;还可以是数字指令处理器(digital signal processing,dsp)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
[0227]
实施例7:
[0228]
在上述各实施例的基础上,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由电子设备执行的计算机程序,计算机可执行指令用于使计算机执行前述方法部分所执行的流程。
[0229]
上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(mo)等、光学存储器如cd、dvd、bd、hvd等、以及半导体存储器如rom、eprom、eeprom、非易失性存储器(nand flash)、固态硬盘(ssd)等。
[0230]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
[0231]
本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0232]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0233]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0234]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围
之内,则本技术也意图包含这些改动和变型在内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献