问答方法、装置、存储介质及电子设备与流程

2022-11-13 11:42:30 来源：中国专利 TAG：

1.本公开涉及信息搜索技术领域，具体地，涉及一种问答方法、装置、存储介质及电子设备。

背景技术：

2.时序知识图谱是一种多关系的知识图谱，相较于常规的知识图谱，时序知识图谱中的关系中还可以与时间段相关联。例如，在常规的知识图谱中存在着“头实体-关系-尾实体”这样的三元组关系，而在时序知识图谱中，还可以包含这段关系存在的时间，从而形成“头实体-关系-尾实体-时间戳”这样的知识四元组形式。因此，时序知识图谱可以由这样的若干知识四元组构成。
3.知识图谱问答任务(kgqa)的任务是使用kg(knowledge graph，知识图谱)作为知识库回答自然语言问题。而相关技术中，在面对复杂时序问题时，知识图谱问答可能难以获得较为准确的答案。

技术实现要素：

4.本公开的目的是提供一种问答方法、装置、存储介质及电子设备，以解决上述相关技术问题。
5.为了实现上述目的，根据本公开实施例的第一方面，提供一种问答方法，包括：
6.响应于接收到目标问题，根据所述目标问题从时序知识图谱中确定目标知识四元组，所述目标知识四元组与所述目标问题的匹配度满足预设匹配度条件；
7.提取所述目标知识四元组所包括的时间信息；
8.将所述目标问题与所述时间信息融合，得到问题表示；
9.基于所述问题表示以及所述时序知识图谱，输出所述目标问题的应答信息。
10.可选地，所述响应于接收到目标问题，根据所述目标问题从时序知识图谱中确定目标知识四元组，包括：
11.从所述时序知识图谱中获取多个候选知识四元组；
12.计算各所述候选知识四元组与所述目标问题的匹配度；
13.将匹配度最高的候选知识四元组作为所述目标知识四元组。
14.可选地，所述从所述时序知识图谱中获取多个候选知识四元组，包括：
15.根据所述目标问题，确定第一编码向量；
16.确定所述时序知识图谱中的各个知识四元组的第二编码向量；
17.计算所述第一编码向量与各个第二编码向量的相似度；
18.将相似度较高的目标第二编码向量所对应的知识四元组作为所述候选知识四元组。
19.可选地，所述计算各所述候选知识四元组与所述目标问题的匹配度，包括：
20.对所述目标问题中的每一词，执行如下操作：
21.获取所述词的第三编码向量，以及目标候选知识四元组的目标第二编码向量，其中，所述目标候选知识四元组为所述多个候选知识四元组中的任一知识四元组；
22.计算所述第三编码向量与所述目标第二编码向量的梯度值，得到所述词的第一梯度值；
23.所述计算各所述候选知识四元组与所述目标问题的匹配度，还包括：对各个词的第一梯度值进行加权求和，得到所述目标问题和所述目标候选知识四元组的第二梯度值；
24.根据所述第二梯度值确定所述目标问题和所述目标候选知识四元组的匹配度。
25.可选地，所述根据所述第二梯度值确定所述目标问题和所述目标候选知识四元组的匹配度，包括：
26.对计算得到的各个第二梯度值进行归一化处理；
27.将所述目标候选知识四元组的第二梯度值的归一化结果，作为所述目标候选知识四元组与所述目标问题的匹配度。
28.可选地，所述将所述目标问题与所述时间信息融合，得到问题表示，包括：
29.通过注意力模块对所述目标问题和所述目标知识四元组进行信息提取，得到第四编码向量；
30.确定所述目标问题中的与所述目标知识四元组匹配度最高的目标词；
31.为所述目标词和所述时间信息设定权重值，所述目标词的权重值小于所述时间信息的权重值；
32.将所述权重值以及所述时间信息添加至所述第四编码向量，得到所述问题表示。
33.可选地，所述通过注意力模块对所述目标问题和所述目标知识四元组进行信息提取，得到第四编码向量，包括：
34.对所述目标问题中的每一词，执行如下操作：
35.获取所述词的第三编码向量，以及目标知识四元组的第五编码向量；
36.基于注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第六编码向量；
37.所述通过注意力模块对所述目标问题和所述目标知识四元组进行信息提取，还包括：对各个词的第六编码向量进行加权求和，得到所述第四编码向量。
38.可选地，所述注意力模块包括连接注意力模块、点乘注意力模块以及减法注意力模块，所述基于注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第六编码向量，包括：
39.基于所述连接注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第一候选编码向量；
40.基于所述点乘注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第二候选编码向量；
41.基于所述减法注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第三候选编码向量；
42.对所述第一候选编码向量、所述第二候选编码向量以及所述第三候选编码向量进行加权求和，得到所述第六编码向量。
43.根据本公开实施例的第二方面，提供一种问答装置，包括：
44.第一确定模块，用于响应于接收到目标问题，根据所述目标问题从时序知识图谱中确定目标知识四元组，所述目标知识四元组与所述目标问题的匹配度满足预设匹配度条件；
45.第一提取模块，用于提取所述目标知识四元组所包括的时间信息；
46.第一融合模块，用于将所述目标问题与所述时间信息融合，得到问题表示；
47.输出模块，用于基于所述问题表示以及所述时序知识图谱，输出所述目标问题的应答信息。
48.可选地，所述第一确定模块，包括：
49.第一获取子模块，用于从所述时序知识图谱中获取多个候选知识四元组；
50.第一计算子模块，用于计算各所述候选知识四元组与所述目标问题的匹配度；
51.第一执行子模块，用于将匹配度最高的候选知识四元组作为所述目标知识四元组。
52.可选地，所述第一获取子模块，包括：
53.第一确定子单元，用于根据所述目标问题，确定第一编码向量；
54.第二确定子单元，用于确定所述时序知识图谱中的各个知识四元组的第二编码向量；
55.第一计算子单元，用于计算所述第一编码向量与各个第二编码向量的相似度；
56.第一执行子单元，用于将相似度较高的目标第二编码向量所对应的知识四元组作为所述候选知识四元组。
57.可选地，所述第一计算子模块，包括：
58.第二执行子模块，用于对所述目标问题中的每一词，执行如下操作：
59.获取所述词的第三编码向量，以及目标候选知识四元组的目标第二编码向量，其中，所述目标候选知识四元组为所述多个候选知识四元组中的任一知识四元组；计算所述第三编码向量与所述目标第二编码向量的梯度值，得到所述词的第一梯度值；
60.第二计算子模块，用于对各个词的第一梯度值进行加权求和，得到所述目标问题和所述目标候选知识四元组的第二梯度值；
61.第一确定子模块，用于根据所述第二梯度值确定所述目标问题和所述目标候选知识四元组的匹配度。
62.可选地，所述第一确定子模块，包括：
63.第二计算子单元，用于对计算得到的各个第二梯度值进行归一化处理；
64.第二执行子单元，用于将所述目标候选知识四元组的第二梯度值的归一化结果，作为所述目标候选知识四元组与所述目标问题的匹配度。
65.可选地，所述第一融合模块，包括：
66.信息提取子模块，用于通过注意力模块对所述目标问题和所述目标知识四元组进行信息提取，得到第四编码向量；
67.第二确定子模块，用于确定所述目标问题中的与所述目标知识四元组匹配度最高的目标词；
68.第三执行子模块，用于为所述目标词和所述时间信息设定权重值，所述目标词的权重值小于所述时间信息的权重值；
69.融合子模块，用于将所述权重值以及所述时间信息添加至所述第四编码向量，得到所述问题表示。
70.可选地，所述信息提取子模块，包括：
71.第三执行子单元，用于对所述目标问题中的每一词，执行如下操作：
72.获取所述词的第三编码向量，以及目标知识四元组的第五编码向量；基于注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第六编码向量；
73.第三计算子单元，对各个词的第六编码向量进行加权求和，得到所述第四编码向量。
74.可选地，所述注意力模块包括连接注意力模块、点乘注意力模块以及减法注意力模块，所述第三执行子单元，用于：
75.基于所述连接注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第一候选编码向量；
76.基于所述点乘注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第二候选编码向量；
77.基于所述减法注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第三候选编码向量；
78.对所述第一候选编码向量、所述第二候选编码向量以及所述第三候选编码向量进行加权求和，得到所述第六编码向量。
79.根据本公开实施例的第三方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述第一方面中任一项所述方法的步骤。
80.根据本公开实施例的第四方面，提供一种电子设备，包括：
81.存储器，其上存储有计算机程序；
82.处理器，用于执行所述存储器中的所述计算机程序，以实现上述第一方面中任一项所述方法的步骤。
83.上述技术方案在接收到目标问题时，可以从时序知识图谱中获取与所述目标问题相匹配的目标知识四元组，并提取所述目标知识四元组的时间信息。由于目标知识四元组与所述目标问题相匹配，因此可以将目标知识四元组中的时间信息作为所述目标问题的时间参照。这样，可以将所述时间信息与所述目标问题进行融合，从而得到包括时间信息的问题表示，并根据所述问题表示以及所述时序知识图谱，输出所述目标问题的应答信息。也就是说，上述技术方案可以提取目标问题中隐含的时间信息，并将时间信息融合到问题表示中，从而为答案搜索提供时间参照。通过这样的方式，有助于提升应答结果的准确度。
84.本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
85.附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：
86.图1是本公开一示例性实施例所示出的一种问答方法的流程图。
87.图2是本公开一示例性实施例所示出的一种目标知识四元组的确定流程图。
88.图3是本公开一示例性实施例所示出的一种候选知识四元组选择模型的架构图。
89.图4是本公开一示例性实施例所示出的一种候选知识四元组与目标问题的匹配度的计算流程图。
90.图5是本公开一示例性实施例所示出的一种目标问题与时间信息的融合流程图。
91.图6是本公开一示例性实施例所示出的一种信息提取的流程图。
92.图7是本公开一示例性实施例所示出的一种问答装置的框图。
93.图8是本公开一示例性实施例所示出的一种电子设备800的框图。
具体实施方式
94.以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本公开，并不用于限制本公开。
95.在介绍本公开的问答方法、装置、存储介质及电子设备之前，首先对本公开的应用场景进行介绍。本公开所提供的实施例可以用于各种知识图谱问答场景，如客服机器人、语音助手、搜索引擎、推荐系统等等。
96.相关场景中，可以通过知识图谱搜索问题的答案。例如，对于问题“who was the captain of the brazil football team before neymar”，可以将该问题与知识图谱进行信息融合，从而得到搜索结果。但本技术发明人发现，由于问题中不包括时间信息，因此这种处理方式得到的结果的准确度还较低。例如，上述问题的搜索结果可能与问题中的实体相关，如“neymar的上任时间、巴西足球队队长是xx”等等，但难以得到准确的答案。
97.为此，本公开提供一种问答方法。所述问答方法可以应用于各种静止或可移动的计算设备，如服务器、笔记本电脑、各种穿戴设备(手环、手表、眼镜)等等。图1是本公开所示出的一种问答方法的流程图，参照图1，所述方法包括：
98.在步骤s11中，响应于接收到目标问题，根据目标问题从时序知识图谱中确定目标知识四元组。
99.其中，目标知识四元组与所述目标问题的匹配度满足预设匹配度条件。例如在一些实施场景中，预设匹配度条件可以包括：目标知识四元组与目标问题的匹配度最高。
100.在这种情况下，参照图2所示出的一种目标知识四元组的确定流程图，所述响应于接收到目标问题，根据所述目标问题从时序知识图谱中确定目标知识四元组(步骤s11)，包括：
101.步骤s111，从时序知识图谱中获取多个候选知识四元组。
102.示例地，在一种可能的实施方式中，从所述时序知识图谱中获取多个候选知识四元组(步骤s111)，包括：
103.根据所述目标问题，确定第一编码向量；确定所述时序知识图谱中的各个知识四元组的第二编码向量；计算所述第一编码向量与各个第二编码向量的相似度；
104.将相似度较高的目标第二编码向量所对应的知识四元组作为所述候选知识四元组。
105.作为一种示例，可以对目标问题进行embedding处理，从而得到所述第一编码向量。并对所述时序知识图谱中的各个知识四元组进行embedding处理，从而得到所述第二编码向量。这样，可以计算所述第一编码向量与每一所述第二编码向量的相似度，并将相似度较高的目标第二编码向量所对应的知识四元组作为所述候选知识四元组。
106.这里，候选知识四元组的数量可以基于应用需求进行设置。作为一种示例，可以选取相似度较高的10个目标第二编码向量，并将10个目标第二编码向量所对应的知识四元组作为所述候选知识四元组。
107.在一些实施场景中，也可以基于候选知识四元组选择模型从所述时序知识图谱中获取多个候选知识四元组。例如，参照图3所示出的一种候选知识四元组选择模型的架构图，所述候选知识四元组选择模型可以为双塔架构，包括网络1以及网络2。
108.其中，网络1可以用于计算目标问题的第一编码向量(embedding)，网络2可以用于计算时序知识图谱中的各个知识四元组的第二编码向量。在网络1和网络2中，还包括dnn(deep neural networks，深度神经网络)模块，用于对输入数据进行处理，得到对应的表征向量。作为一种示例，dnn可以采用bert模型。这样，在处理目标问题时，可以在目标问题的首尾分别插入[cls]标志和[sep]标志，并将处理后的目标问题输入至网络1中，从而得到目标问题的第一编码向量。此外，也可以通过网络2获得知识四元组的第二编码向量。
[0109]
得到第一编码向量和第二编码向量之后，可以计算第一编码向量和第二编码向量的相似度。例如在图3的示例中，可以通过余弦相似计算的方式确定第一编码向量和第二编码向量的相似度。沿用上述例子，可以将相似度较高的10个知识四元组作为所述候选知识四元组。
[0110]
此外值得说明的是，上述实施例中以余弦相似计算的方式对所述相似度计算过程进行了示例性说明，但本领域技术人员应当知晓，任何可行的相似度计算方法都可以应用在所述候选知识四元组选择模型中，本公开对此不做限制。
[0111]
仍参照图2，在确定出多个候选知识四元组的情况下，在步骤s112中，计算各候选知识四元组与目标问题的匹配度。
[0112]
图4是本公开所示出的一种候选知识四元组与目标问题的匹配度的计算流程图，参照图4，所述计算流程包括：
[0113]
在步骤s41中，对目标问题中的每一词，获取所述词的第三编码向量，以及目标候选知识四元组的目标第二编码向量；计算第三编码向量与目标第二编码向量的梯度值，得到所述词的第一梯度值。
[0114]
其中，所述目标候选知识四元组为所述多个候选知识四元组中的任一知识四元组。
[0115]
这里，通过一个示例对步骤s41进行说明。其中，目标问题为“who was the captain of the brazil football team before neymar”，候选知识四元组为：
[0116]
1、《neymar,awarded,south american footballer,2012》
[0117]
2、《brazil nationalteam,awarded,world cupchampion,1970》
[0118]
3、《miranda,joined,brazil nationalteam,2007》
[0119]
4、《neymar,awarded,fifa ference puskas award,2012》
[0120]
5、《neymar,positionheld,captainof brazil nationalteam,2014》
[0121]
6、《dunga,coach,brazil nationalteam,2014》
[0122]
7、《neymar,joined,barcelona,2013》
[0123]
8、《brazil nationalteam,awarded,world cupchampion,1994》
[0124]
9、《brazil nationalteam,awarded,confederations cup,2005》
[0125]
10、《pimenta,coach,brazil nationalteam,1937》
[0126]
11、《neymar,joined,paris saint-germain,2017》
[0127]
以目标候选知识四元组为候选知识四元组1为例，在计算目标问题与候选知识四元组1的相似度时，可以计算所述目标问题中的各个单词的第三编码向量，以及候选知识四元组的目标第二编码向量a。例如，可以计算目标问题中的单词neymar的第三编码向量，并计算该第三编码向量与第二编码向量a的梯度值，得到对应于单词neymar的第一梯度值。通过这样的方式，还可以计算得到所述目标问题中的其他单词的第一梯度值，本公开对此不做赘述。
[0128]
在步骤s42中，对各个词的第一梯度值进行加权求和，得到目标问题和目标候选知识四元组的第二梯度值。
[0129]
这里，各个词的权重值例如可以是相等的。在一些实施场景中，本领域技术人员也可以根据应用需求进行权重调整，本公开对此不做限制。沿用上述例子，通过对各个单词的第一梯度值进行加权求和，可以得到目标问题“who was the captain of the brazil football team before neymar”与候选知识四元组《neymar,awarded,south american footballer,2012》的第二梯度值t1。
[0130]
此外应当理解，基于上述示例中的方法，还可以分别计算得到所述目标问题与其他的候选知识四元组2-11的第二梯度值，并得到对应的第二梯度值t2至t11，本公开对此不做赘述。
[0131]
在步骤s43中，根据第二梯度值确定目标问题和所述目标候选知识四元组的匹配度。
[0132]
例如在一种可能的实施方式中，可以对计算得到的各个第二梯度值进行归一化处理，将所述目标候选知识四元组的第二梯度值的归一化结果，作为所述目标候选知识四元组与所述目标问题的匹配度。
[0133]
沿用上述例子，可以对第二梯度值t1-t11进行归一化处理，得到的所述目标问题与各个候选知识四元组的匹配度如表1所示：
[0134]
序号候选知识四元组匹配度1《neymar,awarded,south american footballer,2012》02《brazil nationalteam,awarded,world cupchampion,1970》0.023《miranda,joined,brazil nationalteam,2007》04《neymar,awarded,fifa ference puskas award,2012》0.015《neymar,positionheld,captainof brazil nationalteam,2014》0.846《dunga,coach,brazil nationalteam,2014》07《neymar,joined,barcelona,2013》08《brazil nationalteam,awarded,world cupchampion,1994》0.119《brazil nationalteam,awarded,confederations cup,2005》0.0110《pimenta,coach,brazil nationalteam,1937》011《neymar,joined,paris saint-germain,2017》0.01
[0135]
表1
[0136]
请参照图2，在获得各个候选知识四元组与所述目标问题的匹配度之后，在步骤
s113中，将匹配度最高的候选知识四元组作为目标知识四元组。
[0137]
沿用上述表1的例子，则可以将候选知识四元组《neymar,positionheld,captainof brazil nationalteam,2014》作为所述目标知识四元组。
[0138]
值得注意的是，本公开中，目标知识四元组与目标问题的匹配度所满足的预设匹配度条件是可以根据应用需求进行设置的。在一些可能的实施场景中，也可以选择匹配度较高的其他候选知识四元组作为所述目标知识四元组。在一些可能的实施场景中，也可以设置匹配度阈值，从而选择匹配度大于匹配度阈值的候选知识四元组作为所述目标候选知识四元组，本公开对此不做限制。
[0139]
仍参照图1，在步骤s12中，提取目标知识四元组所包括的时间信息。
[0140]
在步骤s13中，将目标问题与时间信息融合，得到问题表示；
[0141]
图5是本公开所示出的一种目标问题与时间信息的融合流程图，如图5所示，所述将所述目标问题与所述时间信息融合，得到问题表示(步骤s13)，包括：
[0142]
在步骤s131中，通过注意力模块对目标问题和目标知识四元组进行信息提取，得到第四编码向量。
[0143]
这里，参照图6所示出的一种信息提取的流程图，通过注意力模块对所述目标问题和所述目标知识四元组进行信息提取，得到第四编码向量(步骤s131)，可以包括：
[0144]
s61，对目标问题中的每一词，获取所述词的第三编码向量，以及目标知识四元组的第五编码向量；基于注意力模块对第三编码向量以及第五编码向量进行信息提取，得到第六编码向量。
[0145]
沿用表1的例子，在计算目标问题与目标知识四元组(即候选知识四元组5)的相似度时，可以计算所述目标问题中的各个单词的第三编码向量，以及候选知识四元组5的第五编码向量。例如，可以计算单词neymar的第三编码向量，并通过点乘注意力模块对单词neymar的第三编码向量以及所述第五编码向量进行信息提取，得到单词neymar的第六编码向量。
[0146]
相应的，还可以通过这样的方式，对所述目标问题中的其他单词的第三编码向量以及所述第五编码向量进行特征提取，从而得到所述单词的第六编码向量。
[0147]
需要说明的是，上述示例中以注意力模块为点乘注意力模块为例，对第三编码向量以及第五编码向量的信息提取方式进行了说明。但是，本领域技术人员应当知晓，在具体实施时，所述注意力模块也可以为其他注意力模块，如连接注意力模块、减法注意力模块等等。在一些实施场景中，也可以将多种注意力模块结合使用。
[0148]
例如，在一种可能的实施方式中，所述注意力模块包括连接注意力模块、点乘注意力模块以及减法注意力模块。在这种情况下，所述基于注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第六编码向量，包括：
[0149]
基于所述连接注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第一候选编码向量；基于所述点乘注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第二候选编码向量；基于所述减法注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第三候选编码向量；
[0150]
对所述第一候选编码向量、所述第二候选编码向量以及所述第三候选编码向量进行加权求和，得到所述第六编码向量。
[0151]
示例地，可以通过连接注意力模块对单词neymar的第三编码向量以及所述第五编码向量进行信息提取，得到单词neymar的第一候选编码向量；可以通过点乘注意力模块对单词neymar的第三编码向量以及所述第五编码向量进行信息提取，得到单词neymar的第二候选编码向量；可以通过减法注意力模块对单词neymar的第三编码向量以及所述第五编码向量进行信息提取，得到单词neymar的第三候选编码向量。这样，可以对所述第一候选编码向量、所述第二候选编码向量以及所述第三候选编码向量进行加权求和，得到所述第六编码向量。其中，各个注意力模块的权重可以是相等的。通过这样的方式，能够结合各个注意力模块进行信息提取，有助于提升信息提取的准确度。在一些可能的实施场景中，基于应用场景的需求，各个注意力模块的权重也可以是不相等的，本领域技术人员可以基于应用需求对所述权重进行选择和设置，本公开对此不做限制。
[0152]
s62，对各个词的第六编码向量进行加权求和，得到所述第四编码向量。
[0153]
通过注意力模块进行特征提取，能够对目标问题和目标知识四元组中的干扰信息进行筛除，降低干扰信息在第四编码向量中的比重。
[0154]
参照图5，在步骤s132中，确定目标问题中的与目标知识四元组匹配度最高的目标词。
[0155]
这里，例如可以将目标问题中的各个词与所述目标知识四元组进行匹配度计算，从而将匹配度最高的词作为所述目标词。在确定某个词与所述目标知识四元组的匹配度时，可以对所述词的第三编码向量和所述目标知识四元组的第五编码向量进行梯度计算，从而根据计算得到的梯度值确定所述词与所述目标知识四元组的匹配度。在一些实施方式中，还可以对计算得到的各个词的梯度值进行归一化，将各个词的梯度值的归一化结果作为该词与所述目标知识四元组的匹配度。
[0156]
步骤s133，为目标词和时间信息设定权重值，目标词的权重值小于时间信息的权重值。
[0157]
这里，权重值例如可以基于目标词与目标知识四元组的匹配度确定。沿用表1的例子，目标词为neymar，其与目标知识四元组《neymar,position held,captain of brazil national team,2014》的匹配度为91％。在设定权重时，可以将时间信息的权重值设为91％，并将目标问题中的目标词neymar的权重值设置为9％。
[0158]
步骤s134，将权重值以及时间信息添加至第四编码向量，得到问题表示。
[0159]
这里，例如可以结合门控机制进行信息融合，从而使得目标知识四元组中的时间信息能够融合至问题表示中，并减少干扰信息的融入。这样，目标问题中的词neymar的权重降低，并引入了权重较高时间信息。通过这样的方式，搜索目标的侧重点由“who was the captain of the brazil football team before neymar”转变为“who was the captain of the brazil football team before 2014”。
[0160]
在步骤s14中，基于问题表示以及时序知识图谱，输出目标问题的应答信息。
[0161]
示例地，可以将问题表示和时序知识图谱输入至多层感知机(multilayer perceptron，mlp)模块，从而获得目标问题的应答信息，并输出目标问题的应答信息。其中，通过多层感知机生成问答结果的方式请参照相关技术中的说明，为了说明书的简洁，本公开对此不做赘述。
[0162]
上述技术方案在接收到目标问题时，可以从时序知识图谱中获取与所述目标问题
相匹配的目标知识四元组，并提取所述目标知识四元组的时间信息。由于目标知识四元组与所述目标问题相匹配，因此可以将目标知识四元组中的时间信息作为所述目标问题的时间参照。这样，可以将所述时间信息与所述目标问题进行融合，从而得到包括时间信息的问题表示，并根据所述问题表示以及所述时序知识图谱，输出所述目标问题的应答信息。也就是说，上述技术方案可以提取目标问题中隐含的时间信息，并将时间信息融合到问题表示中，从而为答案搜索提供时间参照。通过这样的方式，有助于提升应答结果的准确度。
[0163]
基于同一发明构思，本公开还提供一种问答装置。图7是本公开所示出的一种问答装置的框图，参照图7，所述问答装置包括：
[0164]
第一确定模块701，用于响应于接收到目标问题，根据所述目标问题从时序知识图谱中确定目标知识四元组，所述目标知识四元组与所述目标问题的匹配度满足预设匹配度条件；
[0165]
第一提取模块702，用于提取所述目标知识四元组所包括的时间信息；
[0166]
第一融合模块703，用于将所述目标问题与所述时间信息融合，得到问题表示；
[0167]
输出模块704，用于基于所述问题表示以及所述时序知识图谱，输出所述目标问题的应答信息。
[0168]
上述技术方案在接收到目标问题时，可以从时序知识图谱中获取与所述目标问题相匹配的目标知识四元组，并提取所述目标知识四元组的时间信息。由于目标知识四元组与所述目标问题相匹配，因此可以将目标知识四元组中的时间信息作为所述目标问题的时间参照。这样，可以将所述时间信息与所述目标问题进行融合，从而得到包括时间信息的问题表示，并根据所述问题表示以及所述时序知识图谱，输出所述目标问题的应答信息。也就是说，上述技术方案可以提取目标问题中隐含的时间信息，并将时间信息融合到问题表示中，从而为答案搜索提供时间参照。通过这样的方式，有助于提升应答结果的准确度。
[0169]
可选地，所述第一确定模块701，包括：
[0170]
第一获取子模块，用于从所述时序知识图谱中获取多个候选知识四元组；
[0171]
第一计算子模块，用于计算各所述候选知识四元组与所述目标问题的匹配度；
[0172]
第一执行子模块，用于将匹配度最高的候选知识四元组作为所述目标知识四元组。
[0173]
可选地，所述第一获取子模块，包括：
[0174]
第一确定子单元，用于根据所述目标问题，确定第一编码向量；
[0175]
第二确定子单元，用于确定所述时序知识图谱中的各个知识四元组的第二编码向量；
[0176]
第一计算子单元，用于计算所述第一编码向量与各个第二编码向量的相似度；
[0177]
第一执行子单元，用于将相似度较高的目标第二编码向量所对应的知识四元组作为所述候选知识四元组。
[0178]
可选地，所述第一计算子模块，包括：
[0179]
第二执行子模块，用于对所述目标问题中的每一词，执行如下操作：
[0180]
获取所述词的第三编码向量，以及目标候选知识四元组的目标第二编码向量，其中，所述目标候选知识四元组为所述多个候选知识四元组中的任一知识四元组；计算所述第三编码向量与所述目标第二编码向量的梯度值，得到所述词的第一梯度值；
[0181]
第二计算子模块，用于对各个词的第一梯度值进行加权求和，得到所述目标问题和所述目标候选知识四元组的第二梯度值；
[0182]
第一确定子模块，用于根据所述第二梯度值确定所述目标问题和所述目标候选知识四元组的匹配度。
[0183]
可选地，所述第一确定子模块，包括：
[0184]
第二计算子单元，用于对计算得到的各个第二梯度值进行归一化处理；
[0185]
第二执行子单元，用于将所述目标候选知识四元组的第二梯度值的归一化结果，作为所述目标候选知识四元组与所述目标问题的匹配度。
[0186]
可选地，所述第一融合模块703，包括：
[0187]
信息提取子模块，用于通过注意力模块对所述目标问题和所述目标知识四元组进行信息提取，得到第四编码向量；
[0188]
第二确定子模块，用于确定所述目标问题中的与所述目标知识四元组匹配度最高的目标词；
[0189]
第三执行子模块，用于为所述目标词和所述时间信息设定权重值，所述目标词的权重值小于所述时间信息的权重值；
[0190]
融合子模块，用于将所述权重值以及所述时间信息添加至所述第四编码向量，得到所述问题表示。
[0191]
可选地，所述信息提取子模块，包括：
[0192]
第三执行子单元，用于对所述目标问题中的每一词，执行如下操作：
[0193]
获取所述词的第三编码向量，以及目标知识四元组的第五编码向量；基于注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第六编码向量；
[0194]
第三计算子单元，对各个词的第六编码向量进行加权求和，得到所述第四编码向量。
[0195]
可选地，所述注意力模块包括连接注意力模块、点乘注意力模块以及减法注意力模块，所述第三执行子单元，用于：
[0196]
基于所述连接注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第一候选编码向量；
[0197]
基于所述点乘注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第二候选编码向量；
[0198]
基于所述减法注意力模块对所述第三编码向量以及所述第五编码向量进行信息提取，得到第三候选编码向量；
[0199]
对所述第一候选编码向量、所述第二候选编码向量以及所述第三候选编码向量进行加权求和，得到所述第六编码向量。
[0200]
关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。
[0201]
本公开还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开所提供的问答方法的步骤。
[0202]
本公开还提供一种电子设备，包括：
[0203]
存储器，其上存储有计算机程序；
[0204]
处理器，用于执行所述存储器中的所述计算机程序，以实现本公开所提供的问答方法的步骤。
[0205]
图8是根据一示例性实施例示出的一种电子设备800的框图。如图8所示，该电子设备800可以包括：处理器801，存储器802。该电子设备800还可以包括多媒体组件803，输入/输出(i/o)接口804，以及通信组件805中的一者或多者。
[0206]
其中，处理器801用于控制该电子设备800的整体操作，以完成上述的问答方法的步骤中的全部或部分步骤。存储器802用于存储各种类型的数据以支持在该电子设备800的操作，这些数据例如可以包括用于在该电子设备800上操作的任何应用程序或方法的指令，以及应用程序相关的数据，例如联系人数据、收发的消息、图片、音频、视频等等。该存储器802可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(static random access memory，简称sram)，电可擦除可编程只读存储器(electrically erasable programmable read-only memory，简称eeprom)，可擦除可编程只读存储器(erasable programmable read-only memory，简称eprom)，可编程只读存储器(programmable read-only memory，简称prom)，只读存储器(read-only memory，简称rom)，磁存储器，快闪存储器，磁盘或光盘。多媒体组件803可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器802或通过通信组件805发送。音频组件还包括至少一个扬声器，用于输出音频信号。i/o接口804为处理器801和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件805用于该电子设备800与其他设备之间进行有线或无线通信。无线通信，例如wi-fi，蓝牙，近场通信(near field communication，简称nfc)，2g、3g、4g、nb-iot、emtc、或其他5g等等，或它们中的一种或几种的组合，在此不做限定。因此相应的该通信组件805可以包括：wi-fi模块，蓝牙模块，nfc模块等等。
[0207]
在一示例性实施例中，电子设备800可以被一个或多个应用专用集成电路(application specific integrated circuit，简称asic)、数字信号处理器(digital signal processor，简称dsp)、数字信号处理设备(digital signal processing device，简称dspd)、可编程逻辑器件(programmable logic device，简称pld)、现场可编程门阵列(field programmable gate array，简称fpga)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的问答方法。
[0208]
在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，该程序指令被处理器执行时实现上述的问答方法的步骤。例如，该计算机可读存储介质可以为上述包括程序指令的存储器802，上述程序指令可由电子设备800的处理器801执行以完成上述的问答方法。
[0209]
在另一示例性实施例中，还提供一种计算机程序产品，该计算机程序产品包含能够由可编程的装置执行的计算机程序，该计算机程序具有当由该可编程的装置执行时用于执行上述的问答方法的代码部分。
[0210]
以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，可以对本公开的技术方案进行多种简
单变型，这些简单变型均属于本公开的保护范围。
[0211]
另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合，为了避免不必要的重复，本公开对各种可能的组合方式不再另行说明。
[0212]
此外，本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：基于语义分析的威胁情报提取方法和系统与流程

问答方法、装置、存储介质及电子设备与流程

相关文献

最热文献