一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

智能问答方法、装置、设备及可读存储介质与流程

2023-02-06 14:41:33 来源:中国专利 TAG:


1.本技术涉及智能问答技术领域,更具体的说,是涉及一种智能问答方法、装置、设备及可读存储介质。


背景技术:

2.智能问答系统是信息检索的一种高级形式,能够更加准确地理解用户用自然语言提出的问题,并通过检索语料库、知识图谱或问答知识库返回简洁、准确的匹配答案。智能问答系统通过对海量的问答信息进行有序和科学的整理,建立基于知识的分类模型,这些分类模型可以为新增的问题和服务找到对应的答案,节约人力成本,提高信息处理的自动性。
3.现有的智能问答技术方案主要有:基于常见问题解答的问答系统(faq)、基于知识图谱的自然语言问答系统(kbqa)等相关技术。基于常见问题解答的问答系统(faq),依赖由专家人工梳理的标准问题库,其问答效果受制于标准问题库集合的规模与质量。基于知识图谱的自然语言问答系统(kbqa),在某些场景下(比如,对于解释或原因等类型的问题),其问答效果也有待提升。
4.因此,如何提供一种问答效果较好的智能问答方法,成为本领域技术人员亟待解决的技术问题。


技术实现要素:

5.鉴于上述问题,本技术提出了一种智能问答方法、装置、设备及可读存储介质。具体方案如下:
6.一种智能问答方法,所述方法包括:
7.获取用户输入的问题;
8.基于所述用户输入的问题与预设常见问题问答库,确定第一答案;
9.确定所述用户输入的问题在预设知识图谱中的答案路径序列,并基于所述用户输入的问题在预设知识图谱中的答案路径序列生成第二答案;
10.基于所述用户输入的问题在预设知识图谱中的答案路径序列进行问题生成,得到生成的问题;
11.基于所述生成的问题与所述常见问题答案库,确定第三答案;
12.从所述第一答案、所述第二答案以及所述第三答案中,确定出置信度最高的作为所述用户输入的问题对应的最终答案。
13.可选地,所述基于所述用户输入的问题与预设常见问题问答库,确定第一答案,包括:
14.利用所述用户输入的问题在所述预设常见问题问答库中进行检索,得到第一候选问题集合,所述第一候选问题集合中的问题是与所述用户输入的问题相关的;
15.计算所述用户输入的问题与所述第一候选问题集合中问题的语义相似度;
16.将所述第一候选问题集合中与所述用户输入的问题语义相似度最高的问题的答案确定为第一答案。
17.可选地,所述计算所述用户输入的问题与所述第一候选问题集合中问题的语义相似度,包括:
18.将所述用户输入的问题与所述第一候选问题集合中问题输入语义相似度计算模型,所述语义相似度计算模型输出所述用户输入的问题与所述第一候选问题集合中问题的语义相似度;
19.所述语义相似度计算模型是以由训练样本问题、所述训练样本问题的正样本问题以及所述训练样本问题的负样本问题组成的样本三元组作为训练样本,以所述语义相似度计算模型得到的正样本问题的向量表示尽可能接近所述训练样本问题的向量表示,以所述负样本问题的向量表示尽可能远离所述训练样本问题的向量表示为训练目标训练得到的。
20.可选地,所述基于所述用户输入的问题在预设知识图谱中的答案路径序列进行问题生成,得到生成的问题,包括:
21.基于预设的生成策略,对所述用户输入的问题在预设知识图谱中的答案路径序列进行处理,得到生成的问题,所述生成策略包括路径拼接、实体消融、宾语前置、概念替换、句式变换中的任意一种或多种。
22.可选地,所述基于所述生成的问题与所述常见问题答案库,确定第三答案,包括:
23.利用所述生成的问题在所述预设常见问题问答库中进行检索,得到第二候选问题集合,所述第二候选问题集合中的问题是与所述生成的问题相关的;
24.计算所述生成的问题与所述第二候选问题集合中问题的语义相似度;
25.将所述第二候选问题集合中与所述生成的问题语义相似度最高的问题的答案确定为第三答案。
26.可选地,所述计算所述生成的问题与所述第二候选问题集合中问题的语义相似度,包括:
27.将所述生成的问题与所述第二候选问题集合中问题输入所述语义相似度计算模型,所述语义相似度计算模型输出所述生成的问题与所述第二候选问题集合中问题的语义相似度。
28.可选地,当用户输入的问题为多轮交互中的第一个问题时,在从所述第一答案、所述第二答案以及所述第三答案中,确定出置信度最高的作为所述用户输入的问题对应的最终答案之后,所述方法还包括:
29.获取用户追问的问题;
30.基于所述预设知识图谱对所述用户追问的问题进行补充,得到补充后的问题;
31.基于所述补充后的问题与所述常见问题答案库,确定所述用户追问的问题对应的答案。
32.可选地,所述基于所述补充后的问题与所述常见问题答案库,确定所述用户追问的问题对应的答案,包括:
33.利用所述补充后的问题在所述预设常见问题问答库中进行检索,得到第三候选问题集合,所述第三候选问题集合中的问题是与所述补充后的问题相关的;
34.计算所述补充后的问题与所述第三候选问题集合中问题的语义相似度;
35.将所述第三候选问题集合中与所述补充后的问题语义相似度最高的问题的答案确定为所述用户追问的问题对应的答案。
36.一种智能问答装置,所述装置包括:
37.用户输入的问题获取单元,用于获取用户输入的问题;
38.第一答案确定单元,用于基于所述用户输入的问题与预设常见问题问答库,确定第一答案;
39.第二答案确定单元,用于确定所述用户输入的问题在预设知识图谱中的答案路径序列,并基于所述用户输入的问题在预设知识图谱中的答案路径序列生成第二答案;
40.问题生成单元,用于基于所述用户输入的问题在预设知识图谱中的答案路径序列进行问题生成,得到生成的问题;
41.第三答案确定单元,用于基于所述生成的问题与所述常见问题答案库,确定第三答案;
42.最终答案确定单元,用于从所述第一答案、所述第二答案以及所述第三答案中,确定出置信度最高的作为所述用户输入的问题对应的最终答案。
43.可选地,所述第一答案确定单元,包括:
44.第一候选问题集合确定单元,用于利用所述用户输入的问题在所述预设常见问题问答库中进行检索,得到第一候选问题集合,所述第一候选问题集合中的问题是与所述用户输入的问题相关的;
45.第一语义相似度计算单元,用于计算所述用户输入的问题与所述第一候选问题集合中问题的语义相似度;
46.第一确定单元,用于将所述第一候选问题集合中与所述用户输入的问题语义相似度最高的问题的答案确定为第一答案。
47.可选地,所述第一语义相似度计算单元,具体用于:
48.将所述用户输入的问题与所述第一候选问题集合中问题输入语义相似度计算模型,所述语义相似度计算模型输出所述用户输入的问题与所述第一候选问题集合中问题的语义相似度;
49.所述语义相似度计算模型是以由训练样本问题、所述训练样本问题的正样本问题以及所述训练样本问题的负样本问题组成的样本三元组作为训练样本,以所述语义相似度计算模型得到的正样本问题的向量表示尽可能接近所述训练样本问题的向量表示,以所述负样本问题的向量表示尽可能远离所述训练样本问题的向量表示为训练目标训练得到的。
50.可选地,所述问题生成单元,具体用于:
51.基于预设的生成策略,对所述用户输入的问题在预设知识图谱中的答案路径序列进行处理,得到生成的问题,所述生成策略包括路径拼接、实体消融、宾语前置、概念替换、句式变换中的任意一种或多种。
52.可选地,所述第三答案确定单元,包括:
53.第二候选问题集合确定单元,用于利用所述生成的问题在所述预设常见问题问答库中进行检索,得到第二候选问题集合,所述第二候选问题集合中的问题是与所述生成的问题相关的;
54.第二语义相似度计算单元,用于计算所述生成的问题与所述第二候选问题集合中
问题的语义相似度;
55.第二确定单元,用于将所述第二候选问题集合中与所述生成的问题语义相似度最高的问题的答案确定为第三答案。
56.可选地,所述第二语义相似度计算单元,具体用于:
57.将所述生成的问题与所述第二候选问题集合中问题输入所述语义相似度计算模型,所述语义相似度计算模型输出所述生成的问题与所述第二候选问题集合中问题的语义相似度。
58.可选地,所述装置还包括:
59.用户追问的问题获取单元,用于当用户输入的问题为多轮交互中的第一个问题时,在从所述第一答案、所述第二答案以及所述第三答案中,确定出置信度最高的作为所述用户输入的问题对应的最终答案之后,获取用户追问的问题;
60.问题补充单元,用于基于所述预设知识图谱对所述用户追问的问题进行补充,得到补充后的问题;
61.用户追问的问题答案确定单元,用于基于所述补充后的问题与所述常见问题答案库,确定所述用户追问的问题对应的答案。
62.可选地,所述用户追问的问题答案确定单元,包括:
63.第三候选问题集合确定单元,用于利用所述补充后的问题在所述预设常见问题问答库中进行检索,得到第三候选问题集合,所述第三候选问题集合中的问题是与所述补充后的问题相关的;
64.第三语义相似度计算单元,用于计算所述补充后的问题与所述第三候选问题集合中问题的语义相似度;
65.第三确定单元,用于将所述第三候选问题集合中与所述补充后的问题语义相似度最高的问题的答案确定为所述用户追问的问题对应的答案。
66.一种智能问答设备,包括存储器和处理器;
67.所述存储器,用于存储程序;
68.所述处理器,用于执行所述程序,实现如上所述的智能问答方法的各个步骤。
69.一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的智能问答方法的各个步骤。
70.借由上述技术方案,本技术公开了一种智能问答方法、装置、设备及可读存储介质。在获取用户输入的问题之后,先基于用户输入的问题与预设常见问题问答库,确定第一答案;然后,确定用户输入的问题在预设知识图谱中的答案路径序列,并基于用户输入的问题在预设知识图谱中的答案路径序列生成第二答案,基于用户输入的问题在预设知识图谱中的答案路径序列进行问题生成,得到生成的问题,再基于生成的问题与常见问题答案库,确定第三答案,最后从第一答案、第二答案以及第三答案中,确定出置信度最高的作为用户输入的问题对应的最终答案。本方案中,同时利用预设常见问题问答库及预设知识图谱,采用多种处理方式,生成多个答案,再从多个答案中确定出置信度最高的为最终答案,在一定程度上来说,提升了问答效果。
附图说明
71.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
72.图1为本技术实施例公开的一种智能问答方法的流程示意图;
73.图2为本技术实施例公开的一种智能问答装置结构示意图;
74.图3为本技术实施例公开的一种智能问答设备的硬件结构框图。
具体实施方式
75.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
76.为了更深入理解本案,本案发明人首先对现有的智能问答系统及其不足之处进行详细说明。
77.现有的智能问答系统主要有:基于常见问题解答的问答系统(faq)、基于知识图谱的自然语言问答系统(kbqa)。
78.基于常见问题解答的问答系统(faq),是一种检索式问答系统,从已有回答的问题中返回与当前问题最相近的问题的答案。通常情况是给定标准问题库,系统需要将用户输入的问题匹配用户最想问的问题上。用户输入的问题通常是短文本,标准问题库是一个封闭的集合。每个标准问题都有固定答案和标题,同时会有多个扩展问法和关键词。模型所需要解决的是给定问题,找到标准问题里用户最接受的答案。
79.基于知识图谱的自然语言问答系统(kbqa),是一种基于知识图谱的问答,基于知识图谱问答技术,从结构化的信息中对答案进行推理。用户输入问题后,基于知识图谱的自然语言问答系统(kbqa)基于机器学习算法对用户查询的问题进行解析、理解,并对知识图谱中的结构化信息进行查询、推理,最终将查询到的精确答案返回给用户。相比于常见问题解答的问答系统(faq)、基于知识图谱的自然语言问答系统(kbqa)可以进行自然语言查询、多跳查询、结束过滤,更好地处理用户的复杂问题。
80.但是,基于常见问题解答的问答系统(faq),此类方案依赖由专家人工梳理的标准问题库,其问答效果受制于标准问题库集合的规模与质量。该方法虽然可以针对用户提出的问题给出专业的自动解答,但是需要耗费高成本的人力整理标准问题库。而由于问答对的数量有限,可能会不包含用户提问的相关问题,从而无法返回正确答案。此外,该方法对训练数据的利用率较低,无法充分利用标注问题集合里的信息来提升问答效果。
81.基于知识图谱的自然语言问答系统(kbqa),虽然可以利用图谱中丰富的语义关联信息,能够深入了解用户的问题并给出答案。但是该方法的模型和计算的复杂度都很高,在用户输入问题后,问答模型需要经过实体识别、实体链接、实体消歧、知识推理等模块。而且此方法提供的答案往往较短,对于解释或原因等类型的问题问答效果较差。
82.鉴于现有的智能问答系统存在的问题,本案发明人进行了深入研究,最终提出了一种智能问答方法。
83.接下来,通过下述实施例对本技术提供的智能问答方法进行介绍。
84.参照图1,图1为本技术实施例公开的一种智能问答方法的流程示意图,该方法可以包括:
85.步骤s101:获取用户输入的问题。
86.步骤s102:基于所述用户输入的问题与预设常见问题问答库,确定第一答案。
87.在本技术中,可以基于所述用户输入的问题与预设常见问题问答库中各问题的语义相似度,确定第一答案。作为一种可实施方式,可以采用语义相似度模型计算所述用户输入的问题与预设常见问题问答库中各问题的语义相似度。
88.语义相似度模型一般通过计算语句之间的距离,再转换为相似度。计算语句之间的距离需要先对语句进行表示学习,一种是特征工程方法,先对语句进行特征学习,如bert、bow、tf-idf,另一种是深度模型方法,通过神经网络构建文本表示与特征抽取。
89.在本技术中,可以采用问答语料作为训练样本进行训练得到语义相似度模型。具体地,将在后面的实施例详细说明。
90.步骤s103:确定所述用户输入的问题在预设知识图谱中的答案路径序列,并基于所述用户输入的问题在预设知识图谱中的答案路径序列生成第二答案。
91.在本技术中,可以对用户输入的问题进行语义解析,得到问题特征,并将问题特征与预设知识图谱中的实体、关系、属性进行链接,得到用户输入的问题在预设知识图谱中的答案路径序列,并基于用户输入的问题在预设知识图谱中的答案路径序列生成自然语言形式的第二答案。
92.步骤s104:基于所述用户输入的问题在预设知识图谱中的答案路径序列进行问题生成,得到生成的问题。
93.在本技术中,可以按多种组合策略对用户输入的问题在预设知识图谱中的答案路径序列进行处理和变化,得到生成的问题,具体实现方式将在后面的实施例详细说明,此处不再展开描述。
94.步骤s105:基于所述生成的问题与所述常见问题答案库,确定第三答案。
95.在本技术中,可以基于所述生成的问题与预设常见问题问答库中各问题的语义相似度,确定第三答案。作为一种可实施方式,也可以采用语义相似度模型计算所述生成的问题与预设常见问题问答库中各问题的语义相似度。
96.步骤s106:从所述第一答案、所述第二答案以及所述第三答案中,确定出置信度最高的作为所述用户输入的问题对应的最终答案。
97.在本技术中,可以采用多种方式计算各个答案的置信度。作为一种可实施方式,可以对所述第一答案、所述第二答案以及所述第三答案进行文本蕴含计算,判断问题和答案之间的包含关系并对答案进行打分作为答案的置信度得分。
98.本实施例公开了一种智能问答方法。在获取用户输入的问题之后,先基于用户输入的问题与预设常见问题问答库,确定第一答案;然后,确定用户输入的问题在预设知识图谱中的答案路径序列,并基于用户输入的问题在预设知识图谱中的答案路径序列生成第二答案,基于用户输入的问题在预设知识图谱中的答案路径序列进行问题生成,得到生成的问题,再基于生成的问题与常见问题答案库,确定第三答案,最后从第一答案、第二答案以及第三答案中,确定出置信度最高的作为用户输入的问题对应的最终答案。本方案中,同时
利用预设常见问题问答库及预设知识图谱,采用多种处理方式,生成多个答案,再从多个答案中确定出置信度最高的为最终答案,在一定程度上来说,提升了问答效果。
99.在本技术的另一个实施例中,对步骤s102所述基于所述用户输入的问题与预设常见问题问答库,确定第一答案的具体实现方式进行说明,该方式可以包括如下步骤:
100.步骤s201:利用所述用户输入的问题在所述预设常见问题问答库中进行检索,得到第一候选问题集合,所述第一候选问题集合中的问题是与所述用户输入的问题相关的。
101.作为一种可实施方式,第一候选问题集合中的问题的mention是与所述用户输入的问题的mention相同的。
102.步骤s202:计算所述用户输入的问题与所述第一候选问题集合中问题的语义相似度。
103.作为一种可实施方式,可以将所述用户输入的问题与所述第一候选问题集合中问题输入语义相似度计算模型,所述语义相似度计算模型输出所述用户输入的问题与所述第一候选问题集合中问题的语义相似度。
104.采用对比学习的方法进行训练可以在少量训练样本的条件下训练得到效果较好的模型,因此,作为一种可实施方式,在本技术中可以采用对比学习的方法训练得到语义相似度计算模型,具体的,可以以由训练样本问题、所述训练样本问题的正样本问题以及所述训练样本问题的负样本问题组成的样本三元组作为训练样本,以所述语义相似度计算模型得到的正样本问题的向量表示尽可能接近所述训练样本问题的向量表示,以所述负样本问题的向量表示尽可能远离所述训练样本问题的向量表示为训练目标训练得到语义相似度模型。
105.需要说明的是,在确定训练样本问题之后,可以基于所述预设知识图谱,确定所述训练样本问题的正样本问题以及所述训练样本问题的负样本问题。具体的,可以根据训练样本问题的mention,基于预设知识图谱中确定与其相关的问题作为训练样本问题的正样本问题,不相关的问题作为训练样本问题的负样本问题。
106.为便于理解,假设训练样本问题为“带多少钱可以入住神泉度假酒店”,其正样本问题可以为“神泉度假酒店的平均价格是多少”,其负样本问题可以为“神泉度假酒店的建议游玩时长是”、“颐和园宿云檐什么时候对外开放”。
107.在语义相似度计算模型训练阶段,可以将样本三元组分batch送入bert模型中取[cls]编码,并使用两次dropout对三元组进行数据增强,再基于online triplet mining策略对每个batch扩增后的输入,动态地计算hard-triplets和semi-hard triplets真正用于下游的对比学习任务。最后,将triplets分别送入两个独立的模型进行下游微调,针对每个triplet而言,正例为自身的entailment,而同一batch中的其余路径均作为负例,两个编码器loss的核心思想都是:使得语义相似的样本,其embedding在embedding空间尽可能接近,而语义不同的样本,其embedding距离尽可能拉远。triplet loss可定义为:
[0108][0109]
其中,h为句子的pooler向量,d(
·
,
·
)为欧几里得距离,margin为控制正负例间的软间隔,当负样本与正样本之间的间隔大于margin,损失函数便不再对其惩罚。contrastive loss又称为infonce loss,可定义为:
[0110][0111]
上式中h取句子的[cls]向量,sim(
·
,
·
)为句子间的语义相似度,可由归一化句子向量的点积得到,τ为温度系数,其通过同比例放大负样本logist值,来对句子间的语义相似度进行修正,使得模型更新的重点,聚集到有区分难度的负例上,即与h距离越近的负样本,其分配到的惩罚越大。在模型预测的前向计算阶段,将query及其在图谱中召回的候选答案路径分别输入两个独立编码器进行相似度计算,并以sigmoid平均的方式进行模型融合,最终输出平均后的相似度矩阵作为模型预测结果。实验证明,基于contrastive loss训练的模型为单模最优模型,并且模型融合后f1值略有上升,基于对比学习的方式,在少量样本条件下即可学习到泛化性能较好的模型。
[0112]
步骤s203:将所述第一候选问题集合中与所述用户输入的问题语义相似度最高的问题的答案确定为第一答案。
[0113]
为便于理解,假设用户输入的问题为“刘德华的妻子叫什么”,第一候选问题集合中包括“刘德华是谁?”“刘德华的妻子是谁?”“刘德华是哪里人?”这三个问题,其中“刘德华的妻子是谁?”这一问题与“刘德华的妻子叫什么”的语义相似度最高,则“刘德华的妻子是谁?”这一问题的答案即为第一答案。
[0114]
在本技术的另一个实施例中,对步骤s104基于所述用户输入的问题在预设知识图谱中的答案路径序列进行问题生成,得到生成的问题的具体实现方式进行了说明,具体地,可以基于预设的生成策略,对所述用户输入的问题在预设知识图谱中的答案路径序列进行处理,得到生成的问题。
[0115]
需要说明的是,所述生成策略包括路径拼接、实体消融、宾语前置、概念替换、句式变换中的任意一种或多种。其中,路径拼接按照路径序列的顺序,将头实体-关系-尾实体依次拼接为包含主谓宾的自然语言语句,是最基础的生成策略;实体消融将路径中的部分实体略去,将其转换为隐含语义表示;宾语前置调整主语与宾语的相对位置,需要在适当位置添加代词以确保语义上的一致性;概念替换将路径中的部分实体替换为其对应的概念及其上位概念,将明确的领域知识表示转换为模糊语义表示;句式变换将原始陈述句中的部分实体、关系略去,并将其转换为针对缺失部分的疑问句、反问句、设问句等句式。
[0116]
为便于理解,示例性的,假定在音乐知识图谱中,确定的答案路径序列p={(刘德华,歌手,作品,《忘情水》,歌曲),(《忘情水》,歌曲,出自电影,《天与地》,电影)},不同生成策略得到的句子如下:
[0117]
路径拼接:刘德华的作品是《忘情水》,其出自电影为《天与地》。
[0118]
实体消融:刘德华作品的出自电影为《天与地》。
[0119]
宾语前置:《忘情水》是刘德华的作品,《天与地》是它的出自电影。
[0120]
概念替换:歌手刘德华的作品有某个歌曲,其出自电影是一部影视剧。
[0121]
句式变换:刘德华的作品中出自电影为《天与地》的是哪个歌曲?、刘德华的作品《忘情水》,与《天与地》是不是出自电影的关系?
[0122]
在本技术的另一个实施例中,对步骤s105基于所述生成的问题与所述常见问题答案库,确定第三答案的具体实现方式进行了说明,该方式可以包括以下步骤:
[0123]
步骤s301:利用所述生成的问题在所述预设常见问题问答库中进行检索,得到第
二候选问题集合,所述第二候选问题集合中的问题是与所述生成的问题相关的。
[0124]
作为一种可实施方式,第二候选问题集合中的问题的mention是与所述生成的问题的mention相同的。
[0125]
步骤s302:计算所述生成的问题与所述第二候选问题集合中问题的语义相似度。
[0126]
作为一种可实施方式,可以将所述生成的问题与所述第二候选问题集合中问题输入所述语义相似度计算模型,所述语义相似度计算模型输出所述生成的问题与所述第二候选问题集合中问题的语义相似度。
[0127]
步骤s303:将所述第二候选问题集合中与所述生成的问题语义相似度最高的问题的答案确定为第三答案。
[0128]
在一些场景中,智能问答可能会涉及到多轮交互,为了提升问答效率,多轮交互中的第一个问题可以采用上述方式进行处理,多轮交互中的追问问题可以采用其他方式处理,因此,在本技术的另一个实施例中,当用户输入的问题为多轮交互中的第一个问题时,在从所述第一答案、所述第二答案以及所述第三答案中,确定出置信度最高的作为所述用户输入的问题对应的最终答案之后,所述方法还包括:
[0129]
步骤s401:获取用户追问的问题。
[0130]
步骤s402:基于所述预设知识图谱对所述用户追问的问题进行补充,得到补充后的问题。
[0131]
在本技术中,可以参考前述问题生成的相关技术,基于所述预设知识图谱对所述用户追问的问题进行补充,得到补充后的问题,具体不再赘述。
[0132]
步骤s403:基于所述补充后的问题与所述常见问题答案库,确定所述用户追问的问题对应的答案。
[0133]
其中,所述基于所述补充后的问题与所述常见问题答案库,确定所述用户追问的问题对应的答案,包括:利用所述补充后的问题在所述预设常见问题问答库中进行检索,得到第三候选问题集合,所述第三候选问题集合中的问题是与所述补充后的问题相关的;计算所述补充后的问题与所述第三候选问题集合中问题的语义相似度;将所述第三候选问题集合中与所述补充后的问题语义相似度最高的问题的答案确定为所述用户追问的问题对应的答案。
[0134]
作为一种可实施方式,可以将所述补充后的问题与所述第三候选问题集合中问题输入语义相似度计算模型,所述语义相似度计算模型输出所述补充后的问题与所述第三候选问题集合中问题的语义相似度。
[0135]
为便于理解,示例性的,如果用户第一次询问的问题为“刘德华的妻子是谁?”,置信度最高的答案是“刘德华的妻子是朱丽倩,出生于1966年4月6日。”,此时用户进行追问“那她是哪里人?”询问刘德华妻子的国籍信息,此时通过基于知识图谱,对用户的问题进行多次补充,生成一系列问题,“刘德华的妻子是哪里人?”,“朱丽倩是哪里人?”等,并通过语义相似度模型与常见问题问答库寻找合适的答案返回给用户。
[0136]
下面对本技术实施例公开的智能问答装置进行描述,下文描述的智能问答装置与上文描述的智能问答方法可相互对应参照。
[0137]
参照图2,图2为本技术实施例公开的一种智能问答装置结构示意图。如图2所示,该智能问答装置可以包括:
[0138]
用户输入的问题获取单元11,用于获取用户输入的问题;
[0139]
第一答案确定单元12,用于基于所述用户输入的问题与预设常见问题问答库,确定第一答案;
[0140]
第二答案确定单元13,用于确定所述用户输入的问题在预设知识图谱中的答案路径序列,并基于所述用户输入的问题在预设知识图谱中的答案路径序列生成第二答案;
[0141]
问题生成单元14,用于基于所述用户输入的问题在预设知识图谱中的答案路径序列进行问题生成,得到生成的问题;
[0142]
第三答案确定单元15,用于基于所述生成的问题与所述常见问题答案库,确定第三答案;
[0143]
最终答案确定单元16,用于从所述第一答案、所述第二答案以及所述第三答案中,确定出置信度最高的作为所述用户输入的问题对应的最终答案。
[0144]
作为一种可实施方式,所述第一答案确定单元,包括:
[0145]
第一候选问题集合确定单元,用于利用所述用户输入的问题在所述预设常见问题问答库中进行检索,得到第一候选问题集合,所述第一候选问题集合中的问题是与所述用户输入的问题相关的;
[0146]
第一语义相似度计算单元,用于计算所述用户输入的问题与所述第一候选问题集合中问题的语义相似度;
[0147]
第一确定单元,用于将所述第一候选问题集合中与所述用户输入的问题语义相似度最高的问题的答案确定为第一答案。
[0148]
作为一种可实施方式,所述第一语义相似度计算单元,具体用于:
[0149]
将所述用户输入的问题与所述第一候选问题集合中问题输入语义相似度计算模型,所述语义相似度计算模型输出所述用户输入的问题与所述第一候选问题集合中问题的语义相似度;
[0150]
所述语义相似度计算模型是以由训练样本问题、所述训练样本问题的正样本问题以及所述训练样本问题的负样本问题组成的样本三元组作为训练样本,以所述语义相似度计算模型得到的正样本问题的向量表示尽可能接近所述训练样本问题的向量表示,以所述负样本问题的向量表示尽可能远离所述训练样本问题的向量表示为训练目标训练得到的。
[0151]
作为一种可实施方式,所述问题生成单元,具体用于:
[0152]
基于预设的生成策略,对所述用户输入的问题在预设知识图谱中的答案路径序列进行处理,得到生成的问题,所述生成策略包括路径拼接、实体消融、宾语前置、概念替换、句式变换中的任意一种或多种。
[0153]
作为一种可实施方式,所述第三答案确定单元,包括:
[0154]
第二候选问题集合确定单元,用于利用所述生成的问题在所述预设常见问题问答库中进行检索,得到第二候选问题集合,所述第二候选问题集合中的问题是与所述生成的问题相关的;
[0155]
第二语义相似度计算单元,用于计算所述生成的问题与所述第二候选问题集合中问题的语义相似度;
[0156]
第二确定单元,用于将所述第二候选问题集合中与所述生成的问题语义相似度最高的问题的答案确定为第三答案。
[0157]
作为一种可实施方式,所述第二语义相似度计算单元,具体用于:
[0158]
将所述生成的问题与所述第二候选问题集合中问题输入所述语义相似度计算模型,所述语义相似度计算模型输出所述生成的问题与所述第二候选问题集合中问题的语义相似度。
[0159]
作为一种可实施方式,所述装置还包括:
[0160]
用户追问的问题获取单元,用于当用户输入的问题为多轮交互中的第一个问题时,在从所述第一答案、所述第二答案以及所述第三答案中,确定出置信度最高的作为所述用户输入的问题对应的最终答案之后,获取用户追问的问题;
[0161]
问题补充单元,用于基于所述预设知识图谱对所述用户追问的问题进行补充,得到补充后的问题;
[0162]
用户追问的问题答案确定单元,用于基于所述补充后的问题与所述常见问题答案库,确定所述用户追问的问题对应的答案。
[0163]
作为一种可实施方式,所述用户追问的问题答案确定单元,包括:
[0164]
第三候选问题集合确定单元,用于利用所述补充后的问题在所述预设常见问题问答库中进行检索,得到第三候选问题集合,所述第三候选问题集合中的问题是与所述补充后的问题相关的;
[0165]
第三语义相似度计算单元,用于计算所述补充后的问题与所述第三候选问题集合中问题的语义相似度;
[0166]
第三确定单元,用于将所述第三候选问题集合中与所述补充后的问题语义相似度最高的问题的答案确定为所述用户追问的问题对应的答案。
[0167]
参照图3,图3为本技术实施例提供的一种智能问答设备的硬件结构框图,参照图3,智能问答设备的硬件结构可以包括:至少一个处理器1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
[0168]
在本技术实施例中,处理器1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信;
[0169]
处理器1可能是一个中央处理器cpu,或者是特定集成电路asic(application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
[0170]
存储器3可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatile memory)等,例如至少一个磁盘存储器;
[0171]
其中,存储器存储有程序,处理器可调用存储器存储的程序,所述程序用于:
[0172]
获取用户输入的问题;
[0173]
基于所述用户输入的问题与预设常见问题问答库,确定第一答案;
[0174]
确定所述用户输入的问题在预设知识图谱中的答案路径序列,并基于所述用户输入的问题在预设知识图谱中的答案路径序列生成第二答案;
[0175]
基于所述用户输入的问题在预设知识图谱中的答案路径序列进行问题生成,得到生成的问题;
[0176]
基于所述生成的问题与所述常见问题答案库,确定第三答案;
[0177]
从所述第一答案、所述第二答案以及所述第三答案中,确定出置信度最高的作为
所述用户输入的问题对应的最终答案。
[0178]
可选的,所述程序的细化功能和扩展功能可参照上文描述。
[0179]
本技术实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的程序,所述程序用于:
[0180]
获取用户输入的问题;
[0181]
基于所述用户输入的问题与预设常见问题问答库,确定第一答案;
[0182]
确定所述用户输入的问题在预设知识图谱中的答案路径序列,并基于所述用户输入的问题在预设知识图谱中的答案路径序列生成第二答案;
[0183]
基于所述用户输入的问题在预设知识图谱中的答案路径序列进行问题生成,得到生成的问题;
[0184]
基于所述生成的问题与所述常见问题答案库,确定第三答案;
[0185]
从所述第一答案、所述第二答案以及所述第三答案中,确定出置信度最高的作为所述用户输入的问题对应的最终答案。
[0186]
可选的,所述程序的细化功能和扩展功能可参照上文描述。
[0187]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0188]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
[0189]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献