话题引导方法、装置、电子设备及存储介质与流程

2022-09-03 04:32:05 来源：中国专利 TAG：

1.本技术涉及人工智能技术领域，尤其涉及一种话题引导方法、装置、电子设备及存储介质。

背景技术：

2.相关技术中，常用的话题引导方法中一方面是基于实体间的联系引入新知识，需要建立完善的知识图谱，然后识别出用户问题中所提及的实体，进而通过实体间关系作为发散，基于原实体出发进行话题引导回复的生成。但知识图谱的建立需要的成本较高，识别用户问题中的实体受到算法的能力限制较大，并且基于原实体出发进行话题引导回复的生成会造成忽略用户问题本身语义的问题，从而出现语义矛盾。

技术实现要素：

3.有鉴于此，本技术的目的在于提出一种话题引导方法、装置、电子设备及存储介质。
4.基于上述目的，在第一方面，本技术提供了一种话题引导方法，包括：
5.构建语义相关性模型；
6.获取话题语料池和对话向量；
7.利用所述语义相关性模型对所述话题语料池编码以确定语料向量；
8.从所述语料向量中确定与所述对话向量相似度最高的目标语料向量；
9.确定所述对话向量和所述目标语料向量的相关度是否大于或等于预设相关度阈值；
10.响应于所述对话向量和所述目标语料向量的相关度大于或等于所述预设相关度阈值，根据所述目标语料向量生成引导回复语料对话题进行引导。
11.在一种可能的实现方式中，所述构建语义相关性模型，进一步包括：
12.构建话题和语料的信息对；
13.根据所述信息对构建语义相关性模型。
14.在一种可能的实现方式中，所述构建话题和语料的信息对，包括：
15.获取问答文本数据；其中，所述问答文本数据包括：问题文本、答案文本和用于佐证所述问题文本与所述答案文本之间的匹配度的证据文本；
16.根据预设划分规则将所述问答文本数据划分为多个文本段落；
17.利用开源搜索框架在所述多个文本段落中确定与所述证据文本的相关度最高且满足预设数量的目标文本段落；
18.根据所述问答文本数据和所述目标文本段落构建所述信息对。
19.在一种可能的实现方式中，所述根据预设划分规则将所述问答文本数据划分为多个文本段落，包括：
20.以预设字符数为单位对所述问答文本进行划分，得到多个文本段落。在一种可能
的实现方式中，所述以预设字节数为单位对所述问答文本进行划分，得到多个文本段落，包括：
21.以预设字符数为单位从所述问答文本的首个字符开始进行划分，若划分得到的初始文本段落的最后一个字符不是结尾字符，则获取下一个字符，并将获取的字符加入所述初始文本段落，直到获取到结尾字符，并将所述结尾字符加入所述初始文本段落，得到文本段落。
22.在一种可能的实现方式中，所述语料，包括：正样本语料和负样本语料；
23.所述根据所述问答文本数据和所述目标文本段落构建所述信息对，包括：
24.根据所述问题文本确定所述话题；
25.根据所述目标文本段落中包含所述答案文本的目标文本段落确定所述正样本语料；
26.根据所述目标文本段落中不包含所述答案文本的目标文本段落确定所述负样本语料；
27.将所述话题和所述正样本语料与所述负样本语料分别配对以确定所述信息对。
28.在一种可能的实现方式中，所述根据所述信息对构建语义相关性模型，包括：
29.获取基础模型，所述话题的第一词向量和第一位置向量，以及所述语料的第二词向量和第二位置向量；
30.利用所述基础模型对所述第一词向量和第一位置向量进行编码以确定话题段落向量；
31.利用所述基础模型对所述第二词向量和第二位置向量进行编码以确定语料段落向量；
32.根据所述话题段落向量和所述预料段落向量的内积确定所述话题与所述语料的相似度；
33.响应于所述相似度满足目标值，则基于双塔模型根据所述信息对构建所述语义相关性模型。
34.在一种可能的实现方式中，获取所述对话向量，进一步包括：
35.响应于接收到用户话题，获取用户的历史对话记录；
36.利用所述语义相关性模型对所述用户话题和所述历史对话记录编码以确定所述对话向量。
37.在一种可能的实现方式中，所述从所述语料向量中确定与所述对话向量相似度最高的目标语料向量，还包括：
38.将所述语料向量存储于检索工具以建立在线索引；
39.将所述对话向量输入所述检索工具执行所述在线索引，以确定与所述对话向量相似度最高的所述目标语料向量。
40.在一种可能的实现方式中，所述方法还包括：
41.响应于所述对话向量和所述目标语料向量的相关度小于所述预设相关度阈值，确定不对所述话题进行引导。
42.在一种可能的实现方式中，所述方法还包括：
43.响应于所述对话向量和所述目标语料向量的相关度小于所述预设相关度阈值，根
据预设引导回复语料对所述话题进行引导。
44.在第二方面，本技术提供了一种话题引导装置，包括：
45.构建模块，被配置为构建语义相关性模型；
46.获取模块，被配置为获取话题语料池和对话向量；
47.编码模块，被配置为利用所述语义相关性模型对所述话题语料池编码以确定语料向量；
48.第一确定模块，被配置为从所述语料向量中确定与所述对话向量相似度最高的目标语料向量；
49.第二确定模块，被配置为确定所述对话向量和所述目标语料向量的相关度是否大于或等于预设相关度阈值；
50.引导模块，被配置为响应于所述对话向量和所述目标语料向量的相关度大于或等于所述预设相关度阈值，根据所述目标语料向量生成引导回复语料对话题进行引导。
51.在第三方面，本技术提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如第一方面所述的话题引导方法。
52.在第四方面，本技术提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使计算机执行如第一方面所述的话题引导方法。
53.从上面所述可以看出，本技术提供的一种话题引导方法、装置、电子设备及存储介质，构建语义相关性模型，并利用语义相关性模型对获取到的话题语料池进行编码，从而避免了相关技术中依赖话题图谱的构建以及依赖实体词识别的问题，降低了前置任务的人工成本，并且构建的语义相关性模型相比于基于词频进行相关度的确定，进一步提升了相关度确定的准确性。进一步，从语料向量中确定与对话向量相似度最高的目标语料向量，通过确定对话向量和目标语料向量的相关度是否大于或等于预设相关度阈值，进而在对话向量和目标语料向量的相关度大于或等于预设相关度阈值的情况下，根据目标语料向量生成引导回复语料，对话题进行引导，不依赖识别算法的能力，并且在语义相关性模型的编码下，获得的目标语料向量是根据话题语义相关的，能够使得在正确理解用户话题语义的前提下，生成引导回复语料，进而对用户话题进行引导。
附图说明
54.为了更清楚地说明本技术或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
55.图1示出了本技术实施例所提供的一种话题引导方法的示例性流程示意图。
56.图2示出了根据本技术的实施例中话题和语料的信息对的示意图。
57.图3示出了根据本技术的实施例中语义相关性模型结构示意图。
58.图4示出了根据本技术的实施例中引导回复生成过程的示意图。
59.图5示出了根据本技术的实施例的具体话题引导示例的示意图。
60.图6示出了本技术实施例所提供的一种话题引导装置的示例性结构示意图。
61.图7示出了本技术实施例所提供的一种电子设备的示例性结构示意图。
具体实施方式
62.为使本技术的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本技术进一步详细说明。
63.需要说明的是，除非另外定义，本技术实施例使用的技术术语或者科学术语应当为本技术所属领域内具有一般技能的人士所理解的通常意义。本技术实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同，而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变后，则该相对位置关系也可能相应地改变。
64.如背景技术部分所述，在闲聊对话场景中，“主动引导能力”是衡量ai (人工智能)是否有近似人类的聊天能力的重要评测指标。主动引导指的是回复出现新的话题，知识，观点，内容，情绪表达等。近年迅速发展的大规模预训练语言模型，让ai的回复日趋通顺合理，但预训练的ai仍然缺少主动把控话题的能力。比如当用户说“我今天读了三国”，没有相关知识的ai 可能会回复“讲了什么”，而能够主动引导的ai则会回复“我最喜欢看赤壁之战的部分了”。用户希望机器人能够聊一些有深层内容的话，即在某个领域具备一定的专业知识，并能及时在对话中插入这些知识，从而丰富聊天的趣味性。
65.在相关技术中，目前的闲聊对话系统多数采用基于大规模语言模型(如 gpt-2)的生成方法。在对话文本前添加控制文本，可以让模型生成时关注到控制信息，按照所给出的信息生成回复。因此，现有的话题引导主要是如下思路：分析当前对话，检索出上下文相关的“话题知识”，将“话题知识”作为控制信息，给模型做进一步生成。
66.其中一种相关技术中，首先建立话题实体图谱，建立实体与关系的三元组，如“曹操”，参与，“赤壁之战”，其中实体就是“曹操”，关系就是参与了“赤壁之战”。对于用户在相关话题领域内的问题，用ner(也可称为命名体识别)技术找到其中的实体词，如“曹操”，再通过话题图谱，链接到其他的关联实体，如“赤壁之战”。并将“赤壁之战”的相关描述作为下一步的控制信息，使回复包含相关新知识。也就是说，相关技术中生成指定话题的引导回复需要建图谱、定搜索策略等。
67.申请人通过研究发现，这种方案基于实体间的联系引入新知识，首先需要建立完善的知识图谱，话题图谱的建立需要较高的人工成本。其次，需要识别出用户问题中提及的实体，这一步往往受到ner(命名体识别)算法的能力限制。在口语场景中，一个实体往往有多种别名，如“诸葛亮”又可称为“孔明”或“武侯”。如果知识库中的实体信息不完备，实体往往识别不到，也无法进行进一步的控制检索。最后，通过实体间关系作为发散，只能基于原实体出发，从而忽略了句子本身的语义。比如用户输入“曹操也是个英雄”，如果关联出“赤壁之战”的败绩作为控制信息，可能会使生成结果出现语义矛盾。
68.另一种相关技术中，首先构建一批话题语料，基于词频检索的方法，找到和用户问
题重合度最高的语料，整句作为下一步的控制信息。其中开源搜索工具(elasticsearch)选择评价搜索词和文档之间相关性的算法。
69.申请人通过研究发现，这种方案虽然不用构建大量图谱，只需搜集语料作为数据，且不依赖实体，避免了第一种相关技术中的方案的部分缺点。但基于关键词的检索算法只是利用词频共现判断相关性，会出现以下两种情况：检索出的语料词语重复度较高，但实际相关性不高，如“我喜欢吃红烧肉”检索出“苏东坡喜欢吃红烧肉”；以及，有些实际相关性高的语料，词语重复度较低，因此检索不到。比如用户说“我很敬重诸葛亮”，语料池里的关键语料“诸葛孔明是蜀汉的丞相，一生鞠躬尽瘁死而后已”，词语重复度仅有“诸葛”两字，因此算出的相关度分数也较低，造成生成的话题引导回复与用户话题的相关度较低的问题，降低了用户的体验。
70.正因如此，本技术提供的一种话题引导方法、装置、电子设备及存储介质，构建语义相关性模型，并利用语义相关性模型对获取到的话题语料池进行编码，从而避免了相关技术中依赖话题图谱的构建以及依赖实体词识别的问题，降低了前置任务的人工成本，并且构建的语义相关性模型相比于基于词频进行相关度的确定，进一步提升了相关度确定的准确性。进一步，从语料向量中确定与对话向量相似度最高的目标语料向量，通过确定对话向量和目标语料向量的相关度是否大于或等于预设相关度阈值，进而在对话向量和目标语料向量的相关度大于或等于预设相关度阈值的情况下，根据目标语料向量生成引导回复语料，对话题进行引导，不依赖识别算法的能力，并且在语义相关性模型的编码下，获得的目标语料向量是根据话题语义相关的，能够使得在正确理解用户话题语义的前提下，生成引导回复语料，进而对用户话题进行引导。
71.下面通过具体的实施例来对本技术实施例所提供的话题引导方法进行具体说明。
72.图1示出了本技术实施例所提供的一种话题引导方法的示例性流程示意图。
73.参考图1，本技术实施例所提供的一种话题引导方法具体包括以下步骤：
74.s102：构建语义相关性模型。
75.s104：获取话题语料池和对话向量。
76.s106：利用所述语义相关性模型对所述话题语料池编码以确定语料向量。
77.s108：从所述语料向量中确定与所述对话向量相似度最高的目标语料向量。
78.s110：确定所述对话向量和所述目标语料向量的相关度是否不小于预设相关度阈值。
79.s112：响应于所述对话向量和所述目标语料向量的相关度不小于所述预设相关度阈值，根据所述目标语料向量生成引导回复语料对话题进行引导。
80.针对于步骤s102，为了避免相关技术中话题引导回复与用户话题之间的相关度低的问题，可以构建一个语义相关性模型。
81.在一些实施例中，构建语义相关性模型可以包括以下步骤：构建话题和语料的信息对；以及根据信息对构建语义相关性模型。其中，根据话题引导的使用场景，可以构建开放域的语义相关性模型的训练语料，也即话题和语料的信息对。
82.需要说明的是，为了确保在应对用户话题时对话题引导回复的检索的泛化性和普适性，信息对中的语料不能局限于某一个话题，例如，仅获取“三国题材”话题的语料，因为一旦用户话题涉及到其他题材，例如美食话题，利用根据“三国题材”话题的语料确定的话
题引导回复对用户进行引导，会产生语义矛盾的问题，使得用户和人工智能讨论的话题无法统一，造成用户体验差的问题。因此，为了获取更大范围内更多的话题语料，可以选择开放域的维基百科中文数据作为信息对中的语料池(也可称为context)。
83.再进一步地，为了确保用户输入的用户话题和语料池中语料的语义相关性，进而可以构建语义相关的用户话题和语料的信息对，也可称为utterance
‑ꢀ
context对。并且，在构建信息对的过程中不能依赖于词频贡献，从而放置语义相关性模型退化为简单的词频统计模型。作为一种应对方法，可以利用问答数据的相关性来构建信息对。
84.在一些实施例中，构建话题和语料的信息对，首先可以获取问答文本数据；其中，所述问答文本数据包括：问题文本、答案文本和用于佐证所述问题文本与所述答案文本之间的匹配度的证据文本。具体地，在问答领域里，通用标准数据集中包含了大量基于维基百科构建的问答对，也即qa对 (question-answer pairs)，例如webqa(一种问答数据集)。以中文版为例，共包含36000条问答文本数据，每一条问答文本数据都包含query、evidence、 answer三个部分，其中query为用户提问的问题文本，answer为用户提问的问题所对应的答案，也即答案文本，evidence为用于佐证答案文本可以回答问题文本的维基百科文本，也即用于佐证问题文本与答案文本之间的匹配度的证据文本。
85.参考表1，进一步地，可以根据预设划分规则将所述问答文本数据划分为多个文本段落，具体地，可以每间隔与预设间隔数m对应数量的字节切分问答文本数据以确定多个文本段落。例如，可以下载维基百科的所有问答文本数据，每100个字节进行一次切分，获得一个文本段落，根据维基百科中的问答文本数据，共可以切分出4200000个文本段落。
86.表1文本段落示例
[0087][0088]
需要说明的是，当确定当前的文本段落中第m个字节处并非句子的结尾，例如第m个字节为非结尾字段。其中非结尾字段可以为非结尾标点符号，例如引号、冒号、顿号或破折号等。也可以为某一个字，例如，一句话“甘宁向周瑜告急，周瑜用吕蒙之计，”中，第m个字节恰好为“之”，显然，此时“之”并非句子的结尾，如果在“之”这个字节处进行文本段落的划分，则会得到一个结尾处存疑，一个起始处存疑的两个文本段落。
[0089]
为了避免这种会造成语义矛盾的文本段落的划分，可以在确定当前文本段落中第m个字节为非结尾字段后，根据下一个结尾标点符号切分问答文本数据，从而重新确定当前文本段落。例如，在同样一句话“甘宁向周瑜告急，周瑜用吕蒙之计，”中，第m个字节恰好为“之”，因为“之”并非句子的结尾，所以将根据下一个结尾标点符号，也即“，”切分问答文本数据。其中结尾标点符号，可以为逗号、句号、叹号、问号或省略号等。
[0090]
再进一步地，在讲问答文本数据划分为多个文本段落后，可以利用开源搜索框架
在多个文本段落中确定与证据文本的相关度最高的且满足预设数量的目标文本段落。具体地，对于每条webqa数据，问题文本query作为信息对中的utterance，而证据文本evidence可以作为正样本的种子，利用开源搜索框架elasticsearch，在4200000个文本段落里找到与证据文本evidence最相关的多个目标段落。
[0091]
需要说明的是，在确定与证据文本evidence最相关的多个目标段落的过程中可以包括以下步骤：首先基于elasticsearch开源搜索框架，计算证据文本evidence和其余文本段落的相关性分数，返回得分最高的文本段落。 elasticsearch中的相关性分数可以是基于bm25算法，一般公式可以写作
[0092][0093]
其中，wi表示第i个文本段落的权重，qi表示第i个证据文本，q表示问题文本，r()表示相关性得分，d表示其余文本段落。
[0094]
在一些实施例中，预设数量的取值一般为1～5，每个证据文本得到的正负样本各保留1个即可，用于语义相关性模型的训练。
[0095]
图2示出了根据本技术的实施例中话题和语料的信息对的示意图。
[0096]
参考图2，需要说明的是，为了消除开源搜索框架基于词频搜索带来的偏差，确保找出的目标文本段落真正具有相关性，在确定目标文本段落后，可以根据问答文本数据和目标文本段落构建信息对。具体地，语料可以包括正样本语料和负样本语料，可以根据问题文本确定话题，进一步可以根据包含答案文本的文本段落确定正样本语料，再根据目标文本段落中不包含答案文本的目标文本段落确定负样本语料，将话题和正样本语料与负样本语料分别配对，从而确定信息对。
[0097]
具体地，仅筛选包含答案文本的目标文本段落作为正样本语料，相关度高但却不包含答案文本的目标文本段落作为负样本语料。参考图2，假设问题文本为“植树节从哪年开始的？”，将问题文本作为用户输入的用户话题，答案文本为“1979”，证据文本为“今年是第33个植树节，我国是1979年开始有植树节的，算上1979年，今年正好是第33个植树节。”。而通过答案文本作为筛选条件，筛选出来的包含答案文本的正样本语料为“全民义务植树运动：全民义务植树运动全民义务植树运动是指在1980年代制定的一项旨在推广种树以提高绿化覆盖面积的政策。1979年2月23日，宣布将每年的3月12日定为植树节。”。而筛选出来的相关度很高但却不包含答案文本的负样本语料为“植树节：提出了设立植树节的提议，该州采纳了莫顿的建议，把4月的第3个星期三定为该州的植树节，并于1932年发行世界上首枚植树节邮票，画面为两个儿童在植树。”。通过问答文本数据的相关性，从而构建出开放域语义搜索需要的信息对。
[0098]
在一些实施例中，根据上述步骤中构建的信息对构建语义相关性模型，进一步可以包括以下步骤：首先获取基础模型、话题的第一词向量和第一位置向量以及语料的第二词向量和第二位置向量；再利用所述基础模型分别对第一词向量和第一位置向量进行编码以及第二词向量和第二位置向量以确定话题段落向量和语料段落向量；再根据话题段落向量和预料段落向量的内积确定相似度；当相似度满足目标值时，则可以基于双塔模型根据信息对构建语义相关性模型。
[0099]
图3示出了根据本技术的实施例中语义相关性模型结构示意图。
[0100]
参考图3，需要说明的是，语义相关性模型可以采用双塔模型的结构，每个塔用预训练语言模型bert-wwm作为基础模型，bert-wwm经过充分预训练，在初始语义上比一般深度模型更具优势。其中，一个塔为utterance encoder，也即用户话题编码器，输入为话题相关的词向量(word embedding)和位置向量(position embedding)；另一个塔为context encoder，也即语料编码器，输入为语料相关的词向量(word embedding)和位置向量(position embedding)，将两个塔的输出通过相关性函数(similarity function)确定语义相关性。这两个塔是两个参数不共享的bert-wwm模型。其中，语义相关性模型是经过预训练的模型，由12个transformer模型的encoder编码器头尾相接组成。其中，transformer模型中编码器的详细结构包括：从上至下依次为多头attention 层、归一化层、全连接层和归一化层。
[0101]
其中，语义相关性模型的输入可以是每个词的词向量和位置向量，输出层取第0个词的向量作为整个文本段落的编码。因此，需要获取话题的第一词向量和第一位置向量，以及语料的第二词向量和第二位置向量。再进一步地，利用基础模型bert-wwm模型对第一词向量和第一位置向量进行编码，从而确定话题段落向量，并利用基础模型bert-wwm模型对第二词向量和第二位置向量进行编码，从而确定语料段落向量。可以在loss层中计算话题段落向量和语料段落向量的内积，作为话题和语料的相似度。对于二者的相似度而言，对应有目标值，当相似度满足目标值时，可以基于双塔模型并根据信息对完成对语义相关性模型的构建。
[0102]
在一些实施例中，为了增强泛化性，使用in-batch负采样的方案，将同一个batch内其他话题的语料的数据都用作负样本。由于维基百科的话题大多为百科式提问，和实际闲聊的语法有差异，实际训练时采用两阶段的方法，先用构建的开放域的信息对训练至收敛，再选取约100条线上用户日志构建 utterance-context对做微调。
[0103]
针对于步骤s104，话题语料池的获取非常广泛，相比较知识图谱的结构化方案，本方案不限制语料形式，因此可以从多个渠道搜集各话题知识语料，用于线上实时检索。对于有实体列表的话题(如历史人物)，可以通过例如百度百科做检索，获取实体的知识介绍；对于没有实体列表的话题，可以用例如百度知道的用户回答，也可以从指定的话题网站(如美食网)上获取语料，最终每条语料都是自然语言文本形式，便于快速低成本的扩增。
[0104]
在获取美食类话题语料池时，例如标题为菜谱，则可以获取到例如热干面、羊羔肉或热冬果等语料，用于扩充话题语料池的内容。
[0105]
示例代码部分如下所示：
[0106][0107]
对于获取对话向量，在一些实施例中，可以通过接收线上的用户请求，接收用户请求中的用户话题，获取到用户的历史对话记录，将用户的历史对话记录和当前输入的用户话题做拼接，然后将拼接后的内容输入到语义相关性模型中，利用语义相关性模型中的话题编码器实时计算，对用户话题和历史对话记录编码，从而确定对话向量。
[0108]
图4示出了根据本技术的实施例中引导回复生成过程的示意图。
[0109]
参考图4，针对步骤s106，在确定对话向量之后，可以用语义相关性模型中的语料编码器，预先对搜集到的各话题语料池中的语料做编码，从而确定语料向量，并将语料向量存储在向量检索工具中，从而建立在线索引。具体地，可以将用户的历史对话和当前对话输入话题编码器，将话题语料输入语料编码器，将语料向量存储在向量检索工具中，建立在线索引，进而通过相似度函数进行相似度检索，计算找到相似度最高的且达到阈值的语料向量，根据该语料向量引导回复语句的生成，如果相似度最高的语料向量未达到阈值，则该语料向量被放入话题语料池中作为语料使用，不直接参与引导回复的生成。
[0110]
进一步地，可以将对话向量放入向量检索工具中检索，执行在线索引，计算得到相似度最高的目标语料向量。
[0111]
在一些实施例中，向量检索工具可以选择faiss向量检索工具，其可以用于线上检索，faiss索引可以将海量向量检索控制在毫秒级，并且支持索引的实时增删，可以灵活控制检索的语料范围。
[0112]
针对步骤s108—s112，可以确定对话向量和目标语料向量的相关度是否不小于预设相关度阈值，其中，相关度阈值可以根据对话向量和目标语料向量的内积来衡量。如果对话向量和目标语料向量的相关度不小于预设相关度阈值，则可以根据目标语料向量生成引
导回复语料，可以由人工智能向用户输出引导回复语料，对用户话题进行引导。
[0113]
在一些实施例中，响应于对话向量和目标语料向量的相关度小于预设相关度阈值，则可以不对用户话题进行引导。例如，如果所有话题池中的语料的相关度都没有达到预设相关度阈值，则说明当前并没有相关的话题语料，判定为当前对话内容不需要做话题引导。
[0114]
在一些实施例中，响应与对话向量和目标语料向量的相关度小于预设相关度阈值，还可以根据预设引导回复语料对用户话题进行引导。具体地，当没有能够使用的目标语料向量时，可以仅关注当前对话历史，将预设引导回复语料拼接到用户历史对话之前，解码时attention层会将预设引导回复语料一并纳入注意力矩阵中计算，从而实现根据预设引导回复语料对用户话题进行引导。
[0115]
图5示出了根据本技术的实施例的具体话题引导示例的示意图。
[0116]
参考图5，作为一个具体的示例，当用户输入的用户话题为“你知道刘备吗？”时，可以利用语义相关性模型检索话题语料，从而确定对话实体为“刘备”，提取相关信息，例如“刘备是三国人物，曾经夺取两川、建立蜀汉、对抗曹操”，其中答案文本为“刘备”，找到的话题语料包含了答案文本。从而使得人工智能向用户输出对话“刘备建立蜀汉，有几分本事”。而此回答恰好命中用户的爱好，用户对话为“我最喜欢蜀汉了！”，此时利用语义相关性模型检索话题语料，根据实体“蜀汉”，确定出与“蜀汉”相关的话题语料，例如“诸葛亮，字孔明、号卧龙，三国时期蜀汉丞相、杰出的政治家、军事家、散文家、书法家”。其中答案文本为“蜀汉”，找到的话题语料包含了答案文本，从而使得人工智能向用户输出对话“蜀汉丞相诸葛亮的书法不错，散文也非常出色。”从而引导用户话题，提高了用户体验。
[0117]
从上面所述可以看出，本技术提供的一种话题引导方法、装置、电子设备及存储介质，构建语义相关性模型，并利用语义相关性模型对获取到的话题语料池进行编码，从而避免了相关技术中依赖话题图谱的构建以及依赖实体词识别的问题，降低了前置任务的人工成本，并且构建的语义相关性模型相比于基于词频进行相关度的确定，进一步提升了相关度确定的准确性。进一步，从语料向量中确定与对话向量相似度最高的目标语料向量，通过确定对话向量和目标语料向量的相关度是否大于或等于预设相关度阈值，进而在对话向量和目标语料向量的相关度大于或等于预设相关度阈值的情况下，根据目标语料向量生成引导回复语料，对话题进行引导，不依赖识别算法的能力，并且在语义相关性模型的编码下，获得的目标语料向量是根据话题语义相关的，能够使得在正确理解用户话题语义的前提下，生成引导回复语料，进而对用户话题进行引导。
[0118]
需要说明的是，本技术实施例的方法可以由单个设备执行，例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下，由多台设备相互配合来完成。在这种分布式场景的情况下，这多台设备中的一台设备可以只执行本技术实施例的方法中的某一个或多个步骤，这多台设备相互之间会进行交互以完成所述的方法。
[0119]
需要说明的是，上述对本技术的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
[0120]
图6示出了本技术实施例所提供的一种话题引导装置的示例性结构示意图。
[0121]
基于同一发明构思，与上述任意实施例方法相对应的，本技术还提供了一种话题引导装置。
[0122]
参考图6，所述话题引导装置，包括：构建模块、获取模块、编码模块、第一确定模块、第二确定模块以及引导模块；其中，
[0123]
构建模块，被配置为构建语义相关性模型；
[0124]
获取模块，被配置为获取话题语料池和对话向量；
[0125]
编码模块，被配置为利用所述语义相关性模型对所述话题语料池编码以确定语料向量；
[0126]
第一确定模块，被配置为从所述语料向量中确定与所述对话向量相似度最高的目标语料向量；
[0127]
第二确定模块，被配置为确定所述对话向量和所述目标语料向量的相关度是否大于或等于预设相关度阈值；
[0128]
引导模块，被配置为响应于所述对话向量和所述目标语料向量的相关度大于或等于所述预设相关度阈值，根据所述目标语料向量生成引导回复语料对话题进行引导。
[0129]
在一种可能的实现方式中，所述构建模块进一步被配置为：
[0130]
构建话题和语料的信息对；
[0131]
根据所述信息对构建语义相关性模型。
[0132]
在一种可能的实现方式中，所述构建模块进一步被配置为：
[0133]
获取问答文本数据；其中，所述问答文本数据包括：问题文本、答案文本和用于佐证所述问题文本与所述答案文本之间的匹配度的证据文本；
[0134]
根据预设划分规则将所述问答文本数据划分为多个文本段落；
[0135]
利用开源搜索框架在所述多个文本段落中确定与所述证据文本的相关度最高且满足预设数量的目标文本段落；
[0136]
根据所述问答文本数据和所述目标文本段落构建所述信息对。
[0137]
在一种可能的实现方式中，所述构建模块进一步被配置为：
[0138]
以预设字符数为单位对所述问答文本进行划分，得到多个文本段落。
[0139]
在一种可能的实现方式中，所述构建模块进一步被配置为：
[0140]
以预设字符数为单位从所述问答文本的首个字符开始进行划分，若划分得到的初始文本段落的最后一个字符不是结尾字符，则获取下一个字符，并将获取的字符加入所述初始文本段落，直到获取到结尾字符，并将所述结尾字符加入所述初始文本段落，得到文本段落。
[0141]
在一种可能的实现方式中，所述语料，包括：正样本语料和负样本语料；
[0142]
所述构建模块进一步被配置为：
[0143]
根据所述问题文本确定所述话题；
[0144]
根据所述目标文本段落中包含所述答案文本的目标文本段落确定所述正样本语料；
[0145]
根据所述目标文本段落中不包含所述答案文本的目标文本段落确定所述负样本语料；
[0146]
将所述话题和所述正样本语料与所述负样本语料分别配对以确定所述信息对。
[0147]
在一种可能的实现方式中，所述构建模块进一步被配置为：
[0148]
获取基础模型，所述话题的第一词向量和第一位置向量，以及所述语料的第二词向量和第二位置向量；
[0149]
利用所述基础模型对所述第一词向量和第一位置向量进行编码以确定话题段落向量；
[0150]
利用所述基础模型对所述第二词向量和第二位置向量进行编码以确定语料段落向量；
[0151]
根据所述话题段落向量和所述预料段落向量的内积确定所述话题与所述语料的相似度；
[0152]
响应于所述相似度满足目标值，则基于双塔模型根据所述信息对构建所述语义相关性模型。
[0153]
在一种可能的实现方式中，所述获取模块进一步被配置为：
[0154]
响应于接收到用户话题，获取用户的历史对话记录；
[0155]
利用所述语义相关性模型对所述用户话题和所述历史对话记录编码以确定所述对话向量。
[0156]
在一种可能的实现方式中，
[0157]
所述第一确定模块进一步被配置为：
[0158]
将所述语料向量存储于检索工具以建立在线索引；
[0159]
将所述对话向量输入所述检索工具执行所述在线索引，以确定与所述对话向量相似度最高的所述目标语料向量。
[0160]
在一种可能的实现方式中，所述引导模块进一步被配置为：
[0161]
响应于所述对话向量和所述目标语料向量的相关度小于所述预设相关度阈值，确定不对所述话题进行引导。
[0162]
在一种可能的实现方式中，所述引导模块进一步被配置为：
[0163]
响应于所述对话向量和所述目标语料向量的相关度小于所述预设相关度阈值，根据预设引导回复语料对所述话题进行引导。
[0164]
为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本技术时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
[0165]
上述实施例的装置用于实现前述任一实施例中相应的话题引导方法，并且具有相应的方法实施例的有益效果，在此不再赘述。
[0166]
图7示出了本技术实施例所提供的一种电子设备的示例性结构示意图。
[0167]
基于同一发明构思，与上述任意实施例方法相对应的，本技术还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上任意一实施例所述的话题引导方法。图7示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图，该设备可以包括：处理器710、存储器720、输入/输出接口730、通信接口740和总线750。其中处理器710、存储器720、输入/输出接口730和通信接口740通过总线750实现彼此之间在设备内部的通信连接。
[0168]
处理器710可以采用通用的cpu(central processing unit，中央处理器)、微处理
器、应用专用集成电路(application specific integrated circuit，asic)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本说明书实施例所提供的技术方案。
[0169]
存储器720可以采用rom(read only memory，只读存储器)、ram (random access memory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器720可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器720中，并由处理器710来调用执行。
[0170]
输入/输出接口730用于连接输入/输出模块，以实现信息输入及输出。输入/输出模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。
[0171]
通信接口740用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如usb、网线等)实现通信，也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信。
[0172]
总线750包括一通路，在设备的各个组件(例如处理器710、存储器720、输入/输出接口730和通信接口740)之间传输信息。
[0173]
需要说明的是，尽管上述设备仅示出了处理器710、存储器720、输入/ 输出接口730、通信接口740以及总线750，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本说明书实施例方案所必需的组件，而不必包含图中所示的全部组件。
[0174]
上述实施例的电子设备用于实现前述任一实施例中相应的话题引导方法，并且具有相应的方法实施例的有益效果，在此不再赘述。
[0175]
基于同一发明构思，与上述任意实施例方法相对应的，本技术还提供了一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令用于使所述计算机执行如上任一实施例所述的话题引导方法。
[0176]
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。
[0177]
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的话题引导方法，并且具有相应的方法实施例的有益效果，在此不再赘述。
[0178]
所属领域的普通技术人员应当理解：以上任何实施例的讨论仅为示例性的，并非旨在暗示本技术的范围(包括权利要求)被限于这些例子；在本技术的思路下，以上实施例或者不同实施例中的技术特征之间也可以进行组合，步骤可以以任意顺序实现，并存在如上所述的本技术实施例的不同方面的许多其它变化，为了简明它们没有在细节中提供。
[0179]
另外，为简化说明和讨论，并且为了不会使本技术实施例难以理解，在所提供的附图中可以示出或可以不示出与集成电路(ic)芯片和其它部件的公知的电源/接地连接。此
外，可以以框图的形式示出装置，以便避免使本技术实施例难以理解，并且这也考虑了以下事实，即关于这些框图装置的实施方式的细节是高度取决于将要实施本技术实施例的平台的(即，这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如，电路)以描述本技术的示例性实施例的情况下，对本领域技术人员来说显而易见的是，可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本技术实施例。因此，这些描述应被认为是说明性的而不是限制性的。
[0180]
尽管已经结合了本技术的具体实施例对本技术进行了描述，但是根据前面的描述，这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如，其它存储器架构(例如，动态ram(dram))可以使用所讨论的实施例。
[0181]
本技术实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此，凡在本技术实施例的精神和原则之内，所做的任何省略、修改、等同替换、改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种高温铁水罐罐号射频识别装置的制作方法

话题引导方法、装置、电子设备及存储介质与流程

相关文献

最热文献