一种可自我学习的智能对话管理系统、方法及处理设备与流程

2022-10-13 01:04:33 来源：中国专利 TAG：

1.本发明涉及对话管理系统技术领域，尤其涉及一种可自我学习的智能对话管理系统、方法及处理设备。

背景技术：

2.目前，对话系统广泛地用在信息技术行业中，如用于手机和平板计算机的移动应用，是具有访问、处理、管理并传递信息的以人为中心的接口，是一种基于计算机的代理系统。对话管理是在对话系统中的一个重要组成部分，负责维护和更新对话的状态，并且基于当前对话状态，选择接下来合适的回复操作。总的说来，对话管理系统是以nlu（natural language understanding，自然语言理解）的输出作为任务的输入，完善对话任务相关信息，在各个业务状态中迁移，输出下一步的行为。
3.现有的对话管理技术通常是创建意图流程和意图结构实现对话管理，对话管理仅限于该用户的本次会话中，无自我学习更新机制，无法感知到用户新需求和对话系统提供意图之间的差异之处，从而使得对话系统不能很快的进行更新以满足用户新的对话需求。还有的对话管理系统通过数据系统将用户对话信息通过策略脚本将数据加载到对话系统进行赋能，以期达到自我学习更新对话系统的效果，但学习机制依赖策略下生成的脚本，不能做到自适应条件下学习更新。
4.在实现本发明过程中，发明人发现现有技术中至少存在如下问题：现有的对话管理系统无自我学习更新机制，或自我学习更新对话系统不能进行自适应学习更新，对话管理系统的更新周期长、难度大、维护成本高，难以适应发展需要。

技术实现要素：

5.本发明的目的在于提供一种可自我学习的智能对话管理系统、方法及处理设备，以解决现有技术中存在的对话管理系统无自我学习更新机制，或自我学习更新对话系统不能进行自适应学习更新，对话管理系统的更新周期长、难度大、维护成本高，难以适应发展需要的技术问题。本发明提供的诸多技术方案中的优选技术方案所能产生的诸多技术效果详见下文阐述。
6.为实现上述目的，本发明提供了以下技术方案：本发明提供的一种可自我学习的智能对话管理系统，包括新意图检测模块、新意图发现模块和辅助更新模块；所述新意图检测模块对用户聊天内容中的系统新意图进行感知；所述新意图发现模块对所述系统新意图进行分类管理，并通知系统管理员审核，得到全局新意图并进行相应配置；所述辅助更新模块对所述新意图检测模块、新意图发现模块及相应的配置信息进行数据更新。
7.一种可自我学习的智能对话管理方法，通过以上所述的一种可自我学习的智能对话管理系统运行，包括以下步骤：s100：所述新意图检测模块对至少一个用户的聊天内容进行自动检测，得到用户
意图；s200：判断所述用户意图是否为系统新意图，若是，执行s300，否则执行s500；s300：对每个所述系统新意图进行保存，在设定条件下自动触发新意图发现模块对全部的所述系统新意图进行分类，并通知系统管理员；s400：所述系统管理员对所述系统新意图是否为全局新意图进行审核，若是，执行s500，否则执行s200；s500：根据所述用户意图或全局新意图执行相应动作，或进行回复，并通过所述辅助更新模块更新所述对话管理系统。
8.优选的，所述s100中，所述新意图检测模块通过以下方法得到：s110：采用预训练bert稠密特征提取器，提取出每个token的特征向量；s120：对全部的所述特征向量进行平均池化操作，提取出句向量；s130：通过bilstm网络学习所述token之间及前后的上下文知识；s140：对现有的意图进行学习更新，得到所述新意图检测模块。
9.优选的，所述s200中，所述预训练bert稠密特征提取器根据置信度阀值判断所述用户意图是否为系统新意图。
10.优选的，所述s300中，每个所述系统新意图送入全局缓存中进行保存，所述设定条件为所述全局缓存的存储容量或所述系统新意图数量达到设定阈值。
11.优选的，所述s300具体包括以下步骤：s310：所述新意图发现模块采用mean-shift均值漂移聚类算法，对全部的所述系统新意图进行区分；s320：根据每个类簇中样本单词的tf-idf值提取关键词，作为所述系统新意图的描述；s330：抽取距离所述类簇的中心最近和最远的多条意图样本和意图描述，发送给所述系统管理员审核。
12.优选的，所述s500之后还包括s600：将审核通过并完成动作配置或回复的所述类簇移交给辅助更新模块，更新所述对话管理系统。
13.优选的，所述辅助更新模块对每个所述用户意图和系统新意图加入的训练数据进行管理。
14.优选的，所述辅助更新模块还能够根据所述意图样本的数量进行抽样。
15.一种处理设备，包括：一个或多个处理器；存储器，用于存储一个或多个计算机程序，一个或多个所述处理器用于执行所述存储器存储的一个或多个计算机程序，以使一个或多个所述处理器执行以上任一项所述的一种可自我学习的智能对话管理方法。
16.实施本发明上述技术方案中的一个技术方案，具有如下优点或有益效果：本发明通过新意图检测模块、新意图发现模块对全局新意图进行感知、判断，并配置相应的操作信息，再通过辅助更新模块对全流程的数据进行更新，从而实现了系统的自适应学习更新，缩短了对话管理系统的新意图更新周期，降低了更新难度和维护成本，更好适应对话管理系统的发展需要。
附图说明
17.为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单的介绍，显而易见，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，附图中：图1是本发明实施例二中一种可自我学习的智能对话管理方法的流程图；
图2是图1中s100步骤的具体流程图；图3是图1中s300步骤的具体流程图；图4是本发明实施例中新意图检测模块的示意图；图5是本发明实施例中新意图发现模块的示意图。
具体实施方式
18.为了使本发明的目的、技术方案及优点更加清楚明白，下文将要描述的各种示例性实施例将要参考相应的附图，这些附图构成了示例性实施例的一部分，其中描述了实现本发明可能采用的各种示例性实施例。除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。应明白，它们仅是与如所附权利要求书中所详述的、本发明公开的一些方面相一致的流程、方法和装置等的例子，还可使用其他的实施例，或者对本文列举的实施例进行结构和功能上的修改，而不会脱离本发明的范围和实质。
19.在本发明的描述中，需要理解的是，术语“中心”、“纵向”、“横向”等指示的是基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的元件必须具有的特定的方位、以特定的方位构造和操作。术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。术语“多个”的含义是两个或两个以上。术语“相连”、“连接”应做广义理解，例如，可以是固定连接、可拆卸连接、一体地连接、机械连接、电连接、通信连接、直接相连、通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系。术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。
20.为了说明本发明所述的技术方案，下面通过具体实施例来进行说明，仅示出了与本发明实施例相关的部分。
21.实施例一：本发明提供了一种可自我学习的智能对话管理系统，其包括新意图检测模块、新意图发现模块和辅助更新模块。新意图检测模块对用户聊天内容中的系统新意图进行感知，从而感知出对智能对话管理系统而言新的意图，现有对话管理系统无法对系统新意图进行自动识别并触发相应的操作。新意图发现模块对系统新意图进行分类管理，分类管理后，便于系统管理员更好进行处理，并通知系统管理员审核，系统管理员对系统新意图进行审核，以确认是否为实质意义上的新意图，是否有智能对话管理系统感知错误识别到的系统新意图实际为现有意图，从而得到实际意义上的新意图，即全局新意图，得到全局新意图并进行相应配置，对全局新意图进行配置即对相应的操作进行配置，以实现对全局新意图的响应。辅助更新模块对新意图检测模块、新意图发现模块及配置信息进行数据更新，即将全局新意图对应的新意图检测模块、新意图发现模块及配置信息进行更新，从而全局新意图对系统而言不再是新的意图，从而实现了智能对话管理系统的自我学习，提高了系统的智能水平。本发明的智能对话管理系统通过新意图检测模块、新意图发现模块对全局新意图进行感知、判断，并配置相应的操作信息，再通过辅助更新模块对全流程的数据进行更新，从而实现了系统的自适应学习更新，缩短了对话管理系统的新意图更新周期，降低了更
新难度和维护成本，更好适应对话管理系统的发展需要。
22.实施例仅是一个特例，并不表明本发明就这样一种实现方式。
23.实施例二：本发明提供了一种可自我学习的智能对话管理方法，通过实施例一中的一种可自我学习的智能对话管理系统运行，包括以下步骤。s100：新意图检测模块对至少一个用户的聊天内容进行自动检测，得到用户意图，聊天内容中还有一些不相关的文字信息，自动检测提炼出用户意图便于进行更准确的处理和判断。s200：新意图检测模块判断用户意图是否为系统新意图，系统新意图为智能对话管理系统无法根据现有的数据及模型进行识别，无法执行自动回复操作的意图，系统新意图是对智能对话管理系统而言是全新的意图，若是，执行s300，否则执行s500。s300：对每个系统新意图进行保存，统一保存便于进行集中处理，在设定条件下自动触发新意图发现模块对全部的系统新意图进行分类，并通知系统管理员，分类后的新意图便于系统管理员查找与此相类似的新意图，便于快速确认该新意图是否为全局新意图，对于系统新意图是否构成实质的新意图（即全局新意图），通过人工判断是最为准确的，此时操作人员或运维人员即为系统管理员。s400：系统管理员对系统新意图是否为全局新意图进行审核，若是，执行s500，否则执行s200，全局新意图即对于智能对话管理系统为实质意义上的新意图，需要根据该新意图的内容配置新的执行动作或回复内容，通过人工审核，提高了对系统新意图判断的准确性，避免了部分只是形式上的新意图作为全局新意图，从而提高了智能对话管理系统对用户新意图识别的准确性。s500：根据用户意图或全局新意图的内容执行相应动作，或进行回复，执行相应动作或进行回复即为系统管理员根据用户意图或全局新意图进行配置的信息，执行相应动作或进行回复即为配置信息，并通过辅助更新模块更新对话管理系统，从而下一次再有用户有该全局新意图时，对话管理系统就能够自动执行相应操作或回复，实现了针对用户新意图的自我学习型智能对话。
24.作为可选的实施方式，s100中，新意图检测模块通过以下方法得到。s110：采用预训练bert（bidirectional encoder representations from transformers）稠密特征提取器，提取出每个token的特征向量，通过提起稠密特征可以减少离散向量的空间维数。预训练bert稠密特征提取器基于bert模型进行，bert模型是一种预训练语言表示的方法，用于创建nlp模型，使用bert模型可以从文本数据中提取高质量的语言特征，也可以使用特定数据对这些模型进行微调，以完成分类、实体识别、问题回答等特定任务，从而生成预测。s120：对全部的特征向量进行平均池化操作，提取出句向量；s130：通过bilstm网络学习token之间及前后的上下文知识，bilstm网络即为双向lstm网络，lstm网络（long short term，长短期神经网络），lstm在主体结构上与rnn类似，是一种rnn特殊的类型，bilstm网络分为2个独立的lstm，输入序列分别以正序和逆序输入至2个lstm神经网络进行特征提取，设计理念是使t时刻所获得特征数据同时拥有过去和将来之间的信息，这种神经网络结构模型对文本特征的提取效率和性能要优于单个lstm结构模型。s140：预训练bert模型对现有的意图进行学习，更新bert模型，即更新得到新的预训练bert稠密特征提取器，得到新意图检测模块。
25.作为可选的实施方式，s200中，预训练bert稠密特征提取器根据置信度阀值判断用户意图是否为系统新意图，根据置信度阀值判断操作简单，容易实现，准确率高，从而能
够快速从用户意图中筛选出系统新意图，具体的置信度阀值可根据需要进行设定。
26.作为可选的实施方式，s300中，每个系统新意图送入全局缓存中进行保存，全局缓存在硬件处理设备中广泛存在，容量能够满足系统新意图的存储需求，且读取速度快，系统新意图送入全局缓存中便于将多个系统新意图进行统一管理，进行分类等操作。设定条件为全局缓存的存储容量（如全局缓存的存储容量只剩下20%，以免全局缓存容量超出后部分系统新意图丢失）或系统新意图数量（可根据每条系统新意图的平均容量确定，也可以避免部分系统新意图的丢失）达到设定阈值，具体的设定阈值可根据全局缓存大小、系统新意图的出现频次等设定。
27.作为可选的实施方式，s300具体包括以下步骤。s310：新意图发现模块采用mean-shift均值漂移聚类算法，对全部的系统新意图进行区分，mean shift是一个迭代的过程，先算出当前点的偏移均值，将该点移动到该偏移均值，以此为新的起始点，继续移动，直到满足最终的条件；聚类处理还可以采用k-means聚类，或者其他聚类方式。s320：根据每个类簇中样本单词的tf-idf值提取关键词，作为系统新意图的描述；每个类簇可以表征一个正常文本类型；tf-idf值的主要思想是，如果某个词或短语在对话中出现的概率高，并且在其他对话中很少出现，则认为此词或者短语具有很好的类别区分能力，可用于评估一字词对于对话的重要程度，因此，tf-idf值可以较为准确的对系统新意图进行描述。s330：抽取距离类簇的中心最近和最远的多条意图样本和意图描述，发送给系统管理员审核。通过获取距离类簇的中心最近和最远的多条意图样本和意图描述，可以确保该类簇的意图是单一的且保证了样本的纯净度，从而聚类出来的该类簇是单一意图而不是多个意图糅合在一起的大意图，进而可以排查出有没有相近意图样本混在里面。
28.作为可选的实施方式，s500之后还包括s600：将审核通过并完成动作配置或回复的类簇移交给辅助更新模块，更新对话管理系统，从而对话管理系统在下次遇到该全局新意图时能够自动执行相应动作，或进行回复，通过反复学习，提高了系统的智能性。
29.作为可选的实施方式，辅助更新模块对每个用户意图和系统新意图加入的训练数据进行管理，通过辅助更新模块，对新意图检测模块、新意图发现模块的数据进行管理更新，实现了新意图检测模块、新意图发现模块的自我学习，使对话管理系统随着使用时间和频次的增加，更加智能，能够更加快速准确获取用户意图。辅助更新模块的工作过程为：接收系统管理员审核通过的新意图消息，从而获取到该新意图缓存下的样本数据，并通过新意图检测模块和nlu模块中的深度学习模型自动更新训练发布。
30.作为可选的实施方式，辅助更新模块还能够根据意图样本的数量进行抽样，以解决意图间样本数据量倾斜的问题，从而使得辅助更新模块更新后的智能对话管理系统更容易对用户意图进行准确的回复或相应操作，交互性能更好，用户的使用体验更好。
31.实施例三：本发明还提供一种处理设备实施例，包括一个或多个处理器及存储器；其中，存储器用于存储一个或多个计算机程序，一个或多个处理器用于执行存储器存储的一个或多个计算机程序，以使处理器执行实施例二中的一种可自我学习的智能对话管理方法实施例的特征/步骤。
32.以上所述仅为本发明的较佳实施例而已，本领域技术人员知悉，在不脱离本发明的精神和范围的情况下，可以对这些特征和实施例进行各种改变或等同替换。另外，在本发
明的教导下，可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此，本发明不受此处所公开的具体实施例的限制，所有落入本技术的权利要求范围内的实施例都属于本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种开机性能的优化方法、装置、设备及存储介质与流程

一种可自我学习的智能对话管理系统、方法及处理设备与流程

相关文献

最热文献