一种对话系统的意图识别方法、电子设备和存储介质与流程

2022-03-22 23:32:30 来源：中国专利 TAG：

1.本发明涉及人工智能领域，尤其涉及一种对话系统的意图识别方法、电子设备和存储介质。

背景技术：

2.意图识别是自然语言处理中一个重要的部分，其主要功能是利用各种机器学习和深度学习方法，针对输入的句子进行识别和分类，甄别出其在既定意图类别中的具体分类，从而判断出当前对话信息的具体意图。一般意图识别仅针对当前对话信息信息进行识别，容易造成信息丢失或者识别错误。例如在商务对话中，如访客上午询问“a项目的价格是多少”被正确识别为咨询价格意图，之后继续询问“b项目呢”。如果仅针对当前对话信息进行意图识别无法得知访客也想了解b项目的价格导致识别出错。

技术实现要素：

3.有鉴于现有技术的上述缺陷，本发明的目的是提供一种对话系统的意图识别方法、电子设备和存储介质，能够在多轮对话中识别出其中的真实意图，从而避免信息丢失识别错误问题。
4.为实现上述目的，本发明提供了一种对话系统的意图识别方法包括：
5.步骤s10、从多轮对话数据中抽取当前轮次的当前对话信息和窗口轮次的前文信息；
6.步骤s20、识别前文信息中的实体；将当前对话信息、前文信息和前文信息的实体转换成维度为m*n的向量矩阵；
7.步骤s30、通过神经网络模型获取当前对话信息的意图信息、前文信息的意图信息和前文信息中实体的意图信息；
8.步骤s40、将步骤s30中的意图信息进行拼接，并输出结果。
9.进一步的，所述步骤s20具体包括：
10.步骤s21、将当前对话信息进行分词、词向量转换、拼接，生成维度为m*n的向量矩阵a，其中m为序列长度，n为embedding维度；
11.步骤s22、将前文信息进行分词、转换成词向量、拼接，生成维度为m*n的向量矩阵b；
12.步骤s23、识别前文信息中的实体，将前文信息的实体进行词向量转换、拼接，生成维度为m*n的向量矩阵c。
13.进一步的，所述步骤s20中，生成维度为m*n的向量矩阵的方法为：对拼接后序列长度大于m的向量，取其前m个向量，对拼接后序列长度不足的向量，不足部分用零向量补足。
14.进一步的，所述步骤s30中的神经网络模型为cnn神经网络模型。
15.进一步的，所述cnn神经网络模型包括：输入层、卷积层、pooling层、全连接层和softmax层；所述输入层用于输入当前对话信息、窗口内前文信息和窗口内前文信息的实体
的向量矩阵；三个向量矩阵分别通过卷积层、pooling层后输出三个特征矩阵；对三个特征矩阵求和得到合并矩阵x；将合并矩阵输入全连接层，输出维度为1*n的向量，并使用softmax进行归一化，输出归一化的向量y’，向量y’即为输出结果。
16.进一步的，所述窗口数为2-5。
17.本发明的第二方面还提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现如本发明第一方面任一方案所述的对话系统的意图识别方法中的步骤。
18.本发明的第三方面还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明第一方面任一方案所述的对话系统的意图识别方法中的步骤。
19.本发明实现了如下技术效果：
20.本方法通过设置多个窗口获取多轮对话数据，结合实体识别，获取前文中更完整的意图信息，避免信息丢失识别错误问题，可提升意图识别准确率。
附图说明
21.图1是本发明的对话系统的意图识别方法的流程框图。
22.图2是cnn神经网络模型的在自然语言处理中的信息流程图。
具体实施方式
23.为进一步说明各实施例，本发明提供有附图。这些附图为本发明揭露内容的一部分，其主要用以说明实施例，并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容，本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。
24.现结合附图和具体实施方式对本发明进一步说明。
25.本实施例给出了一种多轮对话系统的意图识别模型训练方法，包括对话数据抽取、向量嵌入embedding、意图识别和意图拼接等几个步骤，如图1所示。现给出一示例进行分步骤说明。
26.1、对话信息抽取：
27.已知既定意图类别数n，选定窗口数为5。构建模型训练数据集时，不再抽取随机分布的单句句子，而从多轮对话中抽取当前轮次的对话信息和窗口轮次内的句子信息(以下称前文信息)。训练集的每条数据包括窗口数 1条句子。
28.在对话系统中，从接收到的多轮语音数据识别出多轮对话的文本信息，多轮对话的文本信息通过句末识别分为多个句子；该文本信息作为对话信息抽取的输入，抽取出当前对话信息和当前对话信息之前的5个窗口的句子信息。其中窗口数可选，可根据应用场景的复杂程度选取2-5个窗口。
29.2、向量嵌入：
30.针对训练数据，将当前对话信息用jieba分词(“结巴”分词是一个python中文分词组件，可以对中文文本进行分词、词性标注、关键词抽取等功能，并且支持自定义词典)进行分析，利用词向量转换工具word2vec对当前对话信息内每个词进行embedding(嵌入)，并将embedding后的词向量拼接得到向量矩阵a。针对窗口内的前文信息利用相同的方法得到前
文向量矩阵b。矩阵a和矩阵b的维度都为m*n，其中m为sequencelength，n为embedding维度。
31.针对窗口内的前文信息，用ner(命名实体识别)模型对文本内的实体进行识别，对识别出来的实体分别做embedding然后拼接得到向量矩阵c，向量矩阵c的维度是m*n和矩阵a、矩阵b相同，sequencelength不足的部分用padding(零向量)补齐。padding存在的意义在于：不丢弃原图信息；保持featuremap的大小与原图一致；让更深层的layer的input依旧保持有足够大的信息量。为了实现上述目的，padding出来的pixel的值都是0。
32.意图类别可以用向量表示，针对每条数据的意图类别,使用onehot将其编码为维度为1*n的向量y。
33.3、神经网络模型结构及训练：
34.针对向量矩阵a、b、c，采用cnn神经网络模型，分别对其进行卷积和pooling，使其得到相同维度的特征矩阵a’、b’、c’。如图2所示，cnn神经网络模型包括输入层、卷积层、pooling层和输出层等结构，更具体的，输出层包括全连接层、dropout层和softmax层等结构。
35.针对特征矩阵a’、b’、c’进行求和操作，使其得到合并矩阵x。通常的矩阵加法被定义在两个相同大小的矩阵。两个m
×
n矩阵a和b的和，标记为a b，一样是个m
×
n矩阵，其内的各元素为其相对应元素相加后的值。例如：
[0036][0037]
将合并矩阵x输入全连接层，输出维度为1*n的向量，并使用softmax进行归一化。
[0038]
在训练中，输出归一化后的向量为y’，计算y’与y的交叉熵，逐步迭代优化神经网络模型的参数，其中y为已知的意图类别信息的向量。
[0039]
在应用中，则直接输出归一化后的向量y’，获取对应语句的意图信息。
[0040]
本发明的对话系统的意图识别方法，通过设置多个窗口获取多轮对话数据，结合实体识别，获取前文中更完整的意图信息，避免信息丢失识别错误问题，可提升意图识别准确率。
[0041]
基于同一发明构思，本技术另一实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本技术上述任一实施例所述的方法中的步骤。
[0042]
基于同一发明构思，本技术另一实施例提供一种电子设备。该电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行时实现本技术上述任一实施例所述的方法中的步骤。
[0043]
本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。
[0044]
本领域内的技术人员应明白，本技术实施例的实施例可提供为方法、装置或计算机程序产品。因此，本技术实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器、半导
体存储器等)上实施的计算机程序产品的形式。
[0045]
本技术实施例是参照根据本技术实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0046]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0047]
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0048]
尽管结合优选实施方案具体展示和介绍了本发明，但所属领域的技术人员应该明白，在不脱离所附权利要求书所限定的本发明的精神和范围内，在形式上和细节上可以对本发明做出各种变化，均为本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于GAN的语义对抗样本生成方法与流程

一种对话系统的意图识别方法、电子设备和存储介质与流程

相关文献

最热文献