基于人工智能的多轮对话方法、装置及存储介质与流程

2021-12-17 21:05:00 来源：中国专利 TAG：

1.本发明涉及人工智能技术领域，尤其涉及一种基于人工智能的多轮对话的方法、装置、电子设备及计算机可读存储介质。

背景技术：

2.随着人工智能技术的不断发展，越来越多的智能产品应用到大众的日常生活中，例如智能音箱、智能客服、智能电话销售、私人手机助理siri等。这些智能对话系统不仅可以和用户进行正常的信息交流，还能为用户生活带来很多便利。智能对话系统主要由语音识别、自然语言理解、对话管理、对话生成和语音合成等部分组成。为了让机器更好地理解用户的表达，进而对用户的问题作出正确应答，自然语言理解(natural language understanding,nlu)起到了重要的作用，而意图识别是自然语言理解的子模块，也是智能对话系统构成的关键。
3.目前，智能对话系统的意图识别模型基本上都是基于单轮对话的，机器仅仅针对客户当前这轮的问题进行意图识别，并给出回复。但是现实运用中，经常会遇到多轮交互的场景，在次轮对话及后续对话中，用户经常会省略掉部分信息，例如，用户询问：姚明是干什么的，机器回答：篮球运动员；当用户再次提问：他多高，应该还原为姚明多高。这种情况会导致对话机器人无法抓住多轮对话过程中的多个话题信息，这些话题信息作为整个对话过程的上下文，对于机器理解对话有着重要作用。现有处理这类问题的方法一般是将历史信息和本轮信息直接进行拼接，然后由模型加以识别。但这种方法信息冗余，会产生大量噪声信息，导致机器回答错乱。
4.因此，如何准确的抓住多轮次对话的上下文关键信息，辅助当前对话问答，是目前亟需解决的一个重要问题。

技术实现要素：

5.本发明提供一种基于人工智能的多轮对话方法、装置、电子设备及计算机可读存储介质，其主要目的在于提高了基于人工智能的多轮对话的效率。
6.为实现上述目的，本发明提供的一种基于人工智能的多轮对话方法，包括：
7.获取当前轮次对话的询问语句，并基于预训练的判断模型对所述询问语句进行判断，确定所述询问语句是否需要进行信息补全；
8.若所述询问语句需要进行信息补全，则将所述询问语句、上一轮次对话的历史问题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型中，获取与所述询问语句对应的补全语句；
9.将所述补全语句输入预训练的单轮意图识别模型中，获取与所述询问语句对应的答复内容。
10.此外，可选的技术方案是，所述判断模型的训练过程包括：
11.获取训练数据，所述训练数据包括完整语句的正样本和非完整语句的负样本；其
中，所述正样本和所述负样本均是询问语句；
12.基于所述训练数据对神经网络模型进行训练，直至所述神经网络模型收敛至预设范围内，形成所述判断模型；其中，所述神经网络模型的结构包括两层gru、两层全连接层以及sigmoid函数。
13.此外，可选的技术方案是，在将所述询问语句、上一轮次对话的历史问题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型之前，还包括：基于所述询问语句、所述历史问题以及所述历史回答获取对应的输入数据；其中，
14.所述输入数据的获取步骤包括：
15.对所述历史问题、所述历史回答以及当前的询问语句进行分词处理，以获取对应的分词结果；
16.顺次连接所述历史问题、所述历史回答以及所述询问语句的分词结果，并在所述分词结果的预设位置添加标志符号，以形成所述输入数据。
17.此外，可选的技术方案是，所述获取与所述询问语句对应的补全语句的步骤包括：
18.将所述输入数据输入所述信息补全模型的输入层，获取与所述输入数据对应的嵌入特征；
19.通过所述信息补全模型的编码器部分对所述嵌入特征进行特征提取，获取对应的隐含向量；
20.将所述隐含向量输入所述信息补全模的全连接层和softmax层，确定输出的指针信息；
21.基于所述指针信息确定与所述查询语句对应的补全语句。
22.此外，可选的技术方案是，所述指针信息包括关键信息start、关键信息end、补全信息位置、指代start和指代end；其中，
23.所述关键信息的start和所述关键信息end，用于识别所述历史问题和所述历史回答中，需对所述询问语句进行信息补全的指代词；
24.所述补全信息位置，用于预测所述关键信息start和所述关键信息end在所述询问语句中需要插入的位置；
25.所述指代start和所述指代end，用于识别所述询问语句中出现的指代词。
26.此外，可选的技术方案是，所述将所述补全语句输入预训练的单轮意图识别模型中，获取与所述询问语句对应的答复内容的步骤包括：
27.基于所述单轮意图识别模型以及所述补全语句，获取与所述补全语句对应的多个候选回复信息；
28.根据与所述补全语句对应的历史问题及历史回答确定上下文特征，并根据所述候选回复信息生成多个候选回复特征；
29.获取所述上下文特征与所述多个候选回复特正之间的一致性，并根据获取的一致性结果进行排序；
30.基于所述一致性的排序结果，确定所述多个候选回复信息中的目标回复信息，作为所述答复内容。
31.为了解决上述问题，本发明还提供一种基于人工智能的多轮对话装置，所述装置包括：
32.询问语句判断单元，用于获取当前轮次对话的询问语句，并基于预训练的判断模型对所述询问语句进行判断，确定所述询问语句是否需要进行信息补全；
33.补全语句获取单元，用于若所述询问语句需要进行信息补全，则将所述询问语句、上一轮次对话的历史问题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型中，获取与所述询问语句对应的补全语句；
34.答复内容获取单元，用于将所述补全语句输入预训练的单轮意图识别模型中，获取与所述询问语句对应的答复内容。
35.此外，可选的技术方案是，在将所述询问语句、上一轮次对话的历史问题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型之前，还包括：基于所述询问语句、所述历史问题以及所述历史回答获取对应的输入数据；其中，
36.所述输入数据的获取步骤包括：
37.对所述历史问题、所述历史回答以及当前的询问语句进行分词处理，以获取对应的分词结果；
38.顺次连接所述历史问题、所述历史回答以及所述询问语句的分词结果，并在所述分词结果的预设位置添加标志符号，以形成所述输入数据。
39.为了解决上述问题，本发明还提供一种电子设备，所述电子设备包括：
40.存储器，存储至少一个指令；及
41.处理器，执行所述存储器中存储的指令以实现上述所述的基于人工智能的多轮对话方法。
42.为了解决上述问题，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一个指令，所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于人工智能的多轮对话方法。
43.本发明实施例通过预训练的判断模型对所述询问语句进行判断，确定询问语句是否需要进行信息补全；若询问语句需要进行信息补全，则将询问语句、上一轮次对话的历史问题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型中，获取与所述询问语句对应的补全语句，最后将补全语句输入预训练的单轮意图识别模型中，获取与询问语句对应的答复内容，能够充分的通过对话历史信息，抓住询问语句中的关键信息，并将本轮缺少上下文的用户输入语句补全完整，不仅处理简洁，而且不会造成较多信息冗余，更加准确地识别多轮对话场景中客户表达的真实意图，进而帮助对应的智能对话系统改善服务质量，提高用户的满意程度。
附图说明
44.图1为本发明一实施例提供的基于人工智能的多轮对话方法的流程示意图；
45.图2为本发明一实施例提供的基于人工智能的多轮对话装置的模块示意图；
46.图3为本发明一实施例提供的实现基于人工智能的多轮对话方法的电子设备的内部结构示意图；
47.本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。
具体实施方式
48.应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
49.为解决现有的智能对话存在的，不能准确的获取上下文的关键信息，且信息冗余，会产生大量噪声信息，导致机器回答错乱，影响用户体验等问题，本发明提供一种基于人工智能的多轮对话方法，充分的利用对话历史信息，并获取其中的关键信息，将本轮缺少上下文的用户输入语句补全完整，不仅处理简洁，而且不会造成较多信息冗余，能够更加准确地识别多轮对话场景中客户的表达意图，帮助智能对话系统改善服务质量，提高用户满意度。
50.本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(artificial intelligence，ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
51.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
52.本发明提供一种基于人工智能的多轮对话方法。参照图1所示，为本发明一实施例提供的基于人工智能的多轮对话方法的流程示意图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。
53.在本实施例中，基于人工智能的多轮对话方法包括：
54.s100：获取当前轮次对话的询问语句，并基于预训练的判断模型对所述询问语句进行判断，确定所述询问语句是否需要进行信息补全。
55.其中，当前对话也可理解为当轮对话，由于不同用户的询问习惯或表达习惯存在差异，其询问语句有可能为完整的句子，也有可能为省略了部分内容的不完整句子，为确保意图识别的准确性，提供精确的问答内容，可通过预训练的判断模型对询问语句进行一个预判断，确定当前的询问语句是否需要进行信息补全。
56.具体地，所述判断模型的训练过程可进一步包括：
57.s110：获取训练数据，训练数据包括完整语句的正样本和非完整语句的负样本；其中，正样本和负样本均是询问语句，均可通过历史数据库获取。
58.s120：基于训练数据对神经网络模型进行训练，直至所述神经网络模型收敛至预设范围内，形成所述判断模型；其中，所述神经网络模型的结构包括两层gru、两层全连接层以及sigmoid函数。
59.其中，神经网络模型可利用二分类模型，包括两层gru(gate recurrent unit)、两层全连接层dense，以及sigmoid函数构成整体的模型结构，通过该模型可判断输入的询问语句是否需要进行信息补全操作。其中的gru是一种循环神经网络，和lstm(long
‑
short term memory)一样，也是为了解决长期记忆和反向传播中的梯度问题而提出的，但是，在本发明中gru相比lstm计算效率更好。
60.作为具体示例，gur的输入为x(t)以及上一节点传递下来的隐状态h(t
‑
1)，该隐状态包含之前节点的相关信息，结合x(t)和h(t
‑
1)，通过gru会得到当前隐藏节点的输出y(t)和传递至下一节点的隐状态h(t)。其中，在确定隐状态h(t)的过程中：首先，基于输入和上
一节点的隐状态确定重置门控r和更新门控z；然后，基于所述重置门控获取重置后的数据h(t
‑
1)’＝h(t
‑
1)r，并对h(t
‑
1)’和输入x(t)进行拼接，形成拼接数据，拼接后的数据通过tanh激活函数进行收缩处理，获取处理后的状态信息h’；最后，基于该状态信息h’以及更新门控z，确定传递至下一节点的隐状态h(t)＝(1
‑
z)
⊙
h(t
‑
1) z
⊙
h’。
61.在该步骤s100中，如果询问语句不需要进行信息补全，则可以直接输入预训练的单轮意图识别模型中，获取与所述询问语句对应的答复内容。
62.s200：若所述询问语句需要进行信息补全，则将所述询问语句、上一轮次对话的历史问题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型中，获取与所述询问语句对应的补全语句。
63.作为具体示例，在通过信息补全模型对询问语句进行信息补全的过程中，主要的补全类型包括指代词补全和信息补全两种情况，如下表1所示：
[0064][0065]
表1
[0066]
通过上表1可知，对于第一种指代词的补全替换，首先是识别到q2里的指代词“他”,同时识别出上下文的关键信息“姚明”,然后进行替换。对于第二种完善信息，首先是识别出上下文的关键信息“吃什么”，然后识别出q2中需要补全信息的位置在“呢”之前，完成询问语句的信息补全。
[0067]
具体地，假设当前对话的询问语句为q2：他多高啊，经判断模型判断后，可知其是需要进行信息补全的，将该询问语句q2输入信息补全模型后，可识别出其缺少指代词“他”的具体指代，因此，可通过历史询问语句q1中“姚明是干什么的”，确定当前轮次询问语句的指代词，并进行替代，同时，补全其中缺少的信息部分“身高”，形成最终输出的补全语句为“姚明身高多高啊”。
[0068]
具体地，在将所述询问语句、上一轮次对话的历史问题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型之前，还包括：基于所述询问语句、所述历史问题以及所述历史回答获取对应的输入数据；其中，所述输入数据的获取步骤包括：
[0069]
s210：对所述历史问题、所述历史回答以及当前的询问语句进行分词处理，并获取对应的分词结果；
[0070]
s220：顺次连接所述历史问题、所述历史回答以及所述询问语句的分词结果，并在所述分词结果的预设位置添加标志符号。
[0071]
具体地，该预设位置可包括连接分词结果后的第一个分词的前面以及各分词结果的连接处，例如，可在所述历史问题的前面添加开始分类符号(例如【cls】)作为开始标志符号或标志位，并在历史问题、历史回答以及询问语句之间添加分隔符号，例如【sep】。
[0072]
进而，将输入数据输入预训练的信息补全模型中，获取与所述询问语句对应的补
全语句，此处通过信息补全模型获取与所述询问语句对应的补全语句的过程可进一步包括：
[0073]
s230：将所述输入数据输入所述信息补全模型的输入层，获取与所述输入数据对应的嵌入特征；其中，所述嵌入特征包括与所述输入数据对应的token embedding、segment embedding和position embedding的加和。
[0074]
s240：通过所述信息补全模型的编码器部分对所述嵌入特征进行特征提取，获取对应的隐含向量。
[0075]
其中，可将嵌入特征输入到预设的bert模型中的编码器encoder部分进行特征提取，得到语义编码的隐含向量，bert模型中的多个transformer结构可以通过attention机制有效的提取指代词和上下文关键信息的配对关系。
[0076]
s250：将所述隐含向量输入所述信息补全模的全连接层和softmax层，确定输出的指针信息；
[0077]
s260：基于所述指针信息确定与所述查询语句对应的补全语句。
[0078]
具体地，将隐含向量表示经过全连接层dense层和softmax层后，计算得到每个token作为各类指针的概率，输出是一个5分类结果，分别对应五个指针，包括：关键信息start、关键信息end、补全信息位置、指代start和指代end指针。在信息补全模型输出的这个五个指针中，关键信息的start和关键信息end的指针是用来识别历史信息(包括历史问题和历史回答)中，下文可能所需要的做信息补全或者指代词；补全信息位置指针是用来预测关键信息start
‑
end在本轮用户输入q2中需要插入的位置；指代start和指代end指针是用来识别出用户输入q2中出现的指代词。
[0079]
需要说明的是，如果当本轮用户输入仅存在一个需要进行补全的信息时，换言之，当本轮的查询语句不存在指代词或者关键信息的补全时，在模型处理过程中，不需要就进行补全信息对应的补全信息位置、指代start和end指针都会指向[cls]标志位，从而避免被错误补全信息，进而保证信息补全模型的稳定性。
[0080]
在本发明的一个具体实施方式中，信息补全模型的可基于遮盖思想和transformer encoder编码器构建的，通过训练决定缺失位置的信息补全结果；其本质是采用大量遮盖标签产生的噪声，对模型进行训练，使得模型具有文本的生成能力，对文本缺失信息位置生成机器预测的缺失文本结果。在模型训练阶段，结果的产生被用于计算损失函数来完成模型的训练，直至损失函数符合阈值要求，其中，损失函数可根据具体的需求进行自定义，可采用五个指针的损失函数之和，每个指针的损失函数可采用交叉熵损失函数等多种类型的损失函数。
[0081]
s300：将所述补全语句输入预训练的单轮意图识别模型中，获取与所述询问语句对应的答复内容。
[0082]
其中，由于已经通过信息补全模型对询问语句进行信息补全操作，因此，即使单轮意图识别模型选用简单的识别模型，也能够达到高精度的意图识别，减少信息冗余，处理速度快，并能够根据识别的意图确定对应的答复内容，提高用户在智能对话中的体验效果。
[0083]
具体地，待确定补全语句后，可将补全语句作为新的用户query进入到已经训练好的单轮意图识别模型去判断用户具体意图，这里的单轮意图识别模型主要是采用两层结构，第一层是规则引擎，通过正则化表达式直接识别用户意图，第二层是深度学习网络模型
两层双向gru 两层全连接层dense softmax进行多个意图分类识别，并输出概率最高的识别结果，结束本轮对话。
[0084]
在本发明的另一具体实施方式中，获取与询问语句对应的答复内容的过程还可以包括：
[0085]
s310：基于所述单轮意图识别模型以及所述补全语句，获取与所述补全语句对应的多个候选回复信息；
[0086]
s320：根据与所述补全语句对应的历史问题及历史回答确定上下文特征，并根据所述候选回复信息生成多个候选回复特征；
[0087]
s330：获取所述上下文特征与所述多个候选回复特正之间的一致性，并根据获取的一致性结果进行排序；
[0088]
s340：基于所述一致性的排序结果，确定所述多个候选回复信息中的目标回复信息，作为所述答复内容。
[0089]
作为具体示例，本发明的基于人工智能的多轮对话识别方法，在当前单轮对话开始后，首先需要确定用户的询问语句，然后，通过预训练的判断模型，对该询问语句进行判断，确定是否需要进行信息补全，如果不需要则，直接通过单轮意图识别模型对当前对话的用户意图进行识别，并确定回复的内容；否则，如果当前轮次询问语句需要进行信息补全，则将其输入预训练的信息补全模型中，通过信息补全模型输出进行信息补全后的补全语句，然后再通过单轮意图识别模型，进行意图识别及答复。
[0090]
可知，本发明的基于人工智能的多轮对话识别方法，能够充分的通过对话历史信息，抓住询问语句中的关键信息，并将本轮缺少上下文的用户输入语句补全完整，不仅处理简洁，而且不会造成较多信息冗余，更加准确地识别多轮对话场景中客户表达的真实意图，进而帮助对应的智能对话系统改善服务质量，提高用户的满意程度。
[0091]
如图2所示，是本发明基于人工智能的多轮对话装置的功能模块图。
[0092]
本发明所述基于人工智能的多轮对话装置200可以安装于电子设备中。根据实现的功能，所述基于人工智能的多轮对话装置可以包括：询问语句判断单元210、补全语句获取单元220和答复内容获取单元230。本发所述单元也可以称之为模块，是指一种能够被电子设备处理器所执行，并且能够完成固定功能的一系列计算机程序段，其存储在电子设备的存储器中。
[0093]
在本实施例中，关于各模块/单元的功能如下：
[0094]
询问语句判断单元210，用于获取当前轮次对话的询问语句，并基于预训练的判断模型对所述询问语句进行判断，确定询问语句是否需要进行信息补全。
[0095]
其中，当前对话也可理解为当轮对话，由于不同用户的询问习惯或表达习惯存在差异，其询问语句有可能为完整的句子，也有可能为省略了部分内容的不完整句子，为确保意图识别的准确性，提供精确的问答内容，可通过预训练的判断模型对询问语句进行一个预判断，确定当前的询问语句是否需要进行信息补全。
[0096]
具体地，询问语句判断单元210的判断模型的训练过程可进一步包括：
[0097]
训练数据获取模块，用于获取训练数据，训练数据包括完整语句的正样本和非完整语句的负样本；其中，正样本和负样本均是询问语句，均可通过历史数据库获取。
[0098]
判断模型形成模块，用于基于训练数据对神经网络模型进行训练，直至所述神经
网络模型收敛至预设范围内，形成所述判断模型；其中，所述神经网络模型的结构包括两层gru、两层全连接层以及sigmoid函数。
[0099]
其中，神经网络模型可利用二分类模型，包括两层gru(gate recurrent unit)、两层全连接层dense，以及sigmoid函数构成整体的模型结构，通过该模型可判断输入的询问语句是否需要进行信息补全操作。其中的gru是一种循环神经网络，和lstm(long
‑
short term memory)一样，也是为了解决长期记忆和反向传播中的梯度问题而提出的，但是，在本发明中gru相比lstm计算效率更好。
[0100]
作为具体示例，gur的输入为x(t)以及上一节点传递下来的隐状态h(t
‑
1)，该隐状态包含之前节点的相关信息，结合x(t)和h(t
‑
1)，通过gru会得到当前隐藏节点的输出y(t)和传递至下一节点的隐状态h(t)。其中，在确定隐状态h(t)的过程中：首先，基于输入和上一节点的隐状态确定重置门控r和更新门控z；然后，基于所述重置门控获取重置后的数据h(t
‑
1)’＝h(t
‑
1)r，并对h(t
‑
1)’和输入x(t)进行拼接，形成拼接数据，拼接后的数据通过tanh激活函数进行收缩处理，获取处理后的状态信息h’；最后，基于该状态信息h’以及更新门控z，确定传递至下一节点的隐状态h(t)＝(1
‑
z)
⊙
h(t
‑
1) z
⊙
h’。
[0101]
在该询问语句判断单元210中，如果询问语句不需要进行信息补全，则可以直接输入预训练的单轮意图识别模型中，获取与所述询问语句对应的答复内容。
[0102]
补全语句获取单元220，用于若所述询问语句需要进行信息补全，则将所述询问语句、上一轮次对话的历史问题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型中，获取与所述询问语句对应的补全语句。
[0103]
作为具体示例，在通过信息补全模型对询问语句进行信息补全的过程中，主要的补全类型包括指代词补全和信息补全两种情况，如下表1所示：
[0104][0105][0106]
表1
[0107]
通过上表1可知，对于第一种指代词的补全替换，首先是识别到q2里的指代词“他”,同时识别出上下文的关键信息“姚明”,然后进行替换。对于第二种完善信息，首先是识别出上下文的关键信息“吃什么”，然后识别出q2中需要补全信息的位置在“呢”之前，完成询问语句的信息补全。
[0108]
具体地，假设当前对话的询问语句为q2：他多高啊，经判断模型判断后，可知其是需要进行信息补全的，将该询问语句q2输入信息补全模型后，可识别出其缺少指代词“他”的具体指代，因此，可通过历史询问语句q1中“姚明是干什么的”，确定当前轮次询问语句的指代词，并进行替代，同时，补全其中缺少的信息部分“身高”，形成最终输出的补全语句为
“
姚明身高多高啊”。
[0109]
具体地，在将所述询问语句、上一轮次对话的历史问题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型之前，还包括：基于所述询问语句、所述历史问题以及所述历史回答获取对应的输入数据；其中，所述输入数据的获取包括：
[0110]
分词结果获取模块，用于对所述历史问题、所述历史回答以及当前的询问语句进行分词处理，并获取对应的分词结果；
[0111]
标志符号添加模块，用于顺次连接所述历史问题、所述历史回答以及所述询问语句的分词结果，并在所述分词结果的预设位置添加标志符号。
[0112]
具体地，该预设位置可包括连接分词结果后的第一个分词的前面以及各分词结果的连接处，例如，可在所述历史问题的前面添加开始分类符号(例如【cls】)作为开始标志符号或标志位，并在历史问题、历史回答以及询问语句之间添加分隔符号，例如【sep】。
[0113]
进而，将输入数据输入预训练的信息补全模型中，获取与所述询问语句对应的补全语句，此处通过信息补全模型获取与所述询问语句对应的补全语句的过程可进一步包括：
[0114]
嵌入特征获取模块，用于将所述输入数据输入所述信息补全模型的输入层，获取与所述输入数据对应的嵌入特征；其中，所述嵌入特征包括与所述输入数据对应的token embedding、segment embedding和position embedding的加和。
[0115]
隐含向量获取模块，用于通过所述信息补全模型的编码器部分对所述嵌入特征进行特征提取，获取对应的隐含向量。
[0116]
其中，可将嵌入特征输入到预设的bert模型中的编码器encoder部分进行特征提取，得到语义编码的隐含向量，bert模型中的多个transformer结构可以通过attention机制有效的提取指代词和上下文关键信息的配对关系。
[0117]
指针信息确定模块，用于将所述隐含向量输入所述信息补全模的全连接层和softmax层，确定输出的指针信息；
[0118]
补全语句确定模块，基于所述指针信息确定与所述查询语句对应的补全语句。
[0119]
具体地，将隐含向量表示经过全连接层dense层和softmax层后，计算得到每个token作为各类指针的概率，输出是一个5分类结果，分别对应五个指针，包括：关键信息start、关键信息end、补全信息位置、指代start和指代end指针。在信息补全模型输出的这个五个指针中，关键信息的start和关键信息end的指针是用来识别历史信息(包括历史问题和历史回答)中，下文可能所需要的做信息补全或者指代词；补全信息位置指针是用来预测关键信息start
‑
end在本轮用户输入q2中需要插入的位置；指代start和指代end指针是用来识别出用户输入q2中出现的指代词。
[0120]
需要说明的是，如果当本轮用户输入仅存在一个需要进行补全的信息时，换言之，当本轮的查询语句不存在指代词或者关键信息的补全时，在模型处理过程中，不需要就进行补全信息对应的补全信息位置、指代start和end指针都会指向[cls]标志位，从而避免被错误补全信息，进而保证信息补全模型的稳定性。
[0121]
在本发明的一个具体实施方式中，信息补全模型的可基于遮盖思想和transformer encoder编码器构建的，通过训练决定缺失位置的信息补全结果；其本质是采用大量遮盖标签产生的噪声，对模型进行训练，使得模型具有文本的生成能力，对文本缺失
digital，sd)卡、闪存卡(flash card)等。进一步地，所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据，例如基于人工智能的多轮对话程序的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。
[0134]
所述处理器10在一些实施例中可以由集成电路组成，例如可以由单个封装的集成电路所组成，也可以是由多个相同功能或不同功能封装的集成电路所组成，包括一个或者多个中央处理器(central processing unit，cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(control unit)，利用各种接口和线路连接整个电子设备的各个部件，通过运行或执行存储在所述存储器11内的程序或者模块(例如基于人工智能的多轮对话程序等)，以及调用存储在所述存储器11内的数据，以执行电子设备1的各种功能和处理数据。
[0135]
所述总线可以是外设部件互连标准(peripheral component interconnect，简称pci)总线或扩展工业标准结构(extended industry standard architecture，简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
[0136]
图3仅示出了具有部件的电子设备，本领域技术人员可以理解的是，图2示出的结构并不构成对所述电子设备1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。
[0137]
例如，尽管未示出，所述电子设备1还可以包括给各个部件供电的电源(比如电池)，优选地，电源可以通过电源管理装置与所述至少一个处理器10逻辑相连，从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、wi
‑
fi模块等，在此不再赘述。
[0138]
进一步地，所述电子设备1还可以包括网络接口，可选地，所述网络接口可以包括有线接口和/或无线接口(如wi
‑
fi接口、蓝牙接口等)，通常用于在该电子设备1与其他电子设备之间建立通信连接。
[0139]
可选地，该电子设备1还可以包括用户接口，用户接口可以是显示器(display)、输入单元(比如键盘(keyboard))，可选地，用户接口还可以是标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light
‑
emitting diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
[0140]
应该了解，所述实施例仅为说明之用，在专利申请范围上并不受此结构的限制。
[0141]
所述电子设备1中的所述存储器11存储的基于人工智能的多轮对话程序12是多个指令的组合，在所述处理器10中运行时，可以实现：
[0142]
获取当前对话的询问语句，并基于预训练的判断模型对所述询问语句进行判断，确定所述询问语句是否需要进行信息补全；
[0143]
若所述询问语句需要进行信息补全，则将所述询问语句、上一轮次对话的历史问
题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型中，获取与所述询问语句对应的补全语句；
[0144]
将所述补全语句输入预训练的单轮意图识别模型中，获取与所述询问语句对应的答复内容。
[0145]
此外，可选的技术方案是，所述判断模型的训练过程包括：
[0146]
获取训练数据，训练数据包括完整语句的正样本和非完整语句的负样本；其中,正样本和负样本均是询问语句；
[0147]
基于训练数据对神经网络模型进行训练，直至所述神经网络模型收敛至预设范围内，形成所述判断模型；其中，所述神经网络模型的结构包括两层gru、两层全连接层以及sigmoid函数。
[0148]
此外，可选的技术方案是，在将所述询问语句、上一轮次对话的历史问题及与所述历史问题对应的历史回答，同时输入预训练的信息补全模型之前，还包括：基于所述询问语句、所述历史问题以及所述历史回答获取对应的输入数据；其中，
[0149]
所述输入数据的获取步骤包括：
[0150]
对所述历史问题、所述历史回答以及当前的询问语句进行分词处理，并获取对应的分词结果；
[0151]
顺次连接所述历史问题、所述历史回答以及所述询问语句的分词结果，并在所述分词结果的预设位置添加标志符号。
[0152]
此外，可选的技术方案是，所述获取与所述询问语句对应的补全语句的步骤包括：
[0153]
将所述输入数据输入所述信息补全模型的输入层，获取与所述输入数据对应的嵌入特征；
[0154]
通过所述信息补全模型的编码器部分对所述嵌入特征进行特征提取，获取对应的隐含向量；
[0155]
将所述隐含向量输入所述信息补全模的全连接层和softmax层，确定输出的指针信息；
[0156]
基于所述指针信息确定与所述查询语句对应的补全语句。
[0157]
此外，可选的技术方案是，所述指针信息包括关键信息start、关键信息end、补全信息位置、指代start和指代end；其中，
[0158]
所述关键信息的start和所述关键信息end的指针，用于识别所述历史问题和所述历史回答中，需对所述询问语句进行信息补全的指代词；
[0159]
所述补全信息位置，用于预测所述关键信息start和所述关键信息end在所述询问语句中需要插入的位置；
[0160]
所述指代start和所述指代end，用于识别所述询问语句中出现的指代词。
[0161]
此外，可选的技术方案是，所述将所述补全语句输入预训练的单轮意图识别模型中，获取与所述询问语句对应的答复内容的步骤包括：
[0162]
基于所述单轮意图识别模型以及所述补全语句，获取与所述补全语句对应的多个候选回复信息；
[0163]
根据与所述补全语句对应的历史问题及历史回答确定上下文特征，并根据所述候选回复信息生成多个候选回复特征；
[0164]
获取所述上下文特征与所述多个候选回复特正之间的一致性，并根据获取的一致性结果进行排序；
[0165]
基于所述一致性的排序结果，确定所述多个候选回复信息中的目标回复信息，作为所述答复内容。
[0166]
具体地，所述处理器10对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述，在此不赘述。
[0167]
进一步地，所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom，read
‑
only memory)。
[0168]
在本发明所提供的几个实施例中，应该理解到，所揭露的设备，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。
[0169]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0170]
另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能模块的形式实现。
[0171]
对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。
[0172]
因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0173]
此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称，而并不表示任何特定的顺序。
[0174]
最后应说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或等同替换，而不脱离本发明技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种对儿童使用屏幕终端进行智能管控的方法及系统与流程

基于人工智能的多轮对话方法、装置及存储介质与流程

相关文献

最热文献