一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种意图识别方法、装置及电子设备与流程

2022-06-01 16:01:54 来源:中国专利 TAG:


1.本发明涉及数据处理领域,更具体的说,涉及一种意图识别方法、装置及电子设备。


背景技术:

2.随着用人成本的不断提高,为了节约客服中心,不少企业都引进了机器人客服系统,以使机器人客服系统与用户进行自助沟通。
3.在机器人客服系统与用户沟通过程中,机器人客服系统常采用模式化流程,即仅在用户回复预先设定的词语时,机器人客服系统才能够识别出用户意图。如,机器人客服系询问用户,“是否是咨询套餐费用”,用户回复“是”或“否”,机器人客服系统才能够识别出用户是否想咨询套餐费用的意图。
4.此种机器人客服系统的处理方式,用户意图识别准确度低,进而无法满足用户需求。


技术实现要素:

5.有鉴于此,本发明提供一种意图识别方法、装置及电子设备,以解决用户意图识别准确度低,进而无法满足用户需求的问题。
6.为解决上述技术问题,本发明采用了如下技术方案:
7.一种意图识别方法,包括:
8.获取待进行意图识别的会话数据;所述会话数据包括至少一个会话子数据;
9.确定所述会话子数据的特征信息,并确定所述会话子数据的特征信息对应的隐式关联表达信息;
10.确定所述会话数据中的最后一个会话子数据的会话叠加特征;所述会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定;
11.对所述会话叠加特征进行意图识别,得到所述会话数据的意图识别结果。
12.可选地,确定所述会话子数据的特征信息,包括:
13.对所述会话子数据中的每个字进行字典编码,得到每个字对应的字典编码结果;
14.将所述会话子数据中的每个字的字典编码结果进行组合,得到所述会话子数据的字典编码结果;
15.基于所述会话子数据位于所述会话数据中的位置,对所述会话子数据进行位置编码,得到所述会话子数据的位置编码结果;
16.将所述会话子数据的字典编码结果和所述位置编码结果进行组合,得到所述会话子数据的特征信息。
17.可选地,确定所述会话子数据的特征信息对应的隐式关联表达信息,包括:
18.对所述会话子数据的特征信息进行隐式关联表达分析,得到所述会话子数据的隐
式关联表达信息。
19.可选地,确定所述会话数据中的最后一个会话子数据的会话叠加特征,包括:
20.获取最后一个会话子数据的隐式关联表达信息;
21.获取所述会话子数据的前一个会话子数据的会话叠加特征,并获取基于循环神经网络子模型得到的所述会话叠加特征对应的隐状态信息;
22.使用所述循环神经网络子模型,对所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及所述会话叠加特征对应的隐状态信息进行处理,得到所述会话数据中的最后一个会话子数据的会话叠加特征。
23.可选地,对所述会话叠加特征进行意图识别,得到所述会话数据的意图识别结果,包括:
24.对所述会话叠加特征进行降维处理,得到降维结果;
25.确定所述降维结果在不同意图类别信息下的概率值;
26.将概率值最大的意图类别信息,作为所述会话数据的意图识别结果。
27.一种意图识别装置,包括:
28.数据获取模块,用于获取待进行意图识别的会话数据;所述会话数据包括至少一个会话子数据;
29.信息确定模块,用于确定所述会话子数据的特征信息,并确定所述会话子数据的特征信息对应的隐式关联表达信息;
30.特征确定模块,用于确定所述会话数据中的最后一个会话子数据的会话叠加特征;所述会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定;
31.意图识别模块,用于对所述会话叠加特征进行意图识别,得到所述会话数据的意图识别结果。
32.可选地,所述信息确定模块包括:
33.字典编码子模块,用于对所述会话子数据中的每个字进行字典编码,得到每个字对应的字典编码结果;
34.第一组合子模块,用于将所述会话子数据中的每个字的字典编码结果进行组合,得到所述会话子数据的字典编码结果;
35.位置编码子模块,用于基于所述会话子数据位于所述会话数据中的位置,对所述会话子数据进行位置编码,得到所述会话子数据的位置编码结果;
36.第二组合子模块,用于将所述会话子数据的字典编码结果和所述位置编码结果进行组合,得到所述会话子数据的特征信息。
37.可选地,所述信息确定模块用于确定所述会话子数据的特征信息对应的隐式关联表达信息时,具体用于:
38.对所述会话子数据的特征信息进行隐式关联表达分析,得到所述会话子数据的隐式关联表达信息。
39.可选地,所述特征确定模块包括:
40.信息获取子模块,用于获取最后一个会话子数据的隐式关联表达信息;
41.信息处理子模块,用于获取所述会话子数据的前一个会话子数据的会话叠加特
征,并获取基于循环神经网络子模型得到的所述会话叠加特征对应的隐状态信息;
42.特征确定子模块,用于使用所述循环神经网络子模型,对所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及所述会话叠加特征对应的隐状态信息进行处理,得到所述会话数据中的最后一个会话子数据的会话叠加特征。
43.一种电子设备,包括:存储器和处理器;
44.其中,所述存储器用于存储程序;
45.处理器调用程序并用于执行上述的意图识别方法。
46.相较于现有技术,本发明具有以下有益效果:
47.本发明提供了一种意图识别方法、装置及电子设备,获取待进行意图识别的会话数据,所述会话数据包括至少一个会话子数据,确定所述会话子数据的特征信息,并确定所述会话子数据的特征信息对应的隐式关联表达信息,确定所述会话数据中的最后一个会话子数据的会话叠加特征,所述会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定,对所述会话叠加特征进行意图识别,得到所述会话数据的意图识别结果。本发明中,通过确定最后一个会话子数据的会话叠加特征、对所述会话叠加特征进行意图识别,能够得到所述会话数据的意图识别结果,在模式化聊天场景或开放式聊天场景,均能够准确地识别出用户意图。进一步,本发明中,最后一个会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定,使得在进行意图识别时,考虑了会话上下文信息,进而提高用户意图识别的准确度。
附图说明
48.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
49.图1为本发明实施例提供的一种意图识别方法的方法流程图;
50.图2为本发明实施例提供的另一种意图识别方法的方法流程图;
51.图3为本发明实施例提供的一种意图识别模型的部分模型的示意图;
52.图4为本发明实施例提供的再一种意图识别方法的方法流程图;
53.图5为本发明实施例提供的一种意图识别模型的另一部分模型的示意图;
54.图6为本发明实施例提供的一种意图识别装置的结构示意图。
具体实施方式
55.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
56.在机器人客服系统与用户沟通过程中,机器人客服系统常采用模式化流程,即仅
在用户回复预先设定的词语时,机器人客服系统才能够识别出用户意图。
57.具体的,采用设计对话逻辑的方式来实现多轮对话。它能解决很多工业上的问题。特别是一些比较固定的流程,比如说:电销,机器人询问用户是否感兴趣;这里机器人最重要的事情不是促成下单,而是筛选有意向的用户。比如说用户说感兴趣,甚至是跟机器人多聊几句,就会被标识为感兴趣,通过树形结构来逐层判断当前的对话意图和选择相应的对话应答。
58.还可以如,机器人客服系询问用户,“是否是咨询套餐费用”,用户回复“是”或“否”,机器人客服系统才能够识别出用户是否想咨询套餐费用的意图。
59.但是这种方法只适用于模式化的流程,对于开放型的聊天或者客服机器人,此种机器人客服系统的处理方式,用户意图识别准确度低,不能满足其智能化的要求,进而无法满足用户需求。
60.为了解决这一技术问题,发明人发现,对于模式化聊天场景或开放式聊天场景下,可以通过深度神经网络模型来识别用户的说话意图,这就需要构建用户文本在空间上的表征形式,目前常见的表征形式是将用户说话的当前文本作为单独表征,来识别当前句表达的意图,但是当用户的一句话没有携带关键信息时,则无法识别出用户意图。
61.进一步,发明人发现,可以在进行意图识别时,考虑用户的上下文信息,从而能够通过提取上下文的较多的关键信息,来识别用户意图,提高用户意图识别的准确度。
62.具体的,在模型训练阶段,首先将表示同一意图的多句会话内容作为一个训练样本,构建句内(字典编码)和句间(位置编码)两种拼接方式,经过拼接融合后利用多层深度神经网络,得到对多句会话内和多句会话间的特征表达,将两种特征表达融合后以意图类别为目标,训练得到一个意图识别模型。在模型预测阶段,利用redis数据库对数据快速缓存和备份的特点,在同一会话中实时获取该会话中当前文本的前n句对话文本,并通过已训练好的意图识别模型,判断出,当前内容的一个意图类型,并对存放历史会话数据的redis数据库进行更新,该方法保证了在训练和预测两个阶段的数据一致性,不仅利用了当前会话,也没有丢失历史会话内容对当前意图判断的影响,并且还保证的数据的实时性。
63.详细来说,本发明提供了一种意图识别方法、装置及电子设备,获取待进行意图识别的会话数据,所述会话数据包括至少一个会话子数据,确定所述会话子数据的特征信息,并确定所述会话子数据的特征信息对应的隐式关联表达信息,确定所述会话数据中的最后一个会话子数据的会话叠加特征,所述会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定,对所述会话叠加特征进行意图识别,得到所述会话数据的意图识别结果。本发明中,通过确定最后一个会话子数据的会话叠加特征、对所述会话叠加特征进行意图识别,能够得到所述会话数据的意图识别结果,在模式化聊天场景或开放式聊天场景,均能够准确地识别出用户意图。进一步,本发明中,最后一个会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定,使得在进行意图识别时,考虑了会话上下文信息,进而提高用户意图识别的准确度。
64.在上述内容的基础上,本发明的另一实施例提供了一种意图识别方法,可以应用于处理器、服务器等意图识别设备。参照图1,意图识别方法可以包括:
65.s11、获取待进行意图识别的会话数据。
66.本实施例中,待进行意图识别的会话数据,可以是用户在与客服机器人聊天过程中的同一通会话。一般来说,用户与客服机器人采用一问一答的方式,此时,可以提取用户这一方的会话。每一句会话作为一个会话子数据。
67.如客户会话内容如下:
68.第一句话.你好,
69.第二句话.我想问一下这款产品的投保范围有哪些?
70.第三句话.就是xx这款产品。
71.需要说明的是,在用户回答完一句话时,可以采用本发明的方法进行意图识别,若是能够识别出来,则在下次进行意图识别时,则直接从第二句话开始。若是不能够识别出来,则在用户说完第二句时,使用第一句和第二句话,进行意图识别,若仍识别不出来,则结合第三句,第四句,直至到第n句为止,n一般可以是10。
72.本实施例中,将需要进行意图识别的会话称为会话数据,所述会话数据包括至少一个会话子数据。具体的,会话数据中的每一句话作为一个会话子数据,会话数据最多包括上述n个会话子数据。预先可以利用redis数据库对数据快速缓存和备份的特点,缓存会话子数据,并实时更新缓存的会话子数据。保证了在训练和预测两个阶段的数据一致性,不仅利用了当前会话,也没有丢失历史会话内容对当前意图判断的影响,并且还保证的数据的实时性。
73.需要说明的是,若是本次进行意图识别的会话数据中的会话子数据不足n个时,可以补足,补充空白会话子数据,直至会话子数据的数量为n个。
74.s12、确定所述会话子数据的特征信息,并确定所述会话子数据的特征信息对应的隐式关联表达信息。
75.在实际应用中,特征信息包括:字典编码结果和位置编码结果。
76.具体的,参照图2,步骤s12可以包括:
77.s21、对所述会话子数据中的每个字进行字典编码,得到每个字对应的字典编码结果。
78.具体的,参照图3,可以将会话子数据(图3中的第一句话、第二句话、第三句话
……
)作为输入,通过对每一句会话子数据中的每个字进行字典编码,得到每个字对应的字典编码结果。
79.s22、将所述会话子数据中的每个字的字典编码结果进行组合,得到所述会话子数据的字典编码结果。
80.具体的,将会话子数据中的每个字的字典编码结果,按照每个字的字符标识(token_id,具体指在会话子数据中的位置),对每个字的字典编码结果进行组合。
81.在组合过程中,限定了会话子数据的字典编码结果中的字的字典编码结果的数量,如可以为128,128代表每个句子最多对128个字进行编码。在不足128时,用0补足,在超过128时,超出部分截断,即可得到会话子数据的字典编码结果token_embedding。
82.s23、基于所述会话子数据位于所述会话数据中的位置,对所述会话子数据进行位置编码,得到所述会话子数据的位置编码结果。
83.具体的,参照图3,对会话子数据的句子顺序(segment_id)依次进行位置编码,如
在会话子数据为会话数据中的第一句时,会话子数据的位置编码结果为000000
……
,其中,0的个数等于会话子数据的字典编码结果中的字的字典编码结果的个数,如为128,然后第二句话的位置编码结果为128个1,第三句话的位置编码结果为128个0,以此类推,直至最后一句话,本实施例中的位置编码结果可以称为segment_id_embedding。
84.s24、将所述会话子数据的字典编码结果和所述位置编码结果进行组合,得到所述会话子数据的特征信息。
85.具体的,对于每一会话子数据,将其字典编码结果token_embedding与位置编码结果segment_id_embedding相加,即可得到会话子数据的特征信息(即图3中的combine_embedding)。即:
86.token_embedding segment_id_embedding=combine_embedding。
87.在确定出所述会话子数据的特征信息后,需要确定所述会话子数据的特征信息对应的隐式关联表达信息。
88.具体的,对所述会话子数据的特征信息进行隐式关联表达分析,得到所述会话子数据的隐式关联表达信息。
89.详细来说,对于会话子数据,将会话子数据的特征信息输入图3中的multi-head-self-attention(多头自注意力机制)网络结构,该结构的作用在于可以允许模型在不同的表示子空间里学习到相关的信息,也就是学习到单句会话内部字与字之间的隐式关联表达。一个会话数据中的每句话(会话子数据)都会通过该网络层得到一个含有句内的隐式关联表达的文本表征的矩阵(即隐式关联表达信息):hm,在一个会话数据中,我们可以得到其中,n为会话子数据的数量,在n小于n时,用0不足,即可得到会话数据的隐式关联表达矩阵。
90.s13、确定所述会话数据中的最后一个会话子数据的会话叠加特征;所述会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定。
91.s31、获取最后一个会话子数据的隐式关联表达信息。
92.隐式关联表达信息可以通过步骤s12确定,具体实现过程参照上述相应说明。
93.s32、获取所述会话子数据的前一个会话子数据的会话叠加特征,并获取基于循环神经网络子模型得到的所述会话叠加特征对应的隐状态信息。
94.s33、使用所述循环神经网络子模型,对所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及所述会话叠加特征对应的隐状态信息进行处理,得到所述会话数据中的最后一个会话子数据的会话叠加特征。
95.具体的,参照图3,将上述每个会话子数据对应的隐式关联表达信息,输入gru(gate recurrent unit,本实施例中称为循环神经网络子模型)结构的神经网络层,该神经网络结构为是循环神经网络中的一种,循环神经网络的优势在于有一个当前的输入,即隐式关联表达信息和上一个会话子数据传递下来的隐状态信息(hidden state)这个隐状态信息包含了之前会话子数据的相关信息。
96.然后,结合和gru会得到当前隐藏节点,即当前的会话子数据的输出,
即会话叠加特征和传递给下一个会话子数据的隐状态信息由此,在计算每一个循环点的时候,都能考虑到上一个循环点中的隐状态。如一个有三句话的样本在这一部分的传递为:
97.第一句话的表征向量(初始隐状态,可以根据实际情况配置,如为零矩阵),通过gru神经网络层,得到当前节点的输出和当前节点传递给下一个节点的隐状态
98.第二句话的表征向量(分别为上一节点会话叠加特征以及隐状态),通过gru神经网络层,得到当前节点的输出和当前节点传递给下一个节点的隐状态
99.第三句话的表征向量(上一节点隐状态),通过gru神经网络层,得到当前节点的输出和当前节点传递给下一个节点的隐状态
100.这里要说明两点:
101.(1)在每次传递的时候,利用残差结构,将上一节点的输出加入到当前节点的输入,合并作为当前一节点的输入,这里用代替运算,残差网络的优点在于能解决了深度神经网络的一部分退化问题。
102.(2)

代表gru内部中输入与隐状态的hadamard product(哈达玛积),这里存在有多次计算。
103.通过上述这三部分的计算,包含初始编码,多头注意力机制,和gru神经网络,最终输出该样本的会话叠加特征,该会话叠加特征包含了文本本身字符信息(token_embdinng)、会话句子顺序关系(segment_id_embedding)、单句会话内部的隐式关联表达信息以及句子之间的隐状态信息。得到最终意图类别分类前的会话叠加特征final_embedding。
104.s14、对所述会话叠加特征进行意图识别,得到所述会话数据的意图识别结果。
105.具体的,对所述会话叠加特征进行降维处理,得到降维结果,然后确定所述降维结果在不同意图类别信息下的概率值。最后,将概率值最大的意图类别信息,作为所述会话数据的意图识别结果。
106.参照图5,图5的分类子模型主要是将编码成生成的会话叠加特征final_embedding的特征向量通过(globalaveragepooling)全局平均层,降维得到一个低维度的表达,紧接一个全连接层,激活函数为sofmax,得到一个k维且数值为0-1之间的概率分布,k代表需要分类的意图类别信息个数,最终选择概率最高的那一维作为最终输出类别,即会话数据的意图识别结果。
107.需要说明的是,图3的模型和图5的分类子模型可以构成本发明中的意图识别模型,该意图识别模型通过训练得到,在确定训练样本时,以n(n最大为10)为窗口大小,选择一通会话内连续n条会话子数据作为一个样本,将这一个样本对应的意图类别信息,也即意图类型作为样本标签,构造多条以样本-标签,这样的文本对,作为训练数据。
108.需要说明的是,每一样本中包括的会话子数据的数量可以不同,如有的是3条,有的是5条,具体根据实际会话中,能够表达出意图使用的句子数量为准,但最多是10条。
109.在确定了训练数据后,通过图3中的token_embedding(字典编码),即可得到一样本的n个128维的矩阵,其中,n可以为上述的10,超出的截断,不够的用默认0补齐。
110.此后,按照图3的网络架构进行处理,得到最后一个会话子数据的会话叠加特征final_embedding,输入到图5的分类子模型中,即可得到最终的意图识别结果。
111.为了本领域技术人员能够更加清楚地了解本发明,现举例如下:
112.如客户会话内容如下:
113.1.你好,
114.2.我想问一下这款产品的投保范围有哪些?
115.3.就是xx这款产品。
116.这三句话我们可以得到以下几点:
117.a该客户的意图为xx的投保范围;
118.b该意图为客户说完这三句话后我们才能得到;
119.c该意图的线索是通过第2句和第3句得到的。
120.因为利用以上的模型结构设计,在客户说完第三句话时,能将前两句话合并作为一个会话数据,且能在上述模型中得到a、b、c这三条线索,通过gru能得到第二句话对当前句(第三句话)的影响最大,从而得到正确的意图结果。
121.本实施例中,获取待进行意图识别的会话数据,所述会话数据包括至少一个会话子数据,确定所述会话子数据的特征信息,并确定所述会话子数据的特征信息对应的隐式关联表达信息,确定所述会话数据中的最后一个会话子数据的会话叠加特征,所述会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定,对所述会话叠加特征进行意图识别,得到所述会话数据的意图识别结果。本发明中,通过确定最后一个会话子数据的会话叠加特征、对所述会话叠加特征进行意图识别,能够得到所述会话数据的意图识别结果,在模式化聊天场景或开放式聊天场景,均能够准确地识别出用户意图。进一步,本发明中,最后一个会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定,使得在进行意图识别时,考虑了会话上下文信息,进而提高用户意图识别的准确度。
122.另外,本发明采用完整的多轮会话数据,充分保留一个会话内的完整内容表达。通过对文本本身字符编码、会话句子顺序编码、单句会话内部的隐式关联表达分析以及句子之间的隐状态信息,对一句或一段对话的意图判断,更加完整。此外,通过利用gru的特性,将多句本身的句子特征关联起来,使得在进入分类前的最终的文本表征,考虑了文本原本顺序之间的隐式表达。
123.可选地,在上述意图识别方法的实施例的基础上,本发明的另一实施例提供了一种意图识别装置,参照图6,可以包括:
124.数据获取模块11,用于获取待进行意图识别的会话数据;所述会话数据包括至少一个会话子数据;
125.信息确定模块12,用于确定所述会话子数据的特征信息,并确定所述会话子数据
的特征信息对应的隐式关联表达信息;
126.特征确定模块13,用于确定所述会话数据中的最后一个会话子数据的会话叠加特征;所述会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定;
127.意图识别模块14,用于对所述会话叠加特征进行意图识别,得到所述会话数据的意图识别结果。
128.进一步,所述信息确定模块包括:
129.字典编码子模块,用于对所述会话子数据中的每个字进行字典编码,得到每个字对应的字典编码结果;
130.第一组合子模块,用于将所述会话子数据中的每个字的字典编码结果进行组合,得到所述会话子数据的字典编码结果;
131.位置编码子模块,用于基于所述会话子数据位于所述会话数据中的位置,对所述会话子数据进行位置编码,得到所述会话子数据的位置编码结果;
132.第二组合子模块,用于将所述会话子数据的字典编码结果和所述位置编码结果进行组合,得到所述会话子数据的特征信息。
133.进一步,所述信息确定模块用于确定所述会话子数据的特征信息对应的隐式关联表达信息时,具体用于:
134.对所述会话子数据的特征信息进行隐式关联表达分析,得到所述会话子数据的隐式关联表达信息。
135.进一步,所述特征确定模块包括:
136.信息获取子模块,用于获取最后一个会话子数据的隐式关联表达信息;
137.信息处理子模块,用于获取所述会话子数据的前一个会话子数据的会话叠加特征,并获取基于循环神经网络子模型得到的所述会话叠加特征对应的隐状态信息;
138.特征确定子模块,用于使用所述循环神经网络子模型,对所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及所述会话叠加特征对应的隐状态信息进行处理,得到所述会话数据中的最后一个会话子数据的会话叠加特征。
139.进一步,意图识别模块包括:
140.降维子模块,用于对所述会话叠加特征进行降维处理,得到降维结果;
141.概率值确定子模块,用于确定所述降维结果在不同意图类别信息下的概率值;
142.意图确定子模块,用于将概率值最大的意图类别信息,作为所述会话数据的意图识别结果。
143.本实施例中,获取待进行意图识别的会话数据,所述会话数据包括至少一个会话子数据,确定所述会话子数据的特征信息,并确定所述会话子数据的特征信息对应的隐式关联表达信息,确定所述会话数据中的最后一个会话子数据的会话叠加特征,所述会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定,对所述会话叠加特征进行意图识别,得到所述会话数据的意图识别结果。本发明中,通过确定最后一个会话子数据的会话叠加特征、对所述会话叠加特征进行意图识别,能够得到所述会话数据的意图识别结果,在模式化聊
天场景或开放式聊天场景,均能够准确地识别出用户意图。进一步,本发明中,最后一个会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定,使得在进行意图识别时,考虑了会话上下文信息,进而提高用户意图识别的准确度。
144.另外,本发明采用完整的多轮会话数据,充分保留一个会话内的完整内容表达。通过对文本本身字符编码、会话句子顺序编码、单句会话内部的隐式关联表达分析以及句子之间的隐状态信息,对一句或一段对话的意图判断,更加完整。此外,通过利用gru的特性,将多句本身的句子特征关联起来,使得在进入分类前的最终的文本表征,考虑了文本原本顺序之间的隐式表达。
145.需要说明的是,本实施例中的各个模块、子模块的工作过程,请参照上述实施例中的相应说明,在此不再赘述。
146.可选地,在上述意图识别方法及装置的实施例的基础上,本发明的另一实施例提供了一种电子设备,包括:存储器和处理器;
147.其中,所述存储器用于存储程序;
148.处理器调用程序并用于执行上述的意图识别方法。
149.本实施例中,获取待进行意图识别的会话数据,所述会话数据包括至少一个会话子数据,确定所述会话子数据的特征信息,并确定所述会话子数据的特征信息对应的隐式关联表达信息,确定所述会话数据中的最后一个会话子数据的会话叠加特征,所述会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定,对所述会话叠加特征进行意图识别,得到所述会话数据的意图识别结果。本发明中,通过确定最后一个会话子数据的会话叠加特征、对所述会话叠加特征进行意图识别,能够得到所述会话数据的意图识别结果,在模式化聊天场景或开放式聊天场景,均能够准确地识别出用户意图。进一步,本发明中,最后一个会话子数据的会话叠加特征由所述会话子数据的隐式关联表达信息、所述会话子数据的前一个会话子数据的会话叠加特征以及隐状态信息确定,使得在进行意图识别时,考虑了会话上下文信息,进而提高用户意图识别的准确度。
150.另外,本发明采用完整的多轮会话数据,充分保留一个会话内的完整内容表达。通过对文本本身字符编码、会话句子顺序编码、单句会话内部的隐式关联表达分析以及句子之间的隐状态信息,对一句或一段对话的意图判断,更加完整。此外,通过利用gru的特性,将多句本身的句子特征关联起来,使得在进入分类前的最终的文本表征,考虑了文本原本顺序之间的隐式表达。
151.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献