用户意图的预测方法、装置、存储介质和电子设备与流程

2022-04-06 19:06:09 来源：中国专利 TAG：

1.本发明涉及意图识别领域，特别涉及一种用户意图的预测方法、装置、存储介质和电子设备。

背景技术：

2.客服机器化、智能化依然成为未来的发展方向，良好的客户服务需要以准确掌握用户意图为基础。目前的技术在进行用户意图识别时，经常出现各种原因，导致机器无法准确识别用户意图，进一步导致应答不够流畅，用户体验较差。

技术实现要素：

3.鉴于上述问题，本发明提供一种克服上述问题或者至少部分地解决上述问题的用户意图的预测方法、装置、存储介质和电子设备。
4.第一方面，一种用户意图的预测方法，包括：
5.获得用户发出的对话文本；
6.将所述对话文本输入至预先训练好的意图预测模型中，从而获得所述意图预测模型输出的针对所述对话文本的意图识别结果；
7.若所述意图识别结果包括场景信息、业务信息和动作信息，则将所述意图识别结果进行输出，其中，所述场景信息表征所述对话文本对应的事件发生的背景、原因或目前处于的状态，所述动作信息表征实现所述用户在所述对话文本中提出的需求所需进行的操作，所述业务信息表征所述用户在所述对话文本中描述的问题对应的类别；
8.若所述意图识别结果缺少所述场景信息、所述业务信息和所述动作信息中的至少一种信息，则向所述用户发送相应的请求文本，以请求所述用户回复所缺少的信息；
9.获得所述用户回复的、所述所缺少的信息，并将所述所缺少的信息添加至所述意图识别结果后进行输出。
10.结合第一方面，在某些可选的实施方式中，所述获得所述用户回复的、所述所缺少的信息，并将所述所缺少的信息添加至所述意图识别结果后进行输出，包括：
11.获得所述用户回复的补充文本；
12.从所述补充文本中，提取所述所缺少的信息；
13.将提取得到的所述所缺少的信息添加至所述意图识别结果后进行输出。
14.结合上一个实施方式，在某些可选的实施方式中，所述从所述补充文本中，提取所述所缺少的信息，包括：
15.将所述补充文本输入至所述意图预测模型中，从而获得所述意图预测模型识别所述补充文本得到的所述所缺少的信息。
16.结合第一方面，在某些可选的实施方式中，所述意图预测模型的训练过程具体包括：
17.将预先标注好的训练集输入场景模型、动作模型和业务模型分别进行训练，从而
得到训练好的三个模型共同作为所述意图预测模型，其中，所述训练集包括至少一份训练文本，每份所述训练文本均标注有相应的所述场景信息、所述业务信息和所述动作信息，所述场景模型、动作模型和业务模型均可以为：han模型或者textcnn模型或者bert模型。
18.结合第一方面，在某些可选的实施方式中，所述意图预测模型的训练过程具体包括：
19.将预先标注好的训练集输入待训练的多任务学习模型进行训练，以对所述多任务学习模型进行同时预测所述场景信息、业务信息和动作信息的训练，从而得到训练好的所述多任务学习模型作为所述意图预测模型，其中，所述训练集包括至少一份训练文本，每份所述训练文本均标注有相应的所述场景信息、所述业务信息和所述动作信息，所述多任务学习模型为：multi-task bert模型或者multi-task rnn模型。
20.第二方面，一种用户意图的预测装置，包括：对话文本获得单元、意图识别单元、第一输出单元、请求单元和第二输出单元；
21.所述对话文本获得单元，被配置为执行获得用户发出的对话文本；
22.所述意图识别单元，被配置为执行将所述对话文本输入至预先训练好的意图预测模型中，从而获得所述意图预测模型输出的针对所述对话文本的意图识别结果；
23.所述第一输出单元，被配置为执行若所述意图识别结果包括场景信息、业务信息和动作信息，则将所述意图识别结果进行输出，其中，所述场景信息表征所述对话文本对应的事件发生的背景、原因或目前处于的状态，所述动作信息表征实现所述用户在所述对话文本中提出的需求所需进行的操作，所述业务信息表征所述用户在所述对话文本中描述的问题对应的类别；
24.所述请求单元，被配置为执行若所述意图识别结果缺少所述场景信息、所述业务信息和所述动作信息中的至少一种信息，则向所述用户发送相应的请求，以请求所述用户回复所缺少的信息；
25.所述第二输出单元，被配置为执行获得所述用户回复的、所述所缺少的信息，并将所述所缺少的信息添加至所述意图识别结果后进行输出。
26.结合第二方面，在某些可选的实施方式中，所述第二输出单元，包括：补充文本获得单元、信息提取单元和第三输出单元；
27.所述补充文本获得单元，被配置为执行获得所述用户回复的补充文本；
28.所述信息提取单元，被配置为执行从所述补充文本中，提取所述所缺少的信息；
29.所述第三输出单元，被配置为执行将提取得到的所述所缺少的信息添加至所述意图识别结果后进行输出。
30.结合上一个实施方式，在某些可选的实施方式中，所述信息提取单元，包括：信息提取子单元；
31.所述信息提取子单元，被配置为执行将所述补充文本输入至所述意图预测模型中，从而获得所述意图预测模型识别所述补充文本得到的所述所缺少的信息。
32.第三方面，一种计算机可读存储介质，其上存储有程序，所述程序被处理器执行时实现任一项所述的用户意图的预测方法。
33.第四方面，一种电子设备，所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线；其中，所述处理器、所述存储器通过所述总线完成相互间的
通信；所述处理器用于调用所述存储器中的程序指令，以执行任一项所述的用户意图的预测方法。
34.借由上述技术方案，本发明提供的用户意图的预测方法、装置、存储介质和电子设备，可以通过获得用户发出的对话文本；将所述对话文本输入至预先训练好的意图预测模型中，从而获得所述意图预测模型输出的针对所述对话文本的意图识别结果；若所述意图识别结果包括场景信息、业务信息和动作信息，则将所述意图识别结果进行输出，其中，所述场景信息表征所述对话文本对应的事件发生的背景、原因或目前处于的状态，所述动作信息表征实现所述用户在所述对话文本中提出的需求所需进行的操作，所述业务信息表征所述用户在所述对话文本中描述的问题对应的类别；若所述意图识别结果缺少所述场景信息、所述业务信息和所述动作信息中的至少一种信息，则向所述用户发送相应的请求文本，以请求所述用户回复所缺少的信息；获得所述用户回复的、所述所缺少的信息，并将所述所缺少的信息添加至所述意图识别结果后进行输出。由此可以看出，本发明可以基于客户沟通的对话文本，从场景信息、业务信息和动作信息三个层面，通过意图预测模型快速准确地识别出用户的意图，准确率较高。
35.上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。
附图说明
36.通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：
37.图1示出了本发明提供的一种用户意图的预测方法的流程图；
38.图2示出了本发明提供的一种用户意图的预测装置的结构示意图；
39.图3示出了本发明提供的一种电子设备的结构示意图。
具体实施方式
40.经本发明人研究发现，当前技术识别用户意图经常出现不准确的原因在于：1.用户说明意图时不够充分，导致机器识别的用户意图不准确。2.对于用户意图的构成成分划分不够准确，导致机器无法准确识别用户意图。
41.基于上述发现，本发明人认为：一个清楚完整的用户意图应该由场景信息动作信息业务信息这三部分组成，后续将围绕这三个方面进行识别用户意图，具体请参见后续实施方式。
42.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。
43.如图1所示，本发明提供了一种用户意图的预测方法，包括：s100、s200、s300、s400和s500；
44.s100、获得用户发出的对话文本；
45.可选的，本发明可以基于客户与机器人客服或者人工客服之间的对话内容进行后续的用户意图的预测，并且用户意图一般是由客户发出的，所以可以获得用户发出的对话文本。当然，还可以获得客户回复的内容，以便于进行综合识别用户意图，本发明对此不做限制。
46.可选的，用户发出的对话文本可以从多种渠道获得，本发明对此不做限制。例如从用户与客服的即时通讯工具的聊天记录中获得，包括：qq、微信和钉钉等；还可以从具体业务系统的客服聊天窗口从获得，还可以从手机短信，或者将通话语音转换成文本，然后从转换的文本中抽取用户发出的对话文本，本发明对此不做限制。
47.s200、将所述对话文本输入至预先训练好的意图预测模型中，从而获得所述意图预测模型输出的针对所述对话文本的意图识别结果；
48.可选的，本发明对于意图识别结果的具体内容不做限制。例如，意图识别结果可以通过字段的方式进行输出，包括场景字段、动作字段和业务字段。若识别得到相应的场景信息，则将场景信息填入到场景字段中，否则，场景字段为空；若识别得到相应的动作信息，则将动作信息填入到动作字段中，否则，动作字段为空；若识别得到相应的业务信息，则将业务信息填入到业务字段中，否则，业务字段为空，本发明对此不做限制。
49.可选的，本发明对于意图预测模型的训练过程不做具体限制，对所述意图预测模型所采用的技术模型也不做具体限制。例如，结合图1所示的实施方式，在某些可选的实施方式中，所述意图预测模型的训练过程具体包括：
50.将预先标注好的训练集输入场景模型、动作模型和业务模型分别进行训练，从而得到训练好的三个模型共同作为所述意图预测模型，其中，所述训练集包括至少一份训练文本，每份所述训练文本均标注有相应的所述场景信息、所述业务信息和所述动作信息，所述场景模型、动作模型和业务模型均可以为：han模型或者textcnn模型或者bert模型。
51.可选的，每份所述训练文本均标注有相应的所述场景信息、所述业务信息和所述动作信息，所以训练集可以用于训练场景模型、动作模型和业务模型，本发明对此不做限制。
52.当然，也可以分别对于场景模型、动作模型和业务模型设置相应的训练集。例如，用于训练场景模型的训练集的每份训练文本只标注场景信息，不标注业务信息和动作信息；用于训练业务模型的训练集的每份训练文本只标注业务信息，不标注场景信息和动作信息；用于训练动作模型的训练集的每份训练文本只标注动作信息，不标注所述场景信息和业务信息，本发明对此不做限制。
53.可选的，han模型、textcnn模型和bert模型均是现有的模型，本发明对此不做过多描述，具体请参见本领域对于上述三个模型的说明和训练方式。需要说明的是：除了上述三个模型，其它可行的分类模型均可以作为本发明的可选实施方式，本发明对此不做限制。
54.可选的，若所述意图预测模型由场景模型、动作模型和业务模型共同构成，则在实际使用过程中，对话文本输入至意图预测模型后：(1)场景模型识别所述对话文本，若所述对话文本中涉及场景信息，则场景模型获得相应的场景信息，否则，场景模型获得的场景信息为空；(2)业务模型识别所述对话文本，若所述对话文本中涉及业务信息，则业务模型获得相应的业务信息，否则，业务模型获得的业务信息为空；(3)动作模型识别所述对话文本，
若所述对话文本中涉及业务信息，则动作模型获得相应的动作信息，否则，动作模型获得的动作信息为空，本发明对此不做限制。
55.可选的，意图预测模型中的场景模型、动作模型和业务模型可以是并行执行，也可以是按照任意顺序串行执行，本发明对此不做限制。
56.可选的，本发明对于所述场景信息、所述业务信息和所述动作信息具体限制，任何可行的方式均属于本发明的保护范围。例如，所述场景信息表征所述对话文本对应的事件发生的背景、原因或目前处于的状态，包括：订单信息填错了、订单不想要了、发票丢了和商品缺货了等信息。
57.所述动作信息表征实现所述用户在所述对话文本中提出的需求所需进行的操作，包括：订单、发票和售后等。
58.所述业务信息表征所述用户在所述对话文本中描述的问题对应的类别，包括：修改，取消和确认等。
59.又例如，结合图1所示的实施方式，在某些可选的实施方式中，所述意图预测模型的训练过程具体包括：
60.将预先标注好的训练集输入待训练的多任务学习模型进行训练，以对所述多任务学习模型进行同时预测所述场景信息、业务信息和动作信息的训练，从而得到训练好的所述多任务学习模型作为所述意图预测模型，其中，所述训练集包括至少一份训练文本，每份所述训练文本均标注有相应的所述场景信息、所述业务信息和所述动作信息，所述多任务学习模型为：multi-task bert模型或者multi-task rnn模型。
61.可选的，multi-task bert模型和multi-task rnn模型是现有的模型，本发明对此不做过多描述，具体可以参见本领域的相关说明。需要说明的是：本发明的多任务学习模型还可以是其它可行的、可以通过共享数据进行联合训练多任务的模型，本发明对此不做限制。
62.s300、若所述意图识别结果包括场景信息、业务信息和动作信息，则将所述意图识别结果进行输出；
63.其中，所述场景信息表征所述对话文本对应的事件发生的背景、原因或目前处于的状态，所述动作信息表征实现所述用户在所述对话文本中提出的需求所需进行的操作，所述业务信息表征所述用户在所述对话文本中描述的问题对应的类别；
64.可选的，若所述意图识别结果包括场景信息、业务信息和动作信息，则说明对话文本中已经清楚完整地说明了用户意图，即用户意图包括场景信息、业务信息和动作信息，则可以将所述意图识别结果进行输出。
65.可选的，可以将意图识别结果进行输出给用户，让用户再次确认。也可以将意图识别结果发送给应答模块，以使得应答模块可以基于意图识别结果智能应答用户，本发明对此不做限制。
66.s400、若所述意图识别结果缺少所述场景信息、所述业务信息和所述动作信息中的至少一种信息，则向所述用户发送相应的请求文本，以请求所述用户回复所缺少的信息；
67.可选的，若所述意图识别结果缺少所述场景信息、所述业务信息和所述动作信息中的至少一种信息，则说明对话文本中未清楚完整地说明了用户意图，则可以向用户发送相应的请求文本，以请求所述用户回复所缺少的信息。例如，若意图识别结果缺少场景信
息，则可以向用户发一条消息，以请求用户回复本次对话的场景信息，本发明对此不做限制。同理，对于缺少所述业务信息和所述动作信息，也可以发送相应的消息。
68.可选的，本发明可以由应答模块内部实现，即本发明的执行主体可以是应答模块。即应答模块在于用户进行对话的过程中实时不断判断用户意图，这种情况下，可以直接由本发明的执行主体向所述用户发送相应的请求文本。
69.可选的，本发明的执行主体也可以是一个独立的模型，该模块与应答模块连接，并将意图识别结果发送给应答模块。这种情况下，本发明的执行主体可以控制应答模块向所述用户发送相应的请求文本，本发明对此不做限制。
70.可选的，s300和s400两个步骤是并列的情况，二者没有先后顺序，本发明对此不做限制。
71.s500、获得所述用户回复的、所述所缺少的信息，并将所述所缺少的信息添加至所述意图识别结果后进行输出。
72.可选的，s500是基于执行s400的基础上进行的，即s500在s400之后执行，本发明对此不做限制。
73.可选的，本发明对于获得所述用户回复的、所述所缺少的信息的过程不做具体限制，任何可行的方式均属于本发明的保护范围。例如，结合图1所示的实施方式，在某些可选的实施方式中，所述s500，包括：步骤1.1、步骤1.2和步骤1.3；
74.步骤1.1、获得所述用户回复的补充文本；
75.步骤1.2、从所述补充文本中，提取所述所缺少的信息；
76.步骤1.3、将提取得到的所述所缺少的信息添加至所述意图识别结果后进行输出。
77.可选的，若用户回复的补充文本中无法提取到所述所缺少的信息，则可以再次向述用户发送相应的请求文本，以请求用户回复所述所缺少的信息，本发明对此不做限制。
78.结合上一个实施方式，在某些可选的实施方式中，所述步骤1.2，包括：将所述补充文本输入至所述意图预测模型中，从而获得所述意图预测模型识别所述补充文本得到的所述所缺少的信息。
79.由此可以看出，本发明提供的用户意图的预测方法可以基于客户沟通的对话文本，通过意图预测模型快速准确地识别出用户的意图，准确率较高，进一步可以提高机器人或者人工客服回复用户的流畅度和准确度，提高服务水平和用户体验，本发明对此不做限制。
80.如图2所示，本发明提供了一种用户意图的预测装置，包括：对话文本获得单元100、意图识别单元200、第一输出单元300、请求单元400和第二输出单元500；
81.所述对话文本获得单元100，被配置为执行获得用户发出的对话文本；
82.所述意图识别单元200，被配置为执行将所述对话文本输入至预先训练好的意图预测模型中，从而获得所述意图预测模型输出的针对所述对话文本的意图识别结果；
83.所述第一输出单元300，被配置为执行若所述意图识别结果包括场景信息、业务信息和动作信息，则将所述意图识别结果进行输出，其中，所述场景信息表征所述对话文本对应的事件发生的背景、原因或目前处于的状态，所述动作信息表征实现所述用户在所述对话文本中提出的需求所需进行的操作，所述业务信息表征所述用户在所述对话文本中描述的问题对应的类别；
84.所述请求单元400，被配置为执行若所述意图识别结果缺少所述场景信息、所述业务信息和所述动作信息中的至少一种信息，则向所述用户发送相应的请求，以请求所述用户回复所缺少的信息；
85.所述第二输出单元500，被配置为执行获得所述用户回复的、所述所缺少的信息，并将所述所缺少的信息添加至所述意图识别结果后进行输出。
86.结合图2所示的实施方式，在某些可选的实施方式中，所述第二输出单元500，包括：补充文本获得单元、信息提取单元和第三输出单元；
87.所述补充文本获得单元，被配置为执行获得所述用户回复的补充文本；
88.所述信息提取单元，被配置为执行从所述补充文本中，提取所述所缺少的信息；
89.所述第三输出单元，被配置为执行将提取得到的所述所缺少的信息添加至所述意图识别结果后进行输出。
90.结合上一个实施方式，在某些可选的实施方式中，所述信息提取单元，包括：信息提取子单元；
91.所述信息提取子单元，被配置为执行将所述补充文本输入至所述意图预测模型中，从而获得所述意图预测模型识别所述补充文本得到的所述所缺少的信息。
92.结合图2所示的实施方式，在某些可选的实施方式中，所述装置还包括：第一模型训练单元；
93.所述第一模型训练单元，被配置为执行将预先标注好的训练集输入场景模型、动作模型和业务模型分别进行训练，从而得到训练好的三个模型共同作为所述意图预测模型，其中，所述训练集包括至少一份训练文本，每份所述训练文本均标注有相应的所述场景信息、所述业务信息和所述动作信息，所述场景模型、动作模型和业务模型均可以为：han模型或者textcnn模型或者bert模型。
94.结合图2所示的实施方式，在某些可选的实施方式中，所述装置还包括：第二模型训练单元；
95.所述第二模型训练单元，被配置为执行将预先标注好的训练集输入待训练的多任务学习模型进行训练，以对所述多任务学习模型进行同时预测所述场景信息、业务信息和动作信息的训练，从而得到训练好的所述多任务学习模型作为所述意图预测模型，其中，所述训练集包括至少一份训练文本，每份所述训练文本均标注有相应的所述场景信息、所述业务信息和所述动作信息，所述多任务学习模型为：multi-task bert模型或者multi-task rnn模型。
96.本发明提供了一种计算机可读存储介质，其上存储有程序，所述程序被处理器执行时实现任一项所述的用户意图的预测方法。
97.如图3所示，本发明提供了本发明提供了一种电子设备70，所述电子设备70包括至少一个处理器701、以及与所述处理器701连接的至少一个存储器702、总线703；其中，所述处理器701、所述存储器702通过所述总线703完成相互间的通信；所述处理器701用于调用所述存储器702中的程序指令，以执行上述任一项所述的用户意图的预测方法方法。
98.借由上述技术方案，本发明提供的用户意图的预测方法、装置、存储介质和电子设备，可以通过获得用户发出的对话文本；将所述对话文本输入至预先训练好的意图预测模型中，从而获得所述意图预测模型输出的针对所述对话文本的意图识别；若所述意图识别
结果包括场景信息、业务信息和动作信息，则将所述意图识别结果进行输出，其中，所述场景信息表征所述对话文本对应的事件发生的背景、原因或目前处于的状态，所述动作信息表征实现所述用户在所述对话文本中提出的需求所需进行的操作，所述业务信息表征所述用户在所述对话文本中描述的问题对应的类别；若所述意图识别结果缺少所述场景信息、所述业务信息和所述动作信息中的至少一种信息，则向所述用户发送相应的请求文本，以请求所述用户回复所缺少的信息；获得所述用户回复的、所述所缺少的信息，并将所述所缺少的信息添加至所述意图识别结果后进行输出。由此可以看出，本发明可以基于客户沟通的对话文本，通过意图预测模型快速准确地识别出用户的意图，准确率较高。
99.在本技术中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
100.本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
101.对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
102.以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：资产数据的处理装置及处理方法、电子设备及存储介质与流程

用户意图的预测方法、装置、存储介质和电子设备与流程

相关文献

最热文献