一种基于因果图的对话交互智能决策方法及装置与流程

2022-06-11 12:55:22 来源：中国专利 TAG：

1.本技术涉及人机交互技术领域，具体而言，涉及一种基于因果图的对话交互智能决策方法及装置。

背景技术：

2.目前的对话机器人是基于业务专家制定的规则进行对话，对于用户的行为也只是做了常见问题解答，这样使得目前人机交互是粗粒度的，即人机交互过程中对话机器人选择的回复策略或内容并不能够针对性满足客户的需求，从而使得客户的体验度满意度降低并且不能满足客户需求的人机交互，也带来了资源的浪费。

技术实现要素：

3.本技术实施例的目的在于提供一种基于因果图的对话交互智能决策方法及装置，用以解决目前人机交互过程粗粒度带来的回复策略或内容并不能够针对性满足客户的需求的问题。
4.第一方面，本发明提供一种基于因果图的对话交互智能决策方法，包括：获取用户的当前交互信息；根据所述当前交互信息分析所述用户的当前行为信息；根据所述用户的当前行为信息在预先构建的因果图中查找对应的目标回复策略；以及根据所述目标回复策略对用户进行回复。
5.上述设计的基于因果图的对话交互智能决策方法，本方案提前对用户的行为进行分类，使得可基于用户的当前交互信息分析得到用户的当前行为信息，然后利用预先构建的一个行为信息对应至少一个回复策略的因果图，根据用户的当前行为信息在因果图中查找对应的目标回复策略，从而根据目标回复策略对用户进行回复，从而利用提前分类的用户行为和设计的因果图来细粒度地实现人机对话交互过程决策的选择，从而使得人机对话过程中回复策略的选择更加适应客户的需求，进而节约资源且提高用户的满意度。
6.在第一方面的可选实施方式中，所述根据所述目标回复策略对用户进行回复，包括：根据所述目标回复策略获取所述目标回复策略对应的目标回复内容；以及根据所述目标回复内容对用户进行回复。
7.在第一方面的可选实施方式中，所述根据所述用户的当前行为信息在预先构建的因果图中查找对应的目标回复策略，包括：根据所述用户的当前行为信息在预先构建的因果图中查找至少一个回复策略；判断查找到的回复策略是否存在多个；若存在多个，则在多个回复策略中确定所述目标回复策略。
8.在第一方面的可选实施方式中，所述在多个回复策略中确定所述目标回复策略，包括：获取历史数据；其中，所述历史数据包括每个行为信息选择每一回复策略的次数以及每次选择对应的交互结果；根据所述每个行为信息选择每一回复策略的次数以及每次选择对应的交互结果计算所述当前行为信息选择每个回复策略对应的交互成功概率；以及将交互成功概率最大的回复策略确定为所述目标回复策略。
9.在第一方面的可选实施方式中，所述多个回复策略中确定所述目标回复策略，包括：在所述多个回复策略中随机选择一个回复策略作为所述目标回复策略。
10.在第一方面的可选实施方式中，所述当前交互信息包括当前语音信息，所述根据所述当前交互信息分析所述用户的当前行为信息，包括：对所述当前语音信息进行语义识别，获得所述当前语音信息对应的当前语义信息；以及根据所述当前语义信息在预先分类的多种行为信息中进行查找，获得所述当前行为信息。
11.在第一方面的可选实施方式中，在所述获取用户的当前交互信息之前，所述方法还包括：获取预先分类的多种用户行为信息以及每种行为信息对应的至少一个回复策略；根据每种用户行为信息和对应的至少一个回复策略构建所述因果图。
12.第二方面，本发明提供一种基于因果图的对话交互智能决策装置，包括：获取模块，用于获取用户的当前交互信息；分析模块，用于根据所述当前交互信息分析所述用户的当前行为信息；查找模块，用于根据所述用户的当前行为信息在预先构建的因果图中查找对应的目标回复策略；回复模块，用于根据所述目标回复策略对用户进行回复。
13.上述设计的基于因果图的对话交互智能决策装置，本方案提前对用户的行为进行分类，使得可基于用户的当前交互信息分析得到用户的当前行为信息，然后利用预先构建的一个行为信息对应至少一个回复策略的因果图，根据用户的当前行为信息在因果图中查找对应的目标回复策略，从而根据目标回复策略对用户进行回复，从而利用提前分类的用户行为和设计的因果图来细粒度地实现人机对话交互过程决策的选择，从而使得人机对话过程中回复策略的选择更加适应客户的需求，进而节约资源且提高用户的满意度。
14.在第二方面的可选实施方式中，所述回复模块，具体用于根据所述目标回复策略获取所述目标回复策略对应的目标回复内容；以及根据所述目标回复内容对用户进行回复。
15.在第二方面的可选实施方式中，所述查找模块，具体用于根据所述用户的当前行为信息在预先构建的因果图中查找至少一个回复策略；判断查找到的回复策略是否存在多个；若存在多个，则在多个回复策略中确定所述目标回复策略。
16.在第二方面的可选实施方式中，所述当前交互信息包括当前语音信息，所述分析模块，具体用于对所述当前语音信息进行语义识别，获得所述当前语音信息对应的当前语义信息；以及根据所述当前语义信息在预先分类的多种行为信息中进行查找，获得所述当前行为信息。
17.在第二方面的可选实施方式中，所述获取模块，还用于获取预先分类的多种用户行为信息以及每种行为信息对应的至少一个回复策略；构建模块，用于根据每种用户行为信息和对应的至少一个回复策略构建所述因果图。
18.第三方面，本技术提供一种电子设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时执行第一方面、第一方面中任一可选的实现方式中的所述方法。
19.第四方面，本技术提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时执行第一方面、第一方面中任一可选的实现方式中的所述方法。
20.第五方面，本技术提供了一种计算机程序产品，所述计算机程序产品在计算机上
运行时，使得计算机执行第一方面、第一方面中任一可选的实现方式中的所述方法。
附图说明
21.为了更清楚地说明本技术实施例的技术方案，下面将对本技术实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本技术的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
22.图1为本技术实施例提供的基于因果图的对话交互智能决策方法的第一流程图；
23.图2为本技术实施例提供的基于因果图的对话交互智能决策方法的第二流程图；
24.图3为本技术实施例提供的基于因果图的对话交互智能决策方法的第三流程图；
25.图4为本技术实施例提供的基于因果图的对话交互智能决策方法的第四流程图；
26.图5为本技术实施例提供的基于因果图的对话交互智能决策方法的第五流程图；
27.图6为本技术实施例提供的基于因果图的对话交互智能决策装置的结构示意图；
28.图7为本技术实施例提供的电子设备的结构示意图。
29.图标：600-获取模块；610-分析模块；620-查找模块；630-回复模块；640-构建模块；7-电子设备；701-处理器；702-存储器；703-通信总线。
具体实施方式
30.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行描述。
31.本技术实施例提供一种基于因果图的对话交互智能决策方法，该方法基于因果图来细粒度地实现人机对话交互，从而通过细粒度人机交互来准确抓住或满足客户需求。本方案可由控制器、芯片或服务器等执行，如图1所示，该方法可包括如下步骤：
32.步骤s100：获取用户的当前交互信息。
33.步骤s110：根据当前交互信息分析用户的当前行为信息。
34.步骤s120：根据用户的当前行为信息在预先构建的因果图中查找对应的目标回复策略。
35.步骤s130：根据目标回复策略对用户进行回复。
36.在步骤s100中，用户的当前交互信息可包括用户当前说话形成的语音信息，用户当前发送的文本信息等等。其中，如果是面对面人机交互的情况下，本方案可设计声音采集装置来采集用户当前说话形成的语音信息。
37.在步骤s110中，本方案根据获取到的用户的当前交互信息分析用户的当前行为信息，其中，该用户的当前行为信息可包括用户的当前行为目的，例如，在金融场景用户与机器人的对话场景中，用户的当前交互信息提及了额度等，那么可分析该用户的当前行为目的是对某产品的额度进行咨询。
38.作为一种可能的实施方式，用户的当前交互信息为当前语音信息的基础上，如图2所示，步骤s110可通过如下方式实现，包括：
39.步骤s200：对当前语音信息进行语义识别，获得当前语音信息对应的当前语义信息。
40.步骤s210：根据当前语义信息在预先分类的多种行为信息中进行查找获得当前行
为信息。
41.在上述步骤中，本方案对语音信息进行语义识别，从而得到语音信息对应的语义信息，然后基于当前语义信息在预先分类的多种行为信息中查找得到当前行为信息。其中，本方案预先对用户的行为信息进行分类，然后基于不同分类的行为信息映射不同的语义信息，从而使得基于语义信息可查找到对应的行为信息。
42.另外，这里需要说明的是，若用户的当前交互信息为用户当前发送的文本信息，在此基础上，本方案可对文本进行识别从而得出文本中的当前语义信息，进而基于当前语义信息查找到对应的当前行为信息。
43.通过上述方式得到用户的当前行为信息后，本方案执行步骤s120根据用户的当前行为信息在预先构建的因果图中查找对应的目标回复策略。其中，该预先构建的因果图可为预先构建的知识图谱，该知识图谱可提前根据多个行为信息和每个行为信息对应的至少一种回复策略构建，使得每种行为信息映射对应着至少一种回复策略。在此基础上，在执行步骤s110得到用户的当前行为信息后，本方案可根据用户的当前行为信息在构建的知识图谱中去查找到对应的目标回复策略。
44.作为一种可能的实施方式，对于步骤s120本方案可通过如图3所示的步骤具体实现，包括：
45.步骤s300：根据用户的当前行为信息在预先构建的因果图中查找至少一个回复策略。
46.步骤s310：判断查找到的回复策略是否存在多个，若是，则转到步骤s320。
47.步骤s320：在多个回复策略中确定目标回复策略。
48.在上述步骤中，本方案基于用户的当前行为信息在因果图中可能只查找到一个回复策略，也可能查找到多个回复策略，若只查找到一个回复策略，那么查找到的该回复策略则为目标回复策略，进而执行步骤s140根据该目标回复策略对用户进行回复。若查找到多个回复策略，本方案可在多个回复策略中确定一个目标回复策略。
49.作为一种可能的实施方式，本方案可在查找到的多个回复策略中随机确定一个回复策略作为目标回复策略。作为另一种可能的实施方式，本方案可根据专家经验设置每个行为信息对应多个回复策略的目标回复策略。
50.作为又一种可能的实施方式，如图4所示，本方案还可以通过如下方式确定目标回复策略，包括：
51.步骤s400：获取历史选择数据，该历史数据包括每个行为信息选择每一回复策略的次数以及每次选择对应的交互结果。
52.步骤s410：根据每个行为信息选择每一回复策略的次数以及每次选择对应的交互结果计算当前行为信息选择每个回复策略对应的交互成功概率。
53.步骤s420：将交互成功概率最大的回复策略确定为目标回复策略。
54.在上述步骤中，本方案可记录每次人机交互的数据，从而可以获得历史选择数据，该历史选择数据中包含有每个行为信息选择每一回复策略的次数以及每次选择对应的交互结果，该交互结果包括交互达到目的即交互成功，以及交互没有达到目的即交互失败，在此基础上，本方案可根据每个行为信息选择每一回复策略的次数以及每次选择对应的交互结果计算当前行为信息选择每个回复策略对应的交互成功概率，将交互成功概率最大的回
复策略确定为目标回复策略，从而提高当前交互的成功率。
55.作为另一种可能的实施方式，本方案还可以记录每种回复策略最终的产品成交率或客户满意度，然后在当前行为信息对应有多种回复策略的情况下，将产品成交率最高或客户满意度最高的回复策略作为最终的目标回复策略。
56.通过上述方式得到目标回复策略后，本方案执行步骤s130根据目标回复策略对用户进行回复。作为一种可能的实施方式，对于步骤s130，本方案可通过如图5所示的方式具体实现，包括：
57.步骤s500：根据目标回复策略获取目标回复策略对应的目标回复内容。
58.步骤s510：根据目标回复内容对用户进行回复。
59.在上述步骤中，每一回复策略映射有对应的回复内容，本方案可根据目标回复策略查找对应映射的目标回复内容。作为另一种可能的实施方式，预先构建的因果图每一行为信息对应有至少一个回复策略，每一回复策略对应有一回复内容，从而通过预先构建的因果图即可实现目标回复内容的确定。在得到目标回复内容后，本方案可根据目标回复内容对用户进行回复，例如，本方案可根据目标回复内容对用户进行语音播报，或者根据目标回复内容对用户进行文字发送等等。
60.上述设计的基于因果图的对话交互智能决策方法，本方案提前对用户的行为进行分类，使得可基于用户的当前交互信息分析得到用户的当前行为信息，然后利用预先构建的一个行为信息对应至少一个回复策略的因果图，根据用户的当前行为信息在因果图中查找对应的目标回复策略，从而根据目标回复策略对用户进行回复，从而利用提前分类的用户行为和设计的因果图来细粒度地实现人机对话交互过程决策的选择，从而使得人机对话过程中回复策略的选择更加适应客户的需求，进而节约资源且提高用户的满意度。
61.图6出示了本技术提供的基于因果图的对话交互智能决策装置的示意性结构框图，应理解，该装置与图1至图5中执行的方法实施例对应，能够执行前述的方法涉及的步骤，该装置具体的功能可以参见上文中的描述，为避免重复，此处适当省略详细描述。该装置包括至少一个能以软件或固件(firmware)的形式存储于存储器中或固化在装置的操作系统(operating system，os)中的软件功能模块。具体地，该装置包括：获取模块600，用于获取用户的当前交互信息；分析模块610，用于根据当前交互信息分析所述用户的当前行为信息；查找模块620，用于根据用户的当前行为信息在预先构建的因果图中查找对应的目标回复策略；回复模块630，用于根据目标回复策略对用户进行回复。
62.上述设计的基于因果图的对话交互智能决策装置，本方案提前对用户的行为进行分类，使得可基于用户的当前交互信息分析得到用户的当前行为信息，然后利用预先构建的一个行为信息对应至少一个回复策略的因果图，根据用户的当前行为信息在因果图中查找对应的目标回复策略，从而根据目标回复策略对用户进行回复，从而利用提前分类的用户行为和设计的因果图来细粒度地实现人机对话交互过程决策的选择，从而使得人机对话过程中回复策略的选择更加适应客户的需求，进而节约资源且提高用户的满意度。
63.在本实施例的可选实施方式中，回复模块630，具体用于根据目标回复策略获取目标回复策略对应的目标回复内容；以及根据目标回复内容对用户进行回复。
64.在本实施例的可选实施方式中，查找模块620，具体用于根据用户的当前行为信息在预先构建的因果图中查找至少一个回复策略；判断查找到的回复策略是否存在多个；若
存在多个，则在多个回复策略中确定目标回复策略。
65.在本实施例的可选实施方式中，当前交互信息包括当前语音信息，分析模块610，具体用于对当前语音信息进行语义识别，获得当前语音信息对应的当前语义信息；以及根据当前语义信息在预先分类的多种行为信息中进行查找，获得当前行为信息。
66.在本实施例的可选实施方式中，获取模块600，还用于获取预先分类的多种用户行为信息以及每种行为信息对应的至少一个回复策略。基于因果图的对话交互智能决策装置还包括构建模块640，其用于根据每种用户行为信息和对应的至少一个回复策略构建因果图。
67.如图7所示，本技术提供一种电子设备7，包括：处理器701和存储器702，处理器701和存储器702通过通信总线703和/或其他形式的连接机构(未标出)互连并相互通讯，存储器702存储有处理器701可执行的计算机程序，当计算设备运行时，处理器701执行该计算机程序，以执行时执行任一可选的实现方式中的方法，例如步骤s100至步骤s130：获取用户的当前交互信息；根据当前交互信息分析用户的当前行为信息；根据用户的当前行为信息在预先构建的因果图中查找对应的目标回复策略；根据目标回复策略对用户进行回复。
68.本技术提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行前述任一可选的实现方式中的方法。
69.其中，存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(static random access memory,简称sram)，电可擦除可编程只读存储器(electrically erasable programmable read-only memory,简称eeprom)，可擦除可编程只读存储器(erasable programmable read only memory,简称eprom)，可编程只读存储器(programmable red-only memory,简称prom)，只读存储器(read-only memory,简称rom)，磁存储器，快闪存储器，磁盘或光盘。
70.本技术提供一种计算机程序产品，该计算机程序产品在计算机上运行时，使得计算机执行任一可选的实现方式中的方法。
71.在本技术所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
72.另外，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
73.再者，在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。
74.在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
75.以上所述仅为本技术的实施例而已，并不用于限制本技术的保护范围，对于本领域的技术人员来说，本技术可以有各种更改和变化。凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种泵喷推进器非定常宽带激励力的评估方法与流程

一种基于因果图的对话交互智能决策方法及装置与流程

相关文献

最热文献