数据集构建和任务式对话方法、电子设备和存储介质与流程

2022-03-31 12:01:08 来源：中国专利 TAG：

1.本发明实施例涉及计算机技术领域，尤其涉及一种数据集构建和任务式对话方法、电子设备和存储介质。

背景技术：

2.任务式对话也被称为任务导向型对话(task-oriented dialogue，tod)，基于任务式对话的系统用于根据用户输入指令以智能方式执行指令任务，返回用户期望的信息。
3.要实现智能分析和反馈，需要一套可靠的对话数据集构建任务式对话的系统。现有的数据采集过程中需要人工标注对话过程，并需要在对话产生后进一步标注出对话状态等信息，因此其时间成本与人力成本较高。

技术实现要素：

4.有鉴于此，本发明实施例提供了一种数据集构建和任务式对话方法、电子设备和存储介质，以至少部分解决上述问题。
5.根据本发明实施例的第一方面，提供了一种数据集构建方法，包括：构建用户意图集合；从特征数据集合中，确定所述用户意图集合中各个用户意图所对应的关键数据；根据所述各个用户意图中的目标用户意图对应的关键数据，生成所述目标用户意图的任务式对话大纲；根据所述目标用户意图的任务式对话大纲，构建任务式对话数据集。
6.根据本发明实施例的第二方面，提供了一种数据集构建装置，包括：第一构建模块，构建用户意图集合；确定模块，从特征数据集合中，确定所述用户意图集合中各个用户意图所对应的关键数据；生成模块，根据所述各个用户意图中的目标用户意图对应的关键数据，生成所述目标用户意图的任务式对话大纲；第二构建模块，根据所述目标用户意图的任务式对话大纲，构建任务式对话数据集。
7.根据本发明实施例的第二方面，提供了一种任务式对话方法，包括：通过人机交互界面获取用户的任务式对话请求，所述任务式对话请求指示目标用户意图；将所述任务式对话请求发送到任务式对话系统，所述任务式对话系统利用机器学习模型对所述目标用户意图进行处理，得到任务式对话响应，所述机器学习模型采用根据第一方面所述的方法构建的任务式对话数据集训练得到；接收所述任务式对话系统发送的任务式对话响应；通过所述人机交互界面向用户展示所述任务式对话响应。
8.根据本发明实施例的第四方面，提供了一种电子设备，包括：处理器、存储器、通信接口和通信总线，所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信；所述存储器用于存放至少一可执行指令，所述可执行指令使所述处理器执行如第一方面所述的方法对应的操作。
9.根据本发明实施例的第五方面，提供了一种计算机存储介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面所述的方法。
10.在本发明实施例的方案中，从特征数据集合中，确定用户意图集合中各个用户意
图所对应的关键数据，建立了关键数据与用户意图的准确对应关系，根据各个用户意图中的目标用户意图对应的关键数据，高效地生成了准确的任务式对话大纲，根据所述目标用户意图的任务式对话大纲，构建任务式对话数据集，提高了数据集的构建效率，降低了对话数据集构建时的人工成本和时间成本。
附图说明
11.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明实施例中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。
12.图1为根据一个示例的任务式对话系统的示意性结构图；
13.图2为根据本发明的一个实施例的数据集构建方法的步骤流程图；
14.图3a为根据本发明的另一实施例的特征数据集合的构建方法的示意图；
15.图3b为根据本发明的另一实施例的对话数据集的构建方法的示意图；
16.图3c为根据本发明的另一实施例的任务式对话方法的示意图；
17.图4为根据本发明的另一实施例的数据集构建装置的结构框图；
18.图5为根据本发明的另一实施例的电子设备的结构示意图。
具体实施方式
19.为了使本领域的人员更好地理解本发明实施例中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明实施例一部分实施例，而不是全部的实施例。基于本发明实施例中的实施例，本领域普通技术人员所获得的所有其他实施例，都应当属于本发明实施例保护的范围。
20.下面结合本发明实施例附图进一步说明本发明实施例具体实现。
21.图1为根据本发明的一个实施例的任务式对话系统的示意性结构图。图1的任务式对话系统包括语音识别模块110、自然语音理解模块120、对话管理器130、知识库模块140、自然语言生成模块150以及语音合成模块160。
22.对于来自用户请求的语音数据，语音识别模块110能够结构到语音数据，对语音数据进行自动语音识别处理(automatic speech recognition，asr)，得到语音文本输入到自然语音理解模块120中。自然语音理解模块120能够对语音文本进行语义处理(natural language understanding，nlu)，主要作用是对用户输入的句子或者语音识别的结果进行处理，提取用户的对话意图以及用户所传递的信息，生成具有关键语义信息的语义文本。对话管理器130可以包括对话状态追踪(dst)和对话策略学习(dpl)，其主要作用是根据nlu的结果来更新系统的状态，并生成相应的系统动作，例如，通过调用知识库140中的数据，得到关键语义文本的对话语义文本，其中，对话语义文本符合用户请求的意图。对话语义文本通过自然语言生成模块150的自然语言生成处理(natural language generation，nlg)，将对话管理输出的系统动作文本化，用文本的形式将系统的动作表达出来，得到完整语义文本，并且经由语音合成160的文字转语音处理(text-to-speech，tts)，生成能够反馈给用户的语音数据，由此完成了一个典型的任务式对话流程。
23.在另一些示例中，语音识别模块110和语音合成模块160也可以被配置为一个模块，用于从语音数据到语音之间的转换。另外，自然语音理解模块120和自然语言生成模块150可以被配置为一个模块，用于语音文本的语义处理。
24.图2为根据本发明的另一实施例的数据集构建方法的步骤流程图。本实施例的方案可以适用于任意适当的具有数据处理能力的电子设备，包括但不限于：服务器、移动终端(如手机、pad等)和pc机等。图2的数据集构建方法包括：
25.s210：构建用户意图集合。
26.应理解，用户意图集合中的各个用户意图指示用户当前需要的服务类型、服务内容等信息。服务类型包括但不限于用户衣食住行等相关的信息服务，例如，天气服务、餐厅预订服务、诸如车票预订服务或机票预订服务的订票服务、景点查询服务等。
27.s220：从特征数据集合中，确定用户意图集合中各个用户意图所对应的关键数据。
28.应理解，在一个示例中，关键数据可以为包括各个用户意图的用户目标，即，指示用户意图的操作目标。可以基于诸如双语数据集的数据集生成特征数据集合。例如，可以爬取双语互联网数据或采集互联网公布的双语数据，得到双语数据集。双语数据集可以是篇章、段落、句子等文本数据。特征数据集合中的数据具有表示用户意图的特征。
29.s230：根据各个用户意图中的目标用户意图对应的关键数据，生成目标用户意图的任务式对话大纲。
30.应理解，任务式对话大纲指示在任务式对话系统中系统侧与用户侧之间的对话交互特征、对话关键内容等。交互的对话可以是基于预定模式的映射关系生成。对话关键内容可以包括或对应于上述的关键数据，在基于映射关系生成交互的对话时，映射关系可以指示对话内容中的关键数据的对应关系。
31.s240：根据目标用户意图的任务式对话大纲，构建任务式对话数据集。
32.应理解，可以上述的对话关键内容进行语句完善或改写，得到更符合实际表达方式的实际对话数据，作为任务式对话数据集。
33.还应理解，可以确定基于当前任务式对话数据集所构建的任务式对话系统的应用场景，可以利用相同的任务式对话大纲，基于不同的应用场景，构建应用场景相应的语言风格或语言模式的对话数据集。
34.在本发明实施例的方案中，从特征数据集合中，确定用户意图集合中各个用户意图所对应的关键数据，建立了关键数据与用户意图的准确对应关系，根据各个用户意图中的目标用户意图对应的关键数据，高效地生成了准确的任务式对话大纲，根据目标用户意图的任务式对话大纲，构建任务式对话数据集，提高了数据集的构建效率，降低了对话数据集构建时的人工成本和时间成本。
35.下面将描述在上述实施例方案的基础上可行的其他示例性方案。
36.在另一些示例中，数据集构建方法还包括：采集双语数据集；基于知识库规则，对双语数据集进行处理，得到特征数据集合。知识库规则能够可靠地构建各种数据之间的准确关联关系和隐含关联关系，使得到的特征数据集合能够更可靠地反映任务式对话中所需要的意图信息。
37.在另一些示例中，从特征数据集合中，确定用户意图集合中各个用户意图所对应的关键数据，包括：确定用户意图集合中各个用户意图所对应的意图约束条件；从特征数据
集合中，确定符合各个用户意图的意图约束条件的关键数据。意图约束条件反映了意图的完备性，符合约束条件的关键数据能够更加准确和可靠地反映特定意图。
38.在另一些示例中，意图约束条件包括信息类型和信息类型属性，从特征数据集合中，确定符合各个用户意图的意图约束条件的关键数据，包括：从特征数据集合中，确定与信息类型和信息类型属性对应的关键数据，分别作为信息类型的信息槽值和信息类型属性的属性值。信息类型及其信息槽值的使用能够将意图约束条件更好地数量化，反映了数据处理效率。此外，信息类型属性的使用能够提供信息类型及其信息槽值之间的深层特征和依赖关系，因此在大致未降低数据处理效率的同时提高了意图约束条件的精度。
39.在另一些示例中，信息类型属性的属性值指示信息类型的信息槽值的取值范围，从而进一步提高了意图约束条件数量化的精度。
40.在另一些示例中，根据各个用户意图中的目标用户意图对应的关键数据，生成目标用户意图的任务式对话大纲，包括：获取指示目标用户意图的至少一个第一特征语句；根据目标用户意图的意图约束条件的关键数据，调用服务接口，得到指示服务接口的返回结果的至少一个第二特征语句，其中，服务接口基于意图约束条件构建，至少一个第一特征语句和至少一个第二特征语句形成对话大纲。服务接口基于意图约束条件构建，极大地提高了对话大纲的生成效率。应理解，可以构建包括一系列服务接口的接口集合，可以从接口集合中选择目标服务接口，生成相应的对话大纲，当第一特征语句不满足目标服务接口所需的意图约束条件时，可以构建用于引导进一步第一特征语句的第二特征语句，直到满足目标服务接口的意图约束条件，此时，所得到的对话大纲符合目标服务接口的期望精度，从目标服务接口输出作为目标用户意图的反馈的第二特征语句。
41.在另一些示例中，根据目标用户意图的任务式对话大纲，构建任务式对话数据集，包括：根据目标用户意图的任务式对话大纲，构建备选实际对话数据；根据备选实际对话数据中的对话选择频率，确定任务式对话数据集。备选实际对话数据相比于对话大纲更加反映了易于用户接受的表达方式，使得反馈数据更加智能。对话选择频率指示了对话大纲与实际对话数据之间的匹配度，使得所确定的任务式对话数据集更加易于用户接受且更加准确。
42.下面将结合图3a和图3b详细描述和说明另一实施例的对话数据集的构建方法。图3a的实施例图示了所构建的双语特征数据集合的例子。双语特征数据集合根据知识库规则构建，作为双语知识库bilingual knowledge base。例如，可以采集双语数据集，例如，爬取双语互联网数据或采集互联网公布的双语数据，得到双语数据集。双语数据集可以是篇章、段落、句子等文本数据。
43.可以采集互联网公布的双语旅游信息作为双语数据集，例如，旅游信息可以包括地铁站、景点、酒店、以及餐厅的数据。对旅游信息进行处理，可以得到图3a左侧所示的英文特征数据和右侧所示的中文特征数据。
44.然后，可以利用上述的双语特征数据，基于图3b所示的对话数据集的构建，构建对话数据集。
45.具体而言，可以基于构建的一系列服务接口生成对话大纲，然后在利用对话大纲生成指示实际对话的对话数据集。例如，可以从接口集合中选择目标服务接口，生成相应的对话大纲，当第一特征语句不满足目标服务接口所需的意图约束条件时，可以构建用于引
导进一步第一特征语句的第二特征语句，直到满足目标服务接口的意图约束条件，此时，所得到的对话大纲符合目标服务接口的期望精度，从目标服务接口输出作为目标用户意图的反馈的第二特征语句。例如，服务接口包括但不限于返回用户服务类型，例如，查询服务、订阅服务、天气服务、信息服务等。对于旅游场景而言，服务接口包括但不限于搜索餐厅、订阅餐厅、订阅酒店、搜索景点、搜索交通方式、搜索天气等。
46.在一个示例中，目标用户意图为餐厅预定服务，目标服务接口返回要预定的餐厅，其中，目标服务接口对应的意图约束条件为：至少包括餐厅类型、评分、价格。目标服务接口返回的信息为餐厅地点。由此，目标服务接口获取第一特征语句，例如，“我想找个餐厅。我不想吃意大利餐”，该第一特征语句指示餐厅的地点，但是采集到餐厅的评分和价格信息，于是可以继续询问第二特征语句，“对餐厅的评分有要求吗？”，得到用户的反馈为“评分没要求，餐厅价格为中等”，这时满足了目标服务接口对应的意图约束条件，可以通过目标服务接口返回餐厅的地点x street(x街道)，至此生成了对话大纲。另外，还可以生成第二特征语句询问用于是否需要预定，当得到用户要预定餐厅的意图之后，可以进一步生成询问预定时间信息，或者，返回能够接收预定的餐厅地点、或者、符合条件的餐厅地点以及相应的预定时间、预定空位信息等。其中，意图约束条件中的信息、第一特征语句、第二特征语句可以为双语文本。
47.下面将详细描述生成对话大纲所遵循的逻辑。
48.可以通过对话模拟器基于预定的模式生成对话大纲。对话模拟器可以根据来自双语特征数据集合的第一关键数据，返回第二关键数据。例如，“餐厅”、“非意大利餐”都是第一关键数据的示例，“x street”为第二关键数据的示例。
49.在图3b所示的步骤流程中，可以配置两个对话模拟器生成对话大纲，一个对话模拟器用于模拟任务式对话中的用户侧，另一对话模拟器用于模拟任务式对话中的系统侧。
50.在步骤s310中，可以获取来自双语特征数据集合的第一关键数据，作为搜索选项。
51.在步骤s320中，可以根据上述第一关键数据，确定意图约束条件，调用意图约束条件对应的服务接口进行基于搜索选项的搜索处理。
52.在步骤s330中，服务接口中间返回了符合搜索选项的搜索结果。
53.在步骤s340中，判断上述的搜索结果是否足够符合意图约束条件，如果为是，则直接进行到步骤s350，返回第二关键数据，结束流程；如果为否，则返回到步骤s310重新执行，得到补充的搜索结果，直到全部搜索结果是否足够符合意图约束条件。
54.换言之，上述的s310以及s350中的数据实际上体现了对话中的重要信息，因此，两个对话模拟器可以基于上述3100部分的数据对应的主体，生成后续的对话大纲3200。
55.应理解，上述的关键数据可以采用三元组实现，即，关键数据可以抽象为指示信息类型的信息槽，信息槽的槽值、以及信息属性。信息槽的槽值指示信息内容，信息类型属性可以指示槽值的取值范围。在一个示例中，作为搜索选项的关键数据为要预定的餐厅评分情况，则信息类型为预定的餐厅评分，槽值为4分，表示餐厅评分与4分相关，信息类型属性为至少。即，关键数据的三元组表示要预定的餐厅至少评分为4分。又例如，为了模拟更多样的用户目标，作为三元组的示例，信息槽、关系、值的对应关系对关键数据进行了更好的区分。例如，在搜索餐厅场景下，用户“想吃”中餐(cuisine,equal_to,chinese)，和用户“不想吃”中餐(cuisine,not,chinese)，可以通过不同的“关系”得到很好的区分表示。
56.因此，信息类型及其信息槽值的使用能够将意图约束条件更好地数量化，反映了数据处理效率。此外，信息类型属性的使用能够提供信息类型及其信息槽值之间的深层特征和依赖关系，因此在大致未降低数据处理效率的同时提高了意图约束条件的精度。信息类型属性的属性值指示信息类型的信息槽值的取值范围，从而进一步提高了意图约束条件数量化的精度。
57.还应理解，对于推荐服务，给定一个服务接口，可以查询出多个满足条件的结果项。可以基于诸如用户评分等信息进行推荐，可以基于用户评分来对多个结果项进行排序降低服务接口的返回结果的推荐难度。
58.还因理解，知识库中的部分结果项包含混合语言信息，例如，有些餐厅只有英文名。本发明实施例的数据集中配置有专门的转化语句或者用于实现转换语句的能力，在服务接口调用查询时可以更好地处理这些跨语言实体。在餐厅只有英文名的情况下，因此在中文对话交互中，也能够对这类餐厅/酒店/景点名称的实体进行灵活的混合语言展示。
59.还应理解，在一些信息槽的值可能不会被完全指定的情况下，本方案可将这部分信息槽值从先前调用的服务接口结果中继承下来。在用户先预订好了一个餐厅，然后要推荐一个餐厅旁的景点的情况下，景点的位置没有被指定，但可以通过刚才预订的餐厅的位置被继承下来。
60.然后，可以根据对话大概3200生成实际的对话数据集3300。
61.下面将详细描述从对话大纲3200到最终的对话数据集3300之间的构建。
62.可以根据目标用户意图的任务式对话大纲，构建备选实际对话数据，然后根据备选实际对话数据中的对话选择频率，确定任务式对话数据集。具体而言，可以将对话大纲通过众包人工标注的方式转化为更加易于用户接受的自然语言对话。可以根据对话大纲的内容，逐句进行改写。可以在对话改写流程结束后，标注人员可以通读改写好的对话，并回答一些问题，得到对话选择频率，对话选择频率指示真实性和有效性，如果备选实际对话数据被选择的频率越高，则说明其真实性和/或有效性越高。例如，上述的问题的示例可以为：“这段对话看起来像是一名用户和一位专业的人工助手间的对话吗？”“这段对话是否和原对话包含相同意思，同时对话本身很合理顺畅”第一个问题是用来衡量改写后对话的真实性，第二个问题是用来衡量其有效性。
63.图3c为根据本发明的另一实施例的任务式对话方法的示意图。图3c的任务式对话方法包括：
64.s1100：通过人机交互界面获取用户的任务式对话请求，任务式对话请求指示目标用户意图。
65.s1200：将任务式对话请求发送到任务式对话系统，任务式对话系统利用机器学习模型对目标用户意图进行处理，得到任务式对话响应，机器学习模型采用数据集构建方法构建的任务式对话数据集训练得到。
66.s1300：接收任务式对话系统发送的任务式对话响应。
67.s1400：通过人机交互界面向用户展示任务式对话响应。
68.在本实施例的方案中，机器学习模型采用数据集构建方法构建的任务式对话数据集训练得到，因此，在机器学习模型处理目标用户意图时，能够得到准确的任务式对话响应。
69.具体而言，将结合图1的任务式对话系统对图3c的任务式对话方法进行描述。
70.应理解，图3c的任务式对话方法可以应用于诸如智能设备的电子设备，并且智能设备包括诸如嵌入式设备、物联网设备的智能设备等，例如，诸如智能门铃、智能音响等智能家居设备或智能办公设备，诸如智能手表、智能眼镜、智能手环的可穿戴设备、诸如智能手机、平板电脑等智能终端。还应理解，构建完的数据集可以用于机器学习模型训练，机器学习模型可以为端到端模型，机器学习模型的输入可以是任务式对话数据集中的对话文本，也可以为基于对话文本的其他数据，例如，对话文本对应的语音数据。机器学习模型的输出可以任务式对话数据集中的对话文本，也可以为基于对话文本的其他数据，例如，对话文本对应的语音数据。此外，作为一个例子，机器学习模型的输入和输出可以同时为对话文本，也可以同时为语音数据，作为另一个例子，机器学习模式的输入和输出中的一者可以为对话文本，另一者可以为语音数据，本实施例对此不作限定，上述各种示例都可以被理解为基于任务式对话数据集进行训练。还应理解，机器学习模型可以通过诸如tensorflow的机器学习软件框架配合诸如gpu的硬件算力进行训练或推理，例如，利用任务式对话数据集进行训练，或者，诸如执行任务式对话的推理。
71.在一个示例中，机器学习模型可以作为对话管理器130部署。这时，预先训练的机器学习模型的输入和输出均为对话文本，并且自然语音理解模块120和自然语言生成模块150可以为配置好的处理逻辑或其他机器学习模型。
72.在另一示例中，机器学习模型可以作为语音识别模块110、自然语音理解模块120、对话管理器130、自然语言生成模块150以及语音合成模块160。这时，预先训练的机器学习模型的输入和输出均为语音数据。
73.具体而言，智能设备的人机交互界面能够获取用户的任务式对话请求，任务式对话请求指示目标用户意图，任务式对话请求可以为语音指令、文本指令或与文字指令对应的触控指令等。应理解，语音指令、文本指令或触控指令都对应于对话文本，换言之，对话文本指示目标用户意图。此外，智能设备能够从任务式对话系统接收，任务式对话响应，人机交互界面还可以通过文本展示、语音回复、图像回复等多媒体方式向用户展示任务式对话的响应。
74.在一个示例中，人机交互界面获取包括语音数据的语音指令，并且将语音数据发送的部署在后端的任务式对话系统，任务式对话系统通过端到端机器模型对语义数据进行处理，得到包括语音数据的对话响应，并且将对话响应返回到前端的智能设备，然后，智能设备通过人机交互界面向用户展示对话响应。应理解，尽管对话响应为语音数据，但是人机交互界面仍然可以以语音方式之外的多媒体方式进行展示。例如，在获取语音数据匹配的文字信息或图像信息时，智能设备可以执行本地数据处理，得到与语音响应匹配的图像信息或文字信息，智能设备还可以将语音数据发送到后端服务器，得到返回的图像信息或文字信息。这里的后端服务器与任务式对话系统所采用的服务器可以相同，也可以不同。
75.在另一示例中，语音识别模块110和语音合成模块160可以为智能设备中的模块。换言之，智能设备通过人机交互界面获取语音数据，并且将其转化为对话文本，然后将对话文本发送到部署在后端的对话管理器130，对话管理器130中的机器学习模型对对话文本进行处理，并且向智能设备返回响应文本。这时，智能设备可以对响应文本进行处理，得到对应的图像信息或语音数据，以进行多媒体展示。可替代地，智能设备可以将对话文本或响应
文本发送到后端服务器，得到返回的语音数据或图像信息，人机交互界面获取语音数据之后，也可以将语音数据发送到后端服务器处理，得到返回的对话文本。可替代地，对话管理器130(部署在第一服务器中)可以将处理得到的响应文本直接发送到用于多媒体展示处理的第二服务器，第二服务器向智能设备返回响应文本对应的多媒体展示数据。此外，第二服务器还可以其他数据库连接，将响应文本与从其他数据库采集的相关信息融合，得到多媒体展示数据返回到智能设备。智能设备的人机交互界面将多媒体展示数据进行渲染，进行多媒体展示。
76.图4为根据本发明的另一实施例的数据集构建装置的结构框图。本实施例的方案可以适用于任意适当的具有数据处理能力的电子设备，包括但不限于：服务器、移动终端(如手机、pad等)和pc机等。图4的数据集构建装置包括：
77.第一构建模块410，构建用户意图集合。
78.确定模块420，从特征数据集合中，确定所述用户意图集合中各个用户意图所对应的关键数据。
79.生成模块430，根据所述各个用户意图中的目标用户意图对应的关键数据，生成所述目标用户意图的任务式对话大纲。
80.第二构建模块440，根据所述目标用户意图的任务式对话大纲，构建任务式对话数据集。
81.在本发明实施例的方案中，从特征数据集合中，确定用户意图集合中各个用户意图所对应的关键数据，建立了关键数据与用户意图的准确对应关系，根据各个用户意图中的目标用户意图对应的关键数据，高效地生成了准确的任务式对话大纲，根据所述目标用户意图的任务式对话大纲，构建任务式对话数据集，提高了数据集的构建效率，降低了对话数据集构建时的人工成本和时间成本。
82.在另一些示例中，该装置还包括：获取模块，采集双语数据集；基于知识库规则，对所述双语数据集进行处理，得到所述特征数据集合。
83.在另一些示例中，确定模块具体用于：确定所述用户意图集合中各个用户意图所对应的意图约束条件；从特征数据集合中，确定符合所述各个用户意图的意图约束条件的关键数据。
84.在另一些示例中，所述意图约束条件包括信息类型和信息类型属性，确定模块具体用于：从特征数据集合中，确定与所述信息类型和所述信息类型属性对应的关键数据，分别作为所述信息类型的信息槽值和所述信息类型属性的属性值。
85.在另一些示例中，所述信息类型属性的属性值指示所述信息类型的信息槽值的取值范围。
86.在另一些示例中，生成模块具体用于：获取指示所述目标用户意图的至少一个第一特征语句；根据所述目标用户意图的意图约束条件的关键数据，调用所述服务接口，得到指示所述服务接口的返回结果的至少一个第二特征语句，其中，所述服务接口基于所述意图约束条件构建，所述至少一个第一特征语句和所述至少一个第二特征语句形成所述对话大纲。
87.在另一些示例中，第二构建模块具体用于：根据所述目标用户意图的任务式对话大纲，构建备选实际对话数据；根据所述备选实际对话数据中的对话选择频率，确定所述任
务式对话数据集。
88.本实施例的装置用于实现前述多个方法实施例中相应的方法，并具有相应的方法实施例的有益效果，在此不再赘述。此外，本实施例的装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述，在此亦不再赘述。
89.参照图5，示出了根据本发明的另一实施例的电子设备的结构示意图，本发明具体实施例并不对电子设备的具体实现做限定。
90.如图5所示，该电子设备可以包括：处理器(processor)502、通信接口(communications interface)504、存储器(memory)506、以及通信总线508。
91.其中：
92.处理器502、通信接口504、以及存储器506通过通信总线508完成相互间的通信。
93.通信接口504，用于与其它电子设备或服务器进行通信。
94.处理器502，用于执行程序510，具体可以执行上述方法实施例中的相关步骤。
95.具体地，程序510可以包括程序代码，该程序代码包括计算机操作指令。
96.处理器502可能是处理器cpu，或者是特定集成电路asic(application specific integrated circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。智能设备包括的一个或多个处理器，可以是同一类型的处理器，如一个或多个cpu；也可以是不同类型的处理器，如一个或多个cpu以及一个或多个asic。
97.存储器506，用于存放程序510。存储器506可能包含高速ram存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。
98.程序510具体可以用于使得处理器502执行以下操作：构建用户意图集合；从特征数据集合中，确定所述用户意图集合中各个用户意图所对应的关键数据；根据所述各个用户意图中的目标用户意图对应的关键数据，生成所述目标用户意图的任务式对话大纲；根据所述目标用户意图的任务式对话大纲，构建任务式对话数据集。
99.可替代地，程序510具体可以用于使得处理器502执行以下操作：通过人机交互界面获取用户的任务式对话请求，所述任务式对话请求指示目标用户意图；将所述任务式对话请求发送到任务式对话系统，所述任务式对话系统利用机器学习模型对所述目标用户意图进行处理，得到任务式对话响应，所述机器学习模型采用根据数据集构建方法构建的任务式对话数据集训练得到；接收所述任务式对话系统发送的任务式对话响应；通过所述人机交互界面向用户展示所述任务式对话响应。
100.此外，程序510中各步骤的具体实现可以参见上述方法实施例中的相应步骤和单元中对应的描述，在此不赘述。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述方法实施例中的对应过程描述，在此不再赘述。
101.需要指出，根据实施的需要，可将本发明实施例中描述的各个部件/步骤拆分为更多部件/步骤，也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤，以实现本发明实施例的目的。
102.上述根据本发明实施例的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如cd rom、ram、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质
中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如asic或fpga)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，ram、rom、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的方法。此外，当通用计算机访问用于实现在此示出的方法的代码时，代码的执行将通用计算机转换为用于执行在此示出的方法的专用计算机。
103.本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明实施例的范围。
104.以上实施方式仅用于说明本发明实施例，而并非对本发明实施例的限制，有关技术领域的普通技术人员，在不脱离本发明实施例的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本发明实施例的范畴，本发明实施例的专利保护范围应由权利要求限定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：信号处理设备、信号处理方法和程序与流程

数据集构建和任务式对话方法、电子设备和存储介质与流程

相关文献

最热文献