一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种对话关系处理方法、计算机及可读存储介质与流程

2022-06-29 22:04:01 来源:中国专利 TAG:


1.本技术涉及计算机技术领域,尤其涉及一种对话关系处理方法、装置、计算机及可读存储介质。


背景技术:

2.现在,存在许多对话式的数据,在处理该数据时,往往需要对这些对话式的数据进行分析,包括对该对话式的数据中的论元的分析,如针对对话式论元的关系抽取任务。其中,对话式的数据中很多论元都涉及到说话者,在针对对话式的关系抽取任务中,一般会将对话文本与论元进行拼接,显式地将对话文本与论元中的说话者词语全部替换为预先定义的特殊符号,对替换后得到的文本进行编码预测,得到说话者词语之间的关系。由于对话式的数据可能会比较长,通过上述方式,难以准确找到与论元相关的上下文信息,从而使得对论元关系的预测结果可能会不准确。


技术实现要素:

3.本技术实施例提供了一种对话关系处理方法、装置、计算机及可读存储介质,可以提高对对话关系处理的准确性及检测效率。
4.本技术实施例一方面提供了一种对话关系处理方法,该方法包括:
5.将样本对话文本及样本对话文本中的样本论元对输入初始关系预测模型,在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息;样本论元对包括第一样本论元及第二样本论元;
6.基于样本文本语义信息预测第一样本论元与第二样本论元之间的预测论元关系,根据第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成第一损失函数;
7.获取样本对话文本与样本论元对中的隐藏字符,预测隐藏字符对应的预测字符,根据隐藏字符与预测字符生成第二损失函数;
8.根据实际论元关系与样本文本语义信息生成触发词检测文本数据,预测触发词检测文本数据中的预测序列标注,根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数;
9.根据第一损失函数、第二损失函数及第三损失函数对初始关系预测模型进行模型参数调整,生成对话关系预测模型;对话关系预测模型用于预测目标对话文本中的目标论元对之间的目标论元关系。
10.本技术实施例一方面提供了一种对话关系处理方法,该方法包括:
11.将目标对话文本及目标对话文本中的目标论元对输入对话关系预测模型,在对话关系预测模型中对目标对话文本及目标论元对进行特征提取,得到目标对话文本对应的目标文本语义信息;目标论元对包括第一目标论元及第二目标论元;
12.基于对话关系预测模型中的关系预测网络对目标文本语义信息进行预测,得到第
一目标论元与第二目标论元之间的目标论元关系;对话关系预测模型是基于第一损失函数、第二损失函数及第三损失函数对初始关系预测模型训练得到的;初始关系预测模型包括初始关系预测网络、初始词组预测网络及初始触发词预测网络;第一损失函数是由第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成的,实际论元关系是在初始关系预测网络中,对第一样本论元与第二样本论元所在的样本对话文本对应的样本文本语义信息预测得到的;第二损失函数是由隐藏字符与预测字符生成的,预测字符是在初始词组预测网络中,对样本对话文本、第一样本论元与第二样本论元中的隐藏字符进行预测得到的;第三损失函数是由触发词检测文本数据中的实际序列标注与预测序列标注生成的,触发词检测文本数据是在初始触发词预测网络中,根据实际论元关系与样本文本语义信息生成的,预测序列标注是对触发词检测文本数据进行预测得到的。
13.本技术实施例一方面提供了一种对话关系处理装置,该装置包括:
14.模型输入模块,用于将样本对话文本及样本对话文本中的样本论元对输入初始关系预测模型;
15.语义信息提取模块,用于在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息;样本论元对包括第一样本论元及第二样本论元;
16.关系处理模块,用于基于样本文本语义信息预测第一样本论元与第二样本论元之间的预测论元关系;
17.第一损失生成模块,用于根据第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成第一损失函数;
18.字符获取模块,用于获取样本对话文本与样本论元对中的隐藏字符;
19.词组预测模块,用于预测隐藏字符对应的预测字符;
20.第二损失生成模块,用于根据隐藏字符与预测字符生成第二损失函数;
21.触发检测生成模块,用于根据实际论元关系与样本文本语义信息生成触发词检测文本数据;
22.序列标注模块,用于预测触发词检测文本数据中的预测序列标注;
23.第三损失生成模块,用于根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数;
24.模型训练模块,用于根据第一损失函数、第二损失函数及第三损失函数对初始关系预测模型进行模型参数调整,生成对话关系预测模型;对话关系预测模型用于预测目标对话文本中的目标论元对之间的目标论元关系。
25.其中,该语义信息提取模块,包括:
26.样本拼接单元,用于基于样本文本拼接符对样本对话文本与样本论元对进行拼接,生成样本拼接文本数据;
27.论元替换单元,用于将样本拼接文本数据中的第一样本论元替换为第一样本论元符号,将样本拼接文本数据中的第二样本论元替换为第二样本论元符号,生成样本文本序列数据;
28.信息提取单元,用于对样本文本序列数据进行特征提取,得到样本对话文本对应的样本文本语义信息。
29.其中,样本文本拼接符包括样本全局语义符;样本文本序列数据包括样本对话文本对应的样本对话序列数据,样本对话序列数据包括n个样本对话词组,n为正整数;
30.该信息提取单元,包括:
31.隐层提取子单元,用于对样本文本序列数据中的样本全局语义符、n个样本对话词组、第一样本论元符号及第二样本论元符号分别进行隐层特征提取,得到样本全局语义符对应的样本全局隐状态、n个样本对话词组分别对应的样本词组隐状态、第一样本论元符号对应的第一初始样本论元隐状态以及第二样本论元符号对应的第二初始样本论元隐状态;
32.语义确定子单元,用于将样本全局隐状态、n个样本词组隐状态、第一初始样本论元隐状态及第二初始样本论元隐状态,确定为样本对话文本对应的样本文本语义信息。
33.其中,该隐层提取子单元,包括:
34.全局处理子单元,用于基于预训练语言网络,获取n个样本对话词组、第一样本论元符号及第二样本论元符号分别与样本全局语义符之间的样本全局关系,对样本全局关系进行特征融合,生成样本全局语义符对应的样本全局隐状态;
35.状态提取子单元,用于对n个样本对话词组、第一样本论元符号及第二样本论元符号分别进行隐层特征提取,得到n个样本对话词组分别对应的样本词组隐状态、第一样本论元符号对应的第一初始样本论元隐状态,以及第二样本论元符号对应的第二初始样本论元隐状态。
36.其中,n个样本对话词组包括第一样本论元符号及第二样本论元符号;初始关系预测模型包括初始关系预测网络;
37.该关系处理模块,包括:
38.第一论元识别单元,用于基于初始关系预测网络,从样本文本语义信息所包括的n个样本词组隐状态中,获取第一样本论元符号对应的第一样本词组隐状态,对第一样本词组隐状态与第一初始样本论元隐状态进行最大池化处理,得到第一样本论元符号的第一样本论元隐状态;
39.第二论元识别单元,用于从n个样本词组隐状态中获取第二样本论元符号对应的第二样本词组隐状态,对第二样本词组隐状态与第二初始样本论元隐状态进行最大池化处理,得到第二样本论元符号的第二样本论元隐状态;
40.隐状态拼接单元,用于对样本全局隐状态、第一样本论元隐状态及第二样本论元隐状态进行拼接,得到样本隐状态信息;
41.关系预测单元,用于基于样本隐状态信息预测第一样本论元与第二样本论元之间的预测论元关系。
42.其中,该关系预测单元,包括:
43.语义增强子单元,用于对样本隐状态信息进行语义增强,得到样本增强语义信息;
44.概率选取子单元,用于基于样本增强语义信息,预测第一样本论元与第二样本论元对应的m种候选论元关系的样本关系预测概率,将具有最大的样本关系预测概率的候选论元关系,确定为第一样本论元与第二样本论元之间的预测论元关系;m为正整数。
45.其中,样本文本序列数据还包括第一样本论元符号及第二样本论元符号,n为正整数;初始关系预测模型包括初始词组预测网络;
46.该字符获取模块,包括:
47.词组获取单元,用于基于初始词组预测网络,获取样本文本序列数据中的k个序列词组;k个序列词组包括n个样本对话词组、第一样本论元符号及第二样本论元符号;k为正整数;
48.状态检测单元,用于检测样本文本序列数据中的k个序列词组分别对应的字符状态,将字符状态为隐藏状态的序列词组确定为隐藏字符。
49.其中,该词组预测模块,包括:
50.字符关联单元,用于将样本文本序列数据中的隐藏字符替换为字符掩码,获取隐藏字符的关联序列词组与字符掩码之间的字符关联信息,根据字符关联信息得到字符掩码的掩码隐状态;关联序列词组为k个序列词组中除隐藏字符之外的序列词组;
51.字符预测单元,用于对掩码隐状态进行特征提取,预测字符掩码对应的预测字符。
52.其中,初始关系预测模型包括初始触发词预测网络;
53.该触发检测生成模块,包括:
54.向量转换单元,用于基于初始触发词预测网络,对实际论元关系进行向量转换,得到实际论元关系对应的论元关系向量;
55.数据生成单元,用于将论元关系向量与样本文本语义信息中的n个样本词组隐状态进行拼接,生成触发词检测文本数据。
56.其中,该序列标注模块,包括:
57.文本拆分单元,用于对触发词检测文本数据进行词组拆分,得到t个待标注词组;t为正整数;
58.初始标注单元,用于对t个待标注词组分别添加初始标注,检测t个待标注词组中相邻待标注词组对的词组关联关系;
59.标注更新单元,用于基于词组关联关系更新t个待标注词组分别对应的初始标注,得到t个待标注词组分别对应的预测标注,将t个待标注词组分别对应的预测标注组成预测序列标注。
60.本技术实施例一方面提供了一种对话关系处理装置,该装置包括:
61.目标模型输入模块,用于将目标对话文本及目标对话文本中的目标论元对输入对话关系预测模型;
62.目标语义获取模块,用于在对话关系预测模型中对目标对话文本及目标论元对进行特征提取,得到目标对话文本对应的目标文本语义信息;目标论元对包括第一目标论元及第二目标论元;
63.目标关系预测模块,用于基于对话关系预测模型中的关系预测网络对目标文本语义信息进行预测,得到第一目标论元与第二目标论元之间的目标论元关系;对话关系预测模型是基于第一损失函数、第二损失函数及第三损失函数对初始关系预测模型训练得到的;初始关系预测模型包括初始关系预测网络、初始词组预测网络及初始触发词预测网络;第一损失函数是由第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成的,实际论元关系是在初始关系预测网络中,对第一样本论元与第二样本论元所在的样本对话文本对应的样本文本语义信息预测得到的;第二损失函数是由隐藏字符与预测字符生成的,预测字符是在初始词组预测网络中,对样本对话文本、第一样本论元与第二样本论元中的隐藏字符进行预测得到的;第三损失函数是由触发词检测文本数据中的实际序列标
注与预测序列标注生成的,触发词检测文本数据是在初始触发词预测网络中,根据实际论元关系与样本文本语义信息生成的,预测序列标注是对触发词检测文本数据进行预测得到的。
64.其中,该目标语义获取模块,包括:
65.目标拼接单元,用于基于目标文本拼接符对目标对话文本与目标论元对进行拼接,生成目标拼接文本数据;
66.目标替换单元,用于将目标拼接文本数据中的第一目标论元替换为第一目标论元符号,将目标拼接文本数据中的第二目标论元替换为第二目标论元符号,生成目标文本序列数据;
67.目标获取单元,用于对目标文本序列数据进行特征提取,得到目标对话文本对应的目标文本语义信息。
68.其中,该目标模型输入模块,包括:
69.咨询获取单元,用于获取目标对话文本与目标对话文本关联的对话咨询信息;
70.对话解析单元,用于对对话咨询信息进行解析,提取对话咨询信息中的目标论元对;
71.模型输入单元,用于将目标对话文本及目标对话文本中的目标论元对输入对话关系预测模型;
72.该装置还包括:
73.数据存储模块,用于根据目标对话文本、对话咨询信息及目标论元对生成目标问答数据,将目标问答数据添加至问答数据库中。
74.本技术实施例一方面提供了一种计算机设备,包括处理器、存储器、输入输出接口;
75.处理器分别与存储器和输入输出接口相连,其中,输入输出接口用于接收数据及输出数据,存储器用于存储计算机程序,处理器用于调用该计算机程序,以使包含该处理器的计算机设备执行本技术实施例一方面中的对话关系处理方法。
76.本技术实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本技术实施例一方面中的对话关系处理方法。
77.本技术实施例一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本技术实施例一方面中的各种可选方式中提供的方法。
78.实施本技术实施例,将具有如下有益效果:
79.在本技术实施例中,将样本对话文本及样本对话文本中的样本论元对输入初始关系预测模型,在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息;样本论元对包括第一样本论元及第二样本论元;基于样本文本语义信息预测第一样本论元与第二样本论元之间的预测论元关系,根据第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成第一损失函数;获取样本对话文本与样本论元对中的隐藏字符,预测隐藏字符对应的预测字符,根据隐藏字符与预
测字符生成第二损失函数;根据实际论元关系与样本文本语义信息生成触发词检测文本数据,预测触发词检测文本数据中的预测序列标注,根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数;根据第一损失函数、第二损失函数及第三损失函数对初始关系预测模型进行模型参数调整,生成对话关系预测模型;对话关系预测模型用于预测目标对话文本中的目标论元对之间的目标论元关系。通过上述过程,本技术将对话式关系抽取分为三个相关的子任务,分别是关系预测任务、词组预测任务及触发词预测任务,通过综合这三个子任务,对模型进行联合训练,可以充分利用从词组预测任务及触发词预测任务中学到的有效信息,并基于该有效信息影响关系预测任务,从而提高对话关系处理的准确性。
附图说明
80.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
81.图1是本技术实施例提供的一种对话关系处理的网络交互架构图;
82.图2是本技术实施例提供的一种模型训练场景示意图;
83.图3是本技术实施例提供的一种模型结构示意图;
84.图4是本技术实施例提供的一种模型生成过程的方法流程图;
85.图5是本技术实施例提供了一种模型组成架构图;
86.图6是本技术实施例提供的一种模型预测场景示意图;
87.图7是本技术实施例提供的一种模型预测过程的方法流程图;
88.图8是本技术实施例提供的一种对话关系处理装置示意图;
89.图9是本技术实施例提供的另一种对话关系处理装置示意图;
90.图10是本技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
91.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
92.其中,本技术实施例提供的方案涉及人工智能领域中的机器学习等技术,是为了实现对对话文本的自动化提取及分析,从而可以识别该对话文本中的论元对之间的关系。
93.其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。在本技术中,通过机器学习技术,实现对对话关系预测模型的训练和使用,实现了模型的自
动化处理,这整个过程实现了关系预测人工智能。
94.其中,人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。而本技术中主要涉及的是机器学习/深度学习(如对话关系预测模型的训练及使用等)等方向。
95.深度学习(deep learning,dl)是机器学习(machine learning,ml)领域中一个新的研究方向。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。其中,深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术,深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
96.随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值,例如,本技术中的文本分析领域。
97.在本技术实施例中,请参见图1,图1是本技术实施例提供的一种对话关系处理的网络交互架构图,本技术实施例可以由计算机设备101实现,该计算机设备101可以与用户设备(如用户设备102a、用户设备102b及用户设备102c等)之间进行数据交互。其中,若计算机设备101为用于进行模型训练的设备,则该计算机设备101可以从各个用户设备中获取样本对话文本及样本对话文本中的样本论元对,基于样本对话文本及样本论元对实现对模型的训练,得到用于预测论元对关系的对话关系预测模型。可选的,该样本对话文本可以是从各个用户设备中获取到的,也可以是直接从计算机设备101中获取(即存储于计算机设备101中),或者可以基于云存储技术进行获取,也可以基于区块链网络进行获取,在此不做限制。若计算机设备101为用于进行模型预测的设备,则该计算机设备101可以响应任意一个用户设备发送的关系预测请求,例如,响应用户设备102a发送的关系预测请求,获取该关系预测请求所包括的目标对话文本及目标论元对,基于对话关系预测模型对目标对话文本与目标论元对进行预测,得到目标论元对的目标论元关系。可选的,计算机设备101也可以是获取到存储于计算机设备101中的目标对话文本及目标论元对,基于对话关系预测模型对目标对话文本与目标论元对进行预测,得到目标论元对的目标论元关系等。换句话说,本技术中所涉及的数据可以是由用户设备提供的,也可以存储于计算机设备101中,或者可以基于云存储技术进行存储,或者可以存储于区块链网络中,在此不做限制。
98.进一步地,可以参见图2,图2是本技术实施例提供的一种模型训练场景示意图。如图2所示,计算机设备可以获取模型训练样本201,该模型训练样本201包括样本对话文本及样本对话文本中的样本论元对,将样本对话文本及样本论元对输入初始关系预测模型,在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息,将样本文本语义信息输入初始关系预测模型中的任务处理区域,包括关系预测任务区域2021、词组预测任务区域2022及触发词预测任务区域2023等。其中,该样本论元对包括第一样本论元及第二样本论元。其中,该关系预测任务区域2021用于对论
元对进行关系抽取,该关系抽取是一种从自然语言文本中识别并判定实体对之间存在的特定关系的技术。具体的,在关系预测任务区域2021中,对样本文本语义信息进行预测,得到第一样本论元及第二样本论元之间的预测论元关系,获取第一样本论元与第二样本论元之间的实际论元关系,根据预测论元关系与实际论元关系生成第一损失函数。在词组预测任务区域2022中,获取样本对话文本与样本论元对中的隐藏字符,预测该隐藏字符对应的预测字符,根据隐藏字符与预测字符生成第二损失函数。在触发词预测任务区域2023中,根据实际论元关系与样本文本语义信息生成触发词检测文本数据,预测该触发词检测文本数据中的预测序列标注,根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数。根据第一损失函数、第二损失函数及第三损失函数,对初始关系预测模型进行多任务学习,生成对话关系预测模型。通过在关系预测任务中引入词组预测任务及触发词预测任务等学到的有效信息,使得该关系预测任务中可以更为全面地获取到对话文本(如样本对话文本或目标对话文本等)中的信息,从而提高该关系预测任务的预测准确性。
99.进一步地,可以参见图3,图3是本技术实施例提供的一种模型结构示意图。如图3所示,初始关系预测模型中包括初始关系预测网络、初始词组预测网络及触发词预测网络等,该初始关系预测模型中还包括共享编码器,该初始关系预测网络、初始词组预测网络及初始触发词预测网络等的输入,是基于该共享编码器的输出得到的。在对该初始关系预测模型进行模型参数调整(即对初始关系预测模型的模型参数进行调整)后,生成对话关系预测模型,其中,该模型参数是使用通用变量来建立函数和变量之间关系的一个数量,在人工智能领域中,模型参数通常是实数矩阵,可选的,随着模型的发展,该模型参数也可以是其他格式的数据。其中,该对话关系预测模型可以包括共享编码器、关系预测网络、词组预测网络及触发词预测网络。可选的,该对话关系预测模型也可以只包括共享编码器及关系预测网络等,以精简模型结构。
100.其中,该词组预测网络及触发词预测网络用于对关系预测网络进行特征信息补充,从而提高关系预测网络的预测准确性。其中,关系预测任务区域是指初始关系预测网络及关系预测网络所在的区域,也就是说,关系预测任务区域中的网络在训练前称为初始关系预测网络,在训练后称为关系预测网络,用于预测论元对(如样本论元对或目标论元对等)之间的论元关系;词组预测任务区域是指初始词组预测网络及词组预测网络所在的区域,也就是说,词组预测任务区域中的网络在训练前称为初始词组预测网络,在训练后称为词组预测网络,用于对文本中的词组进行预测;触发词预测任务区域是指初始触发词预测网络及触发词预测网络所在的区域,也就是说,触发词预测任务区域中的网络在训练前称为初始触发词预测网络,在训练后称为触发词预测网络,用于对文本的序列标注进行预测。
101.可以理解的是,本技术实施例中所提及的计算机设备或用户设备包括但不限于终端设备或服务器。换句话说,计算机设备或用户设备可以是服务器或终端设备,也可以是服务器和终端设备组成的系统。其中,以上所提及的终端设备可以是一种电子设备,包括但不限于手机、平板电脑、台式电脑、笔记本电脑、掌上电脑、车载设备、增强现实/虚拟现实(augmented reality/virtual reality,ar/vr)设备、头盔显示器、智能电视、可穿戴设备、智能音箱、数码相机、摄像头及其他具备网络接入能力的移动互联网设备(mobile internet device,mid),或者火车、轮船、飞行等场景下的终端设备等。其中,以上所提及的服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式
系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、车路协同、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
102.进一步地,请参见图4,图4是本技术实施例提供的一种模型生成过程的方法流程图。如图4所示,该模型生成过程包括如下步骤:
103.步骤s401,将样本对话文本及样本对话文本中的样本论元对输入初始关系预测模型,在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息,样本论元对包括第一样本论元及第二样本论元。
104.在本技术实施例中,计算机设备获取训练样本,该训练样本包括样本对话文本及样本对话文本中的样本论元对,其中,论元是指带有题元角色的体词性成分,跟谓词搭配的名词可以称为论元,该样本对话文本可以是包括至少两个论元的任意一个文本数据,该样本论元对可以是样本对话文本中的任意两个论元,例如,由样本对话文本中的任意两个说话者组成的论元对,或者,由样本对话文本中的任意两个物品组成的论元对,或者,也可以是由样本对话文本中的说话者与物品组成的论元对等,在此不做限制。举例来说,获取到样本对话文本为“speaker1:

uh,like,could these margaritas be any stronger?hey,chandler.’,speaker2:

hello,mr.bing’,speaker 3:
‘…’

…”
,则该样本论元对可以是该样本对话文本中的任意两个说话者组成的论元对,如“{speaker 1,speaker 2}、{speaker1,speaker 3}及{speaker 2,speaker 3}等”,也可以是说话者与物品组成的论元对,如“{speaker 1,margaritas}、{speaker 2,margaritas}等”,在此不做限制。也就是说,该样本论元对可以有不同的论元对类型,包括但不限于同说话者论元对类型、同物品论元对类型及说话者与物品论元对类型等。其中,在模型训练过程中,可以同时基于不同的论元对类型对初始关系预测模型进行训练,得到可以检测不同的论元对类型的对话关系预测模型,以提高训练得到的模型的泛化性;或者,也可以基于不同的论元对类型,分别对初始关系预测模型进行训练,得到用于多个对话关系预测模型,不同的对话关系预测模型所检测的论元对类型不同,以提高训练得到的模型的准确性。可选的,可以基于需要,综合考虑模型的泛化性及准确性等,确定一个模型所需检测论元对类型的数量,在此不做限制。进一步地,计算机设备可以将获取到的样本对话文本及样本对话文本中的样本论元对输入初始关系预测模型,在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息。
105.其中,计算机设备可以在初始关系预测模型中,对样本对话文本及样本论元对进行数据预处理及隐层特征提取,得到样本对话文本对应的样本文本语义信息。其中,图5是本技术实施例提供的一种模型组成架构图,如图5所示,计算机设备获取到训练样本501,该训练样本501可以包括样本对话文本及样本对话文本中的样本论元对,将样本对话文本及样本论元对输入初始关系预测模型502,基于该初始关系预测模型502中的共享编码器对样本对话文本及样本论元对进行数据预处理以及隐层特征提取,得到该样本对话文本对应的样本文本语义信息。该初始关系预测模型502可以执行关系预测任务、词组预测任务及触发词预测任务。
106.具体的,计算机设备可以在初始关系预测模型中基于样本文本拼接符对样本对话文本与样本论元对进行拼接,生成样本拼接文本数据,其中,该样本文本拼接符可以包括样
本全局语义符及样本分隔符等,具体的,计算机设备可以对样本对话文本与样本论元对进行拼接,在拼接得到的拼接样本中插入样本文本拼接符,得到样本拼接文本数据,其中,该样本文本拼接符及该样本文本拼接符的插入方式,可以是基于共享编码器中的预训练语言网络所确定的,该样本文本拼接符可以是任意一种特殊字符或特殊字符串,在此不做限制,该样本全局语义符用于是指该样本对话文本及样本论元对的全局表示,样本分割符用于对样本对话文本与样本论元对进行分割。举例来说,将该样本对话文本记作tx,假定该样本文本拼接符中的样本全局语义符为[cls],样本文本拼接符中的样本分隔符为[sep],基于样本全局语义符与样本分割符对样本对话文本及样本论元对进行拼接,其中,将第一样本论元记作a1,将第二样本论元记作a2,在对样本对话文本及样本论元对进行拼接后,得到样本拼接文本数据,该样本拼接文本数据可以是“[cls]tx[sep]a1[sep]a2[sep]”,其中,假定该样本对话文本tx为“s1:t1s2:t2…
su:t
u”,此时,该样本拼接文本数据可以表示为“[cls]s1:t1s2:t2…
su:tu[sep]a1[sep]a2[sep]”;可选的,也可以进一步基于样本对话文本的文本组成结构在样本对话文本中插入样本分割符,得到样本拼接文本数据,如“[cls]s1:t1[sep]s2:t2[sep]

[sep]su:tu[sep]a1[sep]a2[sep]”,在此不做限制。
[0107]
进一步地,计算机设备可以将样本拼接文本数据中的第一样本论元替换为第一样本论元符号,将样本拼接文本数据中的第二样本论元替换为第二样本论元符号,生成样本文本序列数据。可选的,在将样本论元替换为对应的样本论元符号(即将第一样本论元替换为第一样本论元符号,或将第二样本论元替换为第二样本论元符号)时,可以基于起始论元符号及结束论元符号标注样本论元在样本拼接文本数据中的位置。具体的,该样本文本序列数据的生成过程可以参见公式

所示:
[0108][0109]
如公式

所示,表示样本文本序列数据中的第i个字符,[b]表示起始论元符号,[e]表示结束论元符号,a1表示第一样本论元,a2表示第二样本论元,si表示样本拼接文本数据中的第i个字符,[s1]表示第一样本论元符号,[s2]表示第二样本论元符号,可选的,本技术汇总的第一样本论元符号、第二样本论元符号、起始论元符号及结束论元符号等均不限于上述的表示方式,也可以由其他的特殊字符或特殊字符串进行表示,在此不做限制。其中,公式

用于表示,计算机设备遍历样本拼接文本数据,若该样本拼接文本数据中的第i个字符为第一样本论元(即si=a1),则将样本拼接文本数据中的第i个字符替换为第一样本论元符号[s1],可选的,还可以基于起始论元符号[b]及结束论元符号[e]标注该第一样本论元在样本拼接文本数据中的位置,即,将样本拼接文本数据中的第i个字符替换为[b][s1][e];若该样本拼接文本数据中的第i个字符为第二样本论元(即si=a2),则将样本拼接文本数据中的第i个字符替换为第二样本论元符号[s2],可选的,还可以基于起始论元符号[b]及结束论元符号[e]标注该第二样本论元在样本拼接文本数据中的位置,即,将样本拼接文本数据中的第i个字符替换为[b][s2][e];若该样本拼接文本数据中的第i个字符不是第一样本论元,且不是第二样本论元,则将该样本拼接文本数据中的第i个字符保持不变。通过上述过程,得到样本文本序列数据。其中,i为正整数,i小于或等于样本拼接文本数据
中所包括的字符数量。
[0110]
其中,上述基于样本对话文本及样本对话文本中的样本论元对生成样本文本序列数据的过程,可以认为是针对样本对话文本及样本对话文本中的样本论元对的数据预处理过程。
[0111]
进一步地,计算机设备可以对样本文本序列数据进行特征提取(即隐层特征提取),得到样本对话文本对应的样本文本语义信息。具体的,该样本文本拼接符包括样本全局语义符;样本文本序列数据包括样本对话文本对应的样本对话序列数据,样本对话序列数据包括n个样本对话词组,n为正整数。计算机设备在对样本文本序列数据进行特征提取,得到样本对话文本对应的样本文本语义信息时,具体是对样本文本序列数据中的样本全局语义符、n个样本对话词组、第一样本论元符号及第二样本论元符号分别进行隐层特征提取,得到样本全局语义符对应的样本全局隐状态、n个样本对话词组分别对应的样本词组隐状态、第一样本论元符号对应的第一初始样本论元隐状态以及第二样本论元符号对应的第二初始样本论元隐状态。将样本全局隐状态、n个样本词组隐状态、第一初始样本论元隐状态及第二初始样本论元隐状态,确定为样本对话文本对应的样本文本语义信息。
[0112]
具体的,计算机设备可以基于预训练语言网络,获取n个样本对话词组、第一样本论元符号及第二样本论元符号分别与样本全局语义符之间的样本全局关系,对样本全局关系进行特征融合,生成样本全局语义符对应的样本全局隐状态;对n个样本对话词组、第一样本论元符号及第二样本论元符号分别进行隐层特征提取,得到n个样本对话词组分别对应的样本词组隐状态、第一样本论元符号对应的第一初始样本论元隐状态,以及第二样本论元符号对应的第二初始样本论元隐状态。其中,该预训练语言网络可以是任意一种可以获取词组的隐层表示的网络,如双向特征表示的自编码预训练语言模型(bidirectional encoder representations from transformers,bert)、自回归预训练模型(embedding from language model,elmo)或生成式的预训练模型(generative pre-training,gpt/gpt2)等,在此不做限制。
[0113]
举例来说,请参见图6,图6是本技术实施例提供的一种模型预测场景示意图。如图6所示,该初始关系预测模型包括共享编码器601、初始关系预测网络602、初始词组预测网络603及初始触发词预测网络604。计算机设备获取训练样本6011,该训练样本6011包括样本对话文本601a及样本论元对601b,假定该样本对话文本601a为“a1:mom!a2:sweetie
……”
,该样本论元对601b包括第一样本论元a1及第二样本论元a2。对训练样本6011进行数据预处理,得到样本文本序列数据6012,具体的,基于样本文本拼接符对样本对话文本601a及样本论元对601b进行拼接,生成样本拼接文本数据,该样本拼接文本数据可以是“[cls]a1:mom!a2:sweetie
……
[sep]a1[sep]a2[sep]”。进一步地,将样本拼接文本数据中的第一样本论元a1替换为第一样本论元符号s1,将样本拼接文本数据中的第一样本论元a2替换为第一样本论元符号s2,得到样本文本序列数据6012,该样本文本序列数据6012为“[cls]s1:mom!s2:sweetie
……
[sep]s1[sep]s2[sep]”。对样本全局语义符“[cls]”、n个样本对话词组、第一样本论元符号及第二样本论元符号分别进行隐层特征提取,得到该样本全局语义符对应的样本全局隐状态“h
[cls]”,n个样本对话词组分别对应的样本词组隐状态,如样本对话词组“s
1”对应的样本词组隐状态(下标1表示样本文本序列数据6012中
出现的第一个第一样本论元),样本对话词组“mom”对应的样本词组隐状态“h
i”(i表示n个样本对话词组中的第i个样本对话词组),样本对话词组“s
2”对应的样本词组隐状态

,以及第一样本论元符号对应的第一初始样本论元隐状态第二样本论元符号对应的第二初始样本论元隐状态j表示样本文本序列数据6012中出现的第j个第一样本论元符号或第二样本论元符号,可选的,在样本文本序列数据6012中,第一样本论元符号与第二样本论元符号的数量可以相同,也可以不相同。其中,将样本全局隐状态、n个样本词组隐状态、第一初始样本论元隐状态及第二初始样本论元隐状态,确定为样本对话文本对应的样本文本语义信息。
[0114]
步骤s402,基于样本文本语义信息预测第一样本论元与第二样本论元之间的预测论元关系,根据第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成第一损失函数。
[0115]
在本技术实施例中,该初始关系预测模型包括初始关系预测网络,n个样本对话词组包括第一样本论元符号及第二样本论元符号。在基于样本文本语义信息预测第一样本论元与第二样本论元之间的预测论元关系时,计算机设备可以基于初始关系预测网络,从样本文本语义信息所包括的n个样本词组隐状态中,获取第一样本论元符号对应的第一样本词组隐状态,对第一样本词组隐状态与第一初始样本论元隐状态进行最大池化处理,得到第一样本论元符号的第一样本论元隐状态;从n个样本词组隐状态中获取第二样本论元符号对应的第二样本词组隐状态,对第二样本词组隐状态与第二初始样本论元隐状态进行最大池化处理,得到第二样本论元符号的第二样本论元隐状态。可选的,该第一样本论元隐状态及第二样本论元隐状态也可以是在共享编码器中生成的,在初始关系预测模型中,将共享编码器得到的第一样本论元隐状态及第二样本论元隐状态,输入初始关系预测网络。进一步地,计算机设备可以对样本全局隐状态、第一样本论元隐状态及第二样本论元隐状态进行拼接,得到样本隐状态信息;基于样本隐状态信息预测第一样本论元与第二样本论元之间的预测论元关系。
[0116]
进一步地,在基于样本隐状态信息预测第一样本论元与第二样本论元之间的预测论元关系时,对样本隐状态信息进行语义增强,得到样本增强语义信息。可选的,计算机设备可以基于融合网络对样本隐状态信息进行语义增强,该融合网络可以是任意一个可以进行语义增强的网络,如包括一个或至少两个高速公路网络(highway network)的网络等,基于样本增强语义信息,预测第一样本论元与第二样本论元对应的m种候选论元关系的样本关系预测概率,将具有最大的样本关系预测概率的候选论元关系,确定为第一样本论元与第二样本论元之间的预测论元关系,m为正整数。
[0117]
进一步地,计算机设备可以根据第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成第一损失函数,该第一损失函数可以是实际论元关系与预测论元关系之间的二值交叉熵损失、对数损失函数或平方损失函数等,在此不做限制。
[0118]
具体的,图6所示,从样本文本语义信息所包括的n个样本词组隐状态中,获取第一样本论元符号s1对应的第一样本词组隐状态,即等,对第一样本词组隐状态与第一
初始样本论元隐状态进行最大池化处理,得到第一样本论元符号的第一样本论元隐状态从n个样本词组隐状态中获取第二样本论元符号s2对应的第二样本词组隐状态,即等,对第二样本词组隐状态与第二初始样本论元隐状态进行最大池化处理,得到第二样本论元符号的第二样本论元隐状态在初始关系预测网络602中,对样本全局隐状态h
[cls]
、第一样本论元隐状态及第二样本论元隐状态进行拼接,得到样本隐状态信息6021,基于样本隐状态信息6021预测第一样本论元与第二样本论元之间的预测论元关系。其中,该样本隐状态信息6021可以记作h,预测论元关系。其中,该样本隐状态信息6021可以记作h,该样本全局隐状态表示了该样本文本序列数据中的全局语义信息,融合了样本文本序列数据中的各个词组分别与样本全局语义符之间的关系,第一样本论元隐状态表示与第一样本论元相关的局部语义信息,第二样本论元隐状态表示与第二样本论元相关的局部语义信息,将样本全局隐状态h
[cls]
、第一样本论元隐状态及第二样本论元隐状态进行拼接,得到样本隐状态信息6021,使得样本隐状态信息可以包括样本文本序列数据中的全局语义信息及局部语义信息等,可以更为全面地提取该样本文本序列数据中的特征,从而提高关系预测的准确性。
[0119]
步骤s403,获取样本对话文本与样本论元对中的隐藏字符,预测隐藏字符对应的预测字符,根据隐藏字符与预测字符生成第二损失函数。
[0120]
在本技术实施例中,样本文本序列数据还包括第一样本论元符号及第二样本论元符号,n为正整数;初始关系预测模型包括初始词组预测网络。其中,在获取样本对话文本与样本论元对中的隐藏字符时,计算机设备可以基于初始词组预测网络,获取样本文本序列数据中的k个序列词组;k个序列词组包括n个样本对话词组、第一样本论元符号及第二样本论元符号;k为正整数,该样本文本序列数据是通过对样本对话文本及样本论元对进行数据预处理得到的,如图6中的“[cls]s1:mom!s2:sweetie
……
[sep]s1[sep]s2[sep]”,获取样本文本序列数据6012中的k个序列词组,该k个序列词组可以包括“[cls]”、“s
1”、“mom”、“s2”…
、“s
1”及“s
2”等。可选的,该k个序列词组中可以不包括样本文本拼接符。进一步地,检测样本文本序列数据中的k个序列词组分别对应的字符状态,将字符状态为隐藏状态的序列词组确定为隐藏字符。具体的,计算机设备可以基于默认隐藏概率,检测样本文本序列数据中的k个序列词组分别对应的字符状态,也就是说,每个序列词组对应的字符状态为隐藏状态的概率为默认隐藏概率,例如,该默认隐藏概率为10%,则以10%的概率随机隐藏k个序列词组中的序列词组。可选的,可以从k个序列词组中获取论元序列词组,从论元序列词组中确定隐藏字符,该论元序列词组是指为论元的序列词组,或者可以是第一样本论元及第二样本论元所对应的序列词组,从而可以捕捉论元的特征,通过该词组预测任务,使得模型可以分辨该样本对话文本中的论元,基于该论元的上下文信息,可以得到该论元的特点,进而有助于样本论元对之间的论元关系预测。
[0121]
进一步地,计算机设备可以预测隐藏字符对应的预测字符。具体的,将样本文本序列数据中的隐藏字符替换为字符掩码,获取隐藏字符的关联序列词组与字符掩码之间的字符关联信息,根据字符关联信息得到字符掩码的掩码隐状态;关联序列词组为k个序列词组中除隐藏字符之外的序列词组。其中,计算机设备可以基于预训练语言网络,获取该字符掩
码的掩码隐状态,即,上述过程(将隐藏字符替换为字符掩码,直至得到字符掩码的掩码隐状态的过程)可以基于预训练语言网络实现。进一步地,对掩码隐状态进行特征提取,预测字符掩码对应的预测字符,可选的,可以通过非线性分类器等在词表上预测字符掩码对应的预测字符。如图6中,在初始词组预测网络603中,获取样本文本序列数据中的隐藏字符,将隐藏字符替换为字符掩码,提取该字符掩码对应的掩码隐状态,基于掩码隐状态预测字符掩码对应的预测字符。该初始词组预测网络603用于执行词组预测任务。
[0122]
进一步地,计算机设备可以根据隐藏字符与预测字符生成第二损失函数,该第二损失函数可以是预测字符与隐藏字符之间的二值交叉熵损失、对数损失函数或平方损失函数等,在此不做限制。
[0123]
步骤s404,根据实际论元关系与样本文本语义信息生成触发词检测文本数据,预测触发词检测文本数据中的预测序列标注,根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数。
[0124]
在本技术实施例中,该初始关系预测模型包括初始触发词预测网络,其中,触发词是指文本中能够清晰指示论元关系的词语。在根据实际论元关系与样本文本语义信息生成触发词检测文本数据时,计算机设备可以基于初始触发词预测网络,对实际论元关系进行向量转换,得到实际论元关系对应的论元关系向量;将论元关系向量与样本文本语义信息中的n个样本词组隐状态进行拼接,生成触发词检测文本数据。进一步地,计算机设备可以对触发词检测文本数据进行词组拆分,得到t个待标注词组;t为正整数。对t个待标注词组分别添加初始标注,检测t个待标注词组中相邻待标注词组对的词组关联关系,以检测各个待标注词组是否是触发词的起始或结束边界。基于词组关联关系更新t个待标注词组分别对应的初始标注,得到t个待标注词组分别对应的预测标注,将t个待标注词组分别对应的预测标注组成预测序列标注。可选的,计算机设备可以基于bio标注模式(b-begin,i-inside,o-outside)、bioes标注模式(b-begin,i-inside,o-outside,e-end,s-single)或只标注触发词的起始边界及结束边界等方式,获取触发词检测文本数据中的预测序列标注。如图6中,在初始触发词预测网络604中,对触发词检测文本数据进行预测,得到预测序列标注6041,其中,该触发词检测文本数据是根据论元关系向量及n个样本词组隐状态进行拼接得到的,图6中的er是指论元关系向量,hi是指n个样本词组隐状态中的第i个样本词组隐状态。
[0125]
进一步地,计算机设备可以根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数,该第三损失函数可以是实际序列标注与预测序列标注之间的二值交叉熵损失、对数损失函数或平方损失函数等,在此不做限制。
[0126]
可选的,计算机设备可以获取初始关系预测网络中得到的预测论元关系,对预测论元关系进行向量转换,得到预测论元关系对应的预测关系向量,将预测关系向量与n个样本词组隐状态进行拼接,生成触发词测试数据,预测触发词测试数据中的测试序列标注,基于测试序列标注与实际序列标注生成的第四损失函数,对初始关系预测网络进行优化调整。
[0127]
步骤s405,根据第一损失函数、第二损失函数及第三损失函数对初始关系预测模型进行模型参数调整,生成对话关系预测模型。
[0128]
在本技术实施例中,对话关系预测模型用于预测目标对话文本中的目标论元对之
间的目标论元关系。具体的,计算机设备可以根据第一损失函数、第二损失函数及第三损失函数生成模型损失函数,基于模型损失函数对初始关系预测模型进行模型参数调整,具体是对初始关系预测模型中的各个网络进行模型参数调整,生成对话关系预测模型。可选的,将第一损失函数记作l1,将第二损失函数记作l2,将第三损失函数记作l3,基于第一损失函数、第二损失函数及第三损失函数得到模型损失函数,该模型损失函数为“l=l1 l2 l3”,基于模型损失函数对初始关系预测模型进行模型参数调整。通过上述过程,对关系预测任务、词组预测任务及触发词预测任务等以多任务学习的方式进行联合训练,使得该词组预测任务及触发词预测任务等的信息可以提供至关系预测任务,即该关系预测任务可以基于词组预测任务得到论元的特征信息等,可以基于触发词预测任务得到触发词信息,从而使得该关系预测任务可以更为全面地获取到样本对话文本中的信息,提高了关系预测的准确性。其中,多任务学习(multi-task learning,mtl),是一种同时考虑多个相关任务的机器学习方法,利用各个任务之间的内在关系提高单个任务学习的泛化性能,即,利用关系预测任务、词组预测任务及触发词预测任务等之间的内在关系,提高关系预测任务的泛化性能。
[0129]
在本技术实施例中,将样本对话文本及样本对话文本中的样本论元对输入初始关系预测模型,在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息;样本论元对包括第一样本论元及第二样本论元;基于样本文本语义信息预测第一样本论元与第二样本论元之间的预测论元关系,根据第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成第一损失函数;获取样本对话文本与样本论元对中的隐藏字符,预测隐藏字符对应的预测字符,根据隐藏字符与预测字符生成第二损失函数;根据实际论元关系与样本文本语义信息生成触发词检测文本数据,预测触发词检测文本数据中的预测序列标注,根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数;根据第一损失函数、第二损失函数及第三损失函数对初始关系预测模型进行模型参数调整,生成对话关系预测模型;对话关系预测模型用于预测目标对话文本中的目标论元对之间的目标论元关系。通过上述过程,本技术将对话式关系抽取分为三个相关的子任务,分别是关系预测任务、词组预测任务及触发词预测任务,通过综合这三个子任务,对模型进行联合训练,可以充分利用从词组预测任务及触发词预测任务中学到的有效信息,并基于该有效信息影响关系预测任务,从而提高对话关系处理的准确性。
[0130]
进一步地,可以参见图7,图7是本技术实施例提供的一种模型预测过程的方法流程图。如图7所示,该模型预测过程包括如下步骤:
[0131]
步骤s701,将目标对话文本及目标对话文本中的目标论元对输入对话关系预测模型,在对话关系预测模型中对目标对话文本及目标论元对进行特征提取,得到目标对话文本对应的目标文本语义信息,目标论元对包括第一目标论元及第二目标论元。
[0132]
在本技术实施例中,计算机设备基于目标文本拼接符对目标对话文本与目标论元对进行拼接,生成目标拼接文本数据;将目标拼接文本数据中的第一目标论元替换为第一目标论元符号,将目标拼接文本数据中的第二目标论元替换为第二目标论元符号,生成目标文本序列数据;对目标文本序列数据进行特征提取,得到目标对话文本对应的目标文本语义信息。其中,该目标文本拼接符与样本文本拼接符相同,只是处于不同的阶段时的名称不同,例如,样本文本拼接符包括样本全局语义符及样本分隔符等,假定样本全局语义符为
[cls],样本分隔符为[sep],则该目标文本拼接符包括目标全局语义符及目标分隔符等,该目标全局语义符为[cls],目标标分隔符为[sep]。进一步地,该目标文本序列数据包括目标对话文本对应的目标对话序列数据,目标对话序列数据包括v个目标对话词组,v为正整数,计算机设备可以对目标文本序列数据中的目标全局语义符、v个目标对话词组、第一目标论元符号及第二目标论元符号分别进行隐层特征提取,得到目标全局语义符对应的目标全局隐状态、n个目标对话词组分别对应的目标词组隐状态、第一目标论元符号对应的第一初始目标论元隐状态以及第二目标论元符号对应的第二初始目标论元隐状态;将目标全局隐状态、v个目标词组隐状态、第一初始目标论元隐状态及第二初始目标论元隐状态,确定为目标对话文本对应的目标文本语义信息。具体的,可以参见图4的步骤s401中,基于样本对话文本及样本论元对得到样本对话文本对应的样本文本语义信息的过程,在此不再进行赘述。
[0133]
可选的,计算机设备可以直接获取目标用户提供的目标对话文本及目标对话文本中的目标论元对。或者,计算机设备可以获取目标对话文本与所述目标对话文本关联的对话咨询信息,对所述对话咨询信息进行解析,提取所述对话咨询信息中的目标论元对;例如,获取到对话咨询信息为“what is the relationship between speaker 2and speaker 4?”,对对话咨询信息进行解析,提取该对话咨询信息中的目标论元对,可以得到,目标论元对包括第一目标论元“speaker 2”及第二目标论元“speaker 4”。可选的,若计算机设备在对话咨询信息中获取到第一目标论元,则解析对话咨询信息,获取关联论元类型,从目标对话文本中获取该关联论元类型对应的论元,将该关联论元类型对应的论元确定为第二目标论元,其中,该关联论元类型包括但不限于人物类型、物品类型或动物类型等,该第二目标论元的数量为一个或至少两个。基于对话关系预测模型,获取第一目标论元与每个第二目标论元之间的目标论元关系。
[0134]
步骤s702,基于对话关系预测模型中的关系预测网络对目标文本语义信息进行预测,得到第一目标论元与第二目标论元之间的目标论元关系。
[0135]
在本技术实施例中,对话关系预测模型是基于第一损失函数、第二损失函数及第三损失函数对初始关系预测模型训练得到的;初始关系预测模型包括初始关系预测网络、初始词组预测网络及初始触发词预测网络;第一损失函数是由第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成的,实际论元关系是在初始关系预测网络中,对第一样本论元与第二样本论元所在的样本对话文本对应的样本文本语义信息预测得到的;第二损失函数是由隐藏字符与预测字符生成的,预测字符是在初始词组预测网络中,对样本对话文本、第一样本论元与第二样本论元中的隐藏字符进行预测得到的;第三损失函数是由触发词检测文本数据中的实际序列标注与预测序列标注生成的,触发词检测文本数据是在初始触发词预测网络中,根据实际论元关系与样本文本语义信息生成的,预测序列标注是对触发词检测文本数据进行预测得到的。
[0136]
其中,计算机设备可以对初始关系预测模型进行模型参数调整后,删除词组预测任务区域及触发词预测任务区域,得到对话关系预测模型,可以精简模型,减少对话关系预测模型所占用的资源。或者,计算机设备对初始关系预测模型进行模型参数调整后,保留词组预测任务区域及触发词预测任务区域,得到对话关系预测模型,便于后续对对话关系预测模型进行进一步地优化,此时,该对话关系预测模型的模型结构可以如图6所示。其中,可
以参见图5,计算机设备在训练阶段,基于关系预测任务、词组预测任务及触发词预测任务进行联合训练,生成对话关系预测模型;在测试阶段,直接基于关系预测任务得到关系预测结果,该关系预测结果用于表示输入对话关系预测模型的论元对之间的论元关系。
[0137]
进一步地,计算机设备可以根据目标对话文本、对话咨询信息及目标论元对生成目标问答数据,将目标问答数据添加至问答数据库中。
[0138]
可选的,若计算机设备在对话咨询信息中获取到第一目标论元,则解析对话咨询信息,获取关联论元类型。具体的,若计算机设备在对话咨询信息中获取到目标论元关系,则获取该目标论元关系对应的关联论元类型,从目标对话文本中获取关联论元类型对应的候选论元,基于对话关系预测模型预测第一目标论元与候选论元之间的候选论元关系,将候选论元关系为目标论元关系的候选论元确定为第二目标论元,该第一目标论元与第二目标论元组成目标论元对,其中,该第二目标论元为对话咨询信息的回复数据,该候选论元的数量为一个或至少两个。例如,该对话咨询信息为“who is the boss of speaker 2?(谁是用户2的老板)”,在对话咨询信息中获取到第一目标论元“speaker 2”,获取到目标论元关系为“boss”,该目标论元关系为“boss(老板)”对应的关联论元类型为人物类型,假定计算机设备从目标对话文本中获取人物类型对应的候选论元,假定该候选论元包括“speaker 1、speaker 3及speaker 4”,基于对话关系预测模型,预测第一目标论元分别与各个候选论元之间的候选论元关系,假定第一目标论元与候选论元“speaker 1”之间的候选论元关系为“subordinate(下属)”,第一目标论元与候选论元“speaker 3”之间的候选论元关系为“friend(朋友)”,第一目标论元与候选论元“speaker 4”之间的候选论元关系为“boss”,则将候选论元“speaker 4”确定为第二目标论元。该第二目标论元为对话咨询信息的回复数据,即speaker 4是speaker 2的老板。
[0139]
具体的,本技术可以应用于文旅领域中的信息抽取业务,进行关系预测能力的优化,可以快速地从介绍文档中提取出有效的知识信息,定制私有化知识图谱;或者,可以应用于问答系统,帮助完善问答系统的知识库,保障问答系统可以更有效地回答用户提问等,在此不做限制。
[0140]
进一步地,在模型训练阶段,该初始关系预测模型的输入参数还可以包括任务类型、任务版本、使用区域、输入数据路径、输出数据路径及任务标识等,在此不做限制,具体可以参见表1所示:
[0141]
表1
[0142][0143]
其中,在表1中,任务类型(action)用于表示本次模型预测任务的任务类型是训练类型还是测试类型等,此时的任务类型可以是训练类型;任务版本(version)用于表示所使用的模型的版本号或版本生成时间等;使用区域(region)用于表示可以应用该模型的地域列表、产品类型或用户列表等;输入数据路径(inputdatasetpath)用于表示训练模型等所使用的训练样本等的存储位置路径;输出数据路径(outputmodelpath)用于表示待训练模型的存储位置路径等;任务标识(projectid)用于表示本次模型预测任务的标识(id)。可选的,该表1中的各个输入参数可以不输入初始关系预测模型中,只作为该次模型训练阶段的一个日志记录。
[0144]
其中,该初始关系预测模型的输出参数还可以包括训练完成时间及任务请求标识等,在此不做限制,具体可以参见表2所示:
[0145]
表2
[0146][0147][0148]
其中,在表2中,训练完成时间(timeoftrain)用于表示本次模型预测任务完成所用的时长或完成时的时间;任务请求标识(requestid)用于表示请求本次模型预测任务的请求标识(id),是请求的唯一标识符,可以用于表示任务的场景变化、发起请求的用户标识或请求的次数等。
[0149]
进一步地,在模型预测阶段,该对话关系预测模型的输入参数还可以包括任务类
型、任务版本、使用区域、输入数据路径、输出数据路径及任务标识等,在此不做限制,具体可以参见表3所示:
[0150]
表3
[0151][0152]
其中,在表3中,任务类型(action)用于表示本次模型预测任务的任务类型是训练类型还是测试类型等,此时的任务类型可以为测试类型或预测类型;version用于表示所使用的模型的版本号或版本生成时间等;region用于表示可以应用该模型的地域列表、产品类型或用户列表等;输入数据路径(inputdatasetpath)用于表示用于测试模型或使用模型等所使用的数据的存储位置路径,如目标对话文本等的存储路径;输出数据路径(outputmodelpath)用于表示已训练好的模型的存储位置路径等;任务标识(projectid)用于表示本次模型预测任务的标识(id)。可选的,该表3中的各个输入参数可以不输入对话关系预测模型中,只作为该次模型训练阶段的一个日志记录。
[0153]
其中,该对话关系预测模型的输出参数还可以包括输出结果数据路径及任务请求标识等,在此不做限制,具体可以参见表4所示:
[0154]
表4
[0155][0156]
其中,在表4中,输出结果数据路径(outputdatasetpath)用于表示本次模型预测任务所得到的数据的存储位置路径,如目标论元关系等,该路径可以是区块链网络中的位置路径,或者是计算机设备中的存储路径,还可以是云存储技术所指示的存储路径等,在此
不做限制;任务请求标识(requestid)用于表示请求本次模型预测任务的请求标识(id),是请求的唯一标识符,可以用于表示任务的场景变化、发起请求的用户标识或请求的次数等。
[0157]
进一步地,请参见图8,图8是本技术实施例提供的一种对话关系处理装置示意图。该对话关系处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码等),例如该对话关系处理装置可以为一个应用软件;该装置可以用于执行本技术实施例提供的方法中的相应步骤。如图8所示,该对话关系处理装置800可以用于图4所对应实施例中的计算机设备,具体的,该装置可以包括:模型输入模块11、语义信息提取模块12、关系处理模块13、第一损失生成模块14、字符获取模块15、词组预测模块16、第二损失生成模块17、触发检测生成模块18、序列标注模块19、第三损失生成模块20及模型训练模块21。
[0158]
模型输入模块11,用于将样本对话文本及样本对话文本中的样本论元对输入初始关系预测模型;
[0159]
语义信息提取模块12,用于在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息;样本论元对包括第一样本论元及第二样本论元;
[0160]
关系处理模块13,用于基于样本文本语义信息预测第一样本论元与第二样本论元之间的预测论元关系;
[0161]
第一损失生成模块14,用于根据第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成第一损失函数;
[0162]
字符获取模块15,用于获取样本对话文本与样本论元对中的隐藏字符;
[0163]
词组预测模块16,用于预测隐藏字符对应的预测字符;
[0164]
第二损失生成模块17,用于根据隐藏字符与预测字符生成第二损失函数;
[0165]
触发检测生成模块18,用于根据实际论元关系与样本文本语义信息生成触发词检测文本数据;
[0166]
序列标注模块19,用于预测触发词检测文本数据中的预测序列标注;
[0167]
第三损失生成模块20,用于根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数;
[0168]
模型训练模块21,用于根据第一损失函数、第二损失函数及第三损失函数对初始关系预测模型进行模型参数调整,生成对话关系预测模型;对话关系预测模型用于预测目标对话文本中的目标论元对之间的目标论元关系。
[0169]
其中,该语义信息提取模块12,包括:
[0170]
样本拼接单元121,用于基于样本文本拼接符对样本对话文本与样本论元对进行拼接,生成样本拼接文本数据;
[0171]
论元替换单元122,用于将样本拼接文本数据中的第一样本论元替换为第一样本论元符号,将样本拼接文本数据中的第二样本论元替换为第二样本论元符号,生成样本文本序列数据;
[0172]
信息提取单元123,用于对样本文本序列数据进行特征提取,得到样本对话文本对应的样本文本语义信息。
[0173]
其中,样本文本拼接符包括样本全局语义符;样本文本序列数据包括样本对话文本对应的样本对话序列数据,样本对话序列数据包括n个样本对话词组,n为正整数;
[0174]
该信息提取单元123,包括:
[0175]
隐层提取子单元1231,用于对样本文本序列数据中的样本全局语义符、n个样本对话词组、第一样本论元符号及第二样本论元符号分别进行隐层特征提取,得到样本全局语义符对应的样本全局隐状态、n个样本对话词组分别对应的样本词组隐状态、第一样本论元符号对应的第一初始样本论元隐状态以及第二样本论元符号对应的第二初始样本论元隐状态;
[0176]
语义确定子单元1232,用于将样本全局隐状态、n个样本词组隐状态、第一初始样本论元隐状态及第二初始样本论元隐状态,确定为样本对话文本对应的样本文本语义信息。
[0177]
其中,该隐层提取子单元1231,包括:
[0178]
全局处理子单元123a,用于基于预训练语言网络,获取n个样本对话词组、第一样本论元符号及第二样本论元符号分别与样本全局语义符之间的样本全局关系,对样本全局关系进行特征融合,生成样本全局语义符对应的样本全局隐状态;
[0179]
状态提取子单元123b,用于对n个样本对话词组、第一样本论元符号及第二样本论元符号分别进行隐层特征提取,得到n个样本对话词组分别对应的样本词组隐状态、第一样本论元符号对应的第一初始样本论元隐状态,以及第二样本论元符号对应的第二初始样本论元隐状态。
[0180]
其中,n个样本对话词组包括第一样本论元符号及第二样本论元符号;初始关系预测模型包括初始关系预测网络;
[0181]
该关系处理模块13,包括:
[0182]
第一论元识别单元131,用于基于初始关系预测网络,从样本文本语义信息所包括的n个样本词组隐状态中,获取第一样本论元符号对应的第一样本词组隐状态,对第一样本词组隐状态与第一初始样本论元隐状态进行最大池化处理,得到第一样本论元符号的第一样本论元隐状态;
[0183]
第二论元识别单元132,用于从n个样本词组隐状态中获取第二样本论元符号对应的第二样本词组隐状态,对第二样本词组隐状态与第二初始样本论元隐状态进行最大池化处理,得到第二样本论元符号的第二样本论元隐状态;
[0184]
隐状态拼接单元133,用于对样本全局隐状态、第一样本论元隐状态及第二样本论元隐状态进行拼接,得到样本隐状态信息;
[0185]
关系预测单元134,用于基于样本隐状态信息预测第一样本论元与第二样本论元之间的预测论元关系。
[0186]
其中,该关系预测单元134,包括:
[0187]
语义增强子单元1341,用于对样本隐状态信息进行语义增强,得到样本增强语义信息;
[0188]
概率选取子单元1342,用于基于样本增强语义信息,预测第一样本论元与第二样本论元对应的m种候选论元关系的样本关系预测概率,将具有最大的样本关系预测概率的候选论元关系,确定为第一样本论元与第二样本论元之间的预测论元关系;m为正整数。
[0189]
其中,样本文本序列数据还包括第一样本论元符号及第二样本论元符号,n为正整数;初始关系预测模型包括初始词组预测网络;
[0190]
该字符获取模块15,包括:
[0191]
词组获取单元151,用于基于初始词组预测网络,获取样本文本序列数据中的k个序列词组;k个序列词组包括n个样本对话词组、第一样本论元符号及第二样本论元符号;k为正整数;
[0192]
状态检测单元152,用于检测样本文本序列数据中的k个序列词组分别对应的字符状态,将字符状态为隐藏状态的序列词组确定为隐藏字符。
[0193]
其中,该词组预测模块16,包括:
[0194]
字符关联单元161,用于将样本文本序列数据中的隐藏字符替换为字符掩码,获取隐藏字符的关联序列词组与字符掩码之间的字符关联信息,根据字符关联信息得到字符掩码的掩码隐状态;关联序列词组为k个序列词组中除隐藏字符之外的序列词组;
[0195]
字符预测单元162,用于对掩码隐状态进行特征提取,预测字符掩码对应的预测字符。
[0196]
其中,初始关系预测模型包括初始触发词预测网络;
[0197]
该触发检测生成模块18,包括:
[0198]
向量转换单元181,用于基于初始触发词预测网络,对实际论元关系进行向量转换,得到实际论元关系对应的论元关系向量;
[0199]
数据生成单元182,用于将论元关系向量与样本文本语义信息中的n个样本词组隐状态进行拼接,生成触发词检测文本数据。
[0200]
其中,该序列标注模块19,包括:
[0201]
文本拆分单元191,用于对触发词检测文本数据进行词组拆分,得到t个待标注词组;t为正整数;
[0202]
初始标注单元192,用于对t个待标注词组分别添加初始标注,检测t个待标注词组中相邻待标注词组对的词组关联关系;
[0203]
标注更新单元193,用于基于词组关联关系更新t个待标注词组分别对应的初始标注,得到t个待标注词组分别对应的预测标注,将t个待标注词组分别对应的预测标注组成预测序列标注。
[0204]
本技术实施例提供了一种对话关系处理装置,该装置可以将样本对话文本及样本对话文本中的样本论元对输入初始关系预测模型,在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息;样本论元对包括第一样本论元及第二样本论元;基于样本文本语义信息预测第一样本论元与第二样本论元之间的预测论元关系,根据第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成第一损失函数;获取样本对话文本与样本论元对中的隐藏字符,预测隐藏字符对应的预测字符,根据隐藏字符与预测字符生成第二损失函数;根据实际论元关系与样本文本语义信息生成触发词检测文本数据,预测触发词检测文本数据中的预测序列标注,根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数;根据第一损失函数、第二损失函数及第三损失函数对初始关系预测模型进行模型参数调整,生成对话关系预测模型;对话关系预测模型用于预测目标对话文本中的目标论元对之间的目标论元关系。通过上述过程,本技术将对话式关系抽取分为三个相关的子任务,分别是关系预测任务、词组预测任务及触发词预测任务,通过综合这三个子任务,对模型进行联合训练,可以
充分利用从词组预测任务及触发词预测任务中学到的有效信息,并基于该有效信息影响关系预测任务,从而提高对话关系处理的准确性。
[0205]
进一步地,请参见图9,图9是本技术实施例提供的另一种对话关系处理装置示意图。该对话关系处理装置可以是运行于计算机设备中的一个计算机程序(包括程序代码等),例如该对话关系处理装置可以为一个应用软件;该装置可以用于执行本技术实施例提供的方法中的相应步骤。如图9所示,该对话关系处理装置900可以用于图7所对应实施例中的计算机设备,具体的,该装置可以包括:目标模型输入模块31、目标语义获取模块32及目标关系预测模块33。
[0206]
目标模型输入模块31,用于将目标对话文本及目标对话文本中的目标论元对输入对话关系预测模型;
[0207]
目标语义获取模块32,用于在对话关系预测模型中对目标对话文本及目标论元对进行特征提取,得到目标对话文本对应的目标文本语义信息;目标论元对包括第一目标论元及第二目标论元;
[0208]
目标关系预测模块33,用于基于对话关系预测模型中的关系预测网络对目标文本语义信息进行预测,得到第一目标论元与第二目标论元之间的目标论元关系;对话关系预测模型是基于第一损失函数、第二损失函数及第三损失函数对初始关系预测模型训练得到的;初始关系预测模型包括初始关系预测网络、初始词组预测网络及初始触发词预测网络;第一损失函数是由第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成的,实际论元关系是在初始关系预测网络中,对第一样本论元与第二样本论元所在的样本对话文本对应的样本文本语义信息预测得到的;第二损失函数是由隐藏字符与预测字符生成的,预测字符是在初始词组预测网络中,对样本对话文本、第一样本论元与第二样本论元中的隐藏字符进行预测得到的;第三损失函数是由触发词检测文本数据中的实际序列标注与预测序列标注生成的,触发词检测文本数据是在初始触发词预测网络中,根据实际论元关系与样本文本语义信息生成的,预测序列标注是对触发词检测文本数据进行预测得到的。
[0209]
其中,该目标语义获取模块32,包括:
[0210]
目标拼接单元321,用于基于目标文本拼接符对目标对话文本与目标论元对进行拼接,生成目标拼接文本数据;
[0211]
目标替换单元322,用于将目标拼接文本数据中的第一目标论元替换为第一目标论元符号,将目标拼接文本数据中的第二目标论元替换为第二目标论元符号,生成目标文本序列数据;
[0212]
目标获取单元323,用于对目标文本序列数据进行特征提取,得到目标对话文本对应的目标文本语义信息。
[0213]
其中,该目标模型输入模块31,包括:
[0214]
咨询获取单元311,用于获取目标对话文本与目标对话文本关联的对话咨询信息;
[0215]
对话解析单元312,用于对对话咨询信息进行解析,提取对话咨询信息中的目标论元对;
[0216]
模型输入单元313,用于将目标对话文本及目标对话文本中的目标论元对输入对话关系预测模型;
[0217]
该装置900还包括:
[0218]
数据存储模块34,用于根据目标对话文本、对话咨询信息及目标论元对生成目标问答数据,将目标问答数据添加至问答数据库中。
[0219]
参见图10,图10是本技术实施例提供的一种计算机设备的结构示意图。如图9所示,本技术实施例中的计算机设备可以包括:一个或多个处理器1001、存储器1002和输入输出接口1003。该处理器1001、存储器1002和输入输出接口1003通过总线1004连接。存储器1002用于存储计算机程序,该计算机程序包括程序指令,输入输出接口1003用于接收数据及输出数据,如用于模型中各个网络之间进行数据交互,或者用于计算机设备与用户设备之间进行数据交互;处理器1001用于执行存储器1002存储的程序指令。
[0220]
其中,该处理器1001位于用于进行模型训练的计算机设备时,可以执行如下操作:
[0221]
将样本对话文本及样本对话文本中的样本论元对输入初始关系预测模型,在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息;样本论元对包括第一样本论元及第二样本论元;
[0222]
基于样本文本语义信息预测第一样本论元与第二样本论元之间的预测论元关系,根据第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成第一损失函数;
[0223]
获取样本对话文本与样本论元对中的隐藏字符,预测隐藏字符对应的预测字符,根据隐藏字符与预测字符生成第二损失函数;
[0224]
根据实际论元关系与样本文本语义信息生成触发词检测文本数据,预测触发词检测文本数据中的预测序列标注,根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数;
[0225]
根据第一损失函数、第二损失函数及第三损失函数对初始关系预测模型进行模型参数调整,生成对话关系预测模型;对话关系预测模型用于预测目标对话文本中的目标论元对之间的目标论元关系。
[0226]
其中,该处理器1001位于用于进行模型预测的计算机设备时,可以执行如下操作:
[0227]
将目标对话文本及目标对话文本中的目标论元对输入对话关系预测模型,在对话关系预测模型中对目标对话文本及目标论元对进行特征提取,得到目标对话文本对应的目标文本语义信息;目标论元对包括第一目标论元及第二目标论元;
[0228]
基于对话关系预测模型中的关系预测网络对目标文本语义信息进行预测,得到第一目标论元与第二目标论元之间的目标论元关系;对话关系预测模型是基于第一损失函数、第二损失函数及第三损失函数对初始关系预测模型训练得到的;初始关系预测模型包括初始关系预测网络、初始词组预测网络及初始触发词预测网络;第一损失函数是由第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成的,实际论元关系是在初始关系预测网络中,对第一样本论元与第二样本论元所在的样本对话文本对应的样本文本语义信息预测得到的;第二损失函数是由隐藏字符与预测字符生成的,预测字符是在初始词组预测网络中,对样本对话文本、第一样本论元与第二样本论元中的隐藏字符进行预测得到的;第三损失函数是由触发词检测文本数据中的实际序列标注与预测序列标注生成的,触发词检测文本数据是在初始触发词预测网络中,根据实际论元关系与样本文本语义信息生成的,预测序列标注是对触发词检测文本数据进行预测得到的。
[0229]
在一些可行的实施方式中,该处理器1001可以是中央处理单元(central processing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0230]
该存储器1002可以包括只读存储器和随机存取存储器,并向处理器1001和输入输出接口1003提供指令和数据。存储器1002的一部分还可以包括非易失性随机存取存储器。例如,存储器902还可以存储设备类型的信息。
[0231]
具体实现中,该计算机设备可通过其内置的各个功能模块执行如该图4或图7中各个步骤所提供的实现方式,具体可参见该图4或图7中各个步骤所提供的实现方式,在此不再赘述。
[0232]
本技术实施例通过提供一种计算机设备,包括:处理器、输入输出接口、存储器,通过处理器获取存储器中的计算机程序,执行该图4中所示方法的各个步骤,进行对话关系处理操作。本技术实施例实现了将样本对话文本及样本对话文本中的样本论元对输入初始关系预测模型,在初始关系预测模型中对样本对话文本及样本论元对进行特征提取,得到样本对话文本对应的样本文本语义信息;样本论元对包括第一样本论元及第二样本论元;基于样本文本语义信息预测第一样本论元与第二样本论元之间的预测论元关系,根据第一样本论元与第二样本论元之间的实际论元关系与预测论元关系生成第一损失函数;获取样本对话文本与样本论元对中的隐藏字符,预测隐藏字符对应的预测字符,根据隐藏字符与预测字符生成第二损失函数;根据实际论元关系与样本文本语义信息生成触发词检测文本数据,预测触发词检测文本数据中的预测序列标注,根据触发词检测文本数据中的实际序列标注与预测序列标注生成第三损失函数;根据第一损失函数、第二损失函数及第三损失函数对初始关系预测模型进行模型参数调整,生成对话关系预测模型;对话关系预测模型用于预测目标对话文本中的目标论元对之间的目标论元关系。通过上述过程,本技术将对话式关系抽取分为三个相关的子任务,分别是关系预测任务、词组预测任务及触发词预测任务,通过综合这三个子任务,对模型进行联合训练,可以充分利用从词组预测任务及触发词预测任务中学到的有效信息,并基于该有效信息影响关系预测任务,从而提高对话关系处理的准确性。
[0233]
本技术实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序适于由该处理器加载并执行图4或图7中各个步骤所提供的对话关系处理方法,具体可参见该图4或图7中各个步骤所提供的实现方式,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本技术所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本技术方法实施例的描述。作为示例,计算机程序可被部署为在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行。
[0234]
该计算机可读存储介质可以是前述任一实施例提供的对话关系处理装置或者该计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡
(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
[0235]
本技术实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图4或图7中的各种可选方式中所提供的方法,实现了将对话式关系抽取分为三个相关的子任务,分别是关系预测任务、词组预测任务及触发词预测任务,通过综合这三个子任务,对模型进行联合训练,可以充分利用从词组预测任务及触发词预测任务中学到的有效信息,并基于该有效信息影响关系预测任务,从而提高对话关系处理的准确性。
[0236]
本技术实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
[0237]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在该说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0238]
本技术实施例提供的方法及相关装置是参照本技术实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
[0239]
本技术实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
[0240]
本技术实施例装置中的模块可以根据实际需要进行合并、划分和删减。
[0241]
以上所揭露的仅为本技术较佳实施例而已,当然不能以此来限定本技术之权利范围,因此依本技术权利要求所作的等同变化,仍属本技术所涵盖的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献