一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

模型训练方法、装置、电子设备及存储介质与流程

2021-10-29 22:36:00 来源:中国专利 TAG:电子设备 计算机技术 装置 模型 训练


1.本公开涉及计算机技术技术领域,具体涉及一种模型训练方法、装置、电子设备及存储介质。


背景技术:

2.随着互联网技术的发展,越来越多的资源(如产品、服务等)通过互联网平台来提供。而为了使用户能够准确找到所需要的资源,互联网平台通常会为用户提供搜索入口,用户通过搜索入口输入查询语句或者关键词,互联网平台调用搜索引擎从众多资源中匹配到最相关的搜索结果并战象给用户。以购物平台为例,买家通过购物平台输入的搜索入口输入查询语句或关键词,购物平台通过相关性算法检索出最相关的商品,而中心词是相关性算法中最为重要的一个部分,其分别提取出查询语句或关键词和商品标题的中心词,然后通过所提取出的中心词,进而得到查询语句或关键词与商品之间的相关性分数,最终根据相关性分数得到搜索结果。因此,如何准确提取出中心词是提高互联网平台中搜索准确率的关键环节。


技术实现要素:

3.本公开实施例提供一种模型训练方法、装置、电子设备及计算机可读存储介质。
4.第一方面,本公开实施例中提供了一种模型训练方法,包括:
5.获取多个样本数据,所述样本数据为包括至少一个中心词和至少一个非中心词的句子;
6.将所述样本数据转换成依存图结构的数据,所述依存图结构中所述中心词和非中心词分别作为节点,所述中心词之间两两相连;
7.使用多个样本数据及其对应的依存图结构的数据训练依存图模型,得到训练后的依存图模型。
8.进一步地,所述将所述样本数据转换成依存图结构的数据,包括:
9.为句子增加中心词父节点代表词和非中心词父节点代表词;
10.按照预定顺序对所述句子进行遍历,如果遍历到中心词,则将所述中心词作为依存树中所述中心词父节点代表词的子节点;如果遍历到非中心词,则将所述非中心词作为所述非中心词父节点代表词的子节点;
11.将所述中心词父节点代表词的子节点两两相连,构成一个带有环的依存图。
12.进一步地,将所述样本数据转换成依存图结构的数据还包括:
13.如果遍历到中心词短语,则将所述中心词短语的第一个词作为所述中心词父节点代表词的子节点;将所述中心词短语中的后续词作为前一个词的子节点。
14.进一步地,所述使用多个样本数据及其对应的依存图结构的数据训练依存图模型,包括:
15.利用所述依存图模型对所述样本数据进行处理得到预测结果;所述预测结果包括
所述依存图结构中任一节点成为其他节点的父节点的预测概率;
16.根据所述预测结果,利用目标函数对所述依存图模型的参数进行优化调整;所述目标函数用于最大化所述依存图结构中各节点成为其他节点的父节点的预测概率。
17.第二方面,本公开实施例中提供了一种中心词提取方法,包括:
18.获取待识别语句;
19.利用依存图模型识别所述待识别语句对应的依存图结构;所述依存图模型利用第一方面所述的方法训练得到;
20.根据所述依存图结构提取所述待识别语句中的中心词。
21.进一步地,根据所述依存图结构提取所述待识别语句中的中心词,包括:
22.根据所述依存图结构确定所述待识别语句中各个词的父节点;
23.根据所述父节点是否包括中心词父节点代表词确定所述词是否为中心词。
24.进一步地,根据所述父节点是否为中心词父节点代表词确定所述词是否为中心词,包括:
25.将所述父节点包括所述中心词父节点代表词的所述词确定为中心词。
26.进一步地,根据所述父节点是否包括中心词父节点代表词确定所述词是否为中心词,包括:
27.将所述父节点包括所述中心词父节点代表词的所述词确定为候选词;
28.根据所述候选词的所述父节点中是否还包括其它词确定所述候选词是否为中心词。
29.进一步地,根据所述候选词的所述父节点信息中是否还包括其它词确定所述候选词是否为中心词,包括:
30.在所述候选词的所述父节点中包括其它词时,根据所述其它词的数量确定所述候选词为中心词的概率。
31.进一步地,根据所述父节点是否包括中心词父节点代表词确定所述词是否为中心词,还包括:
32.确定以所述中心词为首的目标短语;所述目标短语中后一词的所述父节点信息包括前一词且不包括所述中心词父节点代表词;
33.将所述目标短语确定为中心词组。
34.第三方面,本公开实施例中提供了一种中心词提取方法,包括:
35.获取待识别语句;
36.利用依存图模型识别所述待识别语句对应的依存图结构;所述依存图结构中所述待识别语句的中心词和非中心词作为节点,所述中心词之间两两相连;
37.根据所述依存图结构提取所述待识别语句中的中心词。
38.进一步地,所述依存图结构中还包括中心词父节点代表词,所述中心词父节点代表词为所述待识别语句中各中心词的父节点。
39.进一步地,根据所述依存图结构提取所述待识别语句中的中心词,包括:
40.根据所述依存图结构确定所述待识别语句中各个词的父节点;
41.根据所述父节点是否包括中心词父节点代表词确定所述词是否为中心词。
42.进一步地,根据所述父节点是否为中心词父节点代表词确定所述词是否为中心
词,包括:
43.将所述父节点包括所述中心词父节点代表词的所述词确定为中心词。
44.进一步地,根据所述父节点是否包括中心词父节点代表词确定所述词是否为中心词,包括:
45.将所述父节点包括所述中心词父节点代表词的所述词确定为候选词;
46.根据所述候选词的所述父节点中是否还包括其它词确定所述候选词是否为中心词。
47.进一步地,根据所述候选词的所述父节点中是否还包括其它词确定所述候选词是否为中心词,包括:
48.在所述候选词的所述父节点中包括其它词时,根据所述其它词的数量确定所述候选词为中心词的概率。
49.进一步地,根据所述父节点是否包括中心词父节点代表词确定所述词是否为中心词,还包括:
50.确定以所述中心词为首的目标短语;所述目标短语中后一词的所述父节点信息包括前一词且不包括所述中心词父节点代表词;
51.将所述目标短语确定为中心词组。
52.第四方面,本公开实施例中提供了一种查询方法,包括:
53.接收查询语句;
54.利用第二方面或第三方面所述的方法提取所述查询语句中的中心词;
55.利用所述中心词从待查询数据中匹配得到查询结果。
56.第五方面,本公开实施例中提供了一种查询方法,包括:
57.接收查询语句;
58.将所述查询语句与待查询数据的中心词进行匹配,以便确定查询结果;其中,所述中心词利用第二方面或第三方面所述的方法从所述待查询数据中提取得到。
59.第六方面,本发明实施例中提供了一种模型训练装置,包括:
60.第一获取模块,被配置为获取多个样本数据,所述样本数据为包括至少一个中心词和至少一个非中心词的句子;
61.转换模块,被配置为将所述样本数据转换成依存图结构的数据,所述依存图结构中所述中心词和非中心词分别作为节点,所述中心词之间两两相连;
62.训练模块,被配置为使用多个样本数据及其对应的依存图结构的数据训练依存图模型,得到训练后的依存图模型。
63.第七方面,本发明实施例中提供了一种中心词提取装置,包括:
64.第二获取模块,被配置为获取待识别语句;
65.第一识别模块,被配置为利用依存图模型识别所述待识别语句对应的依存图结构;所述依存图模型利用上述模型训练装置训练得到;
66.第一提取模块,被配置为根据所述依存图结构提取所述待识别语句中的中心词。
67.第八方面,本发明实施例中提供了一种中心词提取装置,包括:
68.第三获取模块,被配置为获取待识别语句;
69.第二识别模块,被配置为所述依存图结构中所述待识别语句的中心词和非中心词
作为节点,所述中心词之间两两相连;
70.第二提取模块,被配置为根据所述依存图结构提取所述待识别语句中的中心词。
71.第九方面,本发明实施例中提供了一种查询装置,包括:
72.第一接收模块,被配置为接收查询语句;
73.第三提取模块,被配置为利用上述中心词提取装置提取所述查询语句中的中心词;
74.第一匹配模块,被配置为利用所述中心词从待查询数据中匹配得到查询结果。
75.第十方面,本发明实施例中提供了一种查询装置,包括:
76.第二接收模块,被配置为接收查询语句;
77.第二匹配模块,被配置为将所述查询语句与待查询数据的中心词进行匹配,以便确定查询结果;其中,所述中心词利用上述中心词提取装置从所述待查询数据中提取得到。
78.所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
79.在一个可能的设计中,上述任一装置的结构中包括存储器和处理器,所述存储器用于存储一条或多条支持上述任一装置执行上述任一方面中所述方法的计算机指令,所述处理器被配置为用于执行所述存储器中存储的计算机指令。上述任一装置还可以包括通信接口,用于上述任一装置与其他设备或通信网络通信。
80.第十一方面,本公开实施例提供了一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现上述任一方面所述的方法。
81.第十二方面,本公开实施例提供了一种计算机可读存储介质,用于存储上述任一装置所用的计算机指令,其包含用于执行上述任一方面所述方法所涉及的计算机指令。
82.本公开实施例提供的技术方案可以包括以下有益效果:
83.本公开实施例针对样本数据建立依存图结构,该依存图结构中中心词之间两两相连,也即本公开实施例通过在两两中心词之间建立关联关系,使得依存图模型能够学习到两两中心词之间的相关性,通过这种方式训练得到的依存图模型能够提高依存图结构的识别准确率,进而能够提高中心词的识别准确率。
84.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
85.结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。在附图中:
86.图1示出根据本公开一实施方式的模型训练方法的流程图;
87.图2示出了根据本公开一实施方式针对样本数据所建立的依存图示意图;
88.图3示出根据本公开一实施方式的中心词提取方法的流程图;
89.图4示出根据本公开另一实施方式的中心词提取方法的流程图;
90.图5示出根据本公开一实施方式服务器端提取中心词的流程示意图;
91.图6示出根据本公开一实施方式的查询方法的流程图;
92.图7示出根据本公开另一实施方式的查询方法的流程图;
93.图8是适于用来实现根据本公开一实施方式的模型训练方法、中心词提取方法和/或查询方法的电子设备的结构示意图。
具体实施方式
94.下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。
95.在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
96.另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
97.如背景技术中所述,相关性算法是互联网资源的搜索过程中起重要作用的部分。相关技术中,提取中心词的方案主要有以下两种方式:第一、采用cdssm(cnn-deep structured semantic models,cnn深度语义学习模型)方法提取句子的中心词,主要分为以下几步:1)通过深度cdssm模型计算得到句子与每个词语的相似度分数;2)将相似度分数最高的词语作为中心词;第二、采用基于树型依存句法分析的模型提取句子的中心词,主要分为以下几步:1)利用训练数据训练得到基于树型依存句法分析的模型;2)利用该模型识别出句子对应的依存树;3)根据模型识别出来的依存树得到句子中的中心词;句子对应的依存树的结构如下建立:句子左侧添加两个词:root和oroot,root表示中心词父节点代表词,oroot表示非中心词的父节点,oroot的父亲节点是root;2)从左到右依次遍历该句子,若该词不是中心词,则将其作为依存树中oroot的子节点;若该词是中心词,则将其作为依存树中root的子节点;3)在遍历过程中,若遇到中心词短语,则将中心词短语中第一个词作为root的子节点,中心词短语中的后一词分别是前一个词的子节点;模型识别出来的依存树与上述方式构建出的依存树结构一致,因此可以通过模型识别出来的依存树得到句子中的中心词。
98.本公开实施例提出了一种模型训练方法,该方法包括:获取多个样本数据,所述样本数据为包括至少一个中心词和至少一个非中心词的句子;将所述样本数据转换成依存图结构的数据,所述依存图结构中所述中心词和非中心词分别作为节点,所述中心词之间两两相连;使用多个样本数据及其对应的依存图结构的数据训练依存图模型,得到训练后的依存图模型。
99.本公开实施例针对样本数据建立依存图结构,该依存图结构中中心词之间两两相连,也即本公开实施例通过在两两中心词之间建立关联关系,使得依存图模型能够学习到两两中心词之间的相关性,通过这种方式训练得到的依存图模型能够提高依存图结构的识别准确率,进而能够提高中心词的识别准确率。
100.下面通过具体实施例详细介绍本公开实施例的细节。
101.图1示出根据本公开一实施方式的模型训练方法的流程图。如图1所示,该模型训练方法包括以下步骤:
102.在步骤s101中,获取多个样本数据,所述样本数据为包括至少一个中心词和至少一个非中心词的句子;
103.在步骤s102中,将所述样本数据转换成依存图结构的数据,所述依存图结构中所述中心词和非中心词分别作为节点,所述中心词之间两两相连;
104.在步骤s103中,使用多个样本数据及其对应的依存图结构的数据训练依存图模型,得到训练后的依存图模型。
105.本实施例中,样本数据可以是包括多个词的句子,该多个词中可以至少一个中心词和至少一个非中心词,并且收集到的样本数据语句中的中心词已知(可以通过人工标注得到,也可以通过其他方式确定并经过验证后得到)。例如,可以从互联网平台收集商品的标题,并通过人工方式标注出该标题中的中心词,中心词可以理解为与商品最接近的词,也即最能体现商品属性的词。例如,标题1为“best quality pine nuts grade”,则中心词可以为“pine”和“nuts”,标题2为“high quality new brand women scarfs2019smooth silky touch shawls and wraps 180*90cm long luxury silk scarves gift for ladies”,则中心词可以为“scarfs”“shawls”“wraps”“scarves”。
106.中心词也称为定位词或中心语,中心语是偏正短语中被修饰语所修饰、限制的中心成分,中心语是一部分话中最重要的成分。
107.在收集了样本数据之后,可以针对每个样本数据建立对应的依存图结构。该依存图结构中中心词和非中心词作为节点,并且中心词之间两两相连。两两相连的中心词可以互为父节点。
108.依存图模型可以采用lstm(long short term memory,长短期记忆网络)、bilstm(前向lstm和后向lstm的组合网络)、cnn(convolutional neural network,卷积神经网络)等能够对文本进行自然语言处理的网络模型对文本进行编码,还可以采用self-attention(自注意力机制)模型等,具体可以根据实际需要选择,在此不做限制。
109.在训练过程中,样本数据输入至依存图模型,经过处理之后得到预测结果,根据预测结果可以确定样本数据中各个词对应的父节点,例如预测结果可以包括依存图结构中的节点为样本数据中当前词的父节点的预测概率,该预测概率值越大,则说明该当前词的父节点为该节点的可能性越高。
110.在得到针对样本数据的预测结果之后,通过该预测结果与真实结果(也即根据样本数据构建得到的真实依存图中的信息)之间的误差对依存图模型的模型参数进行调整,以便使得依存图模型的输出结果越来越接近于真实结果。
111.在初始训练时,依存图模型的模型参数可以为随机初始化值,因此针对输入的样本数据得到的预测结果与真实结果相差较大,随着训练次数的增多,依存图模型的模型参数不断被调整,直至依存图模型的预测结果收敛为止(也即预测结果与真实结果的误差不再变小或者变小的幅度低于预期值为止)。
112.模型参数被调整的过程也即依存图模型从样本数据中学习依存图结构的过程,经过大量样本数据的训练之后,依存图模型能够从输入的语句中识别出真实的依存图结构,例如语句中各个词的父节点信息,通过解码该依存图结构即可确定语句中的中心词。
113.经过实验证明,利用本公开实施例的方法训练得到的依存图模型的识别准确率较相关技术中基于树型依存句法分析的模型的识别准确率有显著的提高。
114.实验数据如下表1所示:
[0115][0116]
表1
[0117]
从上表1可以查看出,针对数据测试集(也即购物平台上商品标题数据集),本公开实施例得到的依存图模型(hsagp)的识别准确率为83.61%,而召回率为80.35%,f1(准确率与召回率的几何平均)为81.95%;而相关技术中基于树型依存句法分析的模型(hsadp)的识别准确率为80.88%,召回率为79.58%,f1为80.22%。针对查询语句测试集,本公开实施例得到的依存图模型的识别准确率为90.86%,召回率为90.57%,f1为90.71%,而相关技术中基于树型依存句法分析的模型的识别准确率为90.87%,召回率为81.44%,f1为85.90%,可见,随着本公开实施例的依存图模型的识别召回率的提升,使得f1提升了近5个百分点,提升效果非常显著。
[0118]
在本实施例的一个可选实现方式中,步骤s102,即建立样本数据对应的依存图结构的步骤,进一步包括以下步骤:
[0119]
为句子增加中心词父节点代表词和非中心词父节点代表词;
[0120]
按照预定顺序对所述句子进行遍历,如果遍历到中心词,则将所述中心词作为依存树中所述中心词父节点代表词的子节点;如果遍历到非中心词,则将所述非中心词作为所述非中心词父节点代表词的子节点;
[0121]
将所述中心词父节点代表词的子节点两两相连,构成一个带有环的依存图。
[0122]
该可选的实现方式中,在一些实施例中,依存图结构中还可以包括样本数据中各个词的父节点的信息(也即各个词的父节点为哪个节点的信息),在样本数据中存在多个中心词时,各个中心词的父节点除了包括中心词父节点代表词之外还可以包括其他中心词,其中,中心词父节点代表词为预先设置的节点,且该中心词父节点代表词不对应于该样本数据中的任何词。例如,样本数据中包括2个中心词a1、a2,则该中心词a1的父节点为中心词节点(该节点为预先设置的节点,可以以任何字符或字符串来表示,比如可以表示为root)和a2,中心词a1的父节点为中心词父节点代表词和a1。
[0123]
需要说明的是,依存图结构中可以包括中心词父节点代表词,该代表词不是样本数据中的任何词,而是预先设定好、并且用于标识所有中心词的父节点,因此在训练过程中,可以将该中心词父节点代表词添加在样本数据中一同输入至依存图模型中。例如,样本数据为“best quality pine nuts grade”,且假如中心词父节点代表词由“root”来表示时,则向依存图模型输入的是“root best quality pine nuts grade”或者“best quality pine nuts grade root”。在一些实施例中,依存图模型的预测结果可以包括多个,每个预测结果对应于样本数据中的一个词,且每个预测结果中可以包括依存图结构中各节点为该词的父节点的概率。
[0124]
例如,依存图模型的输出结果可以如下表示:
[0125]
log p(x
j
==heak|x
i
)
[0126]
其中,x
i
为样本数据中的第i个词,x
j
为依存图结构中的第j个节点,依存图结构中的各节点包括样本数据中各个词以及中心词父节点代表词,该预测结果表示x
j
为x
i
的父节点的概率值的对数。
[0127]
针对样本数据所建立的依存图中可以包括中心词父节点代表词、非中心词父节点代表词以及样本数据中的各个词;样本数据中的各个词作为依存图中的节点,中心词父节点代表词和非中心词父节点代表词可以是添加在样本数据的两个代表中心词父节点和非中心词父节点的词,例如中心词父节点代表词可以对应于添加在样本数据中的词“root”,非中心词父节点代表词可以对应于添加在样本数据中的词“oroot”,中心词父节点代表词和非中心词父节点代表词可以添加在样本数据中任何位置,当然为了保持样本数据中语义的完整性,可以将中心词父节点代表词和非中心词父节点代表词添加在样本数据的左侧或者右侧。在一些实施例中,中心词父节点代表词和非中心词父节点代表词添加在样本数据的左侧。
[0128]
在确定了依存图中的节点之后,可以在节点之间建立边,本公开实施例中建立从父节点到子节点的有向边,例如从中心词父节点代表词到各个中心词的有向边。此外,非中心词父节点代表词可以作为中心词父节点代表词的子节点,因此可以建立从中心词父节点代表词到非中心词父节点代表词的有向边。本公开实施例中还可以在中心词之间建立有向环,使得两两中心词互为父节点。
[0129]
下面通过举例说明:
[0130]
样本数据:scarfs smooth silky touch shawls wraps。
[0131]
中心词:scarfs、shawls、wraps。
[0132]
图2示出了根据本公开一实施方式针对样本数据所建立的依存图示意图。如图2所示,添加在样本数据左侧的“root”、“oroot”分别对应于中心词父节点代表词和非中心词父节点代表词,建立了从中心词父节点代表词“root”到各个中心词“scarfs”、“shawls”、“wraps”的有向边,还建立了中心词父节点代表词“root”到非中心词父节点代表词“oroot”的有向边,并且还在中心词“scarfs”、“shawls”、“wraps”两两之间建立了有向环。
[0133]
在本实施例的一个可选实现方式中,步骤s102,即建立样本数据对应的依存图结构的步骤,进一步还包括以下步骤:
[0134]
如果遍历到中心词短语,则将所述中心词短语的第一个词作为所述中心词父节点代表词的子节点;将所述中心词短语中的后续词作为前一个词的子节点。
[0135]
该可选的实现方式中,样本数据中的中心词可以是单个的词也可以是一个词组,例如“free shipping”这类短语。在中心词为一个词组时,还可以建立从该词组中前一词到后一词的有向边,使得词组中第一个词作为中心词父节点代表词的子节点,而词组中后一词为前一词的子节点。通过这种方式,可以在依存图中建立中心词词组的关联信息。
[0136]
在本实施例的一个可选实现方式中,步骤s103,即所述使用多个样本数据及其对应的依存图结构的数据训练依存图模型的步骤,进一步包括以下步骤:
[0137]
利用依存图模型对样本数据进行处理得到预测结果;预测结果包括当前节点是否为样本数据中各词的父节点的预测概率;当前节点包括中心词父节点代表词、非中心词父节点代表词以及样本数据中的各词;
[0138]
利用所述依存图模型对所述样本数据进行处理得到预测结果;所述预测结果包括所述依存图结构中任一节点成为其他节点的父节点的预测概率;
[0139]
根据所述预测结果,利用目标函数对所述依存图模型的参数进行优化调整;所述目标函数用于最大化所述依存图结构中各节点成为其他节点的父节点的预测概率。
[0140]
该可选的实现方式中,在依存图模型的训练过程中,样本数据输入至依存图模型,经过处理之后得到预测结果,根据预测结果可以确定样本数据中各个词对应的父节点,例如预测结果可以包括样本数据对应的依存图结构中的各节点为样本数据中各词的父节点的预测概率,该预测概率值越大,则说明该词的父节点为该节点的可能性越高。
[0141]
下面通过举例说明:样本数据为“scarfs smooth silky touch shawls wraps”,利用该样本数据进行训练时,样本数据对应的依存图中的各节点包括“root oroot scarfs smooth silky touch shawls wraps”中的各词,将这些词输入至依存图模型中,经过处理之后可以得到预测结果,例如上述样本数据的预测结果可以包括r={v1,v2,v3,v4,v5,v6},vi(i=1,2,
……
,6)为对应于样本数据中的第i个词的预测结果,并且vi={pi1,pi2,
……
,pi8},其中,pij(j=1,2,
……
,8)表示样本数据对应的依存图中第j个节点为样本数据中第i个词的父节点的预测概率。
[0142]
上述样本数据的真实依存图结构如图2所示,在模型训练过程中,可以利用预先建立的目标函数基于依存图模型输出的预测结果和真实依存图结构之间的误差对依存图模型的模型参数进行优化调整,以便利用调整后的模型参数对样本数据进行处理后得到的预测结果更加接近于真实结果。利用目标函数调整模型参数的过程可以参见已有的相关技术,在此不再详述。
[0143]
本公开实施例中,目标函数的优化目标可以确定为最大化依存图结构中样本数据中各词的父节点的预测概率,而最小化依存图结构中样本数据中各词的非父节点的预测概率。也就是说,本公开实施例中对应样本数据的某词,调整模型参数的目标是尽可能使得该词的父节点的预测概率值最大化,并且尽可能使得该词的非父节点的预测概率值最小化。本公开实施例中目标函数可以理解为一个二分类问题,其优化目标中不限制各个节点为当前词的父节点的预测概率之和为1,也即这种方式可以使得当前词的父节点为多个,而不是只有一个,与本公开实施例中针对样本数据所建立的依存图(中心词的父节点包括中心词父节点代表词以及其他中心词)相符。而如上文描述的相关技术中基于树型依存句法分析的模型的目标函数是一个多分类问题,该模型的目标函数的优化目标是最大化依存树中样本数据中各词的父节点的预测概率,而压低其他节点的预测概率,并且针对同一个词,依存树中各节点的预测概率之和为1。
[0144]
下面通过举例说明本公开实施例中依存图模型和相关技术中基于树型依存句法分析的模型的目标函数的比较结果,如下表2所示:
[0145]
hsadp:log p(x
j
|x
i
),例子:x
i
=nuts
[0146][0147]
hsagp:log p(x
j
==head|x
i
),例子:x
i
=nuts
[0148][0149]
表2
[0150]
表2中示出了本公开实施例中依存图模型和相关技术中基于树型依存句法分析的模型针对样本数据“best quality nuts”中的第i个词(x
i
=nuts)的预测概率。
[0151]
本公开实施例中依存图模型针对输入的“root oroot best quality nuts”,预测结果为p(root|nuts)=0.9,p(oroot|nuts)=0.25,p(best |nuts)=0.35,p(quality|nuts)=0.4,该预测结果中各概率之和不等于1。而基于树型依存句法分析的模型针对输入的“root oroot best quality nuts”,预测结果为p(root|nuts)=0.8,p(oroot|nuts)=0.05,p(best|nuts)=0.05,p(quality|nuts)=0.1,该预测结果中各概率之和等于1。可见,基于依存图模型可以得到语句中各词的一个或多个父节点,而基于树型依存句法分析的模型只可以得到语句中各词的一个父节点。
[0152]
图3示出根据本公开一实施方式的中心词提取方法的流程图。如图3所示,该中心词提取方法包括以下步骤:
[0153]
在步骤s301中,获取待识别语句;
[0154]
在步骤s302中,利用依存图模型识别待识别语句对应的依存图结构;该依存图模型利用上述模型训练方法得到;
[0155]
在步骤s303中,根据依存图结构提取待识别语句中的中心词。
[0156]
本实施例中,待识别语句可以是待提取中心词的任何语句,可以是多个词构成的词组、一句话、一段文字等。例如,待识别语句可以是购物平台中商品的标题、用户输入的查询商品的查询语句等。
[0157]
该中心词提取方法在服务器端执行,待识别语句可以是从客户端发送至服务器端的,例如可以是用户通过客户端输入的查询语句;待识别语句也可以是服务器端进行批量处理的语句,例如针对购物平台中新上架的商品标题。服务器端可以利用依存图模型对待识别语句进行处理,以便获得该待识别语句对应的依存图结构。该依存图结构中可以包括待识别语句中各词的父节点信息,父节点可以包括中心词父节点代表词、非中心词父节点代表词以及该待识别语句中的各词。依存图结构可以参见上述模型训练方法的描述,在此不再赘述。依存图模型的技术细节也可以参见上述对模型训练方法的描述,在此不再赘述。
[0158]
由于本公开实施例中的依存图模型能够识别出待识别语句对应的依存图结构,而通过对依存图结构进行解码即可确定待识别语句中的中心词。本公开实施例中的依存图结构中中心词的父节点为中心词父节点代表词和其他中心词,因此基于这一原则可以根据依存图结构确定待识别语句中的中心词。
[0159]
本公开实施例中的依存图模型能够针对待识别语句识别出依存图结构,该依存图结构中中心词的父节点除了包括中心词父节点代表词之外,还包括其他中心词,也即本公开实施例通过在两两中心词之间建立关联关系,因此依存图模型能够通过两两中心词之间的相关性,提高依存图结构的识别准确率,进而能够提高中心词的识别准确率。
[0160]
在本实施例的一个可选实现方式中,步骤s303,即根据依存图结构提取待识别语句中的中心词的步骤,进一步包括以下步骤:
[0161]
根据依存图结构确定待识别语句中各个词的父节点;
[0162]
根据父节点是否包括中心词父节点代表词确定词是否为中心词。
[0163]
该可选的实现方式中,依存图模型针对待识别语句的输出结果可以包括该待识别语句对应的依存图中各个节点为待识别语句中各词的父节点的概率值,该概率值越大则说明对应的节点为该词的父节点的可能性越大。待识别语句对应的依存图中的各节点可以包括中心词父节点代表词(如上文的root)、非中心父节点(oroot)和样本数据中的各词,中心词父节点代表词为所有中心词的父节点,因此可以通过依存图结构确定待识别语句中的词的父节点是否包括中心词父节点代表词(root)来确定该词是否为中心词。依存图结构的具体细节可以具体可以参见上述对图2的描述,在此不再赘述。
[0164]
在本实施例的一个可选实现方式中,根据父节点是否包括中心词父节点代表词确定词是否为中心词的步骤,进一步包括以下步骤:
[0165]
将父节点包括中心词父节点代表词的词确定为中心词。
[0166]
该可选的实现方式中,由于待识别语句所对应的真实依存图中,所有中心词都是中心词父节点代表词(root)的子节点,因此可以根据依存图模型针对待识别语句所输出的依存图结构确定中心词父节点代表词的子节点,进而将子节点对应的词确定为中心词。
[0167]
在一些实施例中,依存图模型输出的依存图结构的表现形式可以为待识别语句中的每个词对应一个识别结果,该识别结果中包括依存图中各个节点为该词的父节点的概率值,在该概率值大于预设值时,确定该节点为该词的父节点。依存图中各个节点可以包括中心词父节点代表词(如上文的root)、非中心父节点(oroot)和样本数据中的各词。因此,可以基于依存图模型的输出结果,在中心词父节点代表词为该词的父节点的概率值大于预设值时,将该词确定为中心词。
[0168]
在本实施例的一个可选实现方式中,根据父节点是否包括中心词父节点代表词确定词是否为中心词的步骤,进一步包括以下步骤:
[0169]
将父节点包括中心词父节点代表词的词确定为候选词;
[0170]
根据候选词的父节点中是否还包括其它词确定候选词是否为中心词。
[0171]
该可选的实现方式中,由于待识别语句所对应的真实依存图中,所有中心词都是中心词父节点代表词(root)的子节点,并且两两中心词互为父节点,因此可以根据依存图模型针对待识别语句所输出的依存图结构确定中心词父节点代表词的子节点,进而将子节点对应的词确定为中心词。对于待识别语句中的某个词,在依存图模型的输出结果中,其父节点包括中心词父节点代表词,可以初步确定该词可能为中心词,因此将这类词确定为候选词;由于两两中心词之间也互为父节点,因此还可以确定候选词的父节点是否还包括其他词,如果还包括其他词,则可以确定该词为中心词的可能性更大,因此可以通过这种方式确定该词是否为中心词。通过这种方式,可以使得提取到的中心词的准确率更高。
[0172]
当然需要说明的是,直接通过待识别语句中的词的父节点是否包括中心词父节点代表词也能够判断出该词是否为中心词,但是这种方式的准确率低于进一步通过父节点是否还包括其他词的判断方式,而召回率高于进一步通过父节点是否还包括其他词的判断方式。因此,可以根据实际需要选用上述两种方式中的任意一种对依存图模型输出的依存图结构进行解码。
[0173]
在本实施例的一个可选实现方式中,根据候选词的父节点信息中是否还包括其它
词确定候选词是否为中心词的步骤,进一步包括以下步骤:
[0174]
在候选词的父节点中包括其它词时,根据其它词的数量确定候选词为中心词的概率。
[0175]
该可选的实现方式中,在进一步通过父节点是否还包括其他词确定候选词是否为中心词的方式中,可以通过作为该候选词的父节点的其他词的数量多少来确定该候选词,例如,作为候选词的父节点的其他词的数量越多,则可以确定该候选词为中心词的概率越大,并且可以通过设定一阈值,在该概率高于阈值时确定该候选词为中心词。
[0176]
在本实施例的一个可选实现方式中,根据候选词的父节点信息中是否还包括其它词确定候选词是否为中心词的步骤,进一步还包括以下步骤:
[0177]
确定以中心词为首的目标短语;目标短语中后一词的父节点信息包括前一词且不包括中心词父节点代表词;
[0178]
将目标短语确定为中心词组。
[0179]
该可选的实现方式中,由于本公开实施例中的依存图中,建立了中心词组中各词之间的关联关系。因此还可以通过对依存图模型输出的依存图结构进行解码确定中心词组。解码过程可以为:在确定了待识别语句中的当前词为中心词之后,还可以判断该中心词的后一词的父节点是否为该中心词,以及该后一词的父节点是否不包括中心词父节点代表词(如果包括中心词父节点代表词,则该后一词为中心词,而不是中心词组的成员),如果该中心词的后一词的父节点为该中心词,且该后一词的父节点不包括中心词父节点代表词,则该后一词与该中心词为中心词组的成员,之后还可以继续判断后一词之后的词,以此类推,直到找出中心词组中的全部成员为止。通过这种方式,能够从待识别语句中提取出中心词组。
[0180]
图4示出根据本公开一实施方式的中心词提取方法的流程图。如图4所示,该中心词提取方法包括以下步骤:
[0181]
在步骤s401中,获取待识别语句;
[0182]
在步骤s402中,利用依存图模型识别待识别语句对应的依存图结构;依存图结构中待识别语句中的中心词和非中心词作为节点,中心词之间两两相连;
[0183]
在步骤s403中,根据依存图结构提取待识别语句中的中心词。
[0184]
本实施例中,待识别语句可以是待提取中心词的任何语句,可以是多个词构成的词组、一句话、一段文字等。例如,待识别语句可以是购物平台中商品的标题、用户输入的查询商品的查询语句等。
[0185]
该中心词提取方法在服务器端执行,待识别语句可以是从客户端发送至服务器端的,例如可以是用户通过客户端输入的查询语句;待识别语句也可以是服务器端进行批量处理的语句,例如针对购物平台中新上架的商品标题。服务器端可以利用依存图模型对待识别语句进行处理,以便获得该待识别语句对应的依存图结构。
[0186]
本公开实施例中的依存图模型可以是预先利用训练数据训练得到的,能够从待识别语句中识别出该待识别语句对应的依存图结构。该依存图结构中待识别语句中的中心词和非中心词作为节点,且中心词之间两两相连。两两相连的中心词可以互为父节点。因此,可以通过中心词之间两两相连这种关系从待识别语句中识别出哪些是中心词。
[0187]
由于本公开实施例中的依存图模型能够识别出待识别语句对应的依存图结构,而
通过对依存图结构进行解码即可确定待识别语句中的中心词。本公开实施例中的依存图模型是预先利用训练数据训练得到的,上文中描述的模型训练方法为依存图模型的一种训练方式,依存图模型的具体细节可以参见上述模型训练方法,在此不再赘述。需要说明的是,依存图模型的训练过程不限于上述实施例中的方式,还可以采用其他方式训练得到,只要训练得到的依存图模型所识别出来的依存图结构中能够包括中心词的父节点,且中心词的父节点除了包括中心词父节点代表词之外还包括其他中心词即可。
[0188]
本公开实施例中的依存图模型能够针对待识别语句识别出依存图结构,该依存图结构中中心词的父节点除了包括中心词父节点代表词之外,还包括其他中心词,也即本公开实施例通过在两两中心词之间建立关联关系,使得依存图模型能够通过两两中心词之间的相关性,提高依存图结构的识别准确率,进而能够提高中心词的识别准确率。
[0189]
在本实施例的一个可选实现方式中,所述依存图结构中还包括中心词父节点代表词,所述中心词父节点代表词为所述待识别语句中各中心词的父节点。
[0190]
该可选的实现方式中,中心词父节点代表词为添加在待识别语句中的代表中心词父节点的词,例如上文中描述的“root”。此外,本公开实施例中中心词包括多个时,中心词的父节点除了中心词父节点代表词之外还包括其他中心词。也就是说,本公开实施例中依存图模型所识别出的依存图结构中,除了中心词父节点代表词为各中心词的父节点之外,且两两中心词之间也互为父节点,因此可以通过解码依存图模型所识别出来的依存图结构,例如通过依存图结构中确定父节点是否中心词父节点代表词来确定待识别语句中各词是否为中心词。
[0191]
在本实施例的一个可选实现方式中,步骤s403,即根据依存图结构提取待识别语句中的中心词的步骤,进一步包括以下步骤:
[0192]
根据依存图结构确定待识别语句中各个词的父节点;
[0193]
根据父节点是否包括中心词父节点代表词确定词是否为中心词。
[0194]
该可选的实现方式中,依存图模型针对待识别语句的输出结果可以包括该待识别语句对应的依存图中各个节点为待识别语句中各词的父节点的概率值,该概率值越大则说明对应的节点为该词的父节点的可能性越大。待识别语句对应的依存图中的各节点可以包括中心词父节点代表词(如上文的root)、非中心词父节点代表词(oroot)和样本数据中的各词,中心词父节点代表词为所有中心词的父节点,因此可以通过依存图结构确定待识别语句中的词的父节点是否包括中心词父节点代表词(root)来确定该词是否为中心词。依存图结构的具体细节可以具体可以参见上述对图2的描述,在此不再赘述。
[0195]
在本实施例的一个可选实现方式中,根据父节点是否包括中心词父节点代表词确定词是否为中心词的步骤,进一步包括以下步骤:
[0196]
将父节点包括中心词父节点代表词的词确定为中心词。
[0197]
该可选的实现方式中,由于待识别语句所对应的真实依存图中,所有中心词都是中心词父节点代表词(root)的子节点,因此可以根据依存图模型针对待识别语句所输出的依存图结构确定中心词父节点代表词的子节点,进而将子节点对应的词确定为中心词。
[0198]
在一些实施例中,依存图模型输出的依存图结构的表现形式可以为待识别语句中的每个词对应一个识别结果,该识别结果中包括依存图中各个节点为该词的父节点的概率值,在该概率值大于预设值时,确定该节点为该词的父节点。依存图中各个节点可以包括中
心词父节点代表词(如上文的root)、非中心词父节点代表词(oroot)和样本数据中的各词。因此,可以基于依存图模型的输出结果,在中心词父节点代表词为该词的父节点的概率值大于预设值时,将该词确定为中心词。
[0199]
在本实施例的一个可选实现方式中,根据父节点是否包括中心词父节点代表词确定词是否为中心词的步骤,进一步包括以下步骤:
[0200]
将父节点包括中心词父节点代表词的词确定为候选词;
[0201]
根据候选词的父节点中是否还包括其它词确定候选词是否为中心词。
[0202]
该可选的实现方式中,由于待识别语句所对应的真实依存图中,所有中心词都是中心词父节点代表词(root)的子节点,并且两两中心词互为父节点,因此可以根据依存图模型针对待识别语句所输出的依存图结构确定中心词父节点代表词的子节点,进而将子节点对应的词确定为中心词。对于待识别语句中的某个词,在依存图模型的输出结果中,其父节点包括中心词父节点代表词,可以初步确定该词可能为中心词,因此将这类词确定为候选词;由于两两中心词之间也互为父节点,因此还可以确定候选词的父节点是否还包括其他词,如果还包括其他词,则可以确定该词为中心词的可能性更大,因此可以通过这种方式确定该词是否为中心词。通过这种方式,可以使得提取到的中心词的准确率更高。
[0203]
当然需要说明的是,直接通过待识别语句中的词的父节点是否包括中心词父节点代表词也能够判断出该词是否为中心词,但是这种方式的准确率低于进一步通过父节点是否还包括其他词的判断方式,而召回率高于进一步通过父节点是否还包括其他词的判断方式。因此,可以根据实际需要选用上述两种方式中的任意一种对依存图模型输出的依存图结构进行解码。
[0204]
在本实施例的一个可选实现方式中,根据候选词的父节点信息中是否还包括其它词确定候选词是否为中心词的步骤,进一步包括以下步骤:
[0205]
在候选词的父节点中包括其它词时,根据其它词的数量确定候选词为中心词的概率。
[0206]
该可选的实现方式中,在进一步通过父节点是否还包括其他词确定候选词是否为中心词的方式中,可以通过作为该候选词的父节点的其他词的数量多少来确定该候选词,例如,作为候选词的父节点的其他词的数量越多,则可以确定该候选词为中心词的概率越大,并且可以通过设定一阈值,在该概率高于阈值时确定该候选词为中心词。
[0207]
在本实施例的一个可选实现方式中,根据候选词的父节点信息中是否还包括其它词确定候选词是否为中心词的步骤,进一步还包括以下步骤:
[0208]
确定以中心词为首的目标短语;目标短语中后一词的父节点信息包括前一词且不包括中心词父节点代表词;
[0209]
将目标短语确定为中心词组。
[0210]
该可选的实现方式中,由于本公开实施例中的依存图中,建立了中心词组中各词之间的关联关系。因此还可以通过对依存图模型输出的依存图结构进行解码确定中心词组。解码过程可以为:在确定了待识别语句中的当前词为中心词之后,还可以判断该中心词的后一词的父节点是否为该中心词,以及该后一词的父节点是否不包括中心词父节点代表词(如果包括中心词父节点代表词,则该后一词为中心词,而不是中心词组的成员),如果该中心词的后一词的父节点为该中心词,且该后一词的父节点不包括中心词父节点代表词,
则该后一词与该中心词为中心词组的成员,之后还可以继续判断后一词之后的词,以此类推,直到找出中心词组中的全部成员为止。通过这种方式,能够从待识别语句中提取出中心词组。
[0211]
本公开实施例提出的上述中心词提取方法可以应用于多种应用场景,例如可以应用在跨境电商平台的商品名称识别、在线视频资源播放平台中英文名的识别、物流平台中英文地址的识别等。
[0212]
下面以跨境电商平台的商品名称识别为例详细说明本公开实施例中中心词提取的具体应用场景。
[0213]
针对服务于国际买家的跨境出口电商平台,由于所有商品描述信息均是英文,在该跨境出口电商平台的搜索场景下,买家输入商品名称的英文查询语句,电商平台通过相关性算法检索出最相关的商品并显示给用户。在相关性算法中,通过本公开实施例中的中心词提取方法提取出查询语句和商品名称中的中心词之后,可以通过计算中心词之间的相似度得到查询语句与商品名称之间的相关性分数,进而根据相关性得分得到搜索结果。例如,对于商品名称“best quality pine nuts grade”,提取出的中心词包括:“pine”和“nuts”,在输入查询语句中包括中心词“pine”和/或“nuts”时,两者的相关性分数较高;再例如,对于商品名称“high quality new brand women scarfs 2019smooth silky touch shawls and wraps 180*90cm long luxury silk scarves gift for ladies”,提取出的中心词包括:“scarfs”、“shawls”、“wraps”、“scarves”,在输入的查询语句中包括中心词“scarfs”、“shawls”、“wraps”和/或“scarves”时,两者的相关性分数较高。
[0214]
图5示出根据本公开一实施方式服务器端提取中心词的流程示意图。如图5所示,服务器端针对样本数据构建依存图,以样本数据“中心词1中心词2非中心词非中心词2”为例,构建出的依存图如图7中的虚框所示,其中包括中心词父节点代表词(root)、非中心词父节点代表词(oroot)、中心词1、中心词2、非中心词1和非中心词2,中心词父节点代表词至中心词1、中心词2建立有向边,非中心词父节点代表词至非中心词1、非中心词2建立了有向边,中心词1至中心词2建立了有向环(也即中心词1至中心词2建立有向边,中心词2至中心词1建立有向边)。训练过程中,可以将样本数据输入至依存图模型,依存图模型输出预测结果,该预测结果可以表示出依存图模型针对该样本数据预测得到的一依存图结构(在模型训练之初,该预测结果与真实的依存图差别较大),并根据该预测结果与上述构建的真实依存图结构之间的误差调整依存图模型的模型参数,模型参数的调整目标为使得预测结果中真实父节点被选中的概率最大化,而使得预测结果中非父节点被选中的概率最小化。
[0215]
在依存图模型训练完成之后,可以利用该依存图模型在线识别待识别语句对应的依存图结构。识别过程中,可以将待识别语句输入至训练好的依存图模型中,并得到输出结果;该输出结果可以表示出待识别语句对应的依存图结构,由于依存图结构中包括样本数据中各词的父节点,通过各词的父节点可以确定待识别语句中的中心词。
[0216]
图6示出根据本公开一实施方式的查询方法的流程图。如图6所示,该查询方法包括以下步骤:
[0217]
在步骤s601中,接收查询语句;
[0218]
在步骤s602中,利用上述中心词提取方法提取查询语句中的中心词;
[0219]
在步骤s603中,利用中心词从待查询数据中匹配得到查询结果。
[0220]
本实施例中,该查询方法在服务器端执行。服务器端从客户端接收查询语句,并利用上述中心词提取方法从查询语句中提取中心词,进而通过将该中心词与待查询数据进行匹配获得查询结果。待查询数据可以该查询语句待进行查询的数据库中的相应数据。查询语句中的中心词可以利用本公开实施例中所公开的中心词提取方法提取得到,具体细节可以参见上述对中心词提取方法的描述,在此不再赘述。通过本公开实施例公开的中心词提取方法所提取出的中心词的准确率更高,因此查询结果的准确率也更高。
[0221]
图7示出根据本公开一实施方式的查询方法的流程图。如图7所示,该查询方法包括以下步骤:
[0222]
在步骤s701中,接收查询语句;
[0223]
在步骤s702中,将查询语句与待查询数据的中心词进行匹配,以便确定查询结果;其中,中心词利用上述中心词提取方法从待查询数据中提取得到。
[0224]
本实施例中,该查询方法在服务器端执行。服务器端从客户端接收查询语句,并利用预先从待查询数据中提取出的中心词与查询语句进行匹配的方式确定查询结果。待查询数据可以该查询语句待进行查询的数据库中的相应数据。服务器端可以预先利用上述中心词提取方法从待查询数据中提取出中心词,例如待查询数据可以为购物平台中各商品的标题信息,服务器端可以从各商品的标题中提取出中心词,并对应存储在数据库中。在接收到查询语句之后,可以匹配待查询数据中提取出的中心词与查询语句,如果匹配成功,则该待查询数据为查询结果的一部分,可以返回给客户端。在一些实施例中,还可以利用上述方法从查询语句中提取出中心词,通过匹配查询语句中的中心词与待查询数据中提取出的中心词来获得查询结果。中心词的提取可以利用本公开实施例中所公开的中心词提取方法提取得到,具体细节可以参见上述对中心词提取方法的描述,在此不再赘述。通过本公开实施例公开的中心词提取方法所提取出的中心词的准确率更高,因此查询结果的准确率也更高。
[0225]
下述为本公开装置实施例,可以用于执行本公开方法实施例。
[0226]
根据本公开一实施方式的模型训练装置,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。该模型训练装置包括:
[0227]
第一获取模块,被配置为获取样本数据;其中,样本数据包括样本数据以及样本数据中的中心词;
[0228]
转换模块,被配置为建立样本数据对应的依存图结构;其中,依存图结构中包括样本数据中各个词的父节点,在样本数据中存在两个以上中心词时,中心词的父节点包括中心词父节点代表词和其他中心词;
[0229]
训练模块,被配置为利用样本数据及其对应的依存图结构训练依存图模型,使得依存图模型学习样本数据对应的依存图结构。
[0230]
在本实施例的一个可选实现方式中,转换模块包括:
[0231]
第一增加子模块,被配置为为句子增加中心词父节点代表词和非中心词父节点代表词;
[0232]
第一遍历子模块,被配置为按照预定顺序对所述句子进行遍历,如果遍历到中心词,则将所述中心词作为依存树中所述中心词父节点代表词的子节点;如果遍历到非中心词,则将所述非中心词作为所述非中心词父节点代表词的子节点;
[0233]
第一建立子模块,被配置为将所述中心词父节点代表词的子节点两两相连,构成
一个带有环的依存图。
[0234]
在本实施例的一个可选实现方式中,转换模块包括:
[0235]
第二遍历子模块,被配置为如果遍历到中心词短语,则将所述中心词短语的第一个词作为所述中心词父节点代表词的子节点;将所述中心词短语中的后续词作为前一个词的子节点。
[0236]
在本实施例的一个可选实现方式中,训练模块包括:
[0237]
处理子模块,被配置为利用所述依存图模型对所述样本数据进行处理得到预测结果;所述预测结果包括所述依存图结构中任一节点成为其他节点的父节点的预测概率;
[0238]
调整子模块,被配置为根据所述预测结果,利用目标函数对所述依存图模型的参数进行优化调整;所述目标函数用于最大化所述依存图结构中各节点成为其他节点的父节点的预测概率。
[0239]
本实施例中的模型训练装置与上述实施例中描述的模型训练方法对应一致,具体细节可以参加上述对模型训练方法的描述,在此不再赘述。
[0240]
根据本公开一实施方式的中心词提取装置,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。该中心词提取装置包括:
[0241]
第二获取模块,被配置为获取待识别语句;
[0242]
第一识别模块,被配置为利用依存图模型识别待识别语句对应的依存图结构;依存图模型利用上述模型训练方法训练得到;
[0243]
第一提取模块,被配置为根据依存图结构提取待识别语句中的中心词。
[0244]
在本实施例的一个可选实现方式中,第一提取模块包括:
[0245]
第一确定子模块,被配置为根据依存图结构确定待识别语句中各个词的父节点;
[0246]
第二确定子模块,被配置为根据父节点是否包括中心词父节点代表词确定词是否为中心词。
[0247]
在本实施例的一个可选实现方式中,第二确定子模块包括:
[0248]
第三确定子模块,被配置为将父节点包括中心词父节点代表词的词确定为中心词。
[0249]
在本实施例的一个可选实现方式中,第二确定子模块包括:
[0250]
第四确定子模块,被配置为将父节点包括中心词父节点代表词的词确定为候选词;
[0251]
第五确定子模块,被配置为根据候选词的父节点中是否还包括其它词确定候选词是否为中心词。
[0252]
在本实施例的一个可选实现方式中,第五确定子模块包括:
[0253]
第六确定子模块,被配置为在候选词的父节点中包括其它词时,根据其它词的数量确定候选词为中心词的概率。
[0254]
在本实施例的一个可选实现方式中,第二确定子模块,还包括:
[0255]
第七确定子模块,被配置为确定以中心词为首的目标短语;目标短语中后一词的父节点信息包括前一词且不包括中心词父节点代表词;
[0256]
第八确定子模块,被配置为将目标短语确定为中心词组。
[0257]
本实施例中的中心词提取装置与上述实施例中图3所示实施例及相关实施例中描
述的中心词提取方法对应一致,具体细节可以参加上述对中心词提取方法的描述,在此不再赘述。
[0258]
根据本公开另一实施方式的中心词提取装置,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。该中心词提取装置包括:
[0259]
第三获取模块,被配置为获取待识别语句;
[0260]
第二识别模块,被配置为利用依存图模型识别待识别语句对应的依存图结构;依存图结构中待识别语句的中心词和非中心词作为节点,中心词之间两两相连;
[0261]
第二提取模块,被配置为根据依存图结构提取待识别语句中的中心词。
[0262]
在本实施例的一个可选实现方式中,依存图结构中还包括中心词父节点代表词,中心词父节点代表词为待识别语句中各中心词的父节点。
[0263]
在本实施例的一个可选实现方式中,第二提取模块包括:
[0264]
第九确定子模块,被配置为根据依存图结构确定待识别语句中各个词的父节点;
[0265]
第十确定子模块,被配置为根据父节点是否包括中心词父节点代表词确定词是否为中心词。
[0266]
在本实施例的一个可选实现方式中,第十确定子模块包括:
[0267]
第十一确定子模块,被配置为将父节点包括中心词父节点代表词的词确定为中心词。
[0268]
在本实施例的一个可选实现方式中,第十确定子模块包括:
[0269]
第十二确定子模块,被配置为将父节点包括中心词父节点代表词的词确定为候选词;
[0270]
第十三确定子模块,被配置为根据候选词的父节点中是否还包括其它词确定候选词是否为中心词。
[0271]
在本实施例的一个可选实现方式中,第十三确定子模块包括:
[0272]
第十四确定子模块,被配置为在候选词的父节点中包括其它词时,根据其它词的数量确定候选词为中心词的概率。
[0273]
在本实施例的一个可选实现方式中,第十确定子模块,还包括:
[0274]
第十五确定子模块,被配置为确定以中心词为首的目标短语;目标短语中后一词的父节点信息包括前一词且不包括中心词父节点代表词;
[0275]
第十六确定子模块,被配置为将目标短语确定为中心词组。
[0276]
本实施例中的中心词提取装置与上述实施例中图4所示实施例及相关实施例中描述的中心词提取方法对应一致,具体细节可以参加上述对中心词提取方法的描述,在此不再赘述。
[0277]
根据本公开一实施方式的查询装置,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。该查询装置包括:
[0278]
第一接收模块,被配置为接收查询语句;
[0279]
第三提取模块,被配置为利用上述中心词提取装置提取查询语句中的中心词;
[0280]
第一匹配模块,被配置为利用中心词从待查询数据中匹配得到查询结果。
[0281]
本实施例中的查询装置与上述实施例中图6所示实施例及相关实施例描述的查询方法对应一致,具体细节可以参加上述对查询方法的描述,在此不再赘述。
[0282]
根据本公开一实施方式的查询装置,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。该查询装置包括:
[0283]
第二接收模块,被配置为接收查询语句;
[0284]
第二匹配模块,被配置为将查询语句与待查询数据的中心词进行匹配,以便确定查询结果;其中,中心词利用上述中心词提取装置从待查询数据中提取得到。
[0285]
本实施例中的查询装置与上述实施例中图7所示实施例及相关实施例所描述的查询方法对应一致,具体细节可以参加上述对查询方法的描述,在此不再赘述。
[0286]
图8是适于用来实现根据本公开实施方式的模型训练方法、中心词提取方法和/或查询方法的电子设备的结构示意图。
[0287]
如图8所示,电子设备800包括处理单元801,其可实现为cpu、gpu、fpag、npu等处理单元。处理单元801可以根据存储在只读存储器(rom)802中的程序或者从存储部分808加载到随机访问存储器(ram)803中的程序而执行本公开上述任一方法的实施方式中的各种处理。在ram803中,还存储有电子设备800操作所需的各种程序和数据。处理单元801、rom802以及ram803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
[0288]
以下部件连接至i/o接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至i/o接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
[0289]
特别地,根据本公开的实施方式,上文参考本公开实施方式中的任一方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行本公开实施方式中任一方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。
[0290]
附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0291]
描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
[0292]
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,
未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
[0293]
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜