一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

对话处理方法、装置及电子设备与流程

2022-02-20 23:18:22 来源:中国专利 TAG:


1.本说明书一个或多个实施例涉及计算机应用技术领域,尤其涉及一种对话处理方法、装置及电子设备。


背景技术:

2.在现实生活中,用户经常会遇到因为对其不够了解而导致自己难以解决的问题,从而需要向客服寻求解决问题的方法,例如:向客服咨询想要购买的商品的优缺点;或者,向客服咨询如何办理宽带业务;等等。由于使用人工客服的成本较高,因此通常会使用基于人工智能系统设置的智能客服为用户提供所需的信息或服务。


技术实现要素:

3.本说明书提出一种对话处理方法,所述方法应用于人工智能系统,包括:
4.获取用户对于目标任务问题的回答文本,所述目标任务问题用于预测所述用户在目标任务上的需求;所述目标任务问题包括至少一个可选实体;
5.从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段;
6.分别确定所述关键字段与所述至少一个可选实体的属性字段是否匹配;
7.如果所述关键字段与任意一个可选实体的属性字段匹配,则将属性字段与所述关键字段匹配的可选实体确定为目标实体,并基于所述目标实体执行所述目标任务。
8.可选地,所述从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段,包括:
9.将所述回答文本输入至训练完成的序列标注模型,以由所述序列标注模型对所述回答文本进行序列标注,并基于序列标注结果从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段。
10.可选地,所述从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段,包括:
11.基于命名实体识别算法,从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段。
12.可选地,所述分别确定所述关键字段与所述至少一个可选实体的属性字段是否匹配,包括:
13.分别计算所述关键字段与所述至少一个可选实体的属性字段的相似度,并确定计算得到的所述相似度是否大于预设阈值;
14.如果所述关键字段与任意一个可选实体的属性字段的相似度大于所述阈值,则确定所述关键字段与所述相似度大于所述阈值的可选实体的属性字段匹配。
15.可选地,所述如果所述关键字段与任意一个可选实体的属性字段匹配,则将属性字段与所述关键字段匹配的可选实体确定为目标实体,包括:
16.如果存在所述相似度大于所述阈值的一个可选实体,则将所述可选实体确定为目
标实体;
17.如果存在所述相似度大于所述阈值的多个可选实体,则将所述相似度最大的可选实体确定为目标实体。
18.可选地,所述分别计算所述关键字段与所述至少一个可选实体的属性字段的相似度,包括:
19.将所述关键字段和所述至少一个可选实体的属性字段转换为词向量;
20.基于所述词向量,分别计算所述关键字段与所述至少一个可选实体的属性字段的向量相似度,并将计算得到的所述向量相似度确定为所述关键字段与所述至少一个可选实体的属性字段的相似度。
21.本说明书还提出一种对话处理装置,所述装置应用于人工智能系统,包括:
22.获取模块,获取用户输入的与所述人工智能系统输出的针对目标任务的问题文本对应的回答文本;其中,所述目标任务指示所述人工智能系统预测出的所述用户的需求;所述问题文本由所述人工智能系统基于所述目标任务确定;所述问题文本包括与所述目标任务对应的至少一个可选实体;
23.提取模块,从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段;
24.确定模块,分别确定所述关键字段与所述至少一个可选实体的属性字段是否匹配;
25.执行模块,如果所述关键字段与任意一个可选实体的属性字段匹配,则将属性字段与所述关键字段匹配的可选实体确定为目标实体,并基于所述目标实体执行所述目标任务。
26.可选地,所述提取模块:
27.将所述回答文本输入至训练完成的序列标注模型,以由所述序列标注模型对所述回答文本进行序列标注,并基于序列标注结果从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段。
28.可选地,所述提取模块:
29.基于命名实体识别算法,从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段。
30.可选地,所述确定模块:
31.分别计算所述关键字段与所述至少一个可选实体的属性字段的相似度,并确定计算得到的所述相似度是否大于预设阈值;
32.如果所述关键字段与任意一个可选实体的属性字段的相似度大于所述阈值,则确定所述关键字段与所述相似度大于所述阈值的可选实体的属性字段匹配。
33.可选地,所述执行模块:
34.如果存在所述相似度大于所述阈值的一个可选实体,则将所述可选实体确定为目标实体;
35.如果存在所述相似度大于所述阈值的多个可选实体,则将所述相似度最大的可选实体确定为目标实体。
36.可选地,所述确定模块:
37.将所述关键字段和所述至少一个可选实体的属性字段转换为词向量;
38.基于所述词向量,分别计算所述关键字段与所述至少一个可选实体的属性字段的向量相似度,并将计算得到的所述向量相似度确定为所述关键字段与所述至少一个可选实体的属性字段的相似度。
39.本说明书还提出一种电子设备,包括:
40.处理器;
41.用于存储处理器可执行指令的存储器;
42.其中,所述处理器通过运行所述可执行指令以实现上述方法的步骤。
43.本说明书还提出一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现上述方法的步骤。
44.在上述技术方案中,可以从用户输入的对于与用户的实际需求对应的目标任务问题的回答文本中,提取出用于指示与目标任务对应的实体的关键字段,并在确定该关键字段与任意一个与目标任务对应的可选实体的属性字段匹配时,将属性字段与该关键字段匹配的可选实体确定为目标实体,并基于目标实体执行目标任务。采用这样的方式,可以提高智能客服对用户的回答的理解准确度,从而可以提高为用户提供信息或服务的准确度,提升用户体验。
附图说明
45.图1是本说明书一示例性实施例示出的一种对话处理方法的流程图;
46.图2是本说明书一示例性实施例示出的一种人机交互界面的示意图;
47.图3是本说明书一示例性实施例示出的一种对话处理装置所在电子设备的硬件结构图;
48.图4是本说明书一示例性实施例示出的一种对话处理装置的框图。
具体实施方式
49.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
50.在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
51.应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
52.智能客服在向用户询问其需求时,通常会列举一些可供用户选择的实体(entity,即人、事、物的概念的结构化信息),以便于用户描述自己的实际需求,例如:智能客服可以向用户询问“是否需要为您下单100元的商品a?还是为您下单200元的商品b?”(“100元的商品a”和“200元的商品b”即为两个不同的实体);而用户在回答时,则可能使用“100元”或“a商品”来指代前一个实体,使用“200元”或“b商品”来指代后一个实体。
53.相关技术中,通常需要由用户完整地复述实体的结构化信息,智能客服才能理解用户选择的实体,例如:需要用户回答“下单100元的商品a”,智能客服才能确定用户选择的是商品a,并为用户执行对商品a的下单操作。然而这样,就会导致智能客服无法理解用户的简略回答,从而导致智能客服为用户提供信息或服务的准确度低下,影响用户体验。
54.本说明书旨在提供一种从用户输入的与人工智能系统输出的针对目标任务的问题文本对应的回答文本中,提取出用于指示与目标任务对应的实体的关键字段,并在确定该关键字段与任意一个与目标任务对应的可选实体的属性字段匹配时,将属性字段与该关键字段匹配的可选实体确定为目标实体,并基于目标实体执行目标任务的技术方案。
55.请参考图1,图1是本说明书一示例性实施例示出的一种对话处理方法的流程图。该对话处理方法可以包括以下步骤:
56.步骤101,获取用户对于目标任务问题的回答文本,所述目标任务问题用于预测所述用户在目标任务上的需求;所述目标任务问题包括至少一个可选实体;
57.步骤102,从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段;
58.步骤103,分别确定所述关键字段与所述至少一个可选实体的属性字段是否匹配;
59.步骤104,如果所述关键字段与任意一个可选实体的属性字段匹配,则将属性字段与所述关键字段匹配的可选实体确定为目标实体,并基于所述目标实体执行所述目标任务。
60.需要说明的是,该对话处理方法具体可以应用于提供人机对话服务的服务端或人工智能系统。下面以人工智能系统为例对本实施例进行详细描述。
61.在本实施例中,提供人机对话服务的人工智能系统可以预先根据用户此前的操作预测用户的实际需求。
62.举例来说,如果人工智能系统检测到用户此前浏览了某个商品的商品详情,则可以预测用户需要咨询该商品的优缺点,或者需要购买该商品;如果人工智能系统检测到用户此前浏览了办理宽带业务的网页,则可以预测用户需要办理宽带业务。
63.在本实施例中,在由人工智能系统预测出用户的实际需求的情况下,可以根据该实际需求,确定与该实际需求对应的任务(称为目标任务)。
64.继续以上述举例为例,假设人工智能系统预测出用户需要办理宽带业务,则可以将办理宽带业务确定为与用户的实际需求对应的目标任务。
65.在本实施例中,在确定了上述目标任务的情况下,可以进一步基于目标任务,确定针对目标任务的问题文本,并将该问题文本作为人机对话中的问题文本输出给用户,以供用户查看,并由用户针对该问题文本进行回答。
66.具体地,可以由技术人员预先设置问题数据库,该问题数据库中可以存储任务与由技术人员预先设置的问题文本的对应关系。在这种情况下,可以在该问题数据库中查找
与目标任务对应的问题文本,并将查找到的该问题文本确定为针对目标任务的问题文本。
67.需要说明的是,该问题数据库可以由人工智能系统在本地进行维护,也可以是人工智能系统的外接数据库,本说明书对此不作限制。
68.举例来说,假设上述问题数据库中存储的任务与问题文本的对应关系如下表1所示:
[0069][0070]
表1
[0071]
在如上表1所示的问题数据库中,与“办理宽带业务”这一任务对应的问题文本为“您需要办理哪种套餐的宽带业务?是年付500元的套餐a,还是月付50元的套餐b?”;与任务2对应的问题文本为问题文本2;以此类推。
[0072]
进一步假设由人工智能系统确定的与用户的实际需求对应的目标任务为“办理宽带业务”这一任务,则可以在如上表1所示的问题数据库中查找到与“办理宽带业务”这一任务对应的问题文本为“您需要办理哪种套餐的宽带业务?是年付500元的套餐a,还是月付50元的套餐b?”,并将该问题文本确定为针对目标任务的问题文本。
[0073]
需要说明的是,在上述问题文本中,“年付500元的套餐a”和“月付50元的套餐b”即为可供用户选择的与上述目标任务对应的实体。在实际应用中,可以先确定用户选择的与目标任务对应的实体,再基于用户选择的该实体执行目标任务;例如:假设用户选择了“年付500元的套餐a”这一实体,则可以为用户办理与套餐a对应的宽带业务,并向用户收取500元/年的费用。
[0074]
在本实施例中,在确定了针对上述目标任务的上述问题文本的情况下,可以通过如图2所示的人机交互界面将该问题文本输出给用户,以供用户查看,并由用户针对该问题文本进行回答。
[0075]
具体地,用户可以在该人机交互界面中输入与该问题文本对应的回答文本,并在输入完成之后,点击该人机交互界面中的“发送”按钮。人工智能系统在检测到用户针对该“发送”按钮的点击操作时,可以获取用户输入的该回答文本。
[0076]
在实际应用中,用户也可以采用语音输入的方式,在该人机交互界面中输入与该问题文本对应的回答文本。
[0077]
在本实施例中,在获取到用户输入的上述回答文本的情况下,可以从该回答文本中提取出用于指示与上述目标任务对应的实体的关键字段。
[0078]
在示出的一种实施方式中,可以预先训练用于对文本进行序列标注的序列标注模型。
[0079]
具体地,可以先获取预设数量的文本作为训练样本,并分别为这些训练样本标注
相应的序列标注结果。其中,该预设数量可以由技术人员预先设置;作为训练样本的该文本可以是从用于存储多个用户的历史回答文本的历史数据库中获取到的历史回答文本,也可以是由技术人员设置的回答文本,本说明书对此不作限制。
[0080]
在获取到上述训练样本之后,可以将这些训练样本输入至预设的机器学习模型(即序列标注模型),由该机器学习模型对这些训练样本进行计算,并由技术人员根据该机器学习模型输出的计算结果,对该机器学习模型的模型参数进行调整,从而基于这些训练样本实现对该机器学习模型的训练。
[0081]
在实际应用中,上述机器学习模型可以由技术人员预先设置;该机器学习模型具体可以是隐马尔可夫模型(hidden markov model,hmm)或条件随机场(conditional random field,crf)等用于序列标注的模型。
[0082]
在对上述序列标注模型的训练完成之后,即可使用训练完成的序列标注模型对文本进行序列标注。在这种情况下,可以将上述回答文本输入至训练完成的序列标注模型,以由该序列标注模型对该回答文本进行序列标注,从而可以基于该序列标注模型输出的序列标注结果,从该回答文本中提取出用于指示与上述目标任务对应的实体的关键字段。
[0083]
举例来说,假设用户针对“您需要办理哪种套餐的宽带业务?是年付500元的套餐a,还是月付50元的套餐b?”这一问题文本作出的回答是“我想要办理套餐a”,则在获取到用户输入的“我想要办理套餐a”这一回答文本的情况下,可以使用训练完成的条件随机场对该回答文本进行中文分词和词性标注,由该条件随机场将该回答文本划分为多个词,并为划分出的每个词标注这个词的词性(例如:名词、动词、形容词等)。因此,在由该条件随机场输出的序列标注结果中,被标注为动词的词可以是“办理”,被标注为名词的词可以是“套餐a”。在这种情况下,可以从该回答文本中提取出被标注为名词的“套餐a”,并将“套餐a”确定为用于指示与上述目标任务对应的实体的关键字段。
[0084]
在示出的一种实施方式中,可以基于命名实体识别(named entity recognition,ner)算法,对上述回答文本进行命名实体识别,以从该回答文本中识别出具有特定意义的实体(例如:人名、地名、机构名、专有名词等),从而可以基于命名实体识别结果,从该回答文本中提取出用于指示与上述目标任务对应的实体的关键字段。
[0085]
继续以上述举例为例,在获取到用户输入的“我想要办理套餐a”这一回答文本的情况下,可以基于命名实体识别算法,对该回答文本进行命名实体识别,以从该回答文本中识别出作为与上述目标任务对应的实体的“套餐a”。在这种情况下,可以从该回答文本中提取出“套餐a”,并将“套餐a”确定为用于指示与目标任务对应的实体的关键字段。
[0086]
在本实施例中,在从上述回答文本中提取出上述关键字段的情况下,可以将该关键字段分别与对应于上述目标任务的各个可选实体的属性字段进行匹配,以确定该关键字段与该可选实体的属性字段是否匹配。其中,这些可选实体可以是根据上述问题文本确定的与上述目标文本对应的实体;可选文本的数量通常为大于0的自然数。
[0087]
继续以“您需要办理哪种套餐的宽带业务?是年付500元的套餐a,还是月付50元的套餐b?”这一问题文本为例,根据该问题文本,可以将“年付500元的套餐a”和“月付50元的套餐b”确定为与“办理宽带业务”这一任务对应的两个可选实体。
[0088]
具体地,可以由技术人员预先设置属性数据库,该属性数据库可以存储实体与属性字段的对应关系。在这种情况下,可以在该属性数据库中查找与对应于上述目标任务的
各个可选实体对应的属性字段,并分别确定上述关键字段与各个可选实体的属性字段是否匹配。
[0089]
在实际应用中,不同的用户针对同一实体所使用的指代词可能相同,也可能不同。
[0090]
继续以“您需要办理哪种套餐的宽带业务?是年付500元的套餐a,还是月付50元的套餐b?”这一问题文本为例,针对“年付500元的套餐a”这一可选实体,用户a可能在回答时使用“年付”来指代该可选实体,即用户a输入的回答文本可以是“我想要办理年付的”;用户b可能在回答时使用“500元”来指代该可选实体,即用户b输入的回答文本可以是“我想要办理500元的”;用户c可能在回答时使用“套餐a”来指代该可选实体,即用户c输入的回答文本可以是“我想要办理套餐a”。在这种情况下,可以将“年付”作为该可选实体的指示时间的属性字段,将“500元”作为该可选实体的指示价格的属性字段,将“套餐a”作为该可选实体的指示名称的属性字段,并将该可选实体与这三个属性字段的对应关系存储至上述属性数据库。也即,该属性数据库中存储的实体与属性字段的对应关系可以如下表2所示:
[0091][0092][0093]
表2
[0094]
在如上表2所示的属性数据库中,与“年付500元的套餐a”这一实体对应的属性字段包括“年付”、“500元”、“套餐a”;与“月付50元的套餐b”这一实体对应的属性字段包括“月付”、“50元”、“套餐b”;以此类推。
[0095]
需要说明的是,该属性数据库可以由人工智能系统在本地进行维护,也可以是人工智能系统的外接数据库,本说明书对此不作限制。
[0096]
在本实施例中,如果上述关键字段与任意一个可选实体的属性字段匹配,则可以将属性字段与该关键字段匹配的可选实体确定为目标实体,并基于该目标实体执行上述目标任务。
[0097]
继续以如上表2所示的属性数据库为例,假设用户输入的回答文本是“我想要办理500元的”,而从该回答文本中提取出的关键字段为“500元”,则由于“年付500元的套餐a”这一可选实体的属性字段包括“500元”,因此可以确定该关键字段与该可选实体的属性字段匹配,从而可以将该可选实体确定为目标实体,并基于该目标实体执行“办理宽带业务”这一任务,即为用户办理与套餐a对应的宽带业务,并向用户收取500元/年的费用。
[0098]
在示出的一种实施方式中,为了确定上述关键字段与对应于上述目标任务的各个可选实体的属性字段是否匹配,可以分别计算该关键字段与各个可选实体的属性字段的相似度,并确定计算得到的该相似度是否大于由技术人员预先设置的阈值。
[0099]
对于其中的某个可选实体而言,如果该关键字段与该可选实体的属性字段的相似
度大于该阈值,则可以确定该关键字段与该可选实体匹配。
[0100]
在示出的另一种实施方式中,也可以先获取预设数量的关键字段作为训练样本,并分别为这些训练样本标注相应的分类结果(即指示该训练样本是否与对应于上述目标任务的任意一个可选实体的属性字段匹配的结果)。其中,该预设数量可以由技术人员预先设置;作为训练样本的该关键字段可以是从多个用户的历史回答文本中提取出的关键字段,也可以是由技术人员设置的关键字段,本说明书对此不作限制。
[0101]
在获取到上述训练样本之后,可以将这些训练样本输入至预设的用于分类的机器学习模型,由该机器学习模型对这些训练样本进行计算,并由技术人员根据该机器学习模型输出的计算结果,对该机器学习模型的模型参数进行调整,从而基于这些训练样本实现对该机器学习模型的训练。
[0102]
在训练完成之后,可以使用训练完成的该机器学习模型对从上述回答文本中提取出上述关键字段进行分类计算,以根据分类结果确定该关键字段是否与对应于上述目标任务的任意一个可选实体的属性字段匹配。
[0103]
在示出的一种实施方式中,如果有且仅有一个属性字段与上述关键字段的相似度大于上述阈值的可选实体,则可以直接将该可选实体确定为上述目标实体。相应地,如果存在多个属性字段与上述关键字段的相似度大于上述阈值的可选实体,则可以将该相似度最大的可选实体确定为上述目标实体。
[0104]
在示出的一种实施方式中,可以使用word2vec(word to vector)模型,将上述关键字段和对应于上述目标任务的所有可选实体的属性字段转换为词向量,并基于转换得到的这些词向量,分别计算该关键字段与对应于目标任务的各个可选实体的属性字段的向量相似度,并将计算得到的该向量相似度确定为该关键字段与各个可选实体的属性字段的相似度。
[0105]
对于其中的某个可选实体而言,可以计算对该关键字段和该可选实体的属性字段进行向量转换得到的词向量的向量相似度,并将计算得到的该向量相似度确定为该关键字段与该可选实体的属性字段的相似度。
[0106]
进一步需要说明的是,上述对话处理方法所涉及的人机对话服务可以在电商、电信、政务、金融、教育、文娱、健康、旅游等众多行业得到有效应用。在这些行业中,面向用户的智能客服都可以采用上述对话处理方法,以提升用户体验。
[0107]
在上述技术方案中,可以从用户输入的对于与用户的实际需求对应的目标任务问题的回答文本中,提取出用于指示与目标任务对应的实体的关键字段,并在确定该关键字段与任意一个与目标任务对应的可选实体的属性字段匹配时,将属性字段与该关键字段匹配的可选实体确定为目标实体,并基于目标实体执行目标任务。采用这样的方式,可以提高智能客服对用户的回答的理解准确度,从而可以提高为用户提供信息或服务的准确度,提升用户体验。
[0108]
与前述对话处理方法的实施例相对应,本说明书还提供了对话处理装置的实施例。
[0109]
本说明书对话处理装置的实施例可以应用在电子设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在电子设备的处理器将非易失性存储器中对应的计算机程序指令读
取到内存中运行形成的。从硬件层面而言,如图3所示,为本说明书对话处理装置所在电子设备的一种硬件结构图,除了图3所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常根据该对话处理的实际功能,还可以包括其他硬件,对此不再赘述。
[0110]
请参考图4,图4是本说明书一示例性实施例示出的一种对话处理装置的框图。该对话处理装置40可以应用于如图3所示的电子设备,包括:
[0111]
获取模块401,获取用户对于目标任务问题的回答文本,所述目标任务问题用于预测所述用户在目标任务上的需求;所述目标任务问题包括至少一个可选实体;
[0112]
提取模块402,从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段;
[0113]
确定模块403,分别确定所述关键字段与所述至少一个可选实体的属性字段是否匹配;
[0114]
执行模块404,如果所述关键字段与任意一个可选实体的属性字段匹配,则将属性字段与所述关键字段匹配的可选实体确定为目标实体,并基于所述目标实体执行所述目标任务。
[0115]
在本实施例中,所述提取模块402:
[0116]
将所述回答文本输入至训练完成的序列标注模型,以由所述序列标注模型对所述回答文本进行序列标注,并基于序列标注结果从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段。
[0117]
在本实施例中,所述提取模块402:
[0118]
基于命名实体识别算法,从所述回答文本中提取出用于指示与所述目标任务对应的实体的关键字段。
[0119]
在本实施例中,所述确定模块403:
[0120]
分别计算所述关键字段与所述至少一个可选实体的属性字段的相似度,并确定计算得到的所述相似度是否大于预设阈值;
[0121]
如果所述关键字段与任意一个可选实体的属性字段的相似度大于所述阈值,则确定所述关键字段与所述相似度大于所述阈值的可选实体的属性字段匹配。
[0122]
在本实施例中,所述执行模块404:
[0123]
如果存在所述相似度大于所述阈值的一个可选实体,则将所述可选实体确定为目标实体;
[0124]
如果存在所述相似度大于所述阈值的多个可选实体,则将所述相似度最大的可选实体确定为目标实体。
[0125]
在本实施例中,所述确定模块403:
[0126]
将所述关键字段和所述至少一个可选实体的属性字段转换为词向量;
[0127]
基于所述词向量,分别计算所述关键字段与所述至少一个可选实体的属性字段的向量相似度,并将计算得到的所述向量相似度确定为所述关键字段与所述至少一个可选实体的属性字段的相似度。
[0128]
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
[0129]
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0130]
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
[0131]
在一个典型的配置中,计算机包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0132]
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
[0133]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0134]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0135]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0136]
在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出
项目的任何或所有可能组合。
[0137]
应当理解,尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
[0138]
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献