一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

实体比较及模型训练方法、装置、设备、计算机存储介质与流程

2021-11-26 22:34:00 来源:中国专利 TAG:


1.本技术涉及但不限于人工智能领域,尤其涉及一种实体比较及模型训练方法、装置、设备、计算机可读存储介质。


背景技术:

2.近些年来,随着知识图谱技术的发展,实体比较或实体匹配技术被大量用于知识图谱的构建中,旨在确认给定的两个实体是否为同一实体,若为同一实体则进行融合。相关技术中,在解决实体比较或实体匹配问题上,主要通过属性相似度聚合的方法,或先利用属性构建向量表示,再结合传统机器学习模型或深度学习模型对向量表示进一步编码,将实体比较任务作为一个分类问题来解决。但上述解决方案大多都是针对垂类实体或单一实体类型的比较任务,很难泛化到不同实体类型上,针对不同实体类型的场景,往往都需要进行单独模型的构建与训练,较为耗时,难以支持大量不同实体类型的实体消歧需求。


技术实现要素:

3.本技术实施例提供一种实体比较及模型训练方法、装置、设备、计算机可读存储介质,能够实现通用实体的比较任务,进而可以提高实体消歧任务的迭代效率,还能在一定程度上提高实体比较的准确性,并且处理过程可解释。
4.本技术实施例的技术方案是这样实现的:
5.本技术实施例提供一种实体比较方法,包括:
6.分别获取待比较的第一实体和第二实体的属性信息以及类型信息;
7.基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;
8.基于所述第一实体的类型信息和所述第二实体的类型信息,以及第一注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;
9.基于所述关联度分布特征和所述重要度分布特征,确定所述第一实体与所述第二实体是否相同。
10.本技术实施例提供一种模型训练方法,用于对实体比较模型进行训练,训练得到的所述实体比较模型用于对内容服务中的实体对进行比较,包括:
11.获取样本实体对以及用于标注所述样本实体对中第一样本实体和第二样本实体是否相同的标注结果;
12.将所述样本实体对输入至待训练的实体比较模型;所述实体比较模型用于分别获取所述第一样本实体和所述第二样本实体的属性信息以及类型信息;基于所述第一样本实体的属性信息和所述第二样本实体的属性信息,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间的关联度分布特征;基于所述第一样本实体的类型信息和所述第
二样本实体的类型信息,以及第一注意力分布参数,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;基于所述关联度分布特征和所述重要度分布特征,确定表征所述第一样本实体与所述第二样本实体是否相同的预测结果;
13.基于所述预测结果和所述标注结果,对所述实体比较模型的参数进行调整,以得到已训练的实体比较模型。
14.本技术实施例提供一种实体比较装置,包括:
15.第一获取模块,用于分别获取待比较的第一实体和第二实体的属性信息以及类型信息;
16.第一确定模块,用于基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;
17.第二确定模块,用于基于所述第一实体的类型信息和所述第二实体的类型信息,以及第一注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;
18.第三确定模块,用于基于所述关联度分布特征和所述重要度分布特征,确定所述第一实体与所述第二实体是否相同。
19.在一些实施例中,所述第三确定模块还用于:对所述关联度分布特征和所述重要度分布特征进行特征融合处理,得到所述第一实体的各属性与所述第二实体的各属性之间的重要关联度分布特征;对所述重要关联度分布特征进行分类处理,得到表征所述第一实体与所述第二实体是否相同的分类结果;基于所述分类结果,确定所述第一实体与所述第二实体是否相同。
20.在一些实施例中,所述第一确定模块还用于:基于所述第一实体的属性信息和所述第二实体的属性信息,以及第二注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;所述第二注意力分布参数表征所述第一实体的各属性与所述第二实体的各属性之间可比性的注意力分布情况。
21.在一些实施例中,所述关联度分布特征包括所述第一实体的每一属性与所述第二实体的每一属性之间的关联度,所述第一确定模块还用于:基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的每一属性和所述第二实体的每一属性;针对所述第一实体的每一属性,基于所述第二注意力分布参数,确定所述属性的每一属性值与所述第二实体的每一属性的每一属性值之间的关联度;基于所述第一实体的每一属性的每一属性值与所述第二实体的每一属性的每一属性值之间的关联度,确定所述第一实体的每一属性与所述第二实体的每一属性之间的关联度。
22.在一些实施例中,所述第一确定模块还用于:针对每一组第一实体的属性和第二实体的属性,将所述第一实体的属性的每一属性值与所述第二实体的属性的每一属性值之间的关联度中的最大值,确定为所述第一实体的属性和所述第二实体的属性之间的关联度。
23.在一些实施例中,所述第一实体的属性信息包括第一属性张量,所述第二实体的属性信息包括第二属性张量,所述第二注意力分布参数包括属性注意力张量,所述第一属
性张量和所述第二属性张量均为形状为k*n*d1的三维张量,所述属性注意力张量为形状为k*n*n的三维张量,其中,k为预设的属性数量最大值,n为预设的属性值数量最大值,d1为预设的属性值的表征向量的维度。
24.在一些实施例中,所述第二确定模块还用于:对所述第一实体的类型信息和所述第二实体的类型信息进行关联处理,得到所述第一实体的每一实体类型和所述第二实体的每一实体类型之间的关联度;基于所述第一实体的每一实体类型与所述第二实体的每一实体类型之间的关联度,确定所述第一实体的每一实体类型与所述第二实体之间的关联度;基于所述第一实体的每一实体类型与所述第二实体之间的关联度,以及所述第一注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征。
25.在一些实施例中,所述第二确定模块还用于:针对每一所述第一实体的实体类型,将所述第一实体的实体类型与所述第二实体的每一实体类型之间的关联度中的最大值,确定为所述第一实体的实体类型与所述第二实体之间的关联度。
26.在一些实施例中,所述第一实体的类型信息包括第一类型矩阵,所述第二实体的类型信息包括第二类型矩阵,所述第一注意力分布参数包括类型注意力张量,所述第一类型矩阵和所述第二类型矩阵的形状均为t*d2,所述类型注意力张量为形状为t*k*k的三维张量,其中,t为当前知识图谱中实体类型的总量,d2为预设的实体类型的表征向量的维度,k为预设的属性数量最大值。
27.在一些实施例中,所述装置还包括:第二获取模块,用于获取样本实体对以及用于标注所述样本实体对中第一样本实体和第二样本实体是否相同的标注结果;第三获取模块,用于分别获取所述第一样本实体和所述第二样本实体的属性信息以及类型信息;第四确定模块,用于基于所述第一样本实体的属性信息和所述第二样本实体的属性信息,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间的关联度分布特征;第五确定模块,用于基于所述第一样本实体的类型信息和所述第二样本实体的类型信息,以及第一注意力分布参数,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;第六确定模块,用于基于所述关联度分布特征和所述重要度分布特征,确定表征所述第一样本实体与所述第二样本实体是否相同的预测结果;第一调整模块,用于基于所述预测结果和所述标注结果,对所述第一注意力分布参数进行调整。
28.本技术实施例提供一种模型训练装置,用于对实体比较模型进行训练,训练得到的所述实体比较模型用于对内容服务中的实体对进行比较,所述装置包括:
29.第四获取模块,用于获取样本实体对以及用于标注所述样本实体对中第一样本实体和第二样本实体是否相同的标注结果;
30.比较模块,用于:将所述样本实体对输入至待训练的实体比较模型;所述实体比较模型用于分别获取所述第一样本实体和所述第二样本实体的属性信息以及类型信息;基于所述第一样本实体的属性信息和所述第二样本实体的属性信息,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间的关联度分布特征;基于所述第一样本实体的类型信息和所述第二样本实体的类型信息,以及第一注意力分布参数,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间关联度的重要度分布特征;所述第一注意力
分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;基于所述关联度分布特征和所述重要度分布特征,确定表征所述第一样本实体与所述第二样本实体是否相同的预测结果;
31.第二调整模块,用于基于所述预测结果和所述标注结果,对所述实体比较模型的参数进行调整,以得到已训练的实体比较模型。
32.本技术实施例提供一种实体比较设备,包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现本技术实施例提供的实体比较方法。
33.本技术实施例提供一种模型训练设备,包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现本技术实施例提供的模型训练方法。
34.本技术实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本技术实施例提供的方法。
35.本技术实施例具有以下有益效果:
36.首先,分别获取待比较的第一实体和第二实体的属性信息以及类型信息;其次,基于第一实体的属性信息和第二实体的属性信息,确定第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;然后,基于第一实体的类型信息和第二实体的类型信息,以及第一注意力分布参数,确定第一实体的各属性与第二实体的各属性之间关联度的重要度分布特征;第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;最后,基于关联度分布特征和重要度分布特征,确定第一实体与第二实体是否相同。这样,在进行实体比较时,综合考虑了属性信息以及类型信息,可以基于注意力机制,针对不同实体类型重点关注不同的属性,从而可以实现通用实体的比较任务,满足不同实体类型消歧任务的需要,并能在一定程度上提高实体比较的准确性,进而能够在一定程度上提高实体消歧任务的迭代效率,并且处理过程可解释。
附图说明
37.图1是本技术实施例提供的实体比较系统的一个可选的架构示意图;
38.图2a是本技术实施例提供的实体比较设备的一个可选的结构示意图;
39.图2b是本技术实施例提供的模型训练设备的一个可选的结构示意图;
40.图3是本技术实施例提供的实体比较方法的一个可选的流程示意图;
41.图4是本技术实施例提供的实体比较方法的一个可选的流程示意图;
42.图5是本技术实施例提供的实体比较方法的一个可选的流程示意图;
43.图6是本技术实施例提供的实体比较方法的一个可选的流程示意图;
44.图7是本技术实施例提供的实体比较方法的一个可选的流程示意图;
45.图8是本技术实施例提供的模型训练方法的一个可选的流程示意图;
46.图9是本技术实施例提供的一种实体比较方法的实现架构示意图。
具体实施方式
47.为了使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术作进一步地详细描述,所描述的实施例不应视为对本技术的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
48.在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
49.如果申请文件中出现“第一/第二”的类似描述则增加以下的说明,在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本技术实施例能够以除了在这里图示或描述的以外的顺序实施。
50.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。
51.对本技术实施例进行进一步详细说明之前,对本技术实施例中涉及的名词和术语进行说明,本技术实施例中涉及的名词和术语适用于如下的解释。
52.1)知识图谱:知识图谱(knowledge graph)本质上是一种大规模语义网络(semantic network),富含实体(entity)、概念(concept)、属性(attribute)以及各种语义关系(relationship)。
53.2)实体:指的是存储于知识图谱中的现实世界中的事物,比如人、地名、概念、药物、公司等。
54.3)实体类型:知识图谱中的实体都对应着一个实体类型,实体类型可以看作是实体的概括性归类。一个实体类型可以包括多个实体。如:实体“玫瑰花”的实体类型为“植物类”;又如,实体“冰箱”的实体类型为“家电类”。
55.4)属性:实体类型的一个用于描述实体的特征或特点,例如,“个人”实体类型具有“生日”属性。一个实体类型可以对应多种属性,不同的实体类型对应的属性差异较大,如:“植物类”实体类型下的各个实体通常具有“界”、“门”、“纲”、“目”等属性,而“电影类”实体类型下的各个实体通常具有“上映日期”、“时长”、“电影类型”等属性。
56.5)实体消岐:一个实体指称项可对应到多个真实世界中的实体,从而导致实体的歧义问题,例如乔丹可以表示篮球运动员,也可以表示计算机科学家,或者其他实体。实体消岐是指消除实体指称不明的问题,确定一个实体指称项所指向的真实世界的实体。在实现实体消岐需求时,可以通过比较指定的两个实体是否为同一实体,若为同一实体则将这两个实体进行融合,从而可以实现实体消岐。
57.6)通用实体比较:指的是不区分实体类别,可支持任意类别实体进行比较的方法。
58.本技术实施例提供一种实体比较及模型训练方法、装置、设备和计算机可读存储介质,能够在进行实体比较时,综合考虑了属性信息以及类型信息,可以基于注意力机制,针对不同实体类型重点关注不同的属性,从而可以实现通用实体的比较任务,满足不同实体类型消歧任务的需要,进而可以在一定程度上提高实体消歧任务的迭代效率,并且处理过程可解释。下面说明本技术实施例提供的实体比较设备及模型训练设备的示例性应用,本技术实施例提供的实体比较设备和模型训练设备均为电子设备,可以实施为笔记本电脑,平板电脑,台式计算机,车载导航仪,机顶盒,移动设备(例如,移动电话,便携式音乐播放器,个人数字助理,专用消息设备,便携式游戏设备)等各种类型的用户终端,也可以实施为服务器。下面,将说明本技术实施例提供的电子设备实施为服务器时的示例性应用。
59.参见图1,图1是本技术实施例提供的实体比较系统100的一个可选的架构示意图,可以实现对待比较的实体对进行比较的任务,终端(示例性示出了终端400

1和终端400

2)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。
60.终端用于:在图形界面(示例性示出了图形界面410

1和图形界面410

2)显示用户进行实体比较的交互界面,接收用户的针对待比较的实体对进行的实体比较操作,并向服务器200发送待比较的实体对。
61.服务器200用于:分别获取待比较的第一实体和第二实体的属性信息以及类型信息;基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;基于所述第一实体的类型信息和所述第二实体的类型信息,以及第一注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;基于所述关联度分布特征和所述重要度分布特征,确定所述第一实体与所述第二实体是否相同。
62.或者,服务器200用于:获取样本实体对以及用于标注所述样本实体对中第一样本实体和第二样本实体是否相同的标注结果;将所述样本实体对输入至待训练的实体比较模型;所述实体比较模型用于分别获取所述第一样本实体和所述第二样本实体的属性信息以及类型信息;基于所述第一样本实体的属性信息和所述第二样本实体的属性信息,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间的关联度分布特征;基于所述第一样本实体的类型信息和所述第二样本实体的类型信息,以及第一注意力分布参数,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;基于所述关联度分布特征和所述重要度分布特征,确定表征所述第一样本实体与所述第二样本实体是否相同的预测结果;基于所述预测结果和所述标注结果,对实体比较模型的参数进行调整,以得到已训练的实体比较模型。
63.此外,本技术实施例涉及的实体比较系统也可以是应用于区块链系统的分布式系统,服务器200可以实施为区块链上的节点。该分布式系统可以是由多个节点和客户端形成的分布式节点,节点可以是接入网络中的任意形式的计算设备,如服务器、用户终端等,节点之间形成点对点(p2p,peer to peer)网络。
64.在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是地图数据自动采集车、智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本发明实施例中不做限制。
65.参见图2a,图2a是本技术实施例提供的实体比较设备的结构示意图,图2a所示的实体比较设备包括:至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。实体比较设备中的各个组件通过总线系统240耦合在一起。可理解,总线系统240用于实现这些组件之间的连接通信。总线系统240除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2a中将各种总线都标为总线系统240。
66.处理器210可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(dsp,digital signal processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
67.用户接口230包括使得能够呈现媒体内容的一个或多个输出装置231,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口230还包括一个或多个输入装置232,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
68.存储器250可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。
69.存储器250包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(rom,read only me

mory),易失性存储器可以是随机存取存储器(ram,random access memor

y)。本技术实施例描述的存储器250旨在包括任意适合类型的存储器。
70.在一些实施例中,存储器250能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
71.操作系统251,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
72.网络通信模块252,用于经由一个或多个(有线或无线)网络接口220到达其他计算设备,示例性的网络接口220包括:蓝牙、无线相容性认证(wifi)、和通用串行总线(usb,universal serial bus)等;
73.呈现模块253,用于经由一个或多个与用户接口230相关联的输出装置231(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
74.输入处理模块254,用于对一个或多个来自一个或多个输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
75.在一些实施例中,本技术实施例提供的实体比较装置可以采用软件方式实现,图2a示出了存储在存储器250中的实体比较装置255,其可以是程序和插件等形式的软件,包括以下软件模块:第一获取模块2551、第一确定模块2552、第二确定模块2553和第三确定模块2554,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。
76.将在下文中说明各个模块的功能。
77.在另一些实施例中,本技术实施例提供的实体比较装置可以采用硬件方式实现,作为示例,本技术实施例提供的实体比较装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本技术实施例提供的实体比较方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(asic,application specific integrated circuit)、dsp、可编程逻辑器件(pld,programmable logic device)、复杂可编程逻辑器件(cpld,complex programmable logic device)、现场可编程门阵列(fpga,field

programmable gate array)或其他电子元件。
78.参见图2b,图2b是本技术实施例提供的模型训练设备的结构示意图,图2b所示的模型训练设备包括:至少一个处理器310、存储器350、至少一个网络接口320和用户接口330。模型训练设备中的各个组件通过总线系统340耦合在一起。可理解,总线系统340用于实现这些组件之间的连接通信。总线系统340除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2b中将各种总线都标为总线系统340。
79.处理器310可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(dsp,digital signal processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
80.用户接口330包括使得能够呈现媒体内容的一个或多个输出装置331,包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口330还包括一个或多个输入装置332,包括有助于用户输入的用户接口部件,比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。
81.存储器350可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器350可选地包括在物理位置上远离处理器310的一个或多个存储设备。
82.存储器350包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(rom,read only memory),易失性存储器可以是随机存取存储器(ram,random access memory)。本技术实施例描述的存储器350旨在包括任意适合类型的存储器。
83.在一些实施例中,存储器350能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
84.操作系统351,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
85.网络通信模块352,用于经由一个或多个(有线或无线)网络接口320到达其他计算设备,示例性的网络接口320包括:蓝牙、wifi和usb等;
86.呈现模块353,用于经由一个或多个与用户接口330相关联的输出装置331(例如,显示屏、扬声器等)使得能够呈现信息(例如,用于操作外围设备和显示内容和信息的用户接口);
87.输入处理模块354,用于对一个或多个来自一个或多个输入装置332之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。
88.在一些实施例中,本技术实施例提供的模型训练装置可以采用软件方式实现,图2b示出了存储在存储器350中的模型训练装置355,其可以是程序和插件等形式的软件,包括以下软件模块:第四获取模块3551、比较模块3552和第二调整模块3553,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。
89.将在下文中说明各个模块的功能。
90.在另一些实施例中,本技术实施例提供的模型训练装置可以采用硬件方式实现,作为示例,本技术实施例提供的模型训练装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本技术实施例提供的模型训练方法,例如,硬件译码处理器形式的处理器
可以采用一个或多个asic、dsp、pld,、复杂cpld、fpga或其他电子元件。
91.下面将结合本技术实施例提供的终端或服务器的示例性应用和实施,说明本技术实施例提供的实体比较方法。
92.参见图3,图3是本技术实施例提供的实体比较方法的一个可选的流程示意图,下面将结合图3示出的步骤进行说明,下述步骤的执行主体可以是前文的终端或服务器。
93.在步骤s101中,分别获取待比较的第一实体和第二实体的属性信息以及类型信息。
94.这里,待比较的第一实体和第二实体是需要判断是否为同一实体的两个实体。两个实体指代现实世界中的同一事物时,这两个实体即为同一实体。在实施时,第一实体和第二实体可以是任意合适领域中的实体,例如内容服务中的实体、医学领域中的实体、互联网中的实体、教育领域中的实体等。
95.第一实体的属性信息和类型信息以及第二实体的属性信息和类型信息,可以从现有的知识图谱中获取,也可以通过网络爬虫从网络中抓取的实体数据中获取。例如,可以通过网络爬虫抓取网络中各个实体的非结构化数据,并从抓取的非结构化数据中获取第一实体的属性信息和类型信息以及第二实体的属性信息和类型信息,抓取非结构化数据的数据源可以包括但不限于具有实体的基本描述数据的网站,比如百科类、论坛类网站等。在构建或更新知识图谱的过程中,由于同一实体在不同的数据源中的描述可能存在差异,因此,可以对指向同一实体的多个待比较实体进行融合处理,以实现实体的消歧。
96.实体的属性信息可以包括该实体的至少一个实体属性,每一实体属性可以包括至少一个属性值。例如,若存在一个实体为“腾讯”,该实体对应的实体属性可以包括:“公司名”,对应的属性值可以为“腾讯”;“地址”,对应的属性值可以包括“地址1”、“地址2”等。在实施时,实体的属性信息可以采用文本、向量、矩阵、张量等任意合适的方式进行表示,这里并不限定。
97.实体的类型信息可以包括该实体所关联的至少一个实体类型。例如,若存在一个实体为“战狼”,该实体对应的实体类型可以包括“泛娱乐”、“电影”、“动作片”。又如,对于实体“冰箱”,对应的实体类型可以包括“电器”、“家电类”等。在实施时,实体的类型信息可以采用文本、向量、矩阵、张量等任意合适的方式进行表示,这里并不限定。
98.在步骤s102中,基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征。
99.这里,第一实体的各属性与第二实体的各属性之间的关联度分布特征为表征第一实体的每一属性与第二实体的每一属性之间的关联关系的特征,属性与属性之间的关联关系可以包括但不限于属性之间的相似度、逻辑关联等任意可以表征第一实体和第二实体在属性层面的相关性的信息中的一种或多种。在实施时,可以从实体的属性信息中获取实体的每一属性,通过确定第一实体的每一属性与第二实体的每一属性之间的关联关系,来确定第一实体的各属性与第二实体的各属性之间的关联度分布特征。例如,可以计算第一实体的每一属性与第二实体的每一属性之间的相似度,第一实体的各属性与第二实体的各属性之间的关联度分布特征可以包括第一实体的每一属性与第二实体的每一属性之间的相似度。
100.在步骤s103中,基于所述第一实体的类型信息和所述第二实体的类型信息,以及
第一注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况。
101.这里,第一注意力分布参数可以表征不同实体类型对的各属性之间关联度的注意力分布情况,可以包括在进行实体比较时,需要对不同实体类型对的各属性之间的关联度所采用的注意力,因而,第一注意力分布参数可以反映在实体比较的过程中不同实体类型对的每一属性之间的关联度的重要程度的分布情况。不同的实体类型对可以包括当前知识图谱中或当前抓取的实体类型中的任意实体类型所组成的部分或全部实体类型对。在实施时,第一注意力分布参数可以是预先设定的,或者预先采用任意合适的初始化方式进行初始化得到的,也可以是预先训练得到的,这里并不限定。
102.第一实体的各属性与第二实体的各属性之间关联度的重要度分布特征为表征第一实体的每一属性与第二实体的每一属性之间关联度的重要性的特征。在实施时,可以从实体的类型信息中获取实体所关联的每一类型,由于第一注意力分布参数可以表征不同实体类型对的各属性之间关联度的注意力分布情况,因此,在确定第一实体和第二实体所关联的类型后,可以基于第一注意力分布参数,来确定第一实体的每一属性与第二实体的每一属性之间关联度的重要性,从而得到第一实体的各属性与第二实体的各属性之间关联度的重要度分布特征。
103.在步骤s104中,基于所述关联度分布特征和所述重要度分布特征,确定所述第一实体与所述第二实体是否相同。
104.这里,由于关联度分布特征可以表征第一实体的每一属性与第二实体的每一属性之间的关联关系,重要度分布特征可以表征第一实体的每一属性与第二实体的每一属性之间关联度的重要性,因此,基于关联度分布特征和重要度分布特征可以确定第一实体与第二实体是否相同。在实施时,可以基于该关联度分布特征和该重要度分布特征,采用任意合适的方式,确定第一实体与第二实体是否相同,这里并不限定。例如,可以基于预设的比较条件,通过判断关联度分布特征和重要度分布特征是否满足该比较条件,来确定第一实体与第二实体是否相同,还可以采用任意合适的分类模型,对关联度分布特征和重要度分布特征进行分类,得到表征第一实体与第二实体是否相同的分类结果。
105.在一些实施例中,所述第一实体的属性信息包括第一属性张量,所述第二实体的属性信息包括第二属性张量,所述第一属性张量和所述第二属性张量均为形状为k*n*d1的三维张量,其中,k为预设的属性数量最大值,n为预设的属性值数量最大值,d1为预设的属性值的表征向量的维度。在实施时,可以根据预先设置的k、n和d1,对第一实体的属性信息以及第二实体的属性信息进行建模,得到第一属性张量和第二属性张量。例如,若k为3,n为4,d1为3,则第一属性张量和第二属性张量可以分别为一个形状为3*4*3的三维张量。这样,利用三维张量表征实体的属性信息,可以区分多值属性的不同属性值,从而可以增强灵活处理多值属性的能力。
106.在一些实施例中,所述第一实体的类型信息包括第一类型矩阵,所述第二实体的类型信息包括第二类型矩阵,所述第一注意力分布参数包括类型注意力张量,所述第一类型矩阵和所述第二类型矩阵的形状均为t*d2,所述类型注意力张量为形状为t*k*k的三维张量,其中,t为当前知识图谱中实体类型的总量,d2为预设的实体类型的表征向量的维度,
k为预设的属性数量最大值。在实施时,可以根据预先设置的t、k和d2,对第一实体的类型信息、第二实体的类型信息以及第一注意力分布参数进行建模,得到第一类型矩阵、第二类型矩阵以及类型注意力张量。例如,若t为5,k为3,d1为3,第一类型矩阵和第二类型矩阵可以分别为一个形状为5*3的矩阵,类型注意力张量可以为一个形状为5*3*3的三维张量。
107.在一些实施例中,本技术实施例提供的实体比较方法可以用于对内容服务中的实体对进行比较。内容服务可以是指通过各种方式向用户运送信息内容,包括但不限于通过电视台传送节目,通过互联网传输新闻看点、经济、娱乐、科技、文化等内容,通过无线移动电话传送各种信息等中的一种或多种。实体对中包括待比较的第一实体和第二实体,第一实体和第二实体可以是内容服务中任意类型的实体,例如,通过电视台传送的节目,互联网传输的内容等。第一实体和第二实体可以是相同类型的,也可以是不同类型的。
108.本技术实施例中,首先,分别获取待比较的第一实体和第二实体的属性信息以及类型信息;其次,基于第一实体的属性信息和第二实体的属性信息,确定第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;然后,基于第一实体的类型信息和第二实体的类型信息,以及第一注意力分布参数,确定第一实体的各属性与第二实体的各属性之间关联度的重要度分布特征;第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;最后,基于关联度分布特征和重要度分布特征,确定第一实体与第二实体是否相同。这样,在进行实体比较时,综合考虑了属性信息以及类型信息,可以基于注意力机制,针对不同实体类型重点关注不同的属性,从而可以实现通用实体的比较任务,满足不同实体类型消歧任务的需要,并能在一定程度上提高实体比较的准确性,进而能够在一定程度上提高实体消歧任务的迭代效率,并且处理过程可解释。
109.在一些实施例中,参见图4,图4是本技术实施例提供的实体比较方法的一个可选的流程示意图,基于图3,图3中示出的步骤s104可以通过如下步骤s401至步骤s403实现,下面将结合各步骤进行说明,下述步骤的执行主体可以是前文的终端或服务器。
110.在步骤s401中,对所述关联度分布特征和所述重要度分布特征进行特征融合处理,得到所述第一实体的各属性与所述第二实体的各属性之间的重要关联度分布特征。
111.这里,第一实体的各属性与第二实体的各属性之间的重要关联度分布特征可以反映第一实体与第二实体的重要属性之间的关联度的分布情况。在实施时,可以根据实际情况采用合适的方式对关联度分布特征和重要度分布特征进行特征融合处理,以利用重要度分布特征从关联度分布特征中提取出第一实体的各属性与所述第二实体的各属性之间的重要关联度分布特征。例如,可以利用重要度分布特征中第一实体的每一属性与第二实体的每一属性之间关联度的重要度,分别与关联度分布特征中第一实体的对应属性与第二实体的对应属性之间的关联度相乘,得到第一实体的各属性与第二实体的各属性之间的重要关联度分布特征。
112.在步骤s402中,对所述重要关联度分布特征进行分类处理,得到表征所述第一实体与所述第二实体是否相同的分类结果。
113.这里,可以采用任意合适的分类算法对重要关联度分布特征进行分类处理,分类算法可以包括但不限于k近邻(k

nearest neighbor,knn)分类算法、支持向量机(support vector machine,svm)算法、贝叶斯算法、逻辑回归算法等中的一种或多种。分类结果可以包括第一实体与第二实体相同的概率和第一实体与第二实体不同的概率,分类结果也可以
包括第一实体与第二实体之间的相似度得分,分类结果也可以包括第一实体与第二实体相同的结果或者第一实体与第二实体不同的结果。
114.在步骤s403中,基于所述分类结果,确定所述第一实体与所述第二实体是否相同。
115.这里,分类结果可以表征第一实体与所述第二实体是否相同,基于分类结果,可以确定第一实体与所述第二实体是否相同。在实施时,可以根据实际情况,采用合适的方式确定第一实体与第二实体是否相同,这里并不限定。例如,若分类结果包括第一实体与第二实体相同的概率和第一实体与第二实体不同的概率,则可以在第一实体与第二实体相同的概率大于第一实体与第二实体不同的概率的情况下,确定第一实体与第二实体相同,反之,确定第一实体与第二实体不同。又如,若分类结果包括第一实体与第二实体之间的相似度得分,则可以在相似度得分大于预设的得分阈值的情况下,确定第一实体与第二实体相同,反之,确定第一实体与第二实体不同。
116.本技术实施例中,对关联度分布特征和重要度分布特征进行特征融合处理,得到第一实体的各属性与第二实体的各属性之间的重要关联度分布特征,并对重要关联度分布特征进行分类处理,得到表征第一实体与所述第二实体是否相同的分类结果,基于分类结果,确定第一实体与所述第二实体是否相同。这样,可以方便快捷地基于关联度分布特征和重要度分布特征确定第一实体与所述第二实体是否相同。此外,由于第一实体的各属性与第二实体的各属性之间的重要关联度分布特征中包含了第一实体与第二实体的重要属性之间的关联度,基于该重要属性之间的关联度,确定第一实体与第二实体是否相同,可以进一步提高实体比较的准确性。
117.在一些实施例中,参见图5,图5是本技术实施例提供的实体比较方法的一个可选的流程示意图,基于图3,图3中示出的步骤s102可以通过如下步骤s501实现,下面将结合各步骤进行说明,下述步骤的执行主体可以是前文的终端或服务器。
118.在步骤s501中,基于所述第一实体的属性信息和所述第二实体的属性信息,以及第二注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;所述第二注意力分布参数表征所述第一实体的各属性与所述第二实体的各属性之间可比性的注意力分布情况。
119.这里,第二注意力分布参数可以表征第一实体的各属性与所述第二实体的各属性之间可比性的注意力分布情况,可以包括在进行实体比较时,需要对第一实体的每一属性与第二实体的每一属性之间进行比较时所采用的注意力。由于不同的属性与属性之间具有不同的可比性,因而,可以根据两个属性之间的可比性确定针对两个属性进行比较时所采用的注意力。在实施时,第二注意力分布参数可以是预先设定的,或者预先采用任意合适的初始化方式进行初始化得到的,也可以是预先训练得到的,这里并不限定。本领域技术人员可以根据实际情况采用合适的方式基于第一实体的属性信息和第二实体的属性信息,以及第二注意力分布参数,确定第一实体的各属性与第二实体的各属性之间的关联度分布特征。例如,可以在基于第一实体的属性信息和第二实体的属性信息,确定第一实体的各属性与第二实体的各属性之间的关联度分布特征的基础上,利用第二注意力分布参数,对确定的关联度分布特征进行调整,得到最终的关联度分布特征。又如,可以利用第二注意力分布参数分别对第一实体的属性信息和第二实体的属性信息进行特征提取,得到第一实体的重点属性信息和第二实体的重点属性信息,进而确定第一实体的各属性与第二实体的各属性
之间的关联度分布特征。
120.在一些实施例中,所述关联度分布特征包括所述第一实体的每一属性与所述第二实体的每一属性之间的关联度,上述步骤s501可以通过如下步骤s511至步骤s513实现:
121.在步骤s511中,基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的每一属性和所述第二实体的每一属性。
122.这里,第一实体的属性信息中可以包括第一实体的至少一个属性。第二实体的属性信息中可以包括第二实体的至少一个属性。
123.在步骤s512中,针对所述第一实体的每一属性,基于所述第二注意力分布参数,确定所述属性的每一属性值与所述第二实体的每一属性的每一属性值之间的关联度。
124.这里,实体的每一属性可以包括至少一个属性值,通过比较第一实体的每一属性的每一属性值与第二实体的每一属性的每一属性值,可以得到第一实体的每一属性的每一属性值与第二实体的每一属性的每一属性值之间的关联度。在一些实施例中,可以计算第一实体的每一属性的每一属性值与第二实体的每一属性的每一属性值之间的相似度,作为第一实体的每一属性的每一属性值与第二实体的每一属性的每一属性值之间的关联度。
125.在步骤s513中,基于所述第一实体的每一属性的每一属性值与所述第二实体的每一属性的每一属性值之间的关联度,确定所述第一实体的每一属性与所述第二实体的每一属性之间的关联度。
126.这里,第一实体的每一属性与第二实体的每一属性之间的关联度,可以由第一实体的相应属性的每一属性值与第二实体的相应属性的每一属性值之间的关联度确定。例如,针对待比较的第一实体的第一属性和第二实体的第二属性,可以分别计算第一属性的每一属性值与第二属性的每一属性值之间的关联度,并基于第一属性的每一属性值与第二属性的每一属性值之间的关联度确定第一属性与第二属性之间的关联度。在一些实施例中,可以将第一属性的每一属性值与第二属性的每一属性值之间的关联度之和确定为第一属性与第二属性之间的关联度。在一些实施例中,可以将第一属性的每一属性值与第二属性的每一属性值之间的关联度中的最大值,确定为第一属性与第二属性之间的关联度。在实施时,可以基于第一实体的每一属性的每一属性值与第二实体的每一属性的每一属性值之间的关联度,采用任意合适的池化算法(如最大池化算法等)或多头融合算法等,确定第一实体的每一属性与第二实体的每一属性之间的关联度,这里并不限定。这样,在进行实体比较时,能对多值属性的多个属性值进行针对性处理,从而可以能在一定程度上提高实体比较的准确性,并能使得处理过程可解释。
127.在一些实施例中,上述步骤s513可以通过如下步骤s521实现:
128.步骤s521,针对每一组第一实体的属性和第二实体的属性,将所述第一实体的属性的每一属性值与所述第二实体的属性的每一属性值之间的关联度中的最大值,确定为所述第一实体的属性和所述第二实体的属性之间的关联度。
129.这里,将第一实体的属性的每一属性值与第二实体的属性的每一属性值之间的关联度中的最大值,确定为第一实体的属性和第二实体的属性之间的关联度。在实施时,可以采用最大池化算法确定为第一实体的属性和第二实体的属性之间的关联度。例如,若每一属性的最大属性值数量为n,则第一实体的属性的每一属性值与第二实体的属性的每一属性值之间的关联度可以是一个n*n的矩阵,可以选取每一矩阵中值最大的元素作为第一实
体的相应属性和第二实体的相应属性之间的关联度。
130.在一些实施例中,所述第一实体的属性信息包括第一属性张量,所述第二实体的属性信息包括第二属性张量,所述第二注意力分布参数包括属性注意力张量,所述第一属性张量和所述第二属性张量均为形状为k*n*d1的三维张量,所述属性注意力张量为形状为k*n*n的三维张量,其中,k为预设的属性数量最大值,n为预设的属性值数量最大值,d1为预设的属性值的表征向量的维度。在实施时,可以根据预先设置的k、n和d1,对第一实体的属性信息、第二实体的属性信息以及第二注意力分布参数进行建模,得到第一属性张量、第二属性张量以及属性注意力张量。例如,若k为3,n为4,d1为3,则第一属性张量和第二属性张量可以分别为一个形状为3*4*3的三维张量,属性注意力张量可以为形状为3*4*4的三维张量。
131.本技术实施例中,基于第一实体的属性信息和第二实体的属性信息,以及第二注意力分布参数,确定第一实体的各属性与第二实体的各属性之间的关联度分布特征。这样,由于第二注意力分布参数可以反映第一实体的各属性与第二实体的各属性之间的可比性,从而得到的关联度分布特征可以更好地反映第一实体的每一属性与第二实体的每一属性之间的关联度,从而可以进一步提升实体比较的准确性。
132.在一些实施例中,参见图6,图6是本技术实施例提供的实体比较方法的一个可选的流程示意图,基于图3,上述步骤s103可以通过如下步骤s601至步骤s603实现,下面将结合各步骤进行说明,下述步骤的执行主体可以是前文的终端或服务器。
133.在步骤s601中,对所述第一实体的类型信息和所述第二实体的类型信息进行关联处理,得到所述第一实体的每一实体类型和所述第二实体的每一实体类型之间的关联度;
134.这里,第一实体的类型信息中可以包括至少一个实体类型,第二实体的类型信息中可以包括至少一个实体类型。对第一实体的每一实体类型和第二实体的每一实体类型进行关联处理,可以将第一实体的每一实体类型和第二实体的每一实体类型之间的进行关联,并得到相应的关联度。在实施时,关联处理可以是本领域技术人员根据实际情况确定的,这里并不限定。例如,关联处理可以是第一实体的每一实体类型的表征向量与第二实体的每一实体类型的表征向量进行求和、求积等一种或多种向量运算,运算的结果可以作为第一实体的每一实体类型和第二实体的每一实体类型之间的关联度。又如,关联处理可以是描述第一实体的每一实体类型的文本信息与描述第二实体的每一实体类型的文本信息之间的相似度计算,得到的相似度可以作为第一实体的每一实体类型和第二实体的每一实体类型之间的关联度。
135.在步骤s602中,基于所述第一实体的每一实体类型与所述第二实体的每一实体类型之间的关联度,确定所述第一实体的每一实体类型与所述第二实体之间的关联度。
136.这里,第一实体的每一实体类型与第二实体之间的关联度,可以由第一实体的相应实体类型与第二实体的每一实体类型之间的关联度确定。例如,针对待比较的第一实体的第一实体类型,可以分别计算第一实体类型与第二实体的每一实体类型之间的关联度,并基于第一实体类型与第二实体的每一实体类型之间的关联度,确定第一实体的第一实体类型与第二实体之间的关联度。在一些实施例中,可以将第一实体类型与第二实体的每一实体类型之间的关联度之和确定为第一实体的第一实体类型与第二实体之间的关联度。在一些实施例中,可以将第一实体类型与第二实体的每一实体类型之间的关联度中的最大
值,确定为第一实体的第一实体类型与第二实体之间的关联度。在实施时,可以基于第一实体的每一实体类型与第二实体的每一实体类型之间的关联度,采用任意合适的池化算法(如最大池化算法等)或多头融合算法等,确定第一实体的每一实体类型与所述第二实体之间的关联度,这里并不限定。
137.在步骤s603中,基于所述第一实体的每一实体类型与所述第二实体之间的关联度,以及所述第一注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征。
138.这里,由于第一注意力分布参数可以反映在实体比较的过程中不同实体类型对的每一属性之间的关联度的重要程度的分布情况,因此,基于第一实体的每一实体类型与第二实体之间的关联度,以及所述第一注意力分布参数,可以确定第一实体的每一属性与第二实体的每一属性之间关联度的重要性。在实施时,可以利用第一实体的每一实体类型与第二实体之间的关联度,从第一注意力分布参数中确定第一实体的实体类型和第二实体的实体类型对应的各属性之间的关联度的重要程度,进而可以确定第一实体的各属性与第二实体的各属性之间关联度的重要度分布特征。
139.在一些实施例中,上述步骤s602可以通过如下步骤s611实现:
140.步骤s611,针对每一所述第一实体的实体类型,将所述第一实体的实体类型与所述第二实体的每一实体类型之间的关联度中的最大值,确定为所述第一实体的实体类型与所述第二实体之间的关联度。
141.这里,将第一实体的每一实体类型与第二实体的每一实体类型之间的关联度中的最大值,确定为第一实体的每一实体类型和第二实体之间的关联度。在实施时,可以采用最大池化算法确定为第一实体的每一实体类型和第二实体之间的关联度。例如,若实体类型数量为t,则第一实体的每一实体类型与第二实体的每一实体类型之间的关联度可以是一个t*t的矩阵,可以选取每一矩阵中值最大的元素作为第一实体的每一实体类型和第二实体之间的关联度。
142.本技术实施例中,对第一实体的类型信息和第二实体的类型信息进行关联处理,得到第一实体的每一实体类型和第二实体的每一实体类型之间的关联度,基于第一实体的每一实体类型与第二实体的每一实体类型之间的关联度,确定第一实体的每一实体类型与第二实体之间的关联度,基于第一实体的每一实体类型与第二实体之间的关联度,以及第一注意力分布参数,确定第一实体的各属性与第二实体的各属性之间关联度的重要度分布特征。这样,可以简单快捷地确定第一实体的各属性与第二实体的各属性之间关联度的重要度分布特征,从而可以提升实体比较的效率。
143.在一些实施例中,参见图7,图7是本技术实施例提供的实体比较方法的一个可选的流程示意图,基于图3,该方法还可以执行如下步骤s701至步骤s706,下面将结合各步骤进行说明,下述步骤的执行主体可以是前文的终端或服务器。
144.步骤s701中,获取样本实体对以及用于标注所述样本实体对中第一样本实体和第二样本实体是否相同的标注结果。
145.这里,样本实体对为用于对实体比较过程中的参数进行训练的实体对,可以包括第一样本实体和第二样本实体。在实施时,样本实体对可以是从样本库或者网络中获取的,也可以是用户预先构建的。
146.样本实体对的标注结果可以是预先根据样本实体对中第一样本实体和第二样本实体是否相同来表征的。在实施时,通过人工或自动化方式对样本实体对进行标注。
147.步骤s702中,分别获取所述第一样本实体和所述第二样本实体的属性信息以及类型信息。
148.步骤s703,基于所述第一样本实体的属性信息和所述第二样本实体的属性信息,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间的关联度分布特征。
149.步骤s704,基于所述第一样本实体的类型信息和所述第二样本实体的类型信息,以及第一注意力分布参数,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况。
150.步骤s705,基于所述关联度分布特征和所述重要度分布特征,确定表征所述第一样本实体与所述第二样本实体是否相同的预测结果。
151.这里,步骤s702至步骤s705分别与前述步骤s101至步骤s104相对应,在实施时,可以参照前述步骤s101至步骤s104的具体实施方式。
152.步骤s706,基于所述预测结果和所述标注结果,更新所述第一注意力分布参数。
153.这里,可以采用预设的参数更新策略对第一注意力分布参数进行更新,也可以采用损失函数以及参数优化算法对第一注意力分布参数进行更新,这里并不限定。在实施时,可以采用任意合适的损失函数以及参数优化算法,例如,损失函数可以采用绝对值损失函数、平方损失函数、交叉熵损失函数、指数损失函数等中的一种或多种,参数优化算法可以采用梯度下降法、共轭梯度法、牛顿算法等中的一种或多种。
154.在一些实施例中,还可以基于预测结果和标注结果,对实体比较过程中涉及的其他参数进行更新。在实施时,本领域技术人员可以根据实际情况对合适的参数进行更新,本技术实施例对此并不限定。例如,可以对表征第一实体的各属性与第二实体的各属性之间可比性的注意力分布情况的第二注意力分布参数进行更新。
155.本技术实施例中,通过对样本实体对中的第一样本实体和第二样本实体进行比较得到表征第一样本实体与第二样本实体是否相同的预测结果,并基于预测结果和标注结果更新第一注意力分布参数。这样,可以对第一注意力分布参数进行不断地优化,从而进一步提高实体比较的准确性。
156.下面将结合本技术实施例提供的终端或服务器的示例性应用和实施,说明本技术实施例提供的模型训练方法。
157.参见图8,图8是本技术实施例提供的模型训练方法的一个可选的流程示意图,用于对实体比较模型进行训练,训练得到的所述实体比较模型用于对内容服务中的实体对进行比较,下面将结合图8示出的步骤进行说明,下述步骤的执行主体可以是前文的终端或服务器。
158.在步骤s801中,获取样本实体对以及用于标注所述样本实体对中第一样本实体和第二样本实体是否相同的标注结果;
159.这里,样本实体对中的第一样本实体和第二样本实体可以是内容服务中任意类型的实体,例如,通过电视台传送的节目,互联网传输的内容等。第一样本实体和第二样本实体可以是相同类型的,也可以是不同类型的。
160.在步骤s802中,将所述样本实体对输入至待训练的实体比较模型;所述实体比较模型用于分别获取所述第一样本实体和所述第二样本实体的属性信息以及类型信息;基于所述第一样本实体的属性信息和所述第二样本实体的属性信息,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间的关联度分布特征;基于所述第一样本实体的类型信息和所述第二样本实体的类型信息,以及第一注意力分布参数,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;基于所述关联度分布特征和所述重要度分布特征,确定表征所述第一样本实体与所述第二样本实体是否相同的预测结果;
161.在步骤s803中,基于所述预测结果和所述标注结果,对所述实体比较模型的参数进行调整,以得到已训练的实体比较模型。
162.这里,步骤s801至步骤s803与前述步骤s701至步骤s705相对应,在实施时,可以参照前述步骤s701至步骤s705的具体实施方式。实体比较模型的参数可以是实体比较过程中涉及任意合适的参数,这里并不限定。
163.本技术实施例中,在进行实体比较模型的训练时,综合考虑了实体的属性信息以及类型信息,可以基于注意力机制,针对不同实体类型重点关注不同的属性,从而训练得到的实体比较模型可以实现通用实体的比较任务,能够满足不同实体类型消歧任务的需要,进而可以在一定程度上提高实体消歧任务的迭代效率,并且训练过程可解释。
164.下面,将说明本技术实施例在一个实际的应用场景中的示例性应用。本技术实施例提供的实体比较方法可以应用于知识图谱的构建或更新过程,例如,可以应用到腾讯看点知识图谱构建流程的实体融合中,支持通用实体融合任务。由于知识图谱中定义的实体类型较多,针对每一类实体都设计对应的垂类消歧策略不太现实,耗时耗力。本技术实施例提供一种实体比较方法,可以不区分待比较的实体对的类型,支持通用消歧能力,可以将待比较的实体对的属性信息与类型信息分开处理,通过分别引入独立的属性注意力张量和类型注意力张量进行信息的交互处理,得到对应的表征实体对的各属性之间的相似度分布特征的属性相似度矩阵,和表征实体对的各属性之间关联度的重要度分布特征的属性重要度矩阵,然后通过融合属性相似度矩阵和属性重要度矩阵,得到该实体对的关键的相似度向量,最后基于该相似度向量进行分类打分,确定待比较的实体对中的两个实体是否为同一实体,从而完成通用实体的比较任务。
165.在本技术实施例可以利用三维张量来表征给定实体的属性信息,以此来将多值属性中的多个属性值分开表征,从而便于在实体比较的过程中对多值属性进行处理。此外,通过引入实体类型信息,可以在一定程度上同时满足多个实体类型的消歧需求,并且在属性交互层面对多值属性进行针对性处理,可以在一定程度上提升模型性能和模型可解释性。这里,属性交互层面是指对待比较的实体对中每一实体的各属性之间的关联性进行处理的操作层面。
166.参见图9,图9为本技术实施例提供的一种实体比较方法的实现架构示意图。如图9所示,该方法可以包括三个子流程:属性交互流程910、类型交互流程920和分类打分流程930,下面分别对每一子流程进行具体说明:
167.1)属性交互流程:
168.该流程主要用于提取待比较的实体对的属性交互信息,即两个实体之间的属性相似度。属性交互流程可以通过如下步骤s911至步骤s913实现:
169.步骤s911,将待比较的实体对中的实体1和实体2分别建模成形状为k*n*d1的三维张量,其中k为预设每个实体的重要属性的最大数量,n为预设的每个属性的最多属性值个数,d1为预设的每个属性值的向量表示维度。
170.这里,需要注意的是,若实体的属性a包含的属性值不足n个,则可以利用预设的特殊字符(如<pad_attr>等)进行补全;属性值的向量表示可以由属性值中包含的每个字符对应的字向量取平均值得到。在实施时,实体1可以对应于前述实施例中的第一实体,实体2可以对应于前述实施例中的第二实体。
171.步骤s912,引入一个形状为k*n*n的三维张量作为属性注意力张量,利用三维张量之间的矩阵乘法,将实体1和实体2分别对应的三维张量与属性注意力张量相乘,实现属性间的交互计算,从而得到形状为k*k*n*n的四维的属性值相似度张量,用于表征实体1和实体2的各属性值之间的相似度。
172.这里,属性注意力矩阵的取值可以随机初始化,然后通过不断训练进行优化。实体1和实体2分别对应的三维张量与属性注意力张量相乘,以实现属性间的交互计算的过程可以包括:将实体1和实体2分别对应的形状为k*n*d1的三维张量相乘,得到k*k个n*n的矩阵,然后将该k*k个n*n的矩阵转换成k个形状为k*n*n的三维张量,针对每一个形状为k*n*n的三维张量,将该三维张量与形状为k*n*n的属性注意力张量进行点乘,也即每一对应位置处的元素进行相乘,得到k个更新后的形状为k*n*n的三维张量,也即一个形状为k*k*n*n的属性值相似度张量。该属性值相似度张量中的每一元素可以表征实体1的相应属性的相应属性值与实体2的相应属性的相应属性值之间的相似度。
173.需要说明的是,在将实体1和实体2分别对应的形状为k*n*d1的三维张量相乘时,可以对实体1或实体2对应的三维张量中的矩阵进行转秩,得到一个k*d1*n的三维张量,并将未转秩的形状为k*n*d1的三维张量与该k*d1*n的三维张量中对应位置处的矩阵进行相乘,得到k*k个n*n的矩阵。
174.步骤s913,利用最大池化算法从四维的属性值相似度张量中提取关键信息,得到一个形状为k*k的属性相似度矩阵。
175.在实施时,可以将形状为k*k*n*n的属性值相似度张量转换为k*k个n*n的二维矩阵,每一二维矩阵对应一组实体1和实体2的属性对,针对每一n*n的二维矩阵,从该二维矩阵的各元素中选取最大值作为该二维矩阵对应的属性对中两个属性之间的属性相似度,最终可以得到k*k个属性相似度,k*k个属性相似度可以组成一个形状为k*k的属性相似度矩阵。在实施时,属性值相似度矩阵可以对应于前述实施例中的关联度分布特征。
176.2)类型交互流程:
177.该流程主要用于提取待比较的实体对的类型交互信息,该信息用于表征在指定的实体对的实体类型下,各属性之间相似度的重要程度。类型交互流程可以通过如下步骤s921至步骤s923实现:
178.步骤s921,将给定的实体对中实体1和实体2的类型分别建模成形状为t*d2的二维类型矩阵,其中t表示当前知识图谱中的实体类型总数,d2为预设的每个实体类型的向量表示维度。
179.这里,在实施时,实体1和实体2的类型分别对应的二维类型矩阵可以对应于前述实施例中的第一类型矩阵和第一类型矩阵。
180.步骤s922,将实体1和实体2对应的二维类型矩阵相乘,用于模拟两个实体在类型层面的交互,最终可以得到一个形状为t*t的交互信息矩阵,然后通过最大池化算法,将该交互信息矩阵映射为t*1的相互信息向量。
181.这里,类型交互层面是指对待比较的实体对中每一实体的各实体类型之间的关联性进行处理的操作层面。
182.步骤s923,引入一个形状为t*k*k的类型注意力张量,并将该类型注意力张量与相互信息向量相乘,得到一个形状为k*k的属性重要度矩阵,用于表征实体1的k个属性与实体2的k个属性相互之间相似度的重要度。
183.这里,类型注意力张量的取值可以随机初始化,然后通过不断训练进行优化。在实施时,属性重要度矩阵可以对应于前述实施例中第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征。
184.3)分类打分流程:
185.该流程主要用于融合属性交互信息和类型交互信息,利用类型交互信息来捕捉属性交互信息中的重要部分,最终形成统一的表示信息,并基于该表示信息进行分类打分操作。属性交互流程可以通过如下步骤s931至步骤s933实现:
186.步骤s931,将属性交互流程得到的属性相似度矩阵与类型交互流程得到的属性重要度矩阵点乘,以此凸显出属性相似度矩阵中的重要信息,然后将点乘得到的二维矩阵打平,转换成形状为1*(k*k)的表示向量。
187.这里,在实施时,点乘得到的二维矩阵或者形状为1*(k*k)的表示向量均可以对应于前述实施例中的重要关联度分布特征。
188.步骤s932,将得到的最终表示向量输入全连接网络进行二次维度变换,并利用最后的sigmoid函数对维度变换后的表示向量进行分类打分,得到一个分类得分。
189.步骤s933,若得到的分类得分大于预先设定的分数阈值,则表示实体对相同,可以融合,否则,不可融合。
190.在一些实施例中,上述针对矩阵的显式运算,可以通过一些复杂的网络结构(如卷积网络或自定义网络等)实现,从而可以挖掘更深层的有用信息。
191.在一些实施例中,上述最大池化算法,可以采用池化算法或多头融合替代,从而可以进一步提升模型的性能。
192.在一些实施例中,上述实体比较方法可以通过一个实体比较模型实现。
193.本技术实施例提供的实体比较方法的创新点在于:1)利用三维张量表征实体信息,达到了灵活处理多值属性的目的;2)利用矩阵乘法和池化算法分别模拟了单一属性值相似度的计算过程和同一属性对对应的多个属性值相似度的聚合过程,极大的提高了模型的可解释性;3)将实体类型信息引入实体比较模型,生成对应的属性重要度矩阵,达到了根据不同实体类型关注不同重点属性的目的。
194.本技术实施例提供的实体比较方法具有如下有益效果:1)提高实体消歧任务的迭代效率,该方法通过引入实体类型信息,可以在实体比较过程中学习到在当前实体类型下的重要属性信息,满足了利用同一模型处理不同实体类型消歧任务的需要,由此,在一定程
度上解放了部分人力资源,且不需要针对每一类新实体都进行相应的模型构建与训练,从而在一定程度上提高了实体消歧任务的迭代效率;2)具有更高的模型性能与模型可解释性,该方法将待比较实体对的属性信息与类型信息分开处理,分别引入独立的属性注意力张量和类型注意力张量进行信息的交互处理,在属性和类型两个层面上获得不同的有用信息,然后将二者进行融合挑选出重要的信息,可以在一定程度上提高实体比较的准确性,并且在属性交互层面对多值属性做了针对性处理,可以一定程度上提升模型可解释性。
195.下面继续说明本技术实施例提供的实体比较装置255的实施为软件模块的示例性结构,在一些实施例中,如图2a所示,存储在存储器250的实体比较装置255中的软件模块可以包括:
196.第一获取模块2551,用于分别获取待比较的第一实体和第二实体的属性信息以及类型信息;
197.第一确定模块2552,用于基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;
198.第二确定模块2553,用于基于所述第一实体的类型信息和所述第二实体的类型信息,以及第一注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;
199.第三确定模块2554,用于基于所述关联度分布特征和所述重要度分布特征,确定所述第一实体与所述第二实体是否相同。
200.在一些实施例中,在一些实施例中,所述第三确定模块还用于:对所述关联度分布特征和所述重要度分布特征进行特征融合处理,得到所述第一实体的各属性与所述第二实体的各属性之间的重要关联度分布特征;对所述重要关联度分布特征进行分类处理,得到表征所述第一实体与所述第二实体是否相同的分类结果;基于所述分类结果,确定所述第一实体与所述第二实体是否相同。
201.在一些实施例中,所述第一确定模块还用于:基于所述第一实体的属性信息和所述第二实体的属性信息,以及第二注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间的关联度分布特征;所述第二注意力分布参数表征所述第一实体的各属性与所述第二实体的各属性之间可比性的注意力分布情况。
202.在一些实施例中,所述关联度分布特征包括所述第一实体的每一属性与所述第二实体的每一属性之间的关联度,所述第一确定模块还用于:基于所述第一实体的属性信息和所述第二实体的属性信息,确定所述第一实体的每一属性和所述第二实体的每一属性;针对所述第一实体的每一属性,基于所述第二注意力分布参数,确定所述属性的每一属性值与所述第二实体的每一属性的每一属性值之间的关联度;基于所述第一实体的每一属性的每一属性值与所述第二实体的每一属性的每一属性值之间的关联度,确定所述第一实体的每一属性与所述第二实体的每一属性之间的关联度。
203.在一些实施例中,所述第一确定模块还用于:针对每一组第一实体的属性和第二实体的属性,将所述第一实体的属性的每一属性值与所述第二实体的属性的每一属性值之间的关联度中的最大值,确定为所述第一实体的属性和所述第二实体的属性之间的关联度。
204.在一些实施例中,所述第一实体的属性信息包括第一属性张量,所述第二实体的属性信息包括第二属性张量,所述第二注意力分布参数包括属性注意力张量,所述第一属性张量和所述第二属性张量均为形状为k*n*d1的三维张量,所述属性注意力张量为形状为k*n*n的三维张量,其中,k为预设的属性数量最大值,n为预设的属性值数量最大值,d1为预设的属性值的表征向量的维度。
205.在一些实施例中,所述第二确定模块还用于:对所述第一实体的类型信息和所述第二实体的类型信息进行关联处理,得到所述第一实体的每一实体类型和所述第二实体的每一实体类型之间的关联度;基于所述第一实体的每一实体类型与所述第二实体的每一实体类型之间的关联度,确定所述第一实体的每一实体类型与所述第二实体之间的关联度;基于所述第一实体的每一实体类型与所述第二实体之间的关联度,以及所述第一注意力分布参数,确定所述第一实体的各属性与所述第二实体的各属性之间关联度的重要度分布特征。
206.在一些实施例中,所述第二确定模块还用于:针对每一所述第一实体的实体类型,将所述第一实体的实体类型与所述第二实体的每一实体类型之间的关联度中的最大值,确定为所述第一实体的实体类型与所述第二实体之间的关联度。
207.在一些实施例中,所述第一实体的类型信息包括第一类型矩阵,所述第二实体的类型信息包括第二类型矩阵,所述第一注意力分布参数包括类型注意力张量,所述第一类型矩阵和所述第二类型矩阵的形状均为t*d2,所述类型注意力张量为形状为t*k*k的三维张量,其中,t为当前知识图谱中实体类型的总量,d2为预设的实体类型的表征向量的维度,k为预设的属性数量最大值。
208.在一些实施例中,所述装置还包括:第二获取模块,用于获取样本实体对以及用于标注所述样本实体对中第一样本实体和第二样本实体是否相同的标注结果;第三获取模块,用于分别获取所述第一样本实体和所述第二样本实体的属性信息以及类型信息;第四确定模块,用于基于所述第一样本实体的属性信息和所述第二样本实体的属性信息,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间的关联度分布特征;第五确定模块,用于基于所述第一样本实体的类型信息和所述第二样本实体的类型信息,以及第一注意力分布参数,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;第六确定模块,用于基于所述关联度分布特征和所述重要度分布特征,确定表征所述第一样本实体与所述第二样本实体是否相同的预测结果;第一调整模块,用于基于所述预测结果和所述标注结果,对所述第一注意力分布参数进行调整。
209.下面继续说明本技术实施例提供的模型训练装置355的实施为软件模块的示例性结构,在一些实施例中,模型训练装置355用于对实体比较模型进行训练,训练得到的所述实体比较模型用于对内容服务中的实体对进行比较,如图2b所示,存储在存储器350的模型训练装置355中的软件模块可以包括:
210.第四获取模块3551,用于获取样本实体对以及用于标注所述样本实体对中第一样本实体和第二样本实体是否相同的标注结果;
211.比较模块3552,用于:将所述样本实体对输入至待训练的实体比较模型;所述实体比较模型用于分别获取所述第一样本实体和所述第二样本实体的属性信息以及类型信息;
基于所述第一样本实体的属性信息和所述第二样本实体的属性信息,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间的关联度分布特征;基于所述第一样本实体的类型信息和所述第二样本实体的类型信息,以及第一注意力分布参数,确定所述第一样本实体的各属性与所述第二样本实体的各属性之间关联度的重要度分布特征;所述第一注意力分布参数表征不同实体类型对的各属性之间关联度的注意力分布情况;基于所述关联度分布特征和所述重要度分布特征,确定表征所述第一样本实体与所述第二样本实体是否相同的预测结果;
212.第二调整模块3553,用于基于所述预测结果和所述标注结果,对所述实体比较模型的参数进行调整,以得到已训练的实体比较模型。
213.本技术实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本技术实施例上述的实体比较方法或模型训练方法。
214.本技术实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本技术实施例提供的实体比较方法或模型训练方法,例如,如图3示出的方法。
215.在一些实施例中,计算机可读存储介质可以是fram、rom、prom、eprom、eeprom、闪存、磁表面存储器、光盘、或cd

rom等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
216.在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
217.作为示例,可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(html,hyper text markup language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
218.作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
219.综上所述,通过本技术实施例在进行实体比较时,综合考虑了属性信息以及类型信息,可以基于注意力机制,针对不同实体类型重点关注不同的属性,从而可以实现通用实体的比较任务,满足不同实体类型消歧任务的需要,进而可以在一定程度上提高实体消歧任务的迭代效率,并且处理过程可解释。
220.以上所述,仅为本技术的实施例而已,并非用于限定本技术的保护范围。凡在本技术的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献