一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于知识图谱的信息检索方法

2022-07-02 14:48:24 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其涉及一种基于知识图谱的信息检索方法。


背景技术:

2.随着信息技术和互联网的发展,人们逐渐从信息匮乏进入信息过载时代,为了解决这一问题,推荐系统(recommendation system)应运而生。推荐系统的任务就是联系用户和信息,帮助用户发现对自己有价值的信息,提升用户获取关键信息的效率。
3.目前,传统的方法主要利用显式/隐式反馈的交互数据作为输入,提取用户和物品的高低阶交互特征,从而进行推荐,并在此基础上引入知识图谱(knowledge graph)中大规模的节点信息以及节点自身的属性信息。但是这种方法难以获取用户实体之间的交互信息、容易忽略用户与多重要素之间的动态变化,在面对项目繁杂的信息时,很难为决策人员高效的提供检索的关键信息;
4.由此,需要一种能够提升信息检索效率的方法,便于决策人员进行选择。


技术实现要素:

5.本发明提供一种基于知识图谱的信息检索方法,用以解决上述现有技术中的缺陷,实现针对多要素节点信息的联系,构建决策者用户问答应用推荐中决策者检索问句的多要素迭代循环,从而高效的为决策者提供关键信息。
6.本发明提供一种基于知识图谱的信息检索方法,包括如下步骤:
7.s1、将决策者问句中的概念、实体和关系按照不同要素属性分别构建决策者问句信息词库;
8.s2、根据语义算法将决策者问句分割为要素名称和每个所述要素类型对应的要素值,并以要素名称和对应的要素值构成要素对;
9.s3、按输入的所述决策者问句的语句顺序依次从多个所述要素对中分别抽取要素值,进而构建问句要素模式;
10.s4、获取决策者用户标识,获取对所述决策者问句预处理后抽取的每个检索要素名称,获取每个检索结果的实体名称,以所述决策者用户标识、每个检索要素名称、每个检索结果的实体名称构建检索对;并将检索对存储至检索记录库中;
11.s5、基于知识图谱,生成决策者用户向量;将决策者用户向量和所述检索对输入ripple net模型进行迭代,直至将ripple net模型中每一环的决策者用户向量表示相加形成总体决策者用户向量表示;
12.s6、结合所述总体决策者用户向量表示和目标事物,对决策者检索任一事项的概率进行预测,生成决策者用户检索推荐向量。
13.需要说明的是,ripple net模型为波纹式偏好传播模型,此模型常用于根据用户对某项事物的偏好统计数据,借助知识图谱节点间语义关系在节点之间传播偏好信息,并通过实体节点和语义关系特征向用户推荐检索结论信息;
14.进一步,在步骤s1中,不同要素属性分别包括实体e、关系r、属性值v、概念c、空间a、时间t。
15.进一步,在步骤s4中,包括:
16.检索中决策者用户标识u,获取所述决策者问句预处理后抽取的每个检索要素名称为fi,获取每个检索结果的实体名称为ej;
17.检索对s构造为:s:《u,f1,f2,...fi,e1,e2...,ej》。
18.具体的,步骤s5中,基于知识图谱,生成决策者用户向量,包括:
19.将决策者问句中的实体和实体之间的关系进行向量化,形成覆盖所有实体的图谱三元组(h,r,t);
20.其中,h表示头实体,r表示关系,t表示尾实体。
21.具体的,步骤s6中,将决策者用户向量和所述检索对输入ripple net进行迭代,包括:
22.以每个所述检索对s作为ripple net模型的节点,基于知识图谱g和决策者用户问句,决策者用户在第k轮迭代的实体集合为:
[0023][0024]
定义第k次迭代的三元组集合为:
[0025][0026]
在第一次代入ripple net模型进行迭代时获取第一环ripple set的三元组为:
[0027][0028]
基于第一环ripple set中的每个三元组,将关系的向量ri、头实体的向量hi与目标事物的向量v相乘,得到目标事物v与第一次迭代的每个三元组中的头实体和关系的相关性关系,从而获取第一环ripple set的决策者用户向量表示。
[0029]
具体的,步骤s6中,将决策者用户向量和所述检索对输入ripple net进行迭代,进一步包括:
[0030]
在第k次代入ripple net模型进行迭代时,将第k-1次迭代中ripple set的尾实体作为第k次迭代的头实体,进而生成第k次迭代中ripple set的用户表示。
[0031]
优选的,步骤s6之后,进一步包括:
[0032]
将所述决策者用户检索推荐向量输入预设的知识图谱检索引擎,输出所述决策者用户检索推荐向量对应的实体名称。
[0033]
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的信息检索方法的步骤。
[0034]
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述信息检索方法的步骤。
[0035]
本发明提供的一种基于知识图谱的信息检索方法,通过将决策者问句中的概念、实体和关系按照不同要素属性分别构建决策者问句信息词库,并根据语义算法将决策者问句分割为要素名称和每个所述要素类型对应的要素值,进而构建问句要素模式,从而有利
于在解析决策者用户问句的基础上,构建基于数据的决策问题要素实体与知识库之间的关联以建立一个可迭代拓展的动态实体知识图谱,并涵盖了时间、空间要素的描述;再以所述决策者用户标识、每个检索要素名称、每个检索结果的实体名称构建检索对,并将检索对存储至检索记录库中,以ripple net方法中的迭代算法实现应答信息概率预测,从而实现信息应答推荐,解决了目前由于海量信息导致的信息过载问题,能够助力与决策人员快速获取关键信息,有效的提高信息分析和筛选的效能。
附图说明
[0036]
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037]
图1是本发明提供的基于知识图谱的信息检索方法的流程示意图之一;
[0038]
图2是本发明提供的基于知识图谱的信息检索方法的流程示意图之二;
[0039]
图3是本发明提供的电子设备的结构示意图。
具体实施方式
[0040]
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0041]
在一个实施例中,如图1所示,本发明提供一种基于知识图谱的信息检索方法,包括如下步骤:
[0042]
s1、将决策者问句中的概念、实体和关系按照不同要素属性分别构建决策者问句信息词库;
[0043]
s2、根据语义算法将决策者问句分割为要素名称和每个所述要素类型对应的要素值,并以要素名称和对应的要素值构成要素对;
[0044]
s3、按输入的所述决策者问句的语句顺序依次从多个所述要素对中分别抽取要素值,进而构建问句要素模式;
[0045]
s4、获取决策者用户标识,获取对所述决策者问句预处理后抽取的每个检索要素名称,获取每个检索结果的实体名称,以所述决策者用户标识、每个检索要素名称、每个检索结果的实体名称构建检索对;并将检索对存储至检索记录库中;
[0046]
s5、基于知识图谱,生成决策者用户向量;将决策者用户向量和所述检索对输入ripple net模型进行迭代,直至将ripple net模型中每一环的决策者用户向量表示相加形成总体决策者用户向量表示;
[0047]
s6、结合所述总体决策者用户向量表示和目标事物,对决策者检索任一事项的概率进行预测,生成决策者用户检索推荐向量。
[0048]
需要说明的是,ripple net模型为波纹式偏好传播模型,此模型常用于根据用户对某项事物的偏好统计数据,借助知识图谱节点间语义关系在节点之间传播偏好信息,并
通过实体节点和语义关系特征向用户推荐检索结论信息;
[0049]
进一步,在步骤s1中,不同要素属性分别包括实体e、关系r、属性值v、概念c、空间a、时间t这六种要素;其中决策者问句信息词库为决策者问句信息关联数据库中的一种;
[0050]
具体的,步骤s2中构成的要素对的示例为:《日期,t》、《地域,a》、《实体,e》、《行为,r》、《问句类别,v》、《概念,c》;
[0051]
具体的,步骤s3中,构建的问句要素模式为:《t》|《a》|《e》|《r》|《v》|《c》;
[0052]
进一步,在步骤s4中,包括:
[0053]
检索中决策者用户标识u,获取所述决策者问句预处理后抽取的每个检索要素名称为fi,获取每个检索结果的实体名称为ej;
[0054]
检索对s构造为:s:《u,f1,f2,...fi,e1,e2...,ej》。
[0055]
具体的,步骤s5中,基于知识图谱,生成决策者用户向量,包括:
[0056]
将决策者问句中的实体和实体之间的关系进行向量化,形成覆盖所有实体的图谱三元组(h,r,t);
[0057]
其中,h表示头实体,r表示关系,t表示尾实体;
[0058]
需要说明的是,知识图谱是一种揭示实体之间关系的语义网络;
[0059]
具体的,步骤s6中,如图2所示,将决策者用户向量和所述检索对输入ripple net进行迭代,包括:
[0060]
以每个所述检索对s作为ripple net模型的节点,基于知识图谱g和决策者用户问句,决策者用户在第k轮迭代的实体集合为:
[0061][0062]
定义第k次迭代的三元组集合为:
[0063][0064]
在第一次代入ripple net模型进行迭代时获取第一环ripple set的三元组为:
[0065][0066]
进一步,基于第一环ripple set中的每个三元组,将关系的向量ri、头实体的向量hi与目标事物的向量v相乘,得到目标事物v与第一次迭代的每个三元组中的头实体和关系(hi,ri)的相关性关系,从而获取第一环ripple set的决策者用户向量表示;
[0067]
可选的,通过softmax进行相关性得分的归一化处理,计算得到相关性函数pi如下:
[0068][0069]
需要说明的是,pi即关联概率,为目标事物v和实体hi在关系空间ri中的相似性,进一步得到这一环的决策者用户向量表示:
[0070][0071]
其中,ti∈rd是ripple set尾实体的嵌入向量。
[0072]
具体的,步骤s6中,将决策者用户向量和所述检索对输入ripple net进行迭代,进
一步包括:
[0073]
在第k次代入ripple net模型进行迭代时,将第k-1次迭代中ripple set的尾实体作为第k次迭代的头实体,进而生成第k次迭代中ripple set的决策者用户向量表示;
[0074]
进一步,将每一次迭代中生成的rippleset的决策者用户向量表示相加,获取所述总体决策者用户向量表示:
[0075][0076]
优选的,步骤s6之后,进一步包括:
[0077]
将所述决策者用户检索推荐向量输入预设的知识图谱检索引擎,输出所述决策者用户检索推荐向量对应的实体名称,从而根据多次ripplenet的迭代计算,为决策者准确的提供推荐的检索结果。
[0078]
另一方面,图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)310、通信接口(communicationsinterface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行基于知识图谱的信息检索方法,该方法包括:s1、将决策者问句中的概念、实体和关系按照不同要素属性分别构建决策者问句信息词库;s2、根据语义算法将决策者问句分割为要素名称和每个所述要素类型对应的要素值,并以要素名称和对应的要素值构成要素对;s3、按输入的所述决策者问句的语句顺序依次从多个所述要素对中分别抽取要素值,进而构建问句要素模式;s4、获取决策者用户标识,获取对所述决策者问句预处理后抽取的每个检索要素名称,获取每个检索结果的实体名称,以所述决策者用户标识、每个检索要素名称、每个检索结果的实体名称构建检索对;并将检索对存储至检索记录库中;s5、基于知识图谱,生成决策者用户向量;将决策者用户向量和所述检索对输入ripple net模型进行迭代,直至将ripple net模型中每一环的决策者用户向量表示相加形成总体决策者用户向量表示;s6、结合所述总体决策者用户向量表示和目标事物,对决策者检索任一事项的概率进行预测,生成决策者用户检索推荐向量。
[0079]
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0080]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的基于知识图谱的信息检索方法,该方法包括:s1、将决策者问句中的概念、实体和关系按照不同要素属性分别构建决策者问句信息词库;s2、根据语义算法将决策者问句分割为要素名称和每个所述要素类型对应的要素值,并以要素名称和对应的要素值构成要素对;s3、按输入的所述决策者问句的语
句顺序依次从多个所述要素对中分别抽取要素值,进而构建问句要素模式;s4、获取决策者用户标识,获取对所述决策者问句预处理后抽取的每个检索要素名称,获取每个检索结果的实体名称,以所述决策者用户标识、每个检索要素名称、每个检索结果的实体名称构建检索对;并将检索对存储至检索记录库中;s5、基于知识图谱,生成决策者用户向量;将决策者用户向量和所述检索对输入ripple net模型进行迭代,直至将ripple net模型中每一环的决策者用户向量表示相加形成总体决策者用户向量表示;s6、结合所述总体决策者用户向量表示和目标事物,对决策者检索任一事项的概率进行预测,生成决策者用户检索推荐向量。
[0081]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述提供的基于知识图谱的信息检索方法。
[0082]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0083]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0084]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献