一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于双图谱融合的语言解析方法、系统及终端设备与流程

2022-06-08 21:50:40 来源:中国专利 TAG:


1.本发明涉及智能识别领域,尤其涉及一种基于双图谱融合的语言解析方法、系统、终端设备及计算机可读存储介质。


背景技术:

2.通常情况下,知识图谱在语义理解方面的应用最常见就是问答系统,在问答系统中知识图谱只是作为知识的表示和存储来为生成回答提供数据知识,并未用到具体的语义理解过程当中,知识图谱的作用没有得到充分的发挥,以语义网络为基础的知识图谱并未运用到实际的语义理解当中,并且事理图谱作为一种相对新的事件表示形式与知识图谱具有相似的结构,同样是以图谱的形式表示知识,但是二者一直分开独立使用,但是现实中事件和实体是你中有我的关系,二者联系十分密切,所以彼此独立使用大大限制图谱在各个领域的应用和发展。
3.故有必要提出一种新的技术方案,以解决上述技术问题。


技术实现要素:

4.鉴于此,本发明实施例提供了一种基于双图谱融合的语言解析方法、系统及终端设备,通过该方法可以更准确的理解人的语言,为其提供更精准的服务,使用户能够更加体验到人工智能所带来的便利性。
5.本发明实施例的第一方面提供了一种基于双图谱融合的语言解析方法,所述语言解析方法包括:
6.对输入的文字进行知识信息和事件信息进行双方面提取,分别得到第一提取结果和第二提取结果;
7.根据所述第一提取结果和所述第二提取结果在预先建立的图谱关系库中查找对应的知识-事理图谱;
8.结合所查找到的知识-事理图谱中相关的信息对所述文字信息进行解析。
9.可选地,在本技术提供的另一实施例中,所述对输入的文字进行知识信息和事件信息进行双方面提取,分别得到第一提取结果和第二提取结果,包括:
10.提取至少二个所述文字信息的关键词以及所述关键词之间的关系,关键词对应的关系值,将提取结果作为第一提取结果,其中,所述关系值与知识-事理图谱中关系值对应;
11.提取所述文字信息的逻辑关系,将其作为第二提取结果,所述逻辑关系为所述文字信息中所包含的事件逻辑关系,对所表达的事件进行抽象化逻辑表示。
12.可选地,在本技术提供的另一实施例中,所述提取至少二个所述文字信息的关键词,包括:
13.通过同义词处理、实词提取、语法分析、歧义处理、模型匹配提取至少两个所述文字信息的关键词。
14.可选地,在本技术提供的另一实施例中,所述知识-事理图谱的数据采用rdf三元
组的形式进行存储,包括:
15.结构化数据、半结构化数据以及非结构化数据。
16.本发明实施例的第二方面提供了一种基于双图谱融合的语言解析系统,所述语言解析系统包括:
17.提取模块,用于对输入的文字进行知识信息和事件信息进行双方面提取,分别得到第一提取结果和第二提取结果;
18.查找模块,用于根据所述第一提取结果和所述第二提取结果在预先建立的图谱关系库中查找对应的知识-事理图谱;
19.解析模块,用于结合所查找到的知识-事理图谱中相关的信息对所述文字信息进行解析。
20.可选地,在本技术提供的另一实施例中所述提取模块具体用于:
21.提取至少二个所述文字信息的关键词以及所述关键词之间的关系,关键词对应的关系值,将提取结果作为第一提取结果,其中,所述关系值与知识-事理图谱中关系值对应;
22.提取所述文字信息的逻辑关系,将其作为第二提取结果,所述逻辑关系为所述文字信息中所包含的事件逻辑关系,对所表达的事件进行抽象化逻辑表示。
23.可选地,在本技术提供的另一实施例中所述提取模块在提取至少二个所述文字信息的关键词时,具体用于:
24.通过同义词处理、实词提取、语法分析、歧义处理、模型匹配提取至少两个所述文字信息的关键词。
25.可选地,在本技术提供的另一实施例中所述知识-事理图谱的数据采用rdf三元组的形式进行存储,包括:
26.结构化数据、半结构化数据以及非结构化数据。
27.本发明实施例的第三方面提供了一种终端设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现上述第一方面任一项提及的方法。
28.本发明实施例的第四方面提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,上述计算机程序被处理器执行时实现上述第一方面任一项提及的方法。
29.本发明实施例与现有技术相比存在的有益效果是:本技术提供的基于双图谱的语言解析方法可以让机器更准确的理解人的语言,为其提供更精准的服务,使用户能够更加体验到人工智能所带来的便利性。同时两种图谱的融合应用也是一种新的图谱应用方式,可以扩展应用于搜索、知识推理、可视化决策等多个领域,深化知识图谱的发展和应用。
附图说明
30.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
31.图1为本发明实施例一提供的一种基于双图谱融合的语言解析方法的流程示意
图;
32.图2为本发明另一实施例提供基于双图谱融合的语言解析方法的流程示意图;
33.图3为本发明实施例二提供的基于双图谱融合的语言解析系统的结构示意图;
34.图4为本发明实施例三提供的终端设备的结构示意图。
具体实施方式
35.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
36.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
37.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
38.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
39.如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0040]
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
[0041]
实施例一
[0042]
图1是本发明实施例一提供的基于双图谱融合的语音解析方法的流程示意图,该方法可以包括以下步骤:
[0043]
s101:对输入的文字进行知识信息和事件信息进行双方面提取,分别得到第一提取结果和第二提取结果。
[0044]
s102:根据所述第一提取结果和所述第二提取结果在预先建立的图谱关系库中查找对应的知识-事理图谱。
[0045]
s103:结合所查找到的知识-事理图谱中相关的信息对所述文字信息进行解析。
[0046]
可选地,所述对输入文字信息进行知识信息和事件信息的提取,分别得到第一提取结果和第二提取结果,包括:提取至少二个所述文字信息的关键词以及所述关键词之间的关系,关键词对应的关系值,将提取结果作为第一提取结果,其中,所述关系值与知识-事理图谱中关系值对应;提取所述文字信息的逻辑关系,将其作为第二提取结果。
[0047]
下面结合图2对本技术提供的语言解析方法进行具体说明,在知识抽取步骤中抽取分为两部分,一部分是知识图谱的实体(即关键词)、实体关系(关键词之间的关系)、属性和值的抽取,另一部分是事理图谱事件和事件联系的抽取。二者都是从不同结构的数据中抽取知识单元,知识单元包括知识图谱的实体、关系、属性,以及事理图谱的事件、联系等,
以此为基础形成一系列的高质量的事实表达,为上层图谱的构建奠定基础。本方法对两类图谱知识的抽取采用两种方式结合的方式,一种方式根据构建的模板、规则以及事件知识库,事件知识库中包括事件连词库、结果词库、因果模式库,同时运用词法分析实词提取,以及监督学习将知识图谱、事理图谱和事件与实体之间的联系同时抽取出来,另一种方式是分别采用上述的一些基本方法分别从数据中抽取出知识图谱和事理图谱中的知识数据,然后根据构建的联系知识库,采用规则和监督学习结合的方式将抽取中的两类知识构建联系。此处的技术关键点在于抽取两类图谱知识的方式,融合抽取和先抽后融两种方式结合的方式,具体可根据数据的形式和内容进行判断两种方式具体使用的时机。
[0048]
可选地,预先知识-事理图谱数据库,其中图谱的schema相当于数据模型,它直接影响图谱的应用范围和应用方式,所以schema的设计是图谱构建的关键,本方法在设计schema时将事理图谱和知识图谱同时进行考虑,根据具体需求,增加实体和事件之间的联系属性,以及事件与实体关系的联系属性。另外,数据的来源是多样性的,所以在构建过程中需要对抽取的知识进行融合,融合包括数据模式层和数据层两部分,数据模式层在上述schema设计中已经进行了考虑,数据层的融合通常包括实体合并和实体属性与关系的合并,主要会考虑同义词和别名等情况,但是本方法需要将事理图谱同时考虑其中,同样的词在不同事件背景下意义是不同的,在这里采用构建知识库加入已知规则,并通过监督学习模型进行辅助。此处的技术关键点一部分在schema的设计上,增加了新的联系和属性,构建了知识图谱和事理图谱中间的联系,另一部分在融合方面将事件背景作为要素加入到融合过程当中。
[0049]
知识存储,上述知识-事理图谱的数据来源包含结构化数据、半结构化数据和非结构化数据,其网络形式的数据组织形式使用常用的关系型数据库可能无法满足现实当中的存储需求,利用资源描述框架(resource description framework,rdf)三元组的形式来进行存储,rdf为知识图谱提供了标准的数据模型,用来描述实体、属性、关系,同时也可以表达事件。将抽取出来的知识转换成rdf形式来进行存储,采用图数据库对数据进行存储,此处的技术关键点是针对不同图数据库的特点以及需求需要,采用两种数据库结合应用的方式,对于主体知识数据采用neo4j图形数据库,而对于需求和知识领域的不同,部分数据量比较小的采用fuseki,作为大数据库下的附属依赖,这样不仅使数据进行分布式存储,而且更方便知识的更快更精确的定位,这样可以解决的问题是一方面neo4j只能构建一个数据库,所以无法用多个数据库来对领域知识进行区分,而fuseki可以构建多个数据库,对于针对性强的知识独立存储更方便调用,同时因为存储时候将数据量作为数据库选择的依据,所以虽然采用了两种数据库,但并不影响访问速度。
[0050]
语义理解:语义理解的技术包含多方面的,通常需要经过同义词处理,实词提取、句法分析、歧义处理、模型匹配、答案生成等多方面技术,深度学习也开始应用在其中。不管运用何种技术方法,语义理解的关键是要理解这句话所表示的意图和表达的含义,让机器能够知道如何作出对应操作。人类能够理解语言含义的重要一点就是人类拥有知识储备,并且知识是以人类独有的语言组织形式进行存储的,而知识图谱和事理图谱就是以人类语言的组织形式构建语义网络对知识进行表达的,并且人类的知识主要是以事件和实体作为主体进行表达的,所以由此可见图谱的知识完全可以应用在语义理解过程当中。此处的关键技术点在于在语义实词提取、句法分析等过程当中,会以知识图谱和事理图谱作为依据,
提取出的实词会根据图谱中的实体和对应属性等进行判断其含义,比如说提取出“苹果”,但是“苹果”可能是水果,也可能是手机,同时事理图谱也提供实体的事件背景信息,通过综合判断和规则进行结合,提取出其真正含义,所以在理解过程当中加入了知识依据,这样使语义理解更加准确,而且图谱的融合使用,可以根据理解的意图生成从多维度去生成答案,使回答更加自然更加贴近人类的方式。
[0051]
本技术提供的语言解析方法使用融合事理图谱和知识图谱的自然语言理解方法,不仅实现了两种图谱的融合构建和应用,使其间的联系得到了有效的运用发挥,在语义理解过程当中,加入知识依据,能够更有效更准确的帮助理解语义意图,同时在答案生成过程中在融合图谱中查找所需知识信息,这样覆盖面不但更广,更加符合人类的回答方式。而且,知识图谱和自然语言理解作为人工智能的两个重要研究领域,两者之间更有效的融合应用,对彼此的发展都起到了推动作用。
[0052]
实施例二
[0053]
图3是本发明实施例二提供的一种基于双图谱融合的语言解析系统的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。
[0054]
该故障检测系统可以是内置于机器人内的软件单元、硬件单元或者软硬结合的单元,也可以作为独立的挂件集成到所述计算机或其他终端中。
[0055]
所述基于双图谱的语言解析系统,包括:
[0056]
提取模块31,用于对预先存储的文字信息进行知识图谱的提取和事理图谱的提取,分别得到第一提取结果和第二提取结果;
[0057]
查找模块32,用于根据所述第一提取结果和所述第二提取结果在预先建立的图谱关系库中查找对应的知识-事理图谱;
[0058]
解析模块33,用于结合所查找到的知识-事理图谱对所述文字信息进行解析。
[0059]
可选地,在本技术提供的另一实施例中所述提取模块具体用于:
[0060]
提取至少二个所述文字信息的关键词以及所述关键词之间的关系,关键词对应的关系值,将提取结果作为第一提取结果,其中,所述关系值与知识-事理图谱中关系值对应;
[0061]
提取所述文字信息的逻辑关系,将其作为第二提取结果,所述逻辑关系为所述文字信息中所包含的事件逻辑关系,对所表达的事件进行抽象化逻辑表示。
[0062]
可选地,在本技术提供的另一实施例中所述提取模块在提取至少二个所述文字信息的关键词时,具体用于:
[0063]
通过同义词处理、实词提取、语法分析、歧义处理、模型匹配提取至少两个所述文字信息的关键词。
[0064]
可选地,在本技术提供的另一实施例中所述知识-事理图谱的数据采用rdf三元组的形式进行存储,包括:
[0065]
结构化数据、半结构化数据以及非结构化数据。
[0066]
该基于双图谱的语言解析系统的工作过程参见上述基于双图谱的语言解析方法的实现过程,在此不再赘述。
[0067]
实施例三
[0068]
图4是本发明实施例四提供的终端设备的结构示意图。如图4所示,该实施例的终端设备4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行
的计算机程序42,例如基于双图谱的语言解析方法程序。所述处理器40执行所述计算机程序42时实现上述方法实施例一中的步骤,例如图1所示的步骤s101至s103。所述处理器40执行所述计算机程序42时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块31至33的功能。
[0069]
示例性的,所述计算机程序42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序42在所述终端设备4中的执行过程。例如,所述计算机程序42可以被分割成不同模块各模块具体功能如下:
[0070]
提取模块,用于对输入的文字进行知识信息和事件信息进行双方面提取,分别得到第一提取结果和第二提取结果;
[0071]
查找模块,用于根据所述第一提取结果和所述第二提取结果在预先建立的图谱关系库中查找对应的知识-事理图谱;
[0072]
解析模块,用于结合所查找到的知识-事理图谱中相关的信息对所述文字信息进行解析。
[0073]
可选地,在本技术提供的另一实施例中所述提取模块具体用于:
[0074]
提取至少二个所述文字信息的关键词以及所述关键词之间的关系,关键词对应的关系值,将提取结果作为第一提取结果,其中,所述关系值与知识-事理图谱中关系值对应;
[0075]
提取所述文字信息的逻辑关系,将其作为第二提取结果,所述逻辑关系为所述文字信息中所包含的事件逻辑关系,对所表达的事件进行抽象化逻辑表示。
[0076]
可选地,在本技术提供的另一实施例中所述提取模块在提取至少二个所述文字信息的关键词时,具体用于:
[0077]
通过同义词处理、实词提取、语法分析、歧义处理、模型匹配提取至少两个所述文字信息的关键词。
[0078]
可选地,在本技术提供的另一实施例中所述知识-事理图谱的数据采用rdf三元组的形式进行存储,包括:
[0079]
结构化数据、半结构化数据以及非结构化数据。
[0080]
所述终端设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端设备4的示例,并不构成对终端设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
[0081]
所述处理器40可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0082]
所述存储器41可以是所述终端设备4的内部存储单元,例如终端设备4的硬盘或内
存。所述存储器41也可以是所述终端设备4的外部存储设备,例如所述终端设备4上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器41还可以既包括所述终端设备4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
[0083]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0084]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0085]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各实施例的模块、单元和/或方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0086]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0087]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0088]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0089]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0090]
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前
述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献