一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于机器人的知识图谱库构建方法、装置、机器人及介质与流程

2023-02-06 17:54:10 来源:中国专利 TAG:
1.本技术涉及机器人
技术领域
:,尤其涉及一种基于机器人的知识图谱库构建方法、装置、机器人及介质。
背景技术
::2.目前,随着人工智能和机器人技术的迅猛发展,适用于家庭环境下的服务型机器人逐渐成为现实的可能。如何提升服务机器人的智能化水平,实现机器人个性化、舒适化的服务成为研究热点,而对服务环境信息的表达并以服务机器人知识库的形式存储是实现智能化、个性化和舒适化服务的前提。3.现有技术主要是使用一阶谓词逻辑知识表示方法构建知识库,谓词逻辑是一种形式语言表示形式,其使用接近于自然语言的形式语言来描述环境中的各个实体,易于被人理解和接收,然而谓词逻辑的知识表示形式缺乏结构性,难以处理复杂环境下的学习和存储物品关系,无法满足机器人智能化服务需求。技术实现要素:4.本技术提供了一种基于机器人的知识图谱库构建方法、装置、机器人及介质,实现机器人知识图谱库的构建,以解决机器人在复杂环境下难以学习和存储物品关系的问题。5.第一方面,本技术提供了一种基于机器人的知识图谱库构建方法,包括:6.获取机器人的采集数据;7.依据所述采集数据进行实体数据填充处理,得到实体数据层,所述实体数据层包含实体结构化数据;8.依据所述实体结构化数据进行抽象识别处理,得到数据概念层,所述数据概念层包含所述实体结构化数据对应的概念对象信息和所述概念对象信息对应的概念关系属性信息;9.依据所述概念对象信息、所述概念关系属性信息以及所述实体结构化数据进行知识图谱构建处理,得到所述机器人的知识图谱库。10.可选的,所述获取机器人的采集数据,包括:11.获取所述机器人的传感器监测数据;12.依据所述传感器监测数据进行信息处理,得到环境监测数据;13.将所述环境监测数据确定为所述采集数据。14.可选的,所述获取机器人的采集数据,包括:15.获取所述机器人下载的网络数据,所述网络数据包含结构化数据和/或非结构化数据;16.将所述结构化数据和/或非结构化数据确定为所述采集数据。17.可选的,所述依据所述采集数据进行实体数据填充处理,得到实体数据层,包括:18.对所述环境监测数据进行建图分割处理,得到环境实体信息;19.针对所述环境实体信息,按照预设的空间结构化方式对所述环境监测数据进行推理,得到所述环境实体信息对应的环境实体关系属性信息;20.基于所述环境实体信息和所述环境实体关系属性信息,生成所述实体结构化数据;21.基于所述实体结构化数据构建所述实体数据层。22.可选的,所述依据所述采集数据进行实体数据填充处理,得到实体数据层,包括:23.对所述非结构化数据进行数据过滤,得到目标过滤数据;24.对所述目标过滤数据进行实体隐性知识提取,得到隐性知识信息,所述隐性知识信息包含第一实体信息和所述第一实体信息对应的第一实体关系属性信息;25.从所述结构化数据中提取第二实体信息和第二实体信息对应的第二实体关系属性信息;26.对所述第一实体信息和所述第二实体信息进行去重处理,得到目标实体信息;27.基于所述目标实体信息,对所述第一实体关系属性信息和所述第二实体关系属性信息进行去重处理,得到所述目标实体信息对应的目标实体关系属性信息;28.基于所述目标实体信息和所述目标实体关系属性信息,生成所述实体结构化数据;29.基于所述实体结构化数据构建所述实体数据层。30.可选的,所述依据所述实体结构化数据进行抽象识别处理,得到数据概念层,包括:31.对所述实体结构化数据进行识别分类,得到所述概念对象信息;32.利用预设的语言句式对所述概念对象信息进行关系串联处理,得到所述概念关系属性信息;33.基于所述概念对象信息和所述概念关系属性信息,确定所述数据概念层。34.可选的,所述依据所述概念对象信息、所述概念关系属性信息以及所述实体结构化数据进行知识图谱构建处理,得到所述机器人的知识图谱库,包括:35.利用所述概念对象信息、所述概念关系属性信息以及所述实体结构化数据,生成知识图谱;36.根据所述知识图谱构建所述知识图谱库37.第二方面,本技术提供了一种基于机器人的知识图谱库构建装置,包括:38.采集数据获取模块,用于获取机器人的采集数据;39.实体数据层确定模块,用于依据所述采集数据进行实体数据填充处理,得到实体数据层,所述实体数据层包含实体结构化数据;40.数据概念层确定模块,用于依据所述实体结构化数据进行抽象识别处理,得到数据概念层,所述数据概念层包含所述实体结构化数据对应的概念对象信息和所述概念对象信息对应的概念关系属性信息;41.知识图谱库确定模块,用于依据所述概念对象信息、所述概念关系属性信息以及所述实体结构化数据进行知识图谱构建处理,得到所述机器人的知识图谱库。42.第三方面,本技术提供了一种机器人,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;43.存储器,用于存放计算机程序;44.处理器,用于执行存储器上所存放的程序时,实现如第一方面任一项实施例所述的基于机器人的知识图谱库构建方法的步骤。45.第四方面,本技术提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面任一项实施例所述的基于机器人的知识图谱库构建方法的步骤。46.综上,本技术实施例通过获取机器人的采集数据,依据采集数据进行实体数据填充处理,得到实体数据层,实体数据层包含实体结构化数据,依据实体结构化数据进行抽象识别处理,得到数据概念层,数据概率层包含实体结构化数据对应的概念对象信息和概念对象信息对应的概念关系属性信息,依据概念对象信息、概念关系属性信息以及实体结构化数据进行知识图谱构建处理,得到机器人的知识图谱库,利用实体数据层和数据概念层构建机器人的知识图谱库,使得机器人可以利用知识图谱实现对环境中物品的语义信息、物品的属性信息、空间的功能信息以及上下文信息等的统一表征和储存,从而能对对机器人执行服务任务时所涉及的具有多样性、语义性、层次性以及关联性等特点的服务环境信息进行表达和组织,利用有结构性形式的知识图谱库进行知识表示,能帮助机器人快速处理复杂场景下的物品关系,不仅能帮助机器人快速掌握面向服务的物品语义信息,而且可以帮助机器人快速搜寻环境中的物品,提高机器人人机交互的智能性,能高效的完成智能服务,有效解决机器人在复杂的环境下难以学习和存储物品关系的问题。附图说明47.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。48.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。49.图1为本技术实施例提供的一种基于机器人的知识图谱库构建方法的流程示意图;50.图2是本技术一个可选实施例提供的一种基于机器人的知识图谱库构建方法的步骤流程示意图;51.图3是本技术一个可选实施例提供的一种知识图谱的构建流程图流程图;52.图4是本技术一个可选实施例提供的一种知识提取的逻辑结构图;53.图5是本技术一个可选实施例提供的一种概念与实体之间的层次关系图;54.图6为本技术实施例提供的一种基于机器人的知识图谱库构建装置的结构框图;55.图7是本技术实施例提供的一种机器人的结构示意图。具体实施方式56.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术的一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。57.在相关技术中,由于机器人执行服务任务时所涉及的服务环境信息具有多样性、语义性、层次性和关联性等特点,机器人在知识库构建领域里环境的表征和环境信息获取等方面存在着实用性不足、通用性不足、人机交互能力较差、知识库扩展不足以及语义信息添加人工参与度高、自主添加信息可靠性较低等问题,服务机器人完成智能服务任务的难度较大。58.本技术实施例的构思之一在于提出一种基于机器人的知识图谱库构建方法,通过获取机器人的采集数据,依据采集数据进行实体数据填充处理,得到实体数据层,实体数据层包含实体结构化数据,依据实体结构化数据进行抽象识别处理,得到数据概念层,数据概率层包含实体结构化数据对应的概念对象信息和概念对象信息对应的概念关系属性信息,依据概念对象信息、概念关系属性信息以及实体结构化数据进行知识图谱构建处理,得到机器人的知识图谱库,利用实体数据层和数据概念层构建机器人的知识图谱库,使得机器人可以利用知识图谱实现对环境中物品的语义信息、物品的属性信息、空间的功能信息以及上下文信息等的统一表征和储存,从而能对对机器人执行服务任务时所涉及的具有多样性、语义性、层次性以及关联性等特点的服务环境信息进行表达和组织,解决了在机器人知识库构建领域里环境的表征和环境信息获取等方面存在的实用性通用性不足、人机交互能力较差、知识库扩展不足和语义信息添加人工参与度高、自主添加信息可靠性较低等问题,并且利用有结构性形式的知识图谱库进行知识表示,能帮助机器人快速处理复杂场景下的物品关系,不仅能帮助机器人快速掌握面向服务的物品语义信息,而且可以帮助机器人快速搜寻环境中的物品,提高机器人人机交互的智能性,能高效的完成智能服务,有效解决机器人在复杂的环境下难以学习和存储物品关系的问题。59.为便于对本技术实施例的理解,下面将结合附图以及具体实施例做进一步的解释说明,实施例并不构成对本技术实施例的限定。60.图1为本技术实施例提供的一种基于机器人的知识图谱库构建方法的流程示意图。如图1所示,本技术实施例提供的基于机器人的知识图谱库构建方法具体可以包括如下步骤:61.步骤110,获取机器人的采集数据。62.具体的,机器人可以包含服务机器人,如可以是家庭服务机器人,本技术实施例对此不作限制;采集数据可以是机器人采集到的数据,该采集数据可以包含环境监测数据和/或网络数据,本技术实施例对此不作限制。具体而言,本技术实施例中机器人可以对所在的环境进行数据采集,如机器人可以对所在的室内环境进行数据采集,得到环境监测数据,和/或,机器人可以从网络上下载采集网络数据,如网络数据可以包含文本数据、音频数据以及视频数据等,本技术实施例对此不作限制。随后可以将机器人采集到的环境监测数据和/或网络数据作为采集数据。63.步骤120,依据所述采集数据进行实体数据填充处理,得到实体数据层,所述实体数据层包含实体结构化数据。64.具体的,实体结构化数据可以包含实体信息和实体信息对应的实体关系属性信息,本技术实施例对此不作限制。其中,实体信息可以包含实体,实体可以是环境中的实例(如可以包含人或物体等),实体可以作为知识图谱中的最基本元素,每个实体在知识图谱库中拥有唯一的编号用于与其他实体进行区别,本技术实施例对此不作限制。实体关系属性信息可以包含实体之间的关系和实体属性,属性可以用于描述实体具有的某些特性,如以实体为桌子为例,桌子属性可以包含桌子的高度、面积等;以实体为苹果为例,苹果属性可以包含苹果的颜色等;实体之间的关系可以形式化为一个函数,用于描述知识图谱中实体间的关系,例如当前机器人所处环境中苹果放置与桌子上,则苹果与桌子之间的关系可以为放置关系,本技术实施例对此不作限制。65.具体而言,本技术实施例可以对采集数据进行实体数据填充,如可以对采集数据包含的环境监测数据和/或网络数据进行分析提取,从采集数据中提取实体信息和实体信息对应的实体关系属性信息,随后可以将实体信息和实体关系属性信息作为实体结构化数据,基于实体结构化数据构建实体数据层,得到具有层次性和结构性的实体数据层,针对机器人的服务工作环境,机器人能从环境中感知环境物品,并对环境物品的空间进行划分(如苹果放置于桌子上,则可以对苹果和桌子进行空间划分,得到二者的空间位置关系),针对诸如物品的功能属性和操作属性,机器人能从网络数据中学习各种物品属性,用于弥补机器人无法直接从环境物品中识别物品属性的问题,充分考虑了服务机器人执行服务任务时所涉及的环境信息表示的多样性、语义性、层次性和关联性等特性,实现机器人对环境中各物品的语义信息、属性信息和空间的功能信息、上下文信息等进行统一表征和存储,进而实现对环境信息的表达和组织,能以统一的形式编码诸如图像、视频和文本等环境知识。66.步骤130,依据所述实体结构化数据进行抽象识别处理,得到数据概念层。67.其中,所述数据概念层包含所述实体结构化数据对应的概念对象信息和所述概念对象信息对应的概念关系属性信息。68.具体的,概念对象信息可以包含概念,概念可以是具有相同特性的实体构成的集合,如实体包含香蕉和苹果,香蕉和苹果同为水果,则香蕉和苹果具有的相同概念可以是水果,又如椅子和桌子同为家具,则椅子和桌子具有的相同概念可以是家具,本技术实施例对此不作限制;概念关系属性信息可以包含概念之间的关系和概念属性,本技术实施例对此也不作限制。具体而言,本技术实施例确定实体结构化数据后,可以对实体结构化数据中的实体信息进行识别分类,将实体信息抽象化为概念,得到实体信息对应的概念对象信息,随后可以根据概念间的层次性和联系性建立概念间的上下位关系,形成概念结构,以作为概念关系属性信息,进而可以基于概念关系属性信息确定数据概念层,得到具有层次性和结构性的数据概念层。69.步骤140,依据所述概念对象信息、所述概念关系属性信息以及所述实体结构化数据进行知识图谱构建处理,得到所述机器人的知识图谱库。70.具体而言,本技术实施例确定概念对象信息、概念关系属性信息和实体结构化数据后,可以依据概念对象信息、概念关系属性信息和实体结构化数据进行知识图谱构建处理,得到机器人的知识图谱库,通过具有层次性、结构性的实体数据层和数据概念层构建机器人的知识图谱库,实现机器人的知识图谱库的构建,通过将环境信息等进行表征并以知识图谱库的形式存储,不仅可以帮助机器人掌握面向服务的物品语义信息,而且可以帮助机器人快速搜寻环境中的物品,降低服务机器人完成智能服务任务的难度,使得服务机器人能高效完成智能化、个性化和舒适化的智能服务,提高机器人的人机交互、物品查询、知识推理和任务执行等服务能力,能有效解决机器人在复杂的环境下难以学习和存储物品关系的问题。71.在具体实现中,本技术实施例确定概念对象信息、概念关系属性信息和实体结构化数据后,可以基于概念对象信息、概念关系属性信息和实体结构化数据构建三元组集合,随后可以利用三元组集合构建知识图谱,进而得到机器人的知识图谱库。72.可见,本技术实施例通过获取机器人的采集数据,随后依据采集数据进行实体数据填充处理,得到实体数据层,依据实体数据层包含的实体结构化数据进行抽象识别处理,得到数据概念层,进而依据数据概念层包含的概念对象信息、概念关系属性信息以及实体结构化数据进行知识图谱构建处理,得到机器人的知识图谱库,利用实体数据层和数据概念层构建机器人环境信息知识库框架,使得机器人可以对环境中物品的语义信息、属性信息和空间的功能信息、上下文信息等的进行统一表征和储存,解决机器人在执行服务任务时所涉及的服务环境信息具有多样性、语义性、层次性和关联性的问题,可以帮助机器人掌握面向服务的物品语义信息,并快速搜寻环境中的物品,提高机器人人机交互的智能性,能高效的完成智能服务,提高机器人在人机交互、物品查询、知识推理和任务执行的能力,能有效解决机器人在复杂的环境下难以学习和存储物品关系的问题。73.参照图2,示出了本技术一个可选实施例提供的一种基于机器人的知识图谱库构建方法的步骤流程示意图。该基于机器人的知识图谱库构建方法具体可以包括如下步骤:74.步骤210,获取机器人的采集数据。75.在具体实现中,本技术实施例可以预先构建环境信息的数学模型,该数学模型可以包含知识提取层、实体数据层、数据概念层以及知识库(即知识图谱库),通过知识库描述真实世界中存在的各种实体或概念及其关系,在该知识库中可以使用节点表示实体和/或概念,可以使用边表示实体之间属性和关系,以及概念之间的属性和关系,本技术实施例对此不作限制。具体而言,本技术实施例可以基于知识库构建三元组集合,其中,三元组集合可以包含实体集合、关系集合以及概念关系集合,实体集合e可以作为概念,该实体集合e可以包含实体e,关系集合r可以包含各个实体对应的实体关系r,概念关系集合s可以包含各个实体集合e之间的关系,如实体集合可以表示为e={e1,e2,…e|e|},关系集合可以表示为r={r1,r2,…r|a|},关系集合可以表示为随后可以利用实体集合e、关系集合r以及概念关系集合s,构建三元组g,该三元组可以表示为g=(e,r,s)。76.在实际处理中,参照图3,机器人可以对所在环境进行数据采集,如可以对所在的家庭环境或服务工作环境进行服务环境信息采集,得到采集数据。77.在一个可选实施例中,本技术实施例获取机器人的采集数据,具体可以包括:获取所述机器人的传感器监测数据;依据所述传感器监测数据进行信息处理,得到环境监测数据;将所述环境监测数据确定为所述采集数据。具体而言,机器人可以设置有多种传感器,在对所在环境进行数据采集时,可以通过相应传感器从环境中采集图片、视频和点云等数据,以作为传感器检测数据,随后可以对传感器检测数据进行信息处理,得到环境监测数据,以便可以从环境监测数据中识别环境物品,对环境物品所处的位置进行空间划分等,从而实现对环境中物品的语义信息、属性信息和空间的功能信息、上下文信息等的统一表征和储存。78.进一步而言,参照图3,针对诸如环境物品的功能属性和操作属性等是机器人无法直接通过环境监测数据得到的,机器人可以通过爬虫采集的方式从诸如维基百科等百科类网站获取网络数据。79.在一个可选实施例中,本技术实施例获取机器人的采集数据,具体可以包括:获取所述机器人下载的网络数据,所述网络数据包含结构化数据和/或非结构化数据;将所述结构化数据和/或非结构化数据确定为所述采集数据。其中,非结构化数据可以是未区分实体和实体关系的数据,结构化数据可以是已区分实体和实体关系的数据,本技术实施例对此不作限制。具体而言,本技术实施例可以利用爬虫技术在机器人中预先设置数据抓取器,通过数据抓取器从网络中下载结构化数据和非结构化数据,以作为网络数据,以便可以利用网络数据,从网络数据中学习相关知识以补充知识图谱库,并且通过设置数据抓取器自动获取数据,无需人工参与,有效避免在语义信息添加过程中人工参与度高、自主添加信息可靠性较低等问题。80.作为一个示例,参照图4,可以预先为机器人设计知识提取模块,机器人可以通过知识提取模块从不同的数据源获取采集数据。该知识提取模块可以包含三元组下载器、文档下载器、实体及实体关系提取器、三元组筛选器以及环境信息提取器,其中,文档下载器可以是基于爬虫技术设计的数据抓取器。具体而言,可以预设非结构化数据的下载源和结构化数据的下载源,如非结构化数据的下载源可以是互联网提供的百科网页等,本技术实施例对此不做限制。随后机器人可以利用文档下载器从互联网提供的百科网页中抓取网页文本等,得到非结构化数据。对于结构化数据,机器人可以直接通过三元组下载器,从结构化数据的下载源中下载三元组结构化数据,以作为结构化数据。随后可以将非结构化数据和结构化数据作为机器人下载的网络数据。81.步骤220,依据所述采集数据进行实体数据填充处理,得到实体数据层,所述实体数据层包含实体结构化数据。82.在具体实现中,本技术实施例确定采集数据后,可以依据不同的采集数据进行实体数据填充处理。具体而言,在采集数据包含网络数据的情况下,可以分别对网络数据包含的结构化数据和非结构化数据进行实体及实体关系提取,得到实体结构化数据;在采集数据包含环境监测数据的情况下,可以对环境监测数据进行语义分割和空间结构化推理处理,得到实体结构化数据。83.可选的,本技术实施例依据所述采集数据进行实体数据填充处理,得到实体数据层,具体可以包括以下子步骤:84.子步骤2201,对所述环境监测数据进行建图分割处理,得到环境实体信息。85.具体的,环境实体信息可以包含环境物品,本技术实施例对此不做限制。具体而言,本技术实施例可以对环境监测数据进行建图分割处理,如可以利用语义同步定位建图(simultaneouslocalizationandmapping,slam)技术,对环境监测数据进行环境几何构建,并识别环境中各个环境物品,得到环境中的实体,即环境物品,以作为环境实体信息。86.子步骤2202,针对所述环境实体信息,按照预设的空间结构化方式对所述环境监测数据进行推理,得到所述环境实体信息对应的环境实体关系属性信息。87.具体的,环境实体关系属性信息可以包含环境实体信息之间的位置关系和归属关系,本技术实施例对此不做限制。具体而言,本技术实施例确定环境实体信息后,可以针对环境实体信息,按照预设的空间结构化方式对环境监测数据进行推理,如预设的空间结构化方式可以是空间结构化推理技术,通过利用空间结构化推理技术对环境监测数据进行推理,得到各个环境物品之间的位置关系和归属关系,以作为环境实体关系属性信息。88.子步骤2203,基于所述环境实体信息和所述环境实体关系属性信息,生成所述实体结构化数据。89.具体而言,本技术实施例确定环境实体信息和环境实体关系属性信息后,可以基于环境实体信息和环境实体关系属性信息,生成实体结构化数据,通过从环境中获取环境实体信息和环境实体信息对应的环境实体关系属性信息,能全面覆盖机器人执行服务任务时的服务环境信息所具有多样性、语义性、层次性和关联性,并且通过利用环境实体信息和环境实体关系属性信息,生成实体结构化数据,可以利用结构化的形式对知识进行表示,从而使得机器人能有效处理复杂场景下的物品关系,极大降低服务机器人完成智能服务任务的难度,使得机器人可以快速搜寻环境中的物品,在提高机器人人机交互的智能性的同时,机器人也能高效的完成智能服务任务。90.作为一个示例,参照图3,机器人可以通过环境信息处理模块,利用语义slam技术和空间结构化推理技术对环境监测数据进行处理,得到环境物品和环境物品之间的位置关系、归属关系。91.子步骤2204,基于所述实体结构化数据构建所述实体数据层。92.例如,参照图3,本技术实施例在确定实体结构化数据后,可以利用实体结构化数据进行数据层构建,得到实体数据层。93.可选的,本技术实施例依据所述采集数据进行实体数据填充处理,得到实体数据层,具体可以包括以下子步骤:94.子步骤2205,对所述非结构化数据进行数据过滤,得到目标过滤数据。95.具体的,目标过滤数据可以包含未识别的实体和实体关系属性,本技术实施例对此做限制。具体而言,本技术实施例中机器人下载网络数据后,可以对网络数据中的非结构化数据进行数据过滤,得到目标过滤数据。96.在具体实现中,本技术实施例中的非结构化数据可能包含与构建知识图谱无关的无关数据以及不完整数据,由于可能无法从该无关数据和不完整数据中提取实体信息和实体关系属性信息,因此,本技术实施例确定非结构化数据后,可以对非结构化数据进行数据过滤,从非结构化数据中过滤该无关数据和不完整数据,得到目标过滤数据,从而能避免对无关数据和不完整数据进行无效的提取,进而能有效节省机器人的计算资源和存储资源。97.子步骤2206,对所述目标过滤数据进行实体隐性知识提取,得到隐性知识信息,所述隐性知识信息包含第一实体信息和所述第一实体信息对应的第一实体关系属性信息。98.在具体实现中,针对机器人无法直接从环境信息中获取的隐性知识,本技术实施例可以对目标过滤数据进行实体隐性知识提取,如可以从目标过滤数据中提取物品,得到第一实体信息,并可以针对该物品提取物品的功能属性以及物品的操作属性,得到第一实体关系属性信息,进而将第一实体信息和第一实体关系属性信息作为隐性知识信息。例如,隐性知识信息可以来源于各种对实体的介绍,以电视遥控器为例,可以在维基百科、各种专业网站论坛获取电视遥控器介绍,确定电视遥控器的功能属性为控制电视机,电视遥控器的操作属性为按钮,即可以通过电视遥控器上的按钮控制电视机,从而能利用隐性知识扩充机器人的知识库,使得机器人的知识图谱更加完善,解决机器人在构建知识库时仅获取环境的表征和环境信息所存在的实用性不足、通用性不足、人机交互能力差、知识库扩展不足等问题。99.作为一个示例,参照图4,对于非结构化数据,机器人可以对非结构化数据进行过滤得到目标过滤数据后,通过实体及实体关系提取器对目标过滤数据进行提取,得到第一实体信息和第一实体关系属性信息。具体而言,本示例中实体及实体关系提取器可以是基于斯坦福大学为自然语言处理开发的自然语言分析工具集(corenlp),通过实体及实体关系提取器对分析非结构化数据对应的目标过滤数据的语句特征和语法特征,得到特征分析结果,进而根据特征分析结果确定第一实体信息和第一实体关系属性信息,实现从目标过滤数据中提取隐性知识信息。100.子步骤2207,从所述结构化数据中提取第二实体信息和第二实体信息对应的第二实体关系属性信息。101.具体而言,本技术实施例中,对于结构化数据可以直接从结构化数据中提取实体及实体关系,得到第二实体信息和第二实体信息对应的第二实体关系属性信息。102.例如,参照图4,机器人可以直接通过三元组下载器从结构化数据源中下载结构化数据,并可以从结构化数据中提取第二实体信息和第二实体关系属性信息。103.子步骤2208,对所述第一实体信息和所述第二实体信息进行去重处理,得到目标实体信息。104.在具体实现中,机器人从结构化数据和非结构化数据提取到的实体信息中可能存在重复的实体,为避免对实体信息进行重复添加,本技术实施例在确定第一实体信息和第二实体信息后,可以对第一实体信息和第二实体信息进行去重处理,得到目标实体信息。105.子步骤2209,基于所述目标实体信息,对所述第一实体关系属性信息和所述第二实体关系属性信息进行去重处理,得到所述目标实体信息对应的目标实体关系属性信息。106.在具体实现中,机器人对从结构化数据和非结构化数据提取到的第一实体信息和第二实体信息进行去重后,得到目标实体信息,随后可以针对目标实体信息对应的实体关系属性信息进行判断,确定该重复的第一实体信息和第二实体信息所对应的第一实体关系属性信息和第二实体关系属性信息是否重复,若确定该第一实体关系属性信息和第二实体关系属性信息重复,则可以对该重复的第一实体关系属性信息和第二实体关系属性信息进行去重,得到目标实体信息对应的目标实体关系属性信息。107.子步骤2210,基于所述目标实体信息和所述目标实体关系属性信息,生成所述实体结构化数据。108.具体而言,本技术实施例确定目标实体信息和目标实体关系属性信息后,可以基于目标实体信息和目标实体关系属性信息,生成实体结构化数据,从而可以利用网络数据弥补机器人本体难以通过传感器获取物品的功能属性和操作属性的问题,能有效解决机器人在知识库构建领域里环境的表征和环境信息获取等方面存在的实用性通用性不足、人机交互能力较差、知识库扩展不足和语义信息添加人工参与度高、自主添加信息可靠性较低等问题。109.作为一个示例,参照图4,机器人从结构化数据、非结构化数据和环境监测数据中提取实体和实体关系属性后,可以通过三元组筛选器,利用提取到的实体和实体关系属性进行三元组构建,得到三元组集合,以便可以利用三元组集合知识图谱的表征环境信息。110.子步骤2211,基于所述实体结构化数据构建所述实体数据层。111.在具体实现中,参照图3,本技术实施例确定实体结构化数据后,可以利用实体结构化数据构建实体数据层。112.步骤230,对所述实体结构化数据进行识别分类,得到所述概念对象信息。113.具体而言,本技术实施例确定实体结构化数据后,可以对实体结构化数据中各实体信息进行识别分类,如可以对各实体信息进行识别分类,确定各实体信息对应的实体类别,随后可以根据实体类别利用统计学的方式将实体信息抽象为概念,得到概念对象信息。114.在具体实现中,针对室内环境领域所涉及的相关概念,可以通过统计学的方法提取室内环境下的概念。可以对实体结构化数据进行识别分类,将实体结构化数据分类到室内环境下的概念中,得到概念对象信息。具体而言,对于室内环境下的概念,本技术实施例可以结合专家经验,确定该概念可以是在室内领域中以相当高的频率出现的单词或短语,该概念可以用于表示领域特征,其中,概念可以使用两个特征进行定义:特征1、在室内领域内出现的概率要比在其他领域出现的频率要高;特征2、在室内领域的文档中分布较为均匀,而不是集中出现在个别室内领域文档中。随后可以结合特征1和特征2确定概念与领域之间的相关率,即确定概念与室内领域的相关率,并可以根据实际需求将较低相关率的概念去除,对相关率较高的概念,则可以基于实体结构结构化数据进行分类识别,将实体结构化数据分类到该相关率较高的概念中,从而能有效减少与室内领域无关的概念。115.作为一个示例,对于特征1,可以使用领域相关度进行量化描述,如可以使用如下公式:[0116][0117]具体而言,公式(1)可以用于计算概念t与领域的相关度drt,k,即可以用于计算概念t与室内领域的相关度,其中,室内领域的集合可以表示为set={d1,…,dk},p(t∣dk)可以用于表示条件概率。对于p(t∣dk)可以使用如下公式进行计算:[0118][0119]具体而言,公式(2)中,ft,k可以用于表示概念t在领域dk中的频率,ft′,k可以用于表示概念t′在dk中的频率。[0120]作为一个示例,对于特征2,可以使用领域一致性进行量化描述,如可以使用如下公式(3)计算领域一致性:[0121][0122]具体而言,公式(3)中,dj可以用于表示领域中的任意的一个文档,h(p(t,dj))和dc(t,dk)均可以用于描述领域一致性。[0123]进一步而言,对于p(t,dj),可以使用如下公式(4)进行计算:[0124][0125]其中,在公式(4)中,ft,dj可以用于表示概念t在文档才中出现的频率。[0126]进一步的,本技术实施例确定领域相关度和领域一致性后,可以结合领域相关性和领域一致性,计算概念与领域的相关率,以减少与领域无关的概念出现的几率。如可以通过如下公式(5)进行计算:[0127]twt,k=αdrt,k βdct,k,α,β∈(0,1)ꢀꢀ(5)[0128]其中,参数α和参数β都可以根据实际需求进行预设,本示例对参数α和参数β均不做限制,twt,k可以用于表示概念与领域之间的相关率。[0129]步骤240,利用预设的语言句式对所述概念对象信息进行关系串联处理,得到所述概念关系属性信息。[0130]具体的,语言句式可以包含语言学句式,本技术实施例对此不做限制。具体而言,本技术实施例确定概念对象信息后,可以利用预设的语言句式对概念对象信息进行关系串联,确定概念之间的上下位关系,以作为概念关系属性信息。[0131]在实际处理中,本技术实施例得到的概念对象信息,如室内领域的相关概念等,这些概念可能是相互离散的,无法建立起相互之间的联系,为方便机器人能有效处理复杂场景下的物品关系,本技术实施例可以针对概念对象信息,利用语言学句式,建立概念对象信息之间的上下位关系,即建立概念之间的上下位关系,如机器人可以通过爬虫技术预先设置概念抓取器,通过概念抓取器从预设的文本资源获取与室内领域相关的的百科类文本资源,随后机器人可以从与室内领域相关的的百科类文本资源中学习概念的上下位关系,从而利用上下位关系将离散的概念以上位和下位的关系串联,得到概念关系属性信息,后续可以利用概念对象信息和概念关系属性信息进行概念层构建,形成结构化、层次化的概念层,作为数据概念层。[0132]作为一个示例,参照图5,图5是概念与实体之间的层次关系图。具体而言,室内领域框架(ting)可以包含对象(object)、人(person)以及房间(room)等概念,概念之间可以有上位和下位的关系,如object可以作为上位概念,object可以包含电子设备(electronicdevice)、食物(food)以及家具(furniture)等多个下位概念,electronicdevice可以包含冰箱(fridge)以及个人电脑(personalcomputer,pc)等多个电子设备类型的实体,furniture可以包含床(bed)、沙发(sofa)以及桌子(table)等多个家具类型的实体,person可以包含男性(man)和女性(woman),room可以包含卧室(bedroom)和厨房(kitchen),bedroom可以包含主卧室(masterbedroom),本示例对此不做限制。[0133]步骤250,基于所述概念对象信息和所述概念关系属性信息,确定所述数据概念层。[0134]具体而言,本技术实施例确定概念对象信息和概念关系属性信息后,可以利用概念对象信息和概念关系属性信息进行概念层构建,得到数据概念层,通过构建结构化、层次化的概念层,确保后续形成的知识图谱能够以结构性的形式表征环境知识,从而能有效处理复杂场景下的物品和物品关系,满足机器人智能化服务需求。[0135]作为一个示例,参照图3,可以针对实体结构化数据进行概念规约,如可以依据实体结构化数据进行识别分类等处理,形成包含概念对象信息和概念关系属性信息的概念层次结构,进而构建数据概念层。[0136]步骤260,利用所述概念对象信息、所述概念关系属性信息以及所述实体结构化数据,生成知识图谱。[0137]具体而言,本技术实施例可以利用概念对象信息、概念关系属性信息以及实体结构化数据,生成知识图谱,如可以利用概念对象信息、概念关系属性信息以及实体结构化数据进行三元组构建,得到三元组,通过三元组将真实世界中实体和实体关系构成一张巨大的语义网络图,将三元组作为知识图谱的一种环境信息表征方式,从而能描述真实世界中各种实体和实体关系以及概念和概念关系,充分考虑服务机器人执行服务任务时所涉及的环境信息的多样性、语义性、层次性和关联性,利用知识图谱实现对环境中物品的语义信息、物品的属性信息、空间的功能信息以及上下文信息等的统一表征和储存。[0138]作为一个示例,参照图3,可以预先构建图数据库,在确定实体结构化数据和概念层次结构后,可以将实体结构化数据和概念层次结构存储至图数据库中,随后可以利用图数据库包含的实体和实体关系以及概念和概念关系构建知识图谱,进而可以利用知识图谱构建知识库,即知识图谱库。[0139]步骤270,根据所述知识图谱构建所述知识图谱库。[0140]在具体实现中,本技术实施例可以根据知识图谱构建知识图谱库,如可以在仅有一个知识图谱时,直接利用知识图谱构建知识图谱库,在有多个知识图谱时,结合多个知识图谱进行知识图谱库构建,得到知识图谱库,在机器人执行服务任务时,能够利用该知识图谱库对环境中物品的语义信息、属性信息和空间的功能信息、上下文信息等的统一表征,不仅能帮助机器人快速掌握面向服务的物品语义信息,还可以帮助机器人根据服务任务快速搜寻环境中的物品,提高机器人人机交互的智能性,使得机器人能高效的、个性化的以及舒适化的完成智能服务。[0141]综上,本技术实施例通过获取机器人的采集数据,依据采集数据进行实体数据填充处理,得到实体数据层,随后对实体数据层包含的实体结构化数据进行识别分类,得到概念对象信息,利用预设的语言句式对概念对象信息进行关系串联处理,得到概念关系属性信息,基于概念对象信息和概念关系属性信息,确定数据概念层,利用概念对象信息、概念关系属性信息以及实体结构化数据,生成知识图谱,根据知识图谱构建知识图谱库,利用实体数据层和数据概念层构建机器人的知识图谱库,使得机器人可以利用知识图谱实现对环境中物品的语义信息、物品的属性信息、空间的功能信息以及上下文信息等的统一表征和储存,从而能对对机器人执行服务任务时所涉及的具有多样性、语义性、层次性以及关联性等特点的服务环境信息进行表达和组织,利用有结构性形式的知识图谱库进行知识表示,能帮助机器人快速处理复杂场景下的物品关系,不仅能帮助机器人快速掌握面向服务的物品语义信息,而且可以帮助机器人快速搜寻环境中的物品,提高机器人人机交互的智能性,能高效的完成智能服务,有效解决机器人在复杂的环境下难以学习和存储物品关系的问题。[0142]需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术实施例并不受所描述的动作顺序的限制,因为依据本技术实施例,某些步骤可以采用其他顺序或者同时进行。[0143]如图6所示,本技术实施例还提供了一种基于机器人的知识图谱库构建装置600,包括:[0144]采集数据获取模块610,用于获取机器人的采集数据;[0145]实体数据层确定模块620,用于依据所述采集数据进行实体数据填充处理,得到实体数据层,所述实体数据层包含实体结构化数据;[0146]数据概念层确定模块630,用于依据所述实体结构化数据进行抽象识别处理,得到数据概念层,所述数据概念层包含所述实体结构化数据对应的概念对象信息和所述概念对象信息对应的概念关系属性信息;[0147]知识图谱库确定模块640,用于依据所述概念对象信息、所述概念关系属性信息以及所述实体结构化数据进行知识图谱构建处理,得到所述机器人的知识图谱库。[0148]可选的,所述采集数据获取模块,包括:[0149]传感器监测数据获取子模块,用于获取所述机器人的传感器监测数据;[0150]环境监测数据确定子模块,用于依据所述传感器监测数据进行信息处理,得到环境监测数据;[0151]采集数据确定子模块,用于将所述环境监测数据确定为所述采集数据。[0152]可选的,所述采集数据获取模块,包括:[0153]网络数据获取子模块,用于获取所述机器人下载的网络数据,所述网络数据包含结构化数据和/或非结构化数据;[0154]采集数据确定子模块,用于将所述结构化数据和/或非结构化数据确定为所述采集数据。[0155]可选的,所述实体数据层确定模块,包括:[0156]环境实体信息确定子模块,用于对所述环境监测数据进行建图分割处理,得到环境实体信息;[0157]环境实体关系属性信息确定子模块,用于针对所述环境实体信息,按照预设的空间结构化方式对所述环境监测数据进行推理,得到所述环境实体信息对应的环境实体关系属性信息;[0158]实体结构化数据生成子模块,用于基于所述环境实体信息和所述环境实体关系属性信息,生成所述实体结构化数据;[0159]实体数据层构建子模块,用于基于所述实体结构化数据构建所述实体数据层。[0160]可选的,所述实体数据层确定模块,包括:[0161]目标过滤数据确定子模块,用于对所述非结构化数据进行数据过滤,得到目标过滤数据;[0162]隐性知识信息确定子模块,用于对所述目标过滤数据进行实体隐性知识提取,得到隐性知识信息,所述隐性知识信息包含第一实体信息和所述第一实体信息对应的第一实体关系属性信息;[0163]提取子模块,用于从所述结构化数据中提取第二实体信息和第二实体信息对应的第二实体关系属性信息;[0164]目标实体信息确定子模块,用于对所述第一实体信息和所述第二实体信息进行去重处理,得到目标实体信息;[0165]目标实体关系属性信息确定子模块,用于基于所述目标实体信息,对所述第一实体关系属性信息和所述第二实体关系属性信息进行去重处理,得到所述目标实体信息对应的目标实体关系属性信息;[0166]实体结构化数据确定子模块,用于基于所述目标实体信息和所述目标实体关系属性信息,生成所述实体结构化数据;[0167]实体数据层构建子模块,用于基于所述实体结构化数据构建所述实体数据层。[0168]可选的,所述数据概念层确定模块,包括:[0169]概念对象信息确定子模块,用于对所述实体结构化数据进行识别分类,得到所述概念对象信息;[0170]概念关系属性信息确定子模块,用于利用预设的语言句式对所述概念对象信息进行关系串联处理,得到所述概念关系属性信息;[0171]数据概念层确定子模块,用于基于所述概念对象信息和所述概念关系属性信息,确定所述数据概念层。[0172]可选的,所述知识图谱库确定模块,包括:[0173]知识图谱生成子模块,用于利用所述概念对象信息、所述概念关系属性信息以及所述实体结构化数据,生成知识图谱;[0174]知识图谱库构建子模块,用于根据所述知识图谱构建所述知识图谱库。[0175]需要说明的是,本技术实施例提供的基于机器人的知识图谱库构建装置可执行本技术任意实施例所提供的基于机器人的知识图谱库构建方法,具备执行基于机器人的知识图谱库构建方法相应的功能和有益效果。[0176]在具体实现中,上述基于机器人的知识图谱库构建装置可以集成在机器人中,使得该机器人可以依据采集数据构建知识图谱,得到知识图谱库,实现机器人知识图谱库的构建,能有效解决机器人在复杂的环境下难以学习和存储物品关系的问题。该机器人可以是由两个或多个物理实体构成,也可以是一个物理实体构成,如机器人可以是个人计算机(personalcomputer,pc)、电脑、服务器等,本技术实施例对此不作具体限制。[0177]如图6所示,本技术实施例提供提供了一种机器人,包括处理器111、通信接口112、存储器113和通信总线114,其中,处理器111,通信接口112,存储器113通过通信总线114完成相互间的通信;存储器113,用于存放计算机程序;处理器111,用于执行存储器113上所存放的程序时,实现前述任意一个方法实施例提供的基于机器人的知识图谱库构建方法的步骤。示例性的,基于机器人的知识图谱库构建方法的步骤可以包括如下步骤:获取机器人的采集数据;依据所述采集数据进行实体数据填充处理,得到实体数据层,所述实体数据层包含实体结构化数据;依据所述实体结构化数据进行抽象识别处理,得到数据概念层,所述数据概念层包含所述实体结构化数据对应的概念对象信息和所述概念对象信息对应的概念关系属性信息;依据所述概念对象信息、所述概念关系属性信息以及所述实体结构化数据进行知识图谱构建处理,得到所述机器人的知识图谱库。[0178]本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述任意一个方法实施例提供的基于机器人的知识图谱库构建方法的步骤。[0179]需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者机器人不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者机器人所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者机器人中还存在另外的相同要素。[0180]以上所述仅是本技术的具体实施方式,使本领域技术人员能够理解或实现本技术。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。当前第1页12当前第1页12
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献