一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种普洱茶领域知识图谱构建方法及装置与流程

2022-03-26 14:03:46 来源:中国专利 TAG:


1.本发明涉及普洱茶技术领域,尤其涉及一种普洱茶领域知识图谱构建方法及装置。


背景技术:

2.知识图谱(knowledge graph)以结构化的形式描述客观世界中概念、实体及其关系,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱主要技术包括知识获取、知识表示、知识存储、知识建模、知识融合、知识理解、知识运维等七个方面,通过面向结构化、半结构化和非结构化数据构建知识图谱为不同领域的应用提供支持。
3.知识图谱是一个宏大的数据模型,可以构建庞大的“知识”网络,包含客观世界存在的大量实体、属性以及关系,为人们提供一种快速便捷进行知识检索与推理的方式。近些年蓬勃发展的人工智能本质上是一次知识革命,其核心在于通过数据观察与感知世界,实现分类预测、自动化等智能化服务。知识图谱作为人类知识描述的重要载体,推动着信息检索、智能问答等众多智能应用。
4.普洱茶领域产业链上的各类企业普遍信息化、自动化基础都较为薄弱,受限于成本压力、技术改造风险及技术水平现状等因素,目前对于各类数据信息积累和领域知识的理解应用都处于初级阶段。从整个普洱茶产业链现状来看,普洱茶从种植、初制、精加工、深加工、产品销售、商品流通和使用,全周期各个环节涉及到的各类知识信息分散在各类加工企业、销售流通企业、科研院所、高校及最终用户等对象中,数据信息的综合利用率较低。知识价值对普洱茶产业领域推动的体现程度不高。
5.因此,研究普洱茶产业链上各类知识分类表达和建模方法,构建普洱茶领域知识图谱,通过知识图谱应用,逐步实现普洱茶产业链各环节价值增值,推动企业数字化转型,是当前急需解决的问题。


技术实现要素:

6.普洱茶领域知识图谱为限定领域知识图谱,具有领域专业性特征,其应用场景及服务主要针对特定企业和人群。专业型知识图谱的构建通常采用自顶向下的构建方式,逐层建模和细化,其核心在于各类知识本体的抽象及关系的逻辑表达。
7.普洱茶领域知识图谱构建首先需要建立符合行业特征的知识本体模型及框架,确保各知识本体描述的准确性,然后通过整合结构化和非结构化数据识别知识实体模型,通过增量模型构建,逐步建立普洱茶领域知识图谱模型,支撑各类知识应用场景。
8.为实现上述目的,本发明提出一种普洱茶领域知识图谱构建方法及装置,构建方法具体包括如下步骤:
9.s10,建立普洱茶领域第一层知识本体分类模型;
10.s20,建立普洱茶领域第二层知识本体分类模型;
11.s30,建立与第一、第二层知识本体分类模型关联的普洱茶领域知识实体模型,用于构建普洱茶领域知识图谱。
12.优选地,步骤s10所述的建立普洱茶领域第一层知识本体分类模型,具体包括以下步骤:
13.s101,创建普洱茶领域知识图谱根节点,该普洱茶领域知识图谱根节点即为普洱茶;
14.s102,根据国家标准、行业标准、学术论著等公开资料或数据,建立普洱茶领域第一层知识本体分类节点,该普洱茶领域第一层知识本体分类节点包括:产品、企业、品牌、成分、产地、品种类别、加工制造;
15.s103,针对每一个第一层知识本体分类节点,建立特征词库,该特征词库以第一层知识本体分类节点、属性和属性值三元组结构的方式,挂接到对应的第一层知识本体分类节点上;
16.s104,采用星型结构方式,将第一层知识本体分类节点与根节点连接,建立根节点与第一层知识本体分类节点间的关系;所述星型结构是指每个第一层知识本体分类节点只与根节点关联,各知识本体分类节点之间不进行关联;
17.s105,构建由根节点、关系和第一层知识本体分类节点三元组模型组成的普洱茶领域第一层知识本体分类模型。
18.优选地,步骤s20所述的建立普洱茶领域第二层知识本体分类模型,具体包括以下步骤:
19.s201,针对每一个普洱茶领域第一层知识本体分类节点涉及的知识领域,判断是否需要建立第二层知识本体分类模型;
20.s202,当需要建立第二层知识本体分类模型,则根据国家标准、行业标准、学术论著公开资料或数据,建立普洱茶领域第一层知识本体分类节点所属的第二层知识本体分类节点;
21.s203,针对每一个第二层知识本体分类节点建立特征词库,该特征词库以第二层知识本体分类节点、属性和属性值三元组结构的方式,挂接到对应的第二层知识本体分类节点上;
22.s204,将第二层知识本体分类节点与对应的第一层知识本体分类节点连接,构成普洱茶领域网状知识本体分类结构有向图;
23.s205,构建由第一层知识本体分类节点、关系和第二层知识本体分类节点三元组模型组成的普洱茶领域第二层知识本体分类模型。
24.所述普洱茶领域第一层、第二层知识本体分类节点特征词库,主要用于存储该分类领域内的一组关键字、词、符号等内容,用于实体模型提取时判断实体模型和本体模型的归属及关联关系。
25.优选地,步骤s30所述的建立与第一、第二层知识本体分类模型关联的普洱茶领域知识实体模型,用于构建普洱茶领域知识图谱,具体包括以下步骤:
26.s301,普洱茶领域知识实体模型提取,采用机器学习算法从现有的半结构化和非结构文本数据中,提取普洱茶领域知识实体模型,该普洱茶领域知识实体模型由实体、属性和属性值三元组结构构成;
27.s302,普洱茶领域知识实体模型与本体模型关联,将s301步骤提取的普洱茶领域知识实体模型与第一层、第二层知识本体分类模型的一个或多个节点关联,构成普洱茶领域知识图谱;
28.s303,存储,将普洱茶领域知识本体分类模型、普洱茶领域知识实体模型数据存储到图数据库中;
29.s304,运维,包括:维护普洱茶领域第一层、第二层知识本体分类模型和特征词库,调整普洱茶领域知识实体模型与普洱茶领域知识本体分类模型关联关系,审核及修正普洱茶领域知识实体模型内容。
30.本发明还提供一种普洱茶领域知识图谱构建装置,包括设置在计算机中的:
31.实体模型提取模块,用于从半结构化、非结构化文本中提取普洱茶领域知识实体模型,形成由普洱茶领域知识实体模型名称、属性和属性值构成的三元组数据结构;
32.第一分类确定模块,用于通过特征词库判断、确定普洱茶领域知识实体模型属于普洱茶领域第一层知识本体分类模型的哪个分类;
33.第二分类确定模块,用于通过特征词库判断、确定普洱茶领域知识实体模型,是否属于普洱茶领域第二层知识本体分类模型的某个分类;
34.模型关系构建模块,用于建立普洱茶领域第一层知识本体分类模型、第二层知识本体分类模型、普洱茶领域知识实体模型间相互关联的有向关系;
35.知识运维模块,用于存储、更新、维护普洱茶领域知识图谱数据。
36.本发明还提供一种计算机的部分结构,包括存储器、处理器、总线及存储在所述存储器上,并可在所述处理器上运行的计算机程序,所述处理器与所述存储器之间通过总线通讯,所述处理器执行所述计算机程序时实现如上述任何一项所述普洱茶领域知识图谱构建方法的步骤。
37.与现有技术相比,本发明的有益效果为:
38.本发明提供的普洱茶领域知识图谱构建方法,采用自中心向外围扩展的构建方式,对普洱茶领域知识进行两个层级的分类,先建立普洱茶领域第一层知识本体分类模型,再在第一层知识本体分类模型的基础上,建立普洱茶领域第二层知识本体分类模型,结合本体分类模型特征词库提取实体模型,并与本体分类模型进行关联,构成普洱茶领域知识图谱。采用本发明可以通过知识本体分类管理实体模型间的复杂关系,降低增量知识提取过程中对专业人员的依赖,提高知识建模的准确性。
附图说明
39.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图进行简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图示出的结构获得其他的附图。
40.图1为本发明普洱茶领域知识图谱构建方法流程示意图;
41.图2为本发明普洱茶领域第一层知识本体分类模型建立流程示意图;
42.图3为本发明普洱茶领域第一层知识本体分类模型结构示意图;
43.图4为本发明普洱茶领域第二层知识本体分类模型建立流程示意图;
44.图5为本发明普洱茶领域第二层知识本体分类模型部分结构示意图;
45.图6为本发明普洱茶领域知识实体模型建立流程示意图;
46.图7为本发明普洱茶领域知识图谱示例图;
47.图8为本发明普洱茶领域知识图谱构建装置结构示意图;
48.图9为本发明提供的计算机部分结构示意图。
具体实施方式
49.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
50.在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。术语“内”、“上”、“下”等指示的方位或状态关系为基于附图所示的方位或状态关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
51.在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“连接”、“设有”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,根据具体情况理解上述术语在本发明中的具体含义。
52.普洱茶领域知识图谱为限定领域知识图谱,具有领域专业性特征,其构建通常采用自中心向外围扩展的构建方式,逐层建模和细化,其核心在于各类知识本体的抽象及关系的逻辑表达。
53.普洱茶领域知识图谱构建过程中,首先需要建立符合行业特征的知识本体模型及框架,然后通过整合结构化和非结构化数据识别知识实体模型,通过增量模型构建,逐步建立普洱茶领域知识图谱模型。
54.为此,本发明提供一种普洱茶领域知识图谱构建方法,如图1所示,普洱茶领域知识图谱构建方法包括以下步骤:
55.s10,建立普洱茶领域第一层知识本体分类模型,该普洱茶领域第一层知识本体分类模型建立流程如图2所示,具体包括如下步骤:
56.s101,创建普洱茶领域知识图谱根节点,该普洱茶领域知识图谱根节点即为普洱茶;
57.s102,根据国家标准、行业标准、学术论著等公开资料或数据,建立普洱茶领域第一层知识本体分类节点;
58.需要说明的是,所述知识本体主要用来描述某个领域内的概念和概念之间的关系,使得它们在共享的范围内具有大家共同认可的、明确的、唯一的定义;
59.所述普洱茶领域第一层知识本体分类节点需要对普洱茶领域内的知识进行分类,每个第一层知识本体分类节点对应概念明确、范围清晰的领域知识内容;
60.具体地,本实施例中,根据公开资料或数据的分析,对普洱茶领域知识内容进行分类、抽象、构建的普洱茶领域第一层知识本体分类节点包括:产品、企业、品牌、成分、产地、
品种类别、加工制造共7个方面,如图3所示,其中:
61.产品节点主要为市场销售的所有普洱茶制品的概念抽象;
62.企业节点主要为与普洱茶产业链相关的各类企业实体的概念抽象,如:制茶企业、茶销售企业、制茶设备生产企业等;
63.品牌节点主要为市场认可的普洱茶或普洱茶相关的品牌概念抽象;
64.成分节点主要为普洱茶含有的各类物质或成分的概念抽象;
65.产地节点主要为国家标准《地理标志产品普洱茶》(gbt 22111-2008)中规定的普洱茶地理标志产品保护区域的概念抽象;
66.品种类别节点主要为普洱茶制品、普洱茶树种概念的抽象;
67.加工制造节点主要为普洱茶的不同加工工艺或加工流程的概念抽象;
68.s103,针对每一个第一层知识本体分类节点建立特征词库,该特征词库以第一层知识本体分类节点、属性和属性值三元组结构的方式,挂接到对应的第一层知识本体分类节点上;
69.本实施例中,第一层知识本体分类节点的特征词库属于自然语言技术领域的领域特征词库范畴,具体是指与所述领域具有强相关性,具有领域知识区别能力形成的词语集合,如普洱茶领域中常见的“普洱茶”、“冰岛”、“古树茶”、“勐海”、“布朗山”等,这些词可作为分类特征而存在;
70.表1为本实施例所述第一层知识本体分类节点特征词库的结构关系示意表:
71.表1
[0072][0073]
如表1所示,知识本体分类节点“成分”的特征词库由一组特征词属性和特征词属性值构成,根据需要,特征词属性包括语句、术语、名词、动词、符号等;特征词属性值由知识本体分类节点所属知识领域内的关键词、关键字、专有称谓构成;本实施例中知识本体分类
节点“成分”领域相关的特征词主要是与普洱茶物料理化检测相关的指标、物质、单位等元素;特征词库主要用于知识实体模型提取时,判断实体模型和本体模型的归属及关联关系;
[0074]
s104,采用星型结构方式,将第一层知识本体分类节点与根节点连接,建立根节点与第一层知识本体分类节点间的关系,如图3所示;所述星型结构是指每个第一层知识本体分类节点只与根节点关联,各知识本体分类节点之间不进行关联;
[0075]
需要说明的是,本实施例采用的星型结构连接方式可以保证知识本体分类的独立性,便于管理分类节点对应知识领域的二级本体分类模型和实体模型,降低知识图谱语义网络的复杂性,避免知识歧义性情况;
[0076]
s105,构建由根节点、关系和第一层知识本体分类节点三元组模型组成的普洱茶领域第一层知识本体分类模型,本实施例构建的普洱茶领域第一层知识本体分类模型如图3所示;
[0077]
s20,建立普洱茶领域第二层知识本体分类模型,该普洱茶领域第二层知识本体分类模型建立流程如图4所示,具体包括如下步骤:
[0078]
s201,针对每一个普洱茶领域第一层知识本体分类节点涉及的知识领域,判断是否需要建立第二层知识本体分类模型;
[0079]
需要说明的是,根据知识图谱构建过程的演进和知识图谱应用需求,在第一层知识本体分类节点下,如其知识领域较为单一或过于复杂,可以暂时不构建第二层知识本体分类,待知识实体模型积累到一定规模后再进行划分;
[0080]
s202,当需要建立第二层知识本体分类模型,则根据国家标准、行业标准、学术论著等公开资料或数据,建立普洱茶领域第一层知识本体分类节点所属的第二层知识本体分类节点;
[0081]
具体地,表2为本实施例所述第一层知识本体分类节点、第二层知识本体分类节点构建关系列表2:
[0082]
表2
[0083][0084]
如表2所示,在第一层知识本体分类节点基础上,构建第二层知识本体分类节点,用于管理维护其下的知识实体模型;
[0085]
s203,针对每一个第二层知识本体分类节点建立对应的特征词库,该特征词库以第二层知识本体分类节点、属性和属性值三元组结构的方式挂接到对应的第二层知识本体分类节点上,构建成普洱茶领域第二层知识本体分类模型,如图5所示是普洱茶领域第二层知识本体分类模部分结构图;
[0086]
s204,将第二层知识本体分类节点与对应的第一层知识本体分类节点连接,构成普洱茶领域网状知识本体分类结构有向图,如图7、表2所示;
[0087]
s205,构建由第一层知识本体分类节点、关系和第二层知识本体分类节点三元组模型组成的普洱茶领域第二层知识本体分类模型;
[0088]
s30,建立与第一、第二层知识本体分类模型关联的普洱茶领域知识实体模型,用于构建普洱茶领域知识图谱,该普洱茶领域知识实体模型建立流程如图6所示,具体包括如下步骤:
[0089]
s301,普洱茶领域知识实体模型提取,采用机器学习算法从现有的半结构化和非
结构文本数据中,提取普洱茶领域知识实体模型,该普洱茶领域知识实体模型由实体、属性和属性值三元组结构构成;
[0090]
s302,普洱茶领域知识实体模型与本体模型关联,将普洱茶领域知识实体模型与第一层、第二层知识本体分类模型的多个节点关联,构成普洱茶领域知识图谱,如图7所示;如:
[0091]
第一层知识本体分类节点—产地连接有第二层知识本体分类节点:普洱茶区、西双版纳茶区、临沧茶区、保山茶区;
[0092]
第一层知识本体分类节点—成分连接有第二层知识本体分类节点:干茶、香气、水浸出物;其中:干茶包括灰分、精纤维、水分;香气包括芳樟醇、甲氧基苯、苯甲醛、紫罗酮、可溶性总糖;水浸出物包括可溶性总糖、儿茶素、可溶性蛋白质、咖啡碱、游离氨基酸、茶多酚;
[0093]
第一层知识本体分类节点—企业连接有第二层知识本体分类节点:产业链配置企业、茶叶机械设备生产企业、普洱茶精深加工企业、普洱茶精加工企业、普洱茶初加工企业;
[0094]
第一层知识本体分类节点—品牌连接有第二层知识本体分类节点:品牌a;
[0095]
第一层知识本体分类节点—产品连接有第二层知识本体分类节点:普洱茶产品、普洱茶深加工产品、普洱茶生产设备;
[0096]
第一层知识本体分类节点—加工制造连接有第二层知识本体分类节点:晒青茶、普洱茶(生茶)紧压茶、普洱茶(熟茶)散茶、普洱茶(熟茶)紧压茶;
[0097]
第一层知识本体分类节点—品种类别连接有第二层知识本体分类节点:古树茶、大树茶、台地茶、普洱茶紧茶、普洱茶散茶;其中:普洱紧茶包括生普洱、熟普洱;普洱散茶包括普洱黑茶、普洱红茶、普洱青茶、普洱白茶、普洱黄茶、普洱绿茶;
[0098]
s303,存储,将普洱茶领域知识本体分类模型、知识实体模型数据存储到图数据库中;
[0099]
s304,运维,包括:维护普洱茶领域第一层、第二层知识本体分类模型和特征词库,调整普洱茶领域知识实体模型与普洱茶领域知识本体分类模型关联关系,审核及修正普洱茶领域知识实体模型内容。
[0100]
基于上述实施例,本发明提供的普洱茶领域知识图谱构建装置,如图8所示,包括设置在计算机中的:
[0101]
实体模型提取模块401,用于从半结构化、非结构化文本中,提取普洱茶领域知识实体模型,形成由普洱茶领域知识实体模型名称、属性和属性值构成的三元组数据结构;
[0102]
第一分类确定模块402,用于通过特征词库判断、确定普洱茶领域知识实体模型,属于普洱茶领域第一层知识本体分类模型的哪个分类;
[0103]
第二分类确定模块403,用于通过特征词库判断、确定普洱茶领域知识实体模型,是否属于普洱茶领域第二层知识本体分类模型的某个分类;
[0104]
模型关系构建模块404,用于建立普洱茶领域第一层知识本体分类模型、第二层知识本体分类模型、普洱茶领域知识实体模型间相互关联的有向关系;
[0105]
知识运维模块405,用于存储、更新、维护普洱茶领域知识图谱数据。
[0106]
采用本装置构建的普洱茶领域知识图谱,如图7所示。
[0107]
图9是本发明提供的计算机局部结构示意图,其包括:处理器501、存储器502、通讯接口503、总线504及存储在存储器502上,并可在处理器501上运行的计算机程序。处理器
501、存储器502、通讯接口503之间通过总线504进行相互之间的通讯。通讯接口503处理外部指令,触发处理器501调用存储器502上的计算机程序指令,执行本发明上述实施例普洱茶领域知识图谱构建方法的所有步骤。
[0108]
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献