一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

元数据管理方法、系统、存储介质及电子设备与流程

2021-11-24 23:59:00 来源:中国专利 TAG:


1.本发明属于元数据管理领域,具体涉及一种元数据管理方法、系统、存储介质及电子设备。


背景技术:

2.元数据是关于数据的数据。目前,各行业都已经积累了大量的数据,并且这些数据的数量仍在不断增长的。不同的行业的数据可能不同,其元数据也是多种多样。在同一领域,其元数据也有很大的区别。实现多来源的元数据整合管理对于增强我国的科技能力,降低人力物力资源浪费,促进社会发展具有十分重要的意义。然而现实中,不同的行业长期以来都采用不同的元数据来描述数据,从而导致在不同的行业之间贡献资源成为一个不可逾越的天堑。
3.不同类型的元数据集合和共享的两个基础性技术,分别是互联网技术和元数据技术。
4.互联网技术在集成元数据方面有多个优点,如开放性好,没有界性等。但是也存在以下两个缺陷:1)当前互联网技术缺乏规范性,无法支持无缝的信息继承;2)缺乏一个统一的体系架构对全域范围内的数据进行统一管理。
5.分布式数据库技术的各种模型基于两个基本假设:1)数据库的位置透明性:用户事先并不知道数据源的位置和内容信息,需要用户手动选择信息源,从而在大规模海量数据级城时效率下降;2)数据库的自治性:各数据库在模式设计上完全独立,造成语义冲突,如果不能解决不同模式间的语义冲突,将不能真正意义上实现语义上的互操作和异构数据的统一管理。
6.多来源元数据整合的目的在于改进异构资源的整合与发现效率。2009年1月,全球第一个网络级资源发现系统——summon发布,该系统通过整合海量的异构资源元数据,形成统一的元数据索引,为用户提供快速有效的资源发现与传递服务,由此基于资源发现系统的文献资源整合模式得到迅速发展。目前,国内对资源发现系统的研究逐渐增多,国内图书馆对资源发现系统的实践程度主要集中于商业性资源发现系统的引进和应用,因此相关研究多为资源发现服务系统构建原理分析、商业性资源发现系统的选型与评估、资源发现系统在图书馆服务中的应用等。同时,当前商业资源发现系统中的元数据资源处于集成状态而非经过有效地知识组织与关联,所能提供的发现服务层次处于“资源”而非“知识”层次。彭佳等以上海交通大学图书馆“思源探索”系统为例,指出需要在元数据仓储的基础上,进一步构建资源组织和深度聚合的整体框架体系,从语义层面上实现信息资源的组织和聚合;曾建勋等在国家科技信息发现服务体系构建中,重点强调本体、叙词表等知识组织工具在文献资源语义知识组织中的应用,促进资源发现系统功能从单一资源级发现服务向引文分析、科研实体识别等知识服务方向拓展。多来源元数据集成是资源发现服务系统的数据基础,因此资源发现服务系统构建和实践情况,可在一定程度上反映多来源元数据集成的进展。在我国,除超星、万方数据库等中文商业性资源发现系统外,国家图书馆等国家级文
献资源服务机构也正在强化资源发现服务系统建设,构建多来源元数据资源建设渠道体系。其中,国家图书馆“文津搜索”系统通过收割、转换、清洗、装载不同来源的元数据,并对馆藏资源整合,构建了超大型海量元数据仓储;其元数据来源于不同系统、不同机构,涵盖中西文marc、dc、xml以及mdf等多种数据格式文件。calis在三期项目建设中,建立面向图书馆联盟“云上的”信息服务协作网络。其中,资源汇集与交换平台负责收集各成员馆提交的网上免费资源、外部购买资源以及由合作方提供的资源,成员馆数据直接汇集到calis全国交换中心,或是成员馆数据先汇集到calis省级分中心,再汇集到calis全国交换中心。总体而言,我国在多来源元数据集成方面已有一定研究和实践,但由于当前元数据资源获取渠道相对单一,获取方式相对简单,具有一定局限性,造成元数据集成中的组织管理工作相对粗放,尚未形成标准化、模块化的工作流程,不利于资源发现系统建设。因此,亟待强化前期组织管理工作,提升元数据资源获取质量和效率。
7.就现有的技术来看,在社会信息化的环境下,数据的大量泛滥以及多来源元数据的问题对数据库的设计产生了很大的挑战,数据冗余的现象在数据库中多多少少都存在。如果冗余量过大,会对数据库软件本身造成很大的负担,过多的资源被浪费在冗余信息上,而有用的信息得不到有效的存储,这不仅对用户来说是极大的损失,同时在查找信息时也会带来极大的不便。数据信息的冗余还会导致所有的信息无序的放在一个数据库中,用户需要花费更多的时间和经历去管理数据,不能有效的进行管理。综上,现有的多来源元数据整合管理办法在管理海量多来源数据时,可能会导致极大的数据冗余,在数据查询和管理时可能会导致反应速度慢,维护成本高等缺点。此外,现有的技术针对多来源的元数据的整合管理办法的问题不是很多,更多的还是针对单来源元数据的整合管理。


技术实现要素:

8.本技术实施例提供了一种元数据管理方法、系统、存储介质及电子设备,以至少解决现有的元数据管理方法中用户需要花费更多的时间去管理数据的问题。
9.本发明提供了一种元数据管理方法,其中,包括:
10.构建模型步骤:根据数据源和所需的数据构建至少一个元数据模型;
11.提取步骤:根据所述元数据模型对应地从元数据中提取信息,建立不同的所述信息之间的关联联系;
12.存放步骤:将建立所述关联关系的所有的所述信息统一存放管理。
13.上述元数据管理方法,其中,还包括:
14.检索查询步骤:用户根据实际需求对所述元数据进行检索查询获得对应地信息。
15.上述元数据管理方法,其中,所述提取步骤包括:
16.使用同一个分解模型对至少一个所述元数据模型进行分解以建立不同的所述信息之间的所述关联联系。
17.上述元数据管理方法,其中,所述分解模型对所述元数据模型进行分解得到多个类型,多个所述类型包括:application类型,scene类型,input类型,output类型,data类型,knowledge类型,resource类型。
18.本发明还提供了一种元数据管理系统,其中,包括:
19.构建模型模块,所述构建模型模块根据数据源和所需的数据构建至少一个元数据
模型;
20.提取模块,所述提取模块根据所述元数据模型对应地从元数据中提取信息,建立不同的所述信息之间的关联联系;
21.存放模块,所述存放模块将建立所述关联关系的所有的所述信息统一存放管理。
22.上述元数据管理系统,其中,还包括:
23.检索查询模块,用户根据实际需求通过所述检索查询模块对所述元数据进行检索查询获得对应地信息。
24.上述元数据管理系统,其中,所述提取模块包括:
25.使用同一个分解模型对至少一个所述元数据模型进行分解以建立不同的所述信息之间的所述关联联系。
26.上述元数据管理系统,其中,所述分解模型对所述元数据模型进行分解得到多个类型,多个所述类型包括:application类型,scene类型,input类型,output类型,data类型,knowledge类型,resource类型。
27.本发明还提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述中任一所述的元数据管理方法。
28.本发明还提供了一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述中任一所述的元数据管理方法。
29.本发明的有益效果在于:
30.本发明属于数据能力技术中的数据组织存储领域。本发明在主要针对多来源元数据整合管理的问题,提出了一种对元数据进行模型分解的方法,该方法将不同的元数据模型进行分解,不同的元数据模型能够分解为统一的数据存储,用户通过查询分解后的数据能够有效的查新所需的内容。本方法能够有效解决多来源元数据的整合管理。
附图说明
31.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。
32.在附图中:
33.图1是本发明的元数据管理方法的流程图;
34.图2是本发明的元数据管理系统的结构示意图;
35.图3是根据本发明实施例的电子设备的框架图。
具体实施方式
36.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。基于本技术提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
37.显而易见地,下面描述中的附图仅仅是本技术的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本技术应用
于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本技术公开的内容相关的本领域的普通技术人员而言,在本技术揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本技术公开的内容不充分。
38.在本技术中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本技术所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
39.除非另作定义,本技术所涉及的技术术语或者科学术语应当为本技术所属技术领域内具有一般技能的人士所理解的通常意义。本技术所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本技术所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本技术所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本技术所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本技术所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
40.下面结合附图所示的各实施方式对本发明进行详细说明,但应当说明的是,这些实施方式并非对本发明的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本发明的保护范围之内。
41.在详细阐述本发明各个实施例之前,对本发明的核心发明思想予以概述,并通过下述若干实施例予以详细阐述。
42.实施例一:
43.请参照图1,图1是元数据管理方法的流程图。如图1所示,本发明的元数据管理方法包括:
44.构建模型步骤s1:根据数据源和所需的数据构建至少一个元数据模型;
45.提取步骤s2:根据所述元数据模型对应地从元数据中提取信息,建立不同的所述信息之间的关联联系;
46.存放步骤s3:将建立所述关联关系的所有的所述信息统一存放管理;
47.检索查询步骤s4:用户根据实际需求对所述元数据进行检索查询获得对应地信息。
48.其中,所述提取步骤包括:
49.使用同一个分解模型对至少一个所述元数据模型进行分解以建立不同的所述信息之间的所述关联联系。
50.其中,所述分解模型对所述元数据模型进行分解得到多个类型,多个所述类型包
括:application类型,scene类型,input类型,output类型,data类型,knowledge类型,resource类型。
51.具体地说,本发明通过以下技术方案来实现,步骤如下:
52.不同来源的数据建立本行业的元数据模型;
53.首先根据所需的数据建立元数据模型。对于不同的数据,所描述的意义是不一样的,用户所需要的信息也不一样。比如一条个人信息数据,用户可能关注的是个人信息中的姓名,性别,出生日期等信息,在管理此类数据时,需要整合管理该数据包含的字段,字段的类型取值等元数据;若是一条描述同一个字段在不同表中的联系,则在管理此类数据时,则应该整合该数据在不同表中的关系。因此,对于不同来源的元数据,需要明确不同数据的含义,建立不同的元数据模型。
54.根据元数据模型提取所有的信息,并且不同的信息之间建立联系;
55.待得到元数据模型后,对不同的元数据模型,本发明使用同一个分解模型对元数据模型进行分解。主要将元数据模型分解为7个类型,分别是application,scene,input,output,data,knowledge,resource。其分解的思想是:将所有的元数据看成不同的场景scene,每个场景下分别有输入input和输出output,input和output分别有数据data,每个data都由知识knowledge来描述,knowledge又由资源resource来定义,而不同数据的应用application下又可能包含多个scene,同一个场景又可以细分为多个子场景。举例说明:对于一张个人信息表,可以分解为一个scene,这个场景下的输入为所有的字段,经过直接映射,由于映射没做计算等过程,所以输出仍为所有的字段,输入输出对应的data分别是所有的字段,每个字段对应多个知识,分别代表字段的各种描述,比如字段中英文名,字段类型等,每个知识对应一个resource。经过这样分解,对不同的数据,就可以进行统一的管理。
56.将所有的信息统一存放管理;
57.将所有分解的信息统一存放管理。
58.用户查询所需的元数据。
59.用户根据所需对数据进行检索查询。
60.实施例二:
61.请参照图2,图2是本发明的元数据管理系统的结构示意图。如图2所示本发明的元数据管理系统,其中,包括:
62.构建模型模块11,所述构建模型模块根据数据源和所需的数据构建至少一个元数据模型;
63.提取模块12,所述提取模块根据所述元数据模型对应地从元数据中提取信息,建立不同的所述信息之间的关联联系;
64.存放模块13,所述存放模块将建立所述关联关系的所有的所述信息统一存放管理。
65.其中,还包括:
66.检索查询模块14,用户根据实际需求通过所述检索查询模块对所述元数据进行检索查询获得对应地信息。
67.其中,所述提取模块包括:
68.使用同一个分解模型对至少一个所述元数据模型进行分解以建立不同的所述信
bus)、扩展总线(expansion bus)、局部总线(local bus)。举例来说而非限制,总线80可包括图形加速接口(accelerated graphics port,简称为agp)或其他图形总线、增强工业标准架构(extended industry standard architecture,简称为eisa)总线、前端总线(front side bus,简称为fsb)、超传输(hyper transport,简称为ht)互连、工业标准架构(industry standard architecture,简称为isa)总线、无线带宽(infiniband)互连、低引脚数(low pin count,简称为lpc)总线、存储器总线、微信道架构(micro channel architecture,简称为mca)总线、外围组件互连(peripheral component interconnect,简称为pci)总线、pci

express(pci

x)总线、串行高级技术附件(serial advanced technology attachment,简称为sata)总线、视频电子标准协会局部(video electronics standards association local bus,简称为vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线80可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
79.该电子设备可以基于元数据管理,从而实现结合图1描述的方法。
80.另外,结合上述实施例中基于元数据管理方法,本技术实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种元数据管理法。
81.以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
82.综上所述,基于本发明的有益效果在于,本发明在主要针对多来源元数据整合管理的问题,提出了一种对元数据进行模型分解的方法,该方法将不同的元数据模型进行分解,不同的元数据模型能够分解为统一的数据存储,用户通过查询分解后的数据能够有效的查新所需的内容。本方法能够有效解决多来源元数据的整合管理。
83.以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本发明的保护范围应以所附权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献