一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

数据中台的数据处理方法、装置、设备及可读存储介质与流程

2022-05-31 23:50:16 来源:中国专利 TAG:


1.本技术属于数据处理领域,尤其涉及一种数据中台的数据处理方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.大数据时代,数据量越来越多,数据形式日益复杂,而以数据仓库为代表的、现有的数据存储和处理技术无法满足海量、多样的数据处理需求的背景下产生的。“数据湖”是将复杂的事物具象化,偏技术一些,以一个形象的名字,反应了它在大数据存储和大数据处理方面的优势和能力。
3.数据湖作为一个集中的存储库,可以在其中存储任何形式(结构化和非结构化)、任意规模的数据。在数据湖中,可以不对存储的数据进行结构化,只有在使用数据的时候,再利用数据湖强大的大数据查询、处理、分析等组件对数据进行处理和应用。因此,数据湖具备运行不同类型数据分析的能力。
4.数据中台从技术的层面承接了数据湖的技术,通过人工智能(artificial intelligence,ai)与数据技术相结合,对海量、多源、多样的数据进行自动采集、处理、存储、计算,同时统一标准和口径,把数据统一之后,以标准形式存储,形成大数据资产层,以满足前台数据分析和应用的需求。
5.但是,目前的数据中台的技术在发展过程中尚存在一定的缺陷,如何从海量数据的数据库中筛选出有效的、全面的数据库非常关键。
6.因此,如何从海量数据的数据库中筛选出有效的、全面的数据库是本领域技术人员亟需解决的技术问题。


技术实现要素:

7.本技术实施例提供一种数据中台的数据处理方法、装置、电子设备及计算机可读存储介质,能够从海量数据的数据库中筛选出有效的、全面的数据库。
8.第一方面,本技术实施例提供一种数据中台的数据处理方法,包括:
9.在识别到数据源的情况下,采集数据源中的元数据;
10.对元数据进行质量校验;
11.在元数据质量校验通过的情况下,将元数据同步至数据中台;
12.对数据中台中同步的元数据执行数据开发操作。
13.可选的,采集数据源中的元数据,包括:
14.获取预先设置的需要采集的表信息;其中,表信息是通过前端编辑组件设置的;
15.依据表信息,采集数据源中与表信息对应的元数据。
16.可选的,方法还包括:
17.定时识别获取元数据的变更信息;
18.向目标用户发送变更信息对应的通知信息。
19.可选的,对元数据进行质量校验,包括:
20.对元数据的完整性和/或唯一性进行质量校验。
21.可选的,方法还包括:
22.在元数据质量校验不通过的情况下,对元数据进行自动修正。
23.可选的,对元数据进行自动修正,包括:
24.向目标用户发送自动修正确认请求;
25.在接收到自动修正确认请求对应的确认信息后,对元数据进行自动修正。
26.可选的,对数据中台中同步的元数据执行数据开发操作,包括:
27.根据预先识别的元数据规则,对数据中台中同步的元数据进行数据清洗;
28.将关联数据加工成数据宽表,并创建应用程序编程接口(application programming interface,api);其中,应用程序编程接口用于访问数据宽表。
29.第二方面,本技术实施例提供了一种数据中台的数据处理装置,包括:
30.采集模块,用于在识别到数据源的情况下,采集数据源中的元数据;
31.质量校验模块,用于对元数据进行质量校验;
32.数据同步模块,用于在元数据质量校验通过的情况下,将元数据同步至数据中台;
33.数据开发操作执行模块,用于对数据中台中同步的元数据执行数据开发操作。
34.可选的,采集模块,用于:
35.获取预先设置的需要采集的表信息;其中,表信息是通过前端编辑组件设置的;
36.依据表信息,采集数据源中与表信息对应的元数据。
37.可选的,装置还包括:
38.信息识别获取模块,用于定时识别获取元数据的变更信息;
39.通知信息发送模块,用于向目标用户发送变更信息对应的通知信息。
40.可选的,质量校验模块,用于:对元数据的完整性和/或唯一性进行质量校验。
41.可选的,装置还包括:
42.数据修正模块,用于在元数据质量校验不通过的情况下,对元数据进行自动修正。
43.可选的,数据修正模块,用于:
44.向目标用户发送自动修正确认请求;
45.在接收到自动修正确认请求对应的确认信息后,对元数据进行自动修正。
46.可选的,数据开发操作执行模块,用于:
47.根据预先识别的元数据规则,对数据中台中同步的元数据进行数据清洗;
48.将关联数据加工成数据宽表,并创建应用程序编程接口;其中,应用程序编程接口用于访问数据宽表。
49.第三方面,本技术实施例提供了一种电子设备,电子设备包括:处理器以及存储有计算机程序指令的存储器;
50.处理器执行计算机程序指令时实现如第一方面所示的数据中台的数据处理方法。
51.第四方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所示的数据中台的数据处理方法。
52.本技术实施例的数据中台的数据处理方法、装置、电子设备及计算机可读存储介
质,能够从海量数据的数据库中筛选出有效的、全面的数据库。
53.该数据中台的数据处理方法,在识别到数据源的情况下,采集数据源中的元数据;对元数据进行质量校验;在元数据质量校验通过的情况下,将元数据同步至数据中台;对数据中台中同步的元数据执行数据开发操作。
54.可见,该方法对元数据进行质量校验,也即数据经数据质量控制后进行集成和开发,且经过数据同步处理,故能够从海量数据的数据库中筛选出有效的、全面的数据库。
附图说明
55.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
56.图1是本技术一个实施例提供的数据中台的数据处理方法的流程示意图;
57.图2是本技术一个实施例提供的数据中台的数据处理装置的结构示意图;
58.图3是本技术一个实施例提供的电子设备的结构示意图。
具体实施方式
59.下面将详细描述本技术的各个方面的特征和示例性实施例,为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本技术进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本技术,而不是限定本技术。对于本领域技术人员来说,本技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本技术的示例来提供对本技术更好的理解。
60.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
61.数据中台从技术的层面承接了数据湖的技术,通过人工智能(artificial intelligence,ai)与数据技术相结合,对海量、多源、多样的数据进行自动采集、处理、存储、计算,同时统一标准和口径,把数据统一之后,以标准形式存储,形成大数据资产层,以满足前台数据分析和应用的需求。
62.但是,目前的数据中台的技术在发展过程中尚存在一定的缺陷,如何从海量数据的数据库中筛选出有效的、全面的数据库非常关键。
63.为了解决现有技术问题,本技术实施例提供了一种数据中台的数据处理方法、装置、设备及计算机可读存储介质。下面首先对本技术实施例所提供的数据中台的数据处理方法进行介绍。
64.图1示出了本技术一个实施例提供的数据中台的数据处理方法的流程示意图。如
图1所示,该数据中台的数据处理方法,包括:
65.s101、在识别到数据源的情况下,采集数据源中的元数据。
66.在一个实施例中,采集数据源中的元数据,包括:
67.获取预先设置的需要采集的表信息;其中,表信息是通过前端编辑组件设置的;
68.依据表信息,采集数据源中与表信息对应的元数据。
69.在一个实施例中,方法还包括:
70.定时识别获取元数据的变更信息;
71.向目标用户发送变更信息对应的通知信息。
72.元数据采集是将数据从一个地方拷贝到另一个地方的过程。具体的,该过程包括:
73.(1)从数据库中选择数据源,设置是否启用表过滤。通过前端编辑组件设置需要采集的表信息,达到按需采集的目的。
74.(2)设定是否定时执行能够定时获取数据源端元数据变化,设置好周期和时间。
75.(3)中台ai智能程序识别到数据源,自动进行元数据采集工作,并能识别到元数据变更(即表结构或者字段变化)并自动通知对应管理维护人员。
76.s102、对元数据进行质量校验。
77.s103、在元数据质量校验通过的情况下,将元数据同步至数据中台。
78.在一个实施例中,对元数据进行质量校验,包括:
79.对元数据的完整性和/或唯一性进行质量校验。
80.在一个实施例中,方法还包括:
81.在元数据质量校验不通过的情况下,对元数据进行自动修正。
82.在一个实施例中,对元数据进行自动修正,包括:
83.向目标用户发送自动修正确认请求;
84.在接收到自动修正确认请求对应的确认信息后,对元数据进行自动修正。
85.步骤s102和s103是数据集成的步骤,数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
86.在数据集成中,ai智能程序在识别到元数据信息时会自动进行数据集成作业,将数据同步至数据中台或其他存储介质,在此过程中会对数据的质量自动进行校验(包括数据的完整性、惟一性校验等),对于校验不通过的数据会进行自动修正,并发起流程给对应的数据管理员进行确认,确认无问题,则自动修正。对于校验通过的数据同步至数据中台,并在加工的过程中会对字段的命名进行统一。
87.s104、对数据中台中同步的元数据执行数据开发操作。
88.在一个实施例中,对数据中台中同步的元数据执行数据开发操作,包括:
89.根据预先识别的元数据规则,对数据中台中同步的元数据进行数据清洗;
90.将关联数据加工成数据宽表,并创建应用程序编程接口(application programming interface,api);其中,应用程序编程接口用于访问数据宽表。
91.为了从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
92.ai智能程序根据s101中自动识别的元数据规则,对s103中同步的数据进行自动清
洗,将关联数据自动加工成数据宽表,并自动创建api接口,通过该接口即可访问已加工的数据。
93.该数据中台的数据处理方法,在识别到数据源的情况下,采集数据源中的元数据;对元数据进行质量校验;在元数据质量校验通过的情况下,将元数据同步至数据中台;对数据中台中同步的元数据执行数据开发操作。
94.可见,该方法对元数据进行质量校验,也即数据经数据质量控制后进行集成和开发,且经过数据同步处理,故能够从海量数据的数据库中筛选出有效的、全面的数据库。而且,数据集中存储,可以保证业务数据一致性。
95.图2示出了本技术实施例提供的数据中台的数据处理装置的结构示意图。如图2所示,该数据中台的数据处理装置,包括:
96.采集模块201,用于在识别到数据源的情况下,采集数据源中的元数据;
97.质量校验模块202,用于对元数据进行质量校验;
98.数据同步模块203,用于在元数据质量校验通过的情况下,将元数据同步至数据中台;
99.数据开发操作执行模块204,用于对数据中台中同步的元数据执行数据开发操作。
100.在一个实施例中,采集模块201,用于:
101.获取预先设置的需要采集的表信息;其中,表信息是通过前端编辑组件设置的;
102.依据表信息,采集数据源中与表信息对应的元数据。
103.在一个实施例中,装置还包括:
104.信息识别获取模块,用于定时识别获取元数据的变更信息;
105.通知信息发送模块,用于向目标用户发送变更信息对应的通知信息。
106.在一个实施例中,质量校验模块202,用于:对元数据的完整性和/或唯一性进行质量校验。
107.在一个实施例中,装置还包括:
108.数据修正模块,用于在元数据质量校验不通过的情况下,对元数据进行自动修正。
109.在一个实施例中,数据修正模块,用于:
110.向目标用户发送自动修正确认请求;
111.在接收到自动修正确认请求对应的确认信息后,对元数据进行自动修正。
112.在一个实施例中,数据开发操作执行模块204,用于:
113.根据预先识别的元数据规则,对数据中台中同步的元数据进行数据清洗;
114.将关联数据加工成数据宽表,并创建应用程序编程接口;其中,应用程序编程接口用于访问数据宽表。
115.图2所示装置中的各个模块/单元具有实现图1中各个步骤的功能,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
116.图3示出了本技术实施例提供的电子设备的结构示意图。
117.电子设备可以包括处理器301以及存储有计算机程序指令的存储器302。
118.具体地,上述处理器301可以包括中央处理器(cpu),或者特定集成电路(application specific integrated circuit,asic),或者可以被配置成实施本技术实施例的一个或多个集成电路。
119.存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(hard disk drive,hdd)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,usb)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器302可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器302可在电子设备的内部或外部。在特定实施例中,存储器302可以是非易失性固态存储器。
120.在一个实施例中,存储器302可以是只读存储器(read only memory,rom)。在一个实施例中,该rom可以是掩模编程的rom、可编程rom(prom)、可擦除prom(eprom)、电可擦除prom(eeprom)、电可改写rom(earom)或闪存或者两个或更多个以上这些的组合。
121.处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现上述实施例中的任意一种数据中台的数据处理方法。
122.在一个示例中,电子设备还可包括通信接口303和总线310。其中,如图3所示,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
123.通信接口303,主要用于实现本技术实施例中各模块、装置、单元和/或设备之间的通信。
124.总线310包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(agp)或其他图形总线、增强工业标准架构(eisa)总线、前端总线(fsb)、超传输(ht)互连、工业标准架构(isa)总线、无限带宽互连、低引脚数(lpc)总线、存储器总线、微信道架构(mca)总线、外围组件互连(pci)总线、pci-express(pci-x)总线、串行高级技术附件(sata)总线、视频电子标准协会局部(vlb)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本技术实施例描述和示出了特定的总线,但本技术考虑任何合适的总线或互连。
125.另外,结合上述实施例中的数据中台的数据处理方法,本技术实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种数据中台的数据处理方法。
126.需要明确的是,本技术并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本技术的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本技术的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
127.以上所述的结构框图中所示的功能模块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(asic)、适当的固件、插件、功能卡等等。当以软件方式实现时,本技术的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、rom、闪存、可擦除rom(erom)、软盘、cd-rom、光盘、硬盘、光纤介质、射频(rf)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
128.还需要说明的是,本技术中提及的示例性实施例,基于一系列的步骤或者装置描
述一些方法或系统。但是,本技术不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
129.上面参考根据本技术的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本技术的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
130.以上所述,仅为本技术的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献