一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

元数据权重值的处理方法与装置与流程

2022-02-22 04:38:31 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,具体而言,涉及一种元数据权重值的处理方法与装置。


背景技术:

2.现有技术中,数据管理平台商业智能(data management platform business intelligence,简称为dmpbi)报表生成并没有权重值来评定某些指标和。另外,采用人工评估的方式得到元数据的权重值,不仅操作过程复杂,而且极易出错。
3.针对上述的问题,目前尚未提出有效的解决方案。


技术实现要素:

4.本发明实施例提供了一种元数据权重值的处理方法与装置,以至少解决相关技术中采用人工评估的方式得到元数据的权重值,操作过程复杂且极易出错的技术问题。
5.根据本发明实施例的一个方面,提供了一种元数据权重值的处理方法,包括:获取各个表报中的待处理元数据;确定所述待处理元数据的权重值;将所述权重值更新至权重值列表。
6.可选地,获取各个表报中的待处理元数据,包括:获取各个表报中的原始元数据;依据元数据属性对所述原始元数据进行筛选,得到所述待处理元数据。
7.可选地,确定所述待处理元数据的权重值,包括:获取所述待处理元数据的基础分值和在各个表报中出现的频次;依据所述基础分值以及所述频次,确定所述待处理元数据的分值;确定元数据基础权重值;依据所述分值以及所述元数据基础权重值,生成所述待处理元数据的权重值。
8.可选地,获取所述待处理元数据在各个表报中出现的频次,包括:获取所述待处理元数据在全部的报表中出现的次数,以及获取所述待处理元数据在各个报表中分别出现的次数。
9.可选地,依据所述基础分值以及所述频次,确定所述待处理元数据的分值,包括:在所述频次为所述待处理元数据在全部的报表中出现的次数时,依据所述基础分值以及所述待处理元数据在全部的报表中出现的次数,得到所述待处理元数据的第一分值;在所述频次为所述待处理元数据在各个报表中分别出现的次数时,依据所述基础分值以及所述待处理元数据在各个报表中分别出现的次数,得到所述待处理元数据的第二分值。
10.可选地,所述元数据基础权重值包括第一元数据基础权重值和第二元数据基础权重值,依据所述分值以及所述元数据基础权重值,生成所述待处理元数据的权重值,包括:根据所述第一分值与所述第一元数据基础权重值,得到所述待处理元数据的第一权重值;根据所述第二分值与所述第二元数据基础权重值,得到所述待处理元数据的第二权重值;依据所述第一权重值与所述第二权重值,确定所述待处理元数据的权重值。
11.可选地,在将所述权重值更新至权重值列表之后,还包括:获取所述权重值列表中
权重值排名满足预设排名条件对应的元数据;更新所述元数据对应的基础分值。
12.根据本发明实施例的另一方面,还提供了一种元数据权重值的处理装置,包括:第一获取模块,用于获取各个表报中的待处理元数据;确定模块,用于确定所述待处理元数据的权重值;第一更新模块,用于将所述权重值更新至权重值列表。
13.根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行上述中任意一项所述的元数据权重值的处理方法。
14.根据本发明实施例的另一方面,还提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述中任意一项所述的元数据权重值的处理方法。
15.在本发明实施例中,采用获取各个表报中的待处理元数据;确定待处理元数据的权重值;将权重值更新至权重值列表,通过自动生成待处理元数据的权重值,并利用该权重值来更新权重值列表,从而实现了避免人工评估造成的错误,提高元数据的权重值的准确性以及动态更新权重值列表的技术效果,进而解决了相关技术中采用人工评估的方式得到元数据的权重值,操作过程复杂且极易出错的技术问题。
附图说明
16.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
17.图1是根据本发明实施例的元数据权重值的处理方法的流程图;
18.图2是根据本发明实施例的元数据权重值的处理装置的示意图。
具体实施方式
19.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
20.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
21.实施例1
22.根据本发明实施例,提供了一种元数据权重值的处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
23.图1是根据本发明实施例的元数据权重值的处理方法的流程图,如图1所示,该方法包括如下步骤:
24.步骤s102,获取各个表报中的待处理元数据;
25.在一种可选的实施方式中,获取各个表报中的待处理元数据,包括:获取各个表报中的原始元数据;依据元数据属性对原始元数据进行筛选,得到待处理元数据。
26.上述表报为数据管理平台所支持的不同类型的报表,各个报表包含不同的元数据配置;其中,报表为向上级报告情况的表格,具体为,用表格、图标等格式来动态显示数据;上述待处理元数据不仅包括基础元数据,还包括扩展衍生元数据。
27.步骤s104,确定待处理元数据的权重值;
28.在一种可选的实施方式中,确定待处理元数据的权重值,包括:获取待处理元数据的基础分值和在各个表报中出现的频次;依据基础分值以及频次,确定待处理元数据的分值;确定元数据基础权重值;依据分值以及元数据基础权重值,生成待处理元数据的权重值。
29.需要说明的是,上述频次包括但不限于待处理元数据在全部的报表中出现的次数、待处理元数据在各个报表中分别出现的次数等。
30.在一种可选的实施方式中,获取待处理元数据在各个表报中出现的频次,包括:获取待处理元数据在全部的报表中出现的次数,以及获取待处理元数据在各个报表中分别出现的次数。
31.在一种可选的实施方式中,依据基础分值以及频次,确定待处理元数据的分值,包括:在频次为待处理元数据在全部的报表中出现的次数时,依据基础分值以及待处理元数据在全部的报表中出现的次数,得到待处理元数据的第一分值;在频次为待处理元数据在各个报表中分别出现的次数时,依据基础分值以及待处理元数据在各个报表中分别出现的次数,得到待处理元数据的第二分值。
32.在一种可选的实施方式中,元数据基础权重值包括第一元数据基础权重值和第二元数据基础权重值,依据分值以及元数据基础权重值,生成待处理元数据的权重值,包括:根据第一分值与第一元数据基础权重值,得到待处理元数据的第一权重值;根据第二分值与第二元数据基础权重值,得到待处理元数据的第二权重值;依据第一权重值与第二权重值,确定待处理元数据的权重值。通过上述实施方式可以准确计算出待处理元数据的权重值。
33.步骤s106,将权重值更新至权重值列表。
34.在一种可选的实施方式中,在将权重值更新至权重值列表之后,还包括:获取权重值列表中权重值排名满足预设排名条件对应的元数据;更新元数据对应的基础分值。通过上述实施方式可以根据权重值列表中权重值的排序,动态更新元数据对应的基础分值。
35.通过上述步骤,能够应用于数据管理平台中各种报表的处理,可以采用获取各个表报中的待处理元数据;确定待处理元数据的权重值;将权重值更新至权重值列表,通过自动生成待处理元数据的权重值,并利用该权重值来更新权重值列表,从而实现了避免人工评估造成的错误,提高元数据的权重值的准确性以及动态更新权重值列表的技术效果,进而解决了相关技术中采用人工评估的方式得到元数据的权重值,操作过程复杂且极易出错的技术问题。
36.下面对本发明一种可选的实施方式进行详细说明。
37.步骤1、定时任务每天拉取dmpbi报表配置,获取各个报表配置包含的元数据配置。统计元数据信息,缓存处理。
38.例如,报表a包含元数据imp,click,cost;报表b包含元数据imp,cost,imp_rate;报表c包含元数据imp,click,click_rate。“_”代表相关元数据,头部为基础元数据,尾部为扩展衍生元数据。关键字“_”可配置。
39.步骤2、统计计分前,获取停元信息配置表,根据停元信息中存在的具体元数据属性,剔除掉元数据列表中不参与计算的元数据信息,例如id,date等元数据。
40.步骤3、获取配置元数据信息的基础分值,每个元数据的基础分值可以不同,根据各个元数据的基础分值例如:x:1.0。公式一的基础权重值为y:0.8。公式二的基础权重值为y:0.5。
41.步骤4、利用计算公式,计算出各个元数据实际的频次信息。
42.计算公式一:根据所有报表全范围统计,根据频次累加,出现一次,累计加1,则统计元数据频次计数存储imp:3,click:2,cost:2,imp_rate:1,click_rate:1。
43.计算公式二:根据各个报表单独统计元数据及元数据衍生信息,则a频次为imp:1,click:1,cost:1报表b频次为imp:2,cost:1,imp_rate:1;报表c频次为imp:1,click:2,click_rate:1。
44.步骤5、根据元数据的基础分值x,分别根据公式一、公式二、元数据*元数据的基础分值x:1.0,统计出各个原数据的分值。
45.计算公式一:imp:3.0,click:2.0,cost:2.0,imp_rate:1.0,click_rate:1.0;
46.计算公式二:a分值imp:1.0,click:1.0,cost:1.0;b分值为imp:2.0,cost:1.0,imp_rate:1.0;c分值为imp:1.0,click:2.0,click_rate:1.0。
47.步骤6、汇总计算权重值=元数据分值*元数据基础权重值。
48.计算公式一:imp:3.0*0.8=2.4,click:2.0*0.8=1.6,cost:2.0*0.8=1.6,imp_rate:1.0*0.8=0.8,click_rate:1.0*0.8=0.8;
49.计算公式二:a分值imp:1.0*0.5=0.5,click:1.0*0.5=0.5,cost:1.0*0.5=0.5;b分值为imp:2.0*0.5=1.0,cost:1.0*0.5=0.5,imp_rate:1.0*0.5=0.5;c分值为imp:1.0*0.5=0.5,click:2.0*0.5=1.0,click_rate:1.0*0.5=0.5。
50.步骤7、汇总计算总的权重值。
51.计算公式一和计算公式二的属性累加。生成统一权重值列表。
52.imp:2.4 0.5 1.0 0.5=4.4;click:1.6 0.5 1.0=3.1;cost:1.6 0.5 0.5=2.6;imp_rate:0.8 0.5=1.3;click_rate:0.8 0.5=1.3;需要说明的是,权重值在权重值列表中可以采用降序排列。
53.步骤8、保存生成的权重值到权重值分析表中。获取权重值列表的top n对应的元数据,更新对应top n的元数据基础分值 0.1。例如:x:1.1。
54.步骤9、根据权重值分析表查询实时展示最新的权重值信息,为自动生成报表和业务人员甄别选择指标和维度做依据。
55.步骤10、定时调度,重复步骤1到8,实现动态更新权重值。
56.在本发明的上述实施方式中,采用自动评估权重值引擎,评定指标、维度权重值,
实现了dmpbi报表指标维度权重的打分机制,可为生成报表推荐指标和维度,供业务人员分析和甄别。
57.实施例2
58.根据本发明实施例的另一方面,还提供了一种元数据权重值的处理装置,图2是根据本发明实施例的元数据权重值的处理装置的示意图,如图2所示,该元数据权重值的处理装置包括:第一获取模块22、确定模块24和第一更新模块26。下面对该元数据权重值的处理装置进行详细说明。
59.第一获取模块22,用于获取各个表报中的待处理元数据;
60.确定模块24,连接至上述第一获取模块22,用于确定待处理元数据的权重值;
61.第一更新模块26,连接至上述确定模块24,用于将权重值更新至权重值列表。
62.需要说明的是,上述各个模块是可以通过软件或硬件来实现的,例如,对于后者,可以通过以下方式实现:上述各个模块可以位于同一处理器中;和/或,上述各个模块以任意组合的方式位于不同的处理器中。
63.在上述实施例中,该元数据权重值的处理装置可以通过自动生成待处理元数据的权重值,并利用该权重值来更新权重值列表,从而实现了避免人工评估造成的错误,提高元数据的权重值的准确性以及动态更新权重值列表的技术效果,进而解决了相关技术中采用人工评估的方式得到元数据的权重值,操作过程复杂且极易出错的技术问题。
64.此处需要说明的是,上述第一获取模块22、确定模块24和第一更新模块26对应于实施例1中的步骤s102至s106,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例1所公开的内容。
65.可选地,上述第一获取模块22包括:第一获取单元,用于获取各个表报中的原始元数据;筛选单元,用于依据元数据属性对原始元数据进行筛选,得到待处理元数据。
66.可选地,上述确定模块24包括:第二获取单元,用于获取待处理元数据的基础分值和在各个表报中出现的频次;第一确定单元,用于依据基础分值以及频次,确定待处理元数据的分值;第二确定单元,用于确定元数据基础权重值;生成单元,用于依据分值以及元数据基础权重值,生成待处理元数据的权重值。
67.可选地,上述第二获取单元包括:第一获取子单元,用于获取待处理元数据在全部的报表中出现的次数,以及第二获取子单元,用于获取待处理元数据在各个报表中分别出现的次数。
68.可选地,上述第一确定单元包括:第一子处理单元,用于在频次为待处理元数据在全部的报表中出现的次数时,依据基础分值以及待处理元数据在全部的报表中出现的次数,得到待处理元数据的第一分值;第二子处理单元,用于在频次为待处理元数据在各个报表中分别出现的次数时,依据基础分值以及待处理元数据在各个报表中分别出现的次数,得到待处理元数据的第二分值。
69.可选地,元数据基础权重值包括第一元数据基础权重值和第二元数据基础权重值,上述生成单元包括:第三子处理单元,用于根据第一分值与第一元数据基础权重值,得到待处理元数据的第一权重值;第四子处理单元,用于根据第二分值与第二元数据基础权重值,得到待处理元数据的第二权重值;第五子处理单元,用于依据第一权重值与第二权重值,确定待处理元数据的权重值。
70.可选地,上述装置还包括:第二获取模块,用于在将权重值更新至权重值列表之后,获取权重值列表中权重值排名满足预设排名条件对应的元数据;第二更新模块,用于更新元数据对应的基础分值。
71.实施例3
72.根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,该计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述中任意一项的元数据权重值的处理方法。
73.可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,和/或位于移动终端群中的任意一个移动终端中,上述计算机可读存储介质包括存储的程序。
74.可选地,在程序运行时控制计算机可读存储介质所在设备执行以下功能:获取各个表报中的待处理元数据;确定待处理元数据的权重值;将权重值更新至权重值列表。
75.可选地,获取各个表报中的待处理元数据,包括:获取各个表报中的原始元数据;依据元数据属性对原始元数据进行筛选,得到待处理元数据。
76.可选地,确定待处理元数据的权重值,包括:获取待处理元数据的基础分值和在各个表报中出现的频次;依据基础分值以及频次,确定待处理元数据的分值;确定元数据基础权重值;依据分值以及元数据基础权重值,生成待处理元数据的权重值。
77.可选地,获取待处理元数据在各个表报中出现的频次,包括:获取待处理元数据在全部的报表中出现的次数,以及获取待处理元数据在各个报表中分别出现的次数。
78.可选地,依据基础分值以及频次,确定待处理元数据的分值,包括:在频次为待处理元数据在全部的报表中出现的次数时,依据基础分值以及待处理元数据在全部的报表中出现的次数,得到待处理元数据的第一分值;在频次为待处理元数据在各个报表中分别出现的次数时,依据基础分值以及待处理元数据在各个报表中分别出现的次数,得到待处理元数据的第二分值。
79.可选地,元数据基础权重值包括第一元数据基础权重值和第二元数据基础权重值,依据分值以及元数据基础权重值,生成待处理元数据的权重值,包括:根据第一分值与第一元数据基础权重值,得到待处理元数据的第一权重值;根据第二分值与第二元数据基础权重值,得到待处理元数据的第二权重值;依据第一权重值与第二权重值,确定待处理元数据的权重值。
80.可选地,在将权重值更新至权重值列表之后,还包括:获取权重值列表中权重值排名满足预设排名条件对应的元数据;更新元数据对应的基础分值。
81.实施例4
82.根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述中任意一项的元数据权重值的处理方法。
83.本发明实施例提供了一种设备,该设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取各个表报中的待处理元数据;确定待处理元数据的权重值;将权重值更新至权重值列表。
84.可选地,获取各个表报中的待处理元数据,包括:获取各个表报中的原始元数据;依据元数据属性对原始元数据进行筛选,得到待处理元数据。
85.可选地,确定待处理元数据的权重值,包括:获取待处理元数据的基础分值和在各个表报中出现的频次;依据基础分值以及频次,确定待处理元数据的分值;确定元数据基础权重值;依据分值以及元数据基础权重值,生成待处理元数据的权重值。
86.可选地,获取待处理元数据在各个表报中出现的频次,包括:获取待处理元数据在全部的报表中出现的次数,以及获取待处理元数据在各个报表中分别出现的次数。
87.可选地,依据基础分值以及频次,确定待处理元数据的分值,包括:在频次为待处理元数据在全部的报表中出现的次数时,依据基础分值以及待处理元数据在全部的报表中出现的次数,得到待处理元数据的第一分值;在频次为待处理元数据在各个报表中分别出现的次数时,依据基础分值以及待处理元数据在各个报表中分别出现的次数,得到待处理元数据的第二分值。
88.可选地,元数据基础权重值包括第一元数据基础权重值和第二元数据基础权重值,依据分值以及元数据基础权重值,生成待处理元数据的权重值,包括:根据第一分值与第一元数据基础权重值,得到待处理元数据的第一权重值;根据第二分值与第二元数据基础权重值,得到待处理元数据的第二权重值;依据第一权重值与第二权重值,确定待处理元数据的权重值。
89.可选地,在将权重值更新至权重值列表之后,还包括:获取权重值列表中权重值排名满足预设排名条件对应的元数据;更新元数据对应的基础分值。
90.本发明还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取各个表报中的待处理元数据;确定待处理元数据的权重值;将权重值更新至权重值列表。
91.可选地,获取各个表报中的待处理元数据,包括:获取各个表报中的原始元数据;依据元数据属性对原始元数据进行筛选,得到待处理元数据。
92.可选地,确定待处理元数据的权重值,包括:获取待处理元数据的基础分值和在各个表报中出现的频次;依据基础分值以及频次,确定待处理元数据的分值;确定元数据基础权重值;依据分值以及元数据基础权重值,生成待处理元数据的权重值。
93.可选地,获取待处理元数据在各个表报中出现的频次,包括:获取待处理元数据在全部的报表中出现的次数,以及获取待处理元数据在各个报表中分别出现的次数。
94.可选地,依据基础分值以及频次,确定待处理元数据的分值,包括:在频次为待处理元数据在全部的报表中出现的次数时,依据基础分值以及待处理元数据在全部的报表中出现的次数,得到待处理元数据的第一分值;在频次为待处理元数据在各个报表中分别出现的次数时,依据基础分值以及待处理元数据在各个报表中分别出现的次数,得到待处理元数据的第二分值。
95.可选地,元数据基础权重值包括第一元数据基础权重值和第二元数据基础权重值,依据分值以及元数据基础权重值,生成待处理元数据的权重值,包括:根据第一分值与第一元数据基础权重值,得到待处理元数据的第一权重值;根据第二分值与第二元数据基础权重值,得到待处理元数据的第二权重值;依据第一权重值与第二权重值,确定待处理元数据的权重值。
96.可选地,在将权重值更新至权重值列表之后,还包括:获取权重值列表中权重值排名满足预设排名条件对应的元数据;更新元数据对应的基础分值。
97.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
98.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
99.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
100.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
101.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
102.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
103.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献