数据处理方法、装置、电子设备及计算机可读存储介质与流程

2022-04-16 12:23:40 来源：中国专利 TAG：

1.本发明涉及计算机领域，具体而言，涉及一种数据处理方法、装置、电子设备及计算机可读存储介质。

背景技术：

2.相关技术中，电力用户标签体系研究点主要在于用户日常用电，或者对其他某项单方面进行研究，构建专项的标签体系。例如，电力用户标签体系一般根据用电数据特征，直接获取一部分基本标签，再通过统计、模型得到一部分统计标签与模型标签，简单组合形成完整的标签体系。但是采取上述方法构建标签体系时，标签颗粒度较大，不够精细，直接使用会造成结果不能够完全反映用户的用电特征。
3.针对上述的问题，目前尚未提出有效的解决方案。

技术实现要素：

4.本发明实施例提供了一种数据处理方法、装置、电子设备及计算机可读存储介质，以至少解决相关技术中，难以精准地的展示出能够反映用户用电特征的用电标签的技术问题。
5.根据本发明实施例的一个方面，提供了一种数据处理方法，包括：获取目标区域中目标账户的第一用电数据与所述第一用电数据的数据类型，其中，所述数据类型包括数值型数据与非数值型数据；基于所述第一用电数据的数据类型，确定所述第一用电数据对应的子级标签；将所述子级标签归纳入对应的主级标签；在所述主级标签中包括的子级标签数量大于预定阈值的情况下，在预定界面中展示所述主级标签。
6.可选地，所述基于所述第一用电数据的数据类型，确定所述第一用电数据对应的子级标签，包括：在所述第一用电数据的数据类型为数值型数据的情况下，确定所述第一用电数据所表示的用电类型；依据所述用电类型，按照预定规则排列所述目标区域中全部账户的第二用电数据，其中，所述第二用电数据为全部用电数据中属于所述用电类型的用电数据，所述全部用电数据为所述目标区域中全部账户的用电数据；依据所述第一用电数据在所述第二用电数据中的排列位置，确定所述第一用电数据的子级标签。
7.可选地，所述依据所述第一用电数据在所述第二用电数据中的排列位置，确定所述第一用电数据的子级标签，包括：依据所述第一用电数据在所述第二用电数据中的排列位置，确定所述排列位置所属的位置区间；依据所述位置区间，确定所述第一用电数据的子级标签。
8.可选地，所述基于所述第一用电数据的数据类型，确定所述第一用电数据对应的子级标签，包括：在所述第一用电数据的数据类型为非数值型数据的情况下，依据所述第一用电数据确定所述第一用电数据对应的子级标签。
9.可选地，所述获取目标区域中目标账户的第一用电数据与所述第一用电数据的数据类型，包括：在所述第一用电数据缺失的情况下，填充所述第一用电数据。
10.可选地，所述将所述子级标签归纳入对应的主级标签包括：确定所述子级标签对应的用电特征；依据所述用电特征，将所述子级标签归纳入对应的所述主级标签。
11.根据本发明实施例的一个方面，提供了一种数据处理装置，包括：获取模块，用于获取目标区域中目标账户的第一用电数据与所述第一用电数据的数据类型，其中，所述数据类型包括数值型数据与非数值型数据；确定模块，用于基于所述第一用电数据的数据类型，确定所述第一用电数据对应的子级标签；归纳模块，用于将所述子级标签归纳入对应的主级标签；展示模块，用于在所述主级标签中包括的子级标签数量大于预定阈值的情况下，在预定界面中展示所述主级标签。
12.根据本发明实施例的一个方面，提供了一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现上述任一项所述的数据处理方法。
13.根据本发明实施例的一个方面，提供了一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述任一项所述的数据处理方法。
14.根据本发明实施例的一个方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的数据处理方法。
15.在本发明实施例中，获取目标区域中目标账户的第一用电数据与第一用电数据的数据类型，并基于第一用电数据的数据类型，确定第一用电数据对应的子级标签，进而将子级标签归纳入对应的主级标签，使得主级标签中包括的子级标签数量大于预定阈值的情况下，在预定界面中得以显示，因为最终显示出的主级标签是符合预定条件的，且是根据目标账户的用电数据得到的，进而解决了相关技术中，难以精准地的展示出能够反映用户用电特征的用电标签的技术问题。
附图说明
16.此处所说明的附图用来提供对本发明的进一步理解，构成本技术的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：
17.图1是根据本发明实施例的数据处理方法的流程图；
18.图2是根据本发明实施例的数据处理装置的结构框图。
具体实施方式
19.为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。
20.需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆
盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
21.实施例1
22.根据本发明实施例，提供了一种数据处理方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。
23.图1是根据本发明实施例的数据处理方法的流程图，如图1所示，该方法包括如下步骤：
24.步骤s102，获取目标区域中目标账户的第一用电数据与第一用电数据的数据类型，其中，数据类型包括数值型数据与非数值型数据；
25.步骤s104，基于第一用电数据的数据类型，确定第一用电数据对应的子级标签；
26.步骤s106，将子级标签归纳入对应的主级标签；
27.步骤s108，在主级标签中包括的子级标签数量大于预定阈值的情况下，在预定界面中展示主级标签。
28.通过上述步骤，获取目标区域中目标账户的第一用电数据与第一用电数据的数据类型，并基于第一用电数据的数据类型，确定第一用电数据对应的子级标签，进而将子级标签归纳入对应的主级标签，使得主级标签中包括的子级标签数量大于预定阈值的情况下，在预定界面中得以显示，因为最终显示出的主级标签是符合预定条件的，且是根据目标账户的用电数据得到的，进而解决了相关技术中，难以精准地的展示出能够反映用户用电特征的用电标签的技术问题。
29.需要说明的是，上述目标区域可以以省为单位，以区为单位，或者根据实际应用的场景进行自主设置。通过不同的区域设置，可以获取针对该区域目标账户的用电数据，以便进行更好地处理，对也有利于后续不同地域进行用电数据的分析与比较。
30.目标账户可以为目标区域中用电的全部用户中的某个用户的账户，以便获取该用户的用电数据，对用户的用电行为进行分析，进而依据用电数据给定标签，令用户更好地了解自己的用电情况。
31.目标账户的第一用电数据可以为该记录得到的该账户的某项用电数据，这个用电数据可以是指多种类型的用电数据，例如，可以是账户用电基础信息；也可以是账户用电的日均电量数据、峰段电量数据、谷电量数据、电费、缴费余额、单位面积采暖用电量等数据；该用电数据也可以为能够表示“煤改电”账户节能减排贡献的数据，例如，减少燃煤量数据、等效植树棵数数据等等；该用电数据还可以为表示用电行为的数据，例如，工作日与非工作日的用电比值数据，等等。
32.作为一种可选的实施例，获取目标区域中目标账户的第一用电数据与第一用电数据的数据类型时，可能会存在第一用电数据缺失的情况，在该情况下，可以根据不同的用电数据类型，选取合适的方法填充第一用电数据。在非数值型用电数据缺失的情况下，例如，该账户是否为“煤改电”账户的数据缺失，此时，可以利用自身属性填充，或者调取其他类型的用电数据，对用电数据进行分析比较，为用电类型的账户还是用煤类型的账户。在数值型
用电数据缺失的情况下，可以分为多种情况进行处理，例如，缺失的数值型数据为月总电量、月谷电量、日总电量、日谷电量等连续性的数据时，缺失的数据且与该账户的历史的月总电量、月谷电量、日总电量、日谷电量等数据呈现有一定的相关性，处理方法可以是根据实际情况采用后一条用电数据填充、前一条用电数据填充、前两条用电数据均值填充、后两条用电数据均值填充、前后用电数据平均值填充、插值法填充等进行填充，对于一些异常的用电数据，也可以结合账户的历史用电数据进行修正。在数值型数据出现其他情况时，也可以根据实际的应用与场景对数值型数据进行处理。
33.作为一种可选的实施例，基于第一用电数据的数据类型，确定第一用电数据对应的子级标签时，可以先将第一用电数据的类型分为数值型数据与非数值型数据。在第一用电数据的数据类型为数值型数据的情况下，确定第一用电数据所表示的用电类型，第一用电数据所表示的用电类型即为上述举例的能够以数值表示出的数据，依据用电类型，按照预定规则排列目标区域中全部账户的第二用电数据，其中，第二用电数据为全部用电数据中属于用电类型的用电数据，全部用电数据为目标区域中全部账户的用电数据。即依据用电类型，将相同用电类型的用电数据按照预定规则排列，其中，用电数据可以为多种用电类型下的用电数据，例如，当用电类型为日均电量数据时，按照预定规则排列目标区域中全部账户的日均电量数据，确定目标账户的日均电量数据在目标区域中全部账户的日均电量数据中的位置。该预定规则可以为顺序排列，倒序排列，时间排列，等等。可以根据具体的用电类型进行灵活的设置。排列完数据后，可以依据第一用电数据在第二用电数据中的排列位置，确定第一用电数据的子级标签。例如，当用电类型为日均电量数据时，预定规则为从大到小排列时，根据目标账户的日均电量数据所处的位置，确定与目标账户的这个日均电量数据对应的子级标签。具体地，可以先依据第一用电数据在第二用电数据中的排列位置，确定排列位置所属的位置区间，依据位置区间，确定第一用电数据的子级标签。例如，当用电类型为日均电量数据时，预定规则为从大到小排列时，按照日均电量数据从大到小的规则排列目标区域中全部账户的日均电量数据，此时，若目标账户的日均电量数据所处的位置区间为0-50％，则可以设置为高电量的子级标签；若目标账户的日均电量数据所处的位置区间为50％-75％时，则可以设置为一般电量的子级标签；若目标账户的日均电量数据所处的位置区间为75％-100％，则可以设置为低电量的子级标签。此处，本可选实施例仅提供了一种示例，其他用电类型的数据也可以采用相似的方法。需要说明的是，获取目标区域中目标账户的第一用电数据与第一用电数据的数据类型可以是实时获取的，因此可以根据动态地基于第一用电数据的数据类型，确定第一用电数据对应的子级标签。从而使得最终展示出的主级标签能够动态的反映出目标账户的用电特征。
34.作为一种可选的实施例，基于第一用电数据的数据类型，确定第一用电数据对应的子级标签时，第一用电数据的类型包括数值型数据与非数值型数据。在第一用电数据的数据类型为非数值型数据的情况下，依据第一用电数据确定第一用电数据对应的子级标签时，可以直接提取所述第一用电数据作为子级标签的结果。例如，用电数据为账户用电基础信息，具体为用户的首次改造时间，xxxx年xx月xx日，直接提取第一用电数据作为子级标签的结果。
35.作为一种可选的实施例，还可以将子级标签归纳入对应的主级标签，子级标签能够较为细致的反映出用户的用电情况，主级标签相较于子级标签能够更为宏观的反映出用
户的用电情况。将子级标签归纳入对应的主级标签时，可以通过用电特征，来将子级标签归纳入对应的主级标签，可以采用如下方式：确定子级标签对应的用电特征，依据用电特征，将子级标签归纳入对应的主级标签。例如，当用电类型为日均电量数据时，会依据用电数据所处的位置，确定低电量，一般电量，高电量的子级标签，可以提取上述子级标签的用电特征，低电量，一般电量，高电量表示了用电量高低的用电特征，则可以归纳到相应的主级标签中。通过上述的方式，可以统计目标账户不同用电类型的用电数据，确定出各用电数据对应的子级标签，得到多个子级标签，从而能够提取子级标签的用电特征，根据用电特征确定出对应的主级标签，在主级标签所包括的子级标签数量大于预定阈值的情况下，认为该主级标签能够反映该目标账户的用电状况，以在预定界面中展示主级标签。
36.作为一种可选的实施例，在终端的预定界面展示主级标签后，目标账户还可以查看主级标签中所包括的多个子级标签，以展示综合用电汇总信息，有助于目标账户清晰地了解自己的用电习惯、贡献情况等。
37.基于上述实施例及可选实施例，提供了一种可选实施方式，下面具体说明。
38.在相关技术中，标签颗粒度较大，不够精细，且不能反应动态指标，覆盖维度不够健全，指标阈值划分合理性也需要提高。
39.鉴于此，本发明可选实施方式中提供了一种数据处理方法，通过多源多维度的用电数据进行用户用电行为分析，通过统计分析、聚类分析等方法挖掘覆盖度广、特征明显、实用性强的电量、电费、缴费、补贴、节能减排、行为等多维度的多个子级标签，子级标签可以为依据基础信息，年度账单，节能减排贡献，用电行为中的数据确定出来标签，以反应用户的用电情况。在获取子级标签后，还可以将子级标签上升为主级标签，构建一套特征全面、可用性强、精准度高的用户标签体系。下面对本发明可选实施方式进行详细介绍：
40.s1，获取用户的用电数据与用电数据的数据类型；
41.其中，用电数据可以包括基础信息，年度账单，节能减排贡献，用电行为等等几个大类。在各个类别中，又包括多种数据，例如，在上述大类中还包括如下述的多种数据：账户用电基础信息、账户用电的日均电量数据、峰段电量数据、谷电量数据、电费、缴费余额、单位面积采暖用电量、减少燃煤量数据、等效植树棵数数据、工作日与非工作日的用电比值数据，等等。
42.为了统一数据的格式，可以首先根据数据类型对数据进行预处理。在用电数据缺失的情况下，还可以对用电数据进行填充。对于非数值型数据，可以利用自身属性填充，或者调取其他类型的用电数据，对用电数据进行分析比较，推断出缺失的数据。对于数值型数据，可以利用均值法、插值法、前后n位数据类比法、阈值定义法进行预先处理。在数值型用电数据缺失的情况下，可以分为多种情况进行处理，例如，缺失的数值型数据为月总电量、月谷电量、日总电量、日谷电量等连续性的数据时，缺失的数据与该账户的历史的月总电量、月谷电量、日总电量、日谷电量等数据呈现有一定的相关性，处理方法可以是根据实际情况采用后一条用电数据填充、前一条用电数据填充、前两条用电数据均值填充、后两条用电数据均值填充、前后用电数据平均值填充、插值法填充等进行填充，对于一些异常的用电数据，也可以结合账户的历史用电数据进行修正。在数值型数据出现其他情况时，也进行相应的处理，例如，对于数值型数据存在负值的情况，在该情况下，取其绝对值，然后判断此绝对值是否大于该用户本月非负值用电数据的最大值，若大于最大值，则以平均值填补，否则
以其绝对值填补。对于数值型数据出现极值的情况，在该情况下，通过设定上下界限阈值，若数值在这个数据范围内，保留该数据，否则删除该数据。
43.s2，构建用户标签体系；
44.其中，标签体系中包括子级标签与主级标签，子级标签又包括基础标签与高阶标签，基础标签一般为非数值型数据的标签，表示账户用电的基本属性，可以直接从原始用电数据获取；高阶标签一般为数值型数据的标签，表示出账户用电的用电特征，反映出用户在不同维度的用电状况。下面对基础标签与高阶标签的构建进行介绍：
45.基础标签：表征该用电数据的基础属性。例如，用户名称、用户地址、用户编号、首次改造时间等。
46.高阶标签：结合业务需求，采用统计分析、数据转换、聚类分析法，获取高阶标签。对于数值型数据，通过对数值处理后，根据当前用电数据在全部用电数据中的排列位置，获取高阶标签中每一类区间的临界值，判断该数值型数据的排列位置属于哪个区间，进而得到该区间对应的高阶标签。例如，可以对数值型数据进行百分位数和统计分析，划分不同用电类型的用电数据的位置区间，根据当前用电数据在全部用电数据中的排列位置获取位置区间。其中，对数值型数据进行百分位数计算时，可以采用如下方式。
[0047][0048]
百分位数指的是一组n个观测值按数值大小排列。如，处于p％位置的值称第p百分位数，数值相同的观测值的百分比相同。其中，j表示第j个用户，n表示用户总数，nj表示某一指标中比用户j的数值小于的用户数。某一指标相同数值的用户对应的百分数一致。
[0049]
s3，向用户展示出构建的用户标签体系。
[0050]
基于python技术构建大数据的架构计算获得标签计算结果，并存储生成数字化账单，在终端的界面进行显示，其中，数字化账单包括上述标签，通过数字化账单的形式能够更好地展现出用户的标签，并且使得用户清晰地了解自己的用电习惯、贡献情况等。
[0051]
通过上述可选实施方式，可以达到通过获取用户的用电数据，结合用户的用电行为，可以得出多种标签分类，例如，用电水平、节能减排、用电行为和用电建议等等，构建了用户标签体系，并且展示出标签，以向用户展示综合用电汇总信息，有助于用户清晰地了解自己的用电习惯、贡献情况等的有益效果。
[0052]
需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。
[0053]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例的方法。
[0054]
实施例2
[0055]
根据本发明实施例，还提供了一种用于实施上述数据处理方法的装置，图2是根据本发明实施例的数据处理装置的结构框图，如图2所示，该装置包括：获取模块202，确定模块204，归纳模块206和展示模块208，下面对该装置进行详细说明。
[0056]
获取模块202，用于获取目标区域中目标账户的第一用电数据与第一用电数据的数据类型，其中，数据类型包括数值型数据与非数值型数据；确定模块204，连接于上述获取模块202，用于基于第一用电数据的数据类型，确定第一用电数据对应的子级标签；归纳模块206，连接于上述确定模块204，用于将子级标签归纳入对应的主级标签；展示模块208，连接于上述归纳模块206，用于在主级标签中包括的子级标签数量大于预定阈值的情况下，在预定界面中展示主级标签。
[0057]
此处需要说明的是，上述获取模块202，确定模块204，归纳模块206和展示模块208对应于实施数据处理方法中的步骤s102至步骤s108，多个模块与对应的步骤所实现的实例和应用场景相同，但不限于上述实施例1所公开的内容。
[0058]
实施例3
[0059]
根据本发明实施例的另外一个方面，还提供了一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器，其中，处理器被配置为执行指令，以实现上述任一项的数据处理方法。
[0060]
实施例4
[0061]
根据本发明实施例的另外一个方面，还提供了一种计算机可读存储介质，当计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述任一项的数据处理方法。
[0062]
实施例5
[0063]
根据本发明实施例的另外一个方面，还提供了一种计算机程序产品，包括计算机程序，其特征在于，计算机程序被处理器执行时实现上述任一项的数据处理方法。
[0064]
上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。
[0065]
在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。
[0066]
在本技术所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。
[0067]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0068]
另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0069]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0070]
以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种数智化转型服务平台任务分配方法和系统与流程

数据处理方法、装置、电子设备及计算机可读存储介质与流程

相关文献

最热文献