一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种利用电力客户用电负荷信息实现行业分类的方法与流程

2022-02-24 13:17:49 来源:中国专利 TAG:


1.本发明涉及电力行业客户分析领域,尤其涉及一种利用电力客户用电负荷信息实现行业分类的方法。


背景技术:

2.当前电力增值服务体系体积庞大,内容错综复杂,面对基数庞大的用户群体,需要对不同的用户群体进行划分,以向潜在的用户推送相关个性化服务或增值性服务。在现有技术中,其传统的分类方法一般是采用人工来实现,这种传统方式需要花费大量人力、物力、时间成本,对用户群体进行划分,逐步分析相关数据,才能勉强向潜在用户推送相关增值服务产品,但是由于其不稳定性和主观性,往往导致目标用户错误,推送服务不准确;不但效率低,且准确性也很差,使客户无法获得最合适的服务。


技术实现要素:

3.本发明所要解决的技术问题在于,提供一种利用电力客户用电负荷信息实现行业分类的方法,可以快速准确地对用电客户所在行业进行分类。
4.为了解决上述的技术问题,本发明提供一种利用电力客户用电负荷信息实现行业分类的方法,其包括如下步骤:
5.步骤s10,利用计量自动化采集系统获取多个行业的典型用户的日、月用电量数据和有功功率数据;
6.步骤s11,采用模糊c-均值聚类算法,对所获取的用户日、月用电量数据区间和功率区间进行聚类,自动确认每一典型用户的用电行业分类;
7.步骤s12,利用客户画像系统中所述每一典型用户的用电特征参数,对所述聚类确定的用电行业分类进行检验,确定分类合理性;
8.步骤s13,根据用户的实际行业分类,对存在分类不合理的典型用户日用电量数据和典型用户有功功率数据进行修正,得到更为准确的日用电量曲线和有功功率曲线;
9.步骤s14,根据修正后的日用电量曲线和有功功率曲线,确定每一用电行业最优聚类中心曲线。
10.优选地,所述步骤s11进一步包括:
11.步骤s110,按照模糊c-均值聚类算法与戴维森堡丁指数,对典型用户的日、月用电量数据和有功功率数据进行聚合处理,自动获得每一典型用户对应的用电行业分类。
12.优选地,所述步骤s110进一步包括:
13.把用户日、月用电量数据区间和功率区间样本,分别表示为日用电量集合x={x1,x2,

,xn}、月用电量集合y={y1,y2,

,yn}、功率集合z={z1,z2,

,zn},即:用户日用电量数据x1区间、x2区间
……
xn区间,用户月用电量数据y1区间、y2区间
……
yn区间,功率z1区间、z2区间
……
zn区间;
14.并且将其分成m个用户日用电量模糊组,n个用户月用电量模糊组,i个功率模糊
组,并求每组的聚类中心ci(i=1,2,

,n)、cj(j=1,2,

,n)、ck(k=1,2,

,n),使目标函数达到最小,通过优化目标函数得到每个样本点对所有用电行业类别中心的隶属度;
15.根据隶属度的大小决定每一样本点的用电行业类别。
16.优选地,所述步骤s110进一步包括:
17.如果同一典型用户初步可以归类到2个以上的族类,将最靠近均值的用电行业分类确定所述用户的用电行业分类。
18.优选地,所述步骤s12进一步包括:
19.利用客户画像系统中所述每一典型用户的用电特征参数,确定所述典型用户的实际归类;
20.将每一典型用户通过聚类算法确定的用电行业分类与通过客户画像系统确定的实际归类进行比较;
21.如果两者一致,则确定所述通过聚类算法确定的用电行业分类为合理;否则,则确定所述通过聚类算法确定的用电行业分类不合理。
22.优选地,所述步骤s13进一步包括:
23.在确定所述通过聚类算法确定的用电行业分类不合理时,重新选择样本数据替换所述典型用户的数据,流程转到步骤s11,直至所有典型客户通过聚合算法所获得的用电行业分类均为合理。
24.优选地,所述客户画像系统中的用电特征参数包括:基本属性、缴费行为、用电行为、互动服务、增值服务以及敏感信息。
25.优选地,所述用电行业分类包括如下类别:
26.农、林、牧、渔业类;工业类;建筑业类;交通运输、仓储和邮政业类;信息传输、计算机服务和软件业类;商业、住宿和餐饮业类;金融、房地产、商务及居民服务业;公共事业及管理组织类以及城乡居民生活用电类。
27.实施本发明,具有如下的有益效果:
28.本发明提供了一种利用电力客户用电负荷信息实现行业分类的方法。首先利用计量自动化采集系统获取特定区域中典型用户日、月用电量数据和有功功率数据;采用模糊c-均值聚类算法,根据上述数据对每一用户的用电行业类别进行自动归类;再利用客户画像系统中的用电特性的特征参数对聚类获得的用电行业类别的合理性进行校验修正;最后运用dbi指标确定典型用电行业最优聚类中心曲线。实施本发明,可以快速准确地对用电客户所在行业进行分类。提高了效率以及准确性,并能对客户进行偏好分析,可以为后续对潜在用户推送相关的增值服务产品提供了坚实的基础。
附图说明
29.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
30.图1为本发明提供的一种利用电力客户用电负荷信息实现行业分类的方法的一个实施例的主流程示意图。
具体实施方式
31.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
32.如图1所示,示出了本发明提供的一种利用电力客户用电负荷信息实现行业分类的方法的一个实施例的主流程示意图。在本实施例中,所述方法包括如下的步骤:
33.步骤s10,利用计量自动化采集系统获取多个行业的典型用户的日、月用电量数据和有功功率数据;
34.在一个具体的例子中,可以通过etl每天定时从计量自动化采集系统采集某市全域不同行业的数千个用电客户的样本数据。其中,etl指数据抽取(extract)、转换(transform)、装载(load)的过程,其全称为:extraction-transformation-loading,它是构建数据仓库的重要环节。etl是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。
35.步骤s11,采用模糊c-均值聚类算法,对所获取的用户日、月用电量数据区间和功率区间进行聚类,自动确认每一典型用户的用电行业分类;
36.在一个具体的例子中,所述步骤s11进一步包括:
37.步骤s110,按照模糊c-均值聚类算法与戴维森堡丁指数(dbi),对典型用户的日、月用电量数据和有功功率数据进行聚合处理,自动获得每一典型用户对应的用电行业分类。可以理解的是,戴维森堡丁指数,又称为分类适确性指标,是由大卫l
·
戴维斯和唐纳德
·
bouldin提出的一种评估聚类算法优劣的指标。这个公式的含义是度量每个簇类最大相似度的均值。
38.在具体的例子中,所述用电行业分类包括如下类别:
39.农、林、牧、渔业类;工业类;建筑业类;交通运输、仓储和邮政业类;信息传输、计算机服务和软件业类;商业、住宿和餐饮业类;金融、房地产、商务及居民服务业;公共事业及管理组织类以及城乡居民生活用电类。
40.在具体的例子里,所述步骤s110进一步包括:
41.把用户日、月用电量数据区间和功率区间样本,分别表示为日用电量集合x={x1,x2,

,xn}、月用电量集合y={y1,y2,

,yn}、功率集合z={z1,z2,

,zn},即:用户日用电量数据x1区间、x2区间
……
xn区间,用户月用电量数据y1区间、y2区间
……
yn区间,功率z1区间、z2区间
……
zn区间;
42.并且将其分成m个用户日用电量模糊组,n个用户月用电量模糊组,i个功率模糊组,并求每组的聚类中心ci(i=1,2,

,n)、cj(j=1,2,

,n)、ck(k=1,2,

,n),使目标函数达到最小,通过优化目标函数得到每个样本点对所有用电行业类别中心的隶属度;
43.根据隶属度的大小决定每一样本点的用电行业类别,从而达到自动对样本数据进行行业分类的目的。
44.优选地,所述步骤s110进一步包括:
45.如果同一典型用户初步可以归类到2个以上的族类,将最靠近均值的用电行业分类确定所述用户的用电行业分类。
46.步骤s12,利用客户画像系统中所述每一典型用户的用电特征参数,对所述聚类确
定的用电行业分类进行检验,确定分类合理性;
47.在一个具体的例子中,所述步骤s12进一步包括:
48.利用客户画像系统中所述每一典型用户的用电特征参数,确定所述典型用户的实际归类;优选地,所述客户画像系统中的用电特征参数包括:基本属性、缴费行为、用电行为、互动服务、增值服务以及敏感信息。更具体地,基本属性指客户注册为用电客户,所填写的基本信息;缴费行为指客户在用电过程中,进行付费操作;用电行为指客户使用电的各种操作,如新装、运行、销户;互动服务指用户在用电过程中,进行的交流活动;增值服务指如果用户是满足某些条件的客户,还可以享有其他相关服务,如电价优惠;敏感信息指用户的账号、身份证、银行卡等机密信息;
49.将每一典型用户通过聚类算法确定的用电行业分类与通过客户画像系统确定的实际归类进行比较;
50.如果两者一致,则确定所述通过聚类算法确定的用电行业分类为合理;否则,则确定所述通过聚类算法确定的用电行业分类不合理。
51.例如,某个公司注册的工商业行业类别为:信息传输、计算机服务和软件业,通过上面的模糊c-均值聚类算法与戴维森堡丁指数,如果确实得出的是这个行业,那么分类基本是合理的。如果不合理,那么就要从样本数据着手,分析是否样本数据问题还是该企业本身运行效益,影响了用电量,使得最终得出的行业分类不准确,因此,行业分类算法还应该加入其它的社会、环境、企业运行效益等有关因素,来验证行业分类的合理性。
52.步骤s13,根据用户的实际行业分类,对存在分类不合理的典型用户日用电量数据和典型用户有功功率数据进行修正,得到更为准确的日用电量曲线和有功功率曲线;
53.优选地,所述步骤s13进一步包括:
54.在确定所述通过聚类算法确定的用电行业分类不合理时,重新选择样本数据替换所述典型用户的数据,因为样本数据会受到社会、环境、企业运行效益等有关因素的影响,使得行业分类结果不准确;流程转到步骤s11,直至所有典型客户通过聚合算法所获得的用电行业分类均为合理。
55.步骤s14,根据修正后的日用电量曲线和有功功率曲线,确定每一用电行业最优聚类中心曲线。可以理解的是,在重新选择样本数据后,再按照模糊c-均值聚类算法与戴维森堡丁指数,重新运行行业分类算法,直至获得特定客户的比较合理的行业分类。
56.实施本发明,具有如下的有益效果:
57.本发明提供了一种利用电力客户用电负荷信息实现行业分类的方法。首先利用计量自动化采集系统获取特定区域中典型用户日、月用电量数据和有功功率数据;采用模糊c-均值聚类算法,根据上述数据对每一用户的用电行业类别进行自动归类;再利用客户画像系统中的用电特性的特征参数对聚类获得的用电行业类别的合理性进行校验修正;最后运用dbi指标确定典型用电行业最优聚类中心曲线。实施本发明,可以快速准确地对用电客户所在行业进行分类。提高了效率以及准确性,并能对客户进行偏好分析,可以为后续对潜在用户推送相关的增值服务产品提供了坚实的基础。
58.以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献