基于聚类分析法的综合能源用户用能行为分析方法、系统及存储介质与流程

2022-11-19 12:21:48 来源：中国专利 TAG：

1.本发明属于能源互联网与人工智能行业应用领域，涉及一种基于聚类分析法的综合能源用户用能行为分析方法及系统。

背景技术：

2.受市场环境、政策导向等因素的影响，在较长的时间尺度下，人们对不同形式能源的选择也并非一成不变，同时人们的能源消费需求往往相对稳定。不同形式能源间的转换关系存在物理意义不明确，统计学特征明显的特点，无法直接构建其能源转换的物理模型。
3.用户用能行为分析是近年来的研究热点，但目前的研究大多集中于对用户用电行为的分析方面，而从综合能源系统角度对用户的综合用能行为分析建模的研究尚处于起步阶段。传统的用户用能行为分析方法是对日负荷曲线进行简单的分析，将负荷曲线的形态特征作为分析结果。从而单纯对用户用电行为进行分析这种方法实际可操作性差，信息量少，分析效果差；不仅如此传统分析方法主要是对用户的用电行为进行分析，并没有考虑到用户用能行为数据(例如，电、热、气、冷)间存在互补耦合关系，而气候、季节、节假日等因素也是同时交互影响用户用能行为的关键因素，因此，单纯对用户用电行为分析忽视了实际的用户用能行为模型的输入输出数据之间是具有复杂的耦合关系的，其分析数据缺乏准确性。
4.其次，随着各种分布式电源和储能装置的大量接入，用户逐渐从单一的能源消费者成为具有一定能源生产和消纳能力的产销者。对于企业、政府识别某一区域的能源消费情况以及制定相应的政策方面，产生较大的偏差。
5.此外，随着未来各类能源市场多元化进程的不断加深，综合能源服务商要在市场中占有一席之地，必须要满足用户的个性化需求，而用户用能行为规律分析成为了必要前提。
6.因此，急需一种考虑综合能源耦合的用户用能行为分析方法来实现综合能源系统用户侧用能信息的有效挖掘利用，以满足用户个性化需求，同时实现节能减排，达到能源企业的利益最大化的目的。

技术实现要素：

7.鉴于上述问题，本发明提供了基于聚类分析法的综合能源用户用能行为分析方法，包括如下步骤，
8.s1、获取包括电、热、气及冷能源在内的多个用户的用能数据；
9.s2、将上述用户用能数据分为分析性数据、特征性数据和描述性数据三类；
10.s3、根据k-means聚类分析法和聚类有效性评价指标对分析性数据进行聚类分析，获得聚类结果图；
11.s4、根据聚类后的结果图使用描述性数据对用户用能行为进行簇别划分，得到用
户的簇别标签；
12.s5、对特征性数据，根据最大相关最小冗余准则选取用户用能行为的特征标签；
13.s6、对用户簇别标签及特征标签进行可视化展示。
14.进一步的，步骤1中，用户用能数据包括：用户用能的能源市场交易结果数据，包括电热气冷能源的历史负荷数据；气象数据，包括温度、湿度、风速、降水量；季节数据，包括春季、夏季、秋季、冬季；节假日数据，包括周六、周天以及法定节假日；用户用能成本数据；分布式电源以及储能装置的输入负荷数据；其中电热气冷历史负荷数据为分析性数据，交易价格及气象数据、储能装置输出数据、分布式电源输出数据为特征性数据；季节数据及节假日数据为描述性数据。
15.进一步的，s2中，对用户用能数据中的分析性数据及特征性数据进行预处理，包括：
16.1)通过对采样间隔大于预设间隔时间a的分析数据及特征数据做拟合处理使之变为关于时间连续的用能数据，然后再对拟合处理后的连续的用能数据进行离散化，使之按照预设时间b采样一次；
17.2)通过归一化算法对上述离散化后的用户用能数据进行归一化处理，删除掉不具有样本意义的数据、不准确的数据、前后浮动较大的数据，分类存储于数据集中。
18.进一步的，z-score归一化公式为：
[0019][0020]
式中x
i,j
为用户i中第j分钟的用能数据的值，i,mean为用户i中用能数据的平均值，σ为用户i中用能数据的标准差，x
′
i,j
为用户i中第j分钟的用能数据归一化后的值。
[0021]
进一步的，步骤s3中，将分析数据分为k组，则随机选取k个对象作为初始的聚类中心；计算其余每个对象与各个种子聚类中心之间的距离，并对应分配给距离它最近的聚类中心，每分配一个对象，聚类中心会根据聚类中现有的样本被重新计算，终止条件可以是没有对象被重新分配给不同的聚类或者没有聚类中心再发生变化，使得聚类结果对应的损失函数最小；其中，损失函数定义为各个样本距离所属簇中心点的误差平方和：
[0022]
式中，xi代表第i个用户所包含的分析性数据，ci是xi所属的类，μ
ci
代表类对应的中心点，n是用户总数。
[0023]
进一步的，步骤s5中，取第一样本数据中的特征性数据构成原始特征集，将原始特征集中已经归一化后的数据变量区间均匀离散，得到各个特征变量的概率分布；使用信息熵描述特征与分类变量之间的相关性，计算聚类后的每一簇别用户与某一特征的联合信息熵；通过最大相关最小冗余准则将上述数据进行迭代，从而得出满足指标的最优解，此时的最优解即为用户用能的最优特征标签，其中
[0024]
信息熵的计算公式：
[0025]
式中，p(qi)为用能特征qi的概率密度函数，i为用能特征q的第i个特征
[0026]
经离散化处理以后，可得到第i个特征qi的熵的计算公式：
[0027]
式中，ni为用能特征qi在变量区间的数量；mu为特征落在第u个区间的样本个数，m为变量区间的总的特征数量。
[0028]
进一步的，步骤s6中，通过类间绘制雷达图与类内绘制柱状图来展示用户用能行为的画像，完成对用户的行为分析。
[0029]
根据本发明的另一方面，还提供了基于聚类分析法的综合能源用户用能行为分析系统，包括，
[0030]
数据采集模块，采集包括电、热、气及冷能源在内的多个用户的用能数据；
[0031]
预处理模块，将上述用户用能数据分为分析性数据、特征性数据和描述性数据；
[0032]
聚类算法模块，根据k-means聚类分析法和聚类有效性评价指标对分析性数据进行聚类分析，获得聚类结果图；
[0033]
簇别分析模块，用于通过对获得的聚类后的结果图使用描述性数据对用户用能行为进行簇别划分得到用户的簇别标签；
[0034]
特征标签提取模块，根据最大相关最小冗余准则基于特征性数据选取用户用能行为的特征标签；
[0035]
用户用能行为分析模块，对用户簇别标签及特征标签进行可视化展示。
[0036]
进一步的，用户用能行为分析模块，通过类间绘制雷达图与类内绘制柱状图来展示用户用能行为的画像，完成对用户的行为分析。
[0037]
本发明还提供了一种计算机存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法。本发明提供了一种基于聚类分析法的综合能源用户用能行为分析方法突破了传统用户用电行为分析提取信息有限，对多种能源之间的多能耦合、协同互补的重要特征缺乏考量，其分析数据缺乏准确性，与实际偏差较大的这一瓶颈，提高用户用能行为分析的准确性，为为需求管理终端和智慧用能方案提供准确的技术基础。
附图说明
[0038]
图1为本发明某一实施例的基于聚类分析法的综合能源用户用能行为分析方法流程框图；
[0039]
图2为本发明另一实施例的基于聚类分析法的综合能源用户用能行为分析方法流程框图；
[0040]
图3为本发明实施例的基于聚类分析法的综合能源用户用能行为分析方法的聚类分析流程框图；
[0041]
图4为本发明实施例的基于聚类分析法的综合能源用户用能行为分析系统结构示意图。
具体实施方式
[0042]
为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0043]
请参阅图1-4，本发明某一实施例提供了一种基于聚类分析法的综合能源用户用能行为分析方法，包括如下步骤：
[0044]
s1、获取包括电、热、气、冷在内的n个用户用能的能源市场交易结果数据；获取用户用能的气象数据；获取季节数据；获取节假日数据；获取用户用能成本的数据；获取分布式电源以及储能装置的输入负荷数据，存储于数据集中；需要说明的是，用户用能的能源市场交易结果数据包括：电热气冷能源负荷的历史数据；用户用能的气象数据包括：温度、湿度、风速、降水量；节假日数据包括：周六、周天以及法定节假日；季节数据包括：春季3月-5月，夏季6-8月，秋季9-11月，冬季12-2月。
[0045]
s2、将所述用户用能数据中的分析性数据及特征性数据进行预处理，得到用户用能的第一样本数据，并将所述的第一样本数据按照一定的离散序列形式分类存储于数据集。上述储存于数据集中的数据分为分析性数据、特征性数据和描述性数据三类。其中，分析性数据包括电热气冷历史负荷数据，特征性数据包括交易价格、气温、湿度、风速、降水量、储能装置输出数据、分布式电源输出数据；描述性数据包括季节、节假日等，其中分析性数据用于聚类分析，特征性数据用于用户用能特征提取；描述性数据用于聚类后辅助簇别分析。
[0046]
在某一具体的实施方式中，所述的预处理包括：
[0047]
通过对采样间隔太大，例如采用频率为15min/次的用户用能的离散数据做拟合处理使之变为关于时间连续的数据，然后再对连续的用户用能数据进行离散化，使之每1min采样一次；
[0048]
通过归一化算法对所述的离散化后的用户用能数据进行归一化处理，对归一化处理后的数据删除掉不具有样本意义的数据、剔除掉不准确的数据、剔除掉前后浮动较大的数据，并将数据存储于数据集中。
[0049]
s3、根据k-means聚类分析法和聚类有效性评价指标对用户用能的第一样本数据中的分析数据进行聚类分析，获得最优聚类点以及其聚类结果图。
[0050]
在某一具体实施方式中，所述的最优聚类中心提取，包括：随机定义聚类中心k，用户的用能数据自动分配到距离聚类中心最近的类别之中，再从一类中选取最近的数据点，重新定义聚类中心k，当满足聚类有效性指标后，输出的聚类图像即为最优聚类点的聚类图像。
[0051]
s4、通过获得的聚类后的用户用能数据对用户用能行为进行簇别分析。
[0052]
在某一具体实施方式中，所述的簇别分析，包括：对获得的聚类后的结果图使用描述性数据对用户用能行为进行簇别划分，得到用户的簇别标签。
[0053]
s5、根据最大相关最小冗余准则选取用户的特征标签。
[0054]
根据最大相关最小冗余准则选取用户的特征标签，包括：对数据集中的用户用能数据提取特征性数据作为原始特征集，将原始特征集中已经归一化后的数据变量区间均匀离散，得到各个特征变量的概率分布；使用信息熵描述特征于分类变量之间的相关性，将聚类后的每一簇别的用户用能数据计算在某一特征下的联合信息熵；通过最大相关最小冗余准则将上述数据进行迭代，从而得出满足指标的最优解，此时的最优解即为用户用能的最优特征标签。
[0055]
s6、将上述所有用户用能行为标签中的特征标签，采用赋分制的方法将获取的特
征标签转化为便于理解的标签，最后对用户用能标签进行可视化展示，通过类间绘制雷达图与类内绘制柱状图来展示用户用能行为，完成对所述目标用户的行为画像分析。
[0056]
根据本发明的另一方面，还提供了基于聚类分析法的综合能源用户用能行为分析系统，包括，数据采集模块，采集包括电、热、气及冷能源在内的多个用户的用能数据；
[0057]
预处理模块，对用能数据按照一定离散序列形式归一化处理储于数据集形成第一样本数据；
[0058]
聚类算法模块，根据k-means聚类分析法和聚类有效性评价指标对分析性数据进行聚类分析，获得最优聚类点以及其聚类结果图；
[0059]
簇别分析模块，用于通过对获得的聚类后的结果图使用描述性数据对用户用能行为进行簇别划分得到用户的簇别标签；
[0060]
特征标签提取模块，对数据集中的用户用能数据提取特征性数据作为原始特征集，根据最大相关最小冗余准则选取用户用能行为的特征标签；
[0061]
用户用能行为分析模块，对用户簇别标签及特征标签进行可视化展示，通过类间绘制雷达图与类内绘制柱状图来展示用户用能行为的画像，完成对用户的行为分析。
[0062]
本发明还提供了一种计算机存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法。
[0063]
本发明提供的一种基于聚类分析法的综合能源用户用能行为分析方法突破了传统用户用电行为分析提取信息有限，对多种能源之间的多能耦合、协同互补的重要特征缺乏考量，其分析数据缺乏准确性，与实际偏差较大的这一瓶颈；k-means聚类分析、信息熵、最大相关最小冗余等多重算法的应用，不仅提高了运算的速度，而且还使得本方法具备复杂场景下的强适应能力与可解释性，进而满足作为需求管理终端和智慧用能方案基础技术的要求。
[0064]
实施例1：
[0065]
请参阅图2，本发明提供了一种基于聚类分析法的综合能源用户用能行为分析方法，包括：步骤1，采集n个用户的用能数据，包括：分析性数据，即用户的用能负荷序列为xi＝[x
i,1
,x
i,2
,
…
,x
i,k
]
[0066]
其中xi为四维向量，表示用户i的用能负荷序列(包含电热气冷四种负荷的离散时间序列)，x
i,k
表示用户i的第k分钟负荷数据；
[0067]
特征性数据：定义q＝[q1,q2,
…
,q
10
]
t q1,q2,
…
,q
10
分别为电热气冷的成本数据(用电成本、用热成本、用气成本、用冷成本)，气温、湿度、风速、降水量，分布式电源放电功率和分布式储能装置放电功率十大特征。
[0068]
描述性数据：季节、节假日等。
[0069]
步骤2，分析采集到的数据，进行数据预处理。所谓数据预处理是指，通过使用物理方法将原始数据转换为可以理解的格式或者符合挖掘的格式。主要是清理异常值、纠正错误数据，现实世界中数据大体上都是不完整、不一致的数据，无法直接进行数据挖掘，或挖掘结果差强人意，为了提高数据挖掘的质量产生了数据预处理技术。对采样数据进行预处理，其主要任务是数据归一化与缺失值的补充，重复值与异常值以及噪声数据的清除。所述的归一化处理公式：z-score归一化公式
[0070]
式中x
i,j
为用户i中第j分钟的分析性数据的值，i,mean为用户i中分析性数据的平均值，σ为用户i中分析性数据的标准差，x
′
i,j
为用户i中第j分钟的分析性数据归一化后的值。
[0071]
步骤3，对预处理后的分析数据进行聚类算法分析，所述的聚类算法是指一种迭代求解的聚类分析算法，其步骤是，先将数据分为k组，则随机选取k个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。.聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类算法的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类，没有(或最小数目)聚类中心再发生变化，使得聚类结果对应的损失函数最小。其中，损失函数可以定义为各个样本距离所属簇中心点的误差平方和：
[0072]
式中，xi代表第i个用户所包含的分析性数据，ci是xi所属的簇，代表簇对应的中心点，n是用户总数。
[0073]
步骤4，簇别分析与用户用能行为画像，所述的簇别分析是对获得的聚类后的结果图使用描述性数据对用户用能行为进行簇别划分(划分为k类用户)，得到用户的簇别标签。
[0074]
步骤5，选取用户的特征标签
[0075]
对数据集中的用户用能数据提取特征性数据作为原始特征集，将原始特征集中已经归一化后的数据变量区间均匀离散，得到各个特征变量的概率分布；使用信息熵描述特征于分类变量之间的相关性，将聚类后的每一簇别的用户用能数据计算在某一特征下的联合信息熵；通过最大相关最小冗余准则将上述数据进行迭代，从而得出满足指标的最优解，此时的最优解即为用户用能的最优特征标签。
[0076]
信息熵的计算公式：
[0077]
式中，p(qi)为用能特征qi的概率密度函数，i为用能特征q的第i个特征
[0078]
经离散化处理以后，可得到第i个特征qi的熵的计算公式：
[0079]
式中，ni为用能特征qi在变量区间的数量；mu为特征落在第u个区间的样本个数，m为变量区间的总的特征数量。
[0080]
用户类别a的信息熵为：
[0081]
经离散化处理以后，用户类别a的信息熵为：
[0082]
式中，其中mv为第v个类别的样本数量，n为用户总类别数，经聚类后为k类。
[0083]
用能特征qi与用户a的联合信息熵为：
[0084]
经离散化处理以后，用能特征与用户a的联合信息熵为：
[0085]
式中：m
uv
为v类用户用能特征qi落在第u个区间的样本数量。
[0086]
第i个用能特征qi与用户类别a的互信息为：i(qi,a)＝h(x) h(a)-h(q,a)
[0087]
最优特征集与a类用户的最大相关性公式为：
[0088]
式中，设q表示特征{qi}的集合，|q|＝m.为了选出m个最相关特征，使得x满足如下：d(q,a)＝maxd(q,a)，其主要目的为选出m个平均互信息最大的集合x。因选取的最优特征为相关度很大的特征，因此其特征间存在冗余，特征集x冗余的计算公式为：为了选取出m个最小无关特征，使q满足：r(q)＝minr(q)，最终目标为找出m个相关性最大，冗余性最小的最优特征集q,采用如下目标函数maxφ(d,r)＝φ＝d-r。
[0089]
式中，φ组成的集合即为最优特征集。
[0090]
所述的用户用能行为画像，是指为了准确而又直白的描述用户的用能行为，利用打分制的方法定义特征标签。主要步骤为：
[0091]
首先将每类用户的最优特征进行打分，公式如下：
[0092][0093]
式中，y
i,j
为第i类用户的第j个特征标签得分，为第j个特征的平均值，q
jmin
为第j个特征的最小值，q
jmax
为第j个特征的最大值。
[0094]
其次通过雷达图绘制出最优特征的得分情况，对k个雷达图进行画像描述分析。
[0095]
最后通过柱状图进行不同类别用户标签对比分析出不同类别用户的用电习惯。
[0096]
本发明提供的一种基于聚类分析法的综合能源用户用能行为分析方法突破了传统用户用电行为分析提取信息有限，对多种能源之间的多能耦合、协同互补的重要特征缺乏考量，其分析数据缺乏准确性，与实际偏差较大的这一瓶颈；k-means聚类分析、信息熵、最大相关最小冗余等多重算法的应用，不仅提高了运算的速度，而且还使得本方法具备复杂场景下的强适应能力与可解释性，进而满足作为需求管理终端和智慧用能方案基础技术的要求。
[0097]
请参阅图2，本发明提供了聚类分析算法与有效性指标的流程框图，包括：具体操作步骤：
[0098]
(1)对归一化后的数据随机选取k个中心以作为聚类中心，记为
[0099]
(2)定义损失函数：
[0100]
(3)令t＝0，1，2
…
为迭代步数，重复如下过程使得j收敛
[0101]
(3.1)对于每一个样本xi，将其分配到距离最近的中心
[0102]
(3.2)对于每个聚类中心k，重新计算该类的中心
[0103]
最终输出最优聚类点及其聚类结果图。
[0104]
以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施
例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：电池组容量预测方法及相关设备与流程

基于聚类分析法的综合能源用户用能行为分析方法、系统及存储介质与流程

相关文献

最热文献