一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于GMM、Elman神经网络和KNN的建筑能耗集体异常检测方法

2022-12-07 10:16:27 来源:中国专利 TAG:

基于gmm、elman神经网络和knn的建筑能耗集体异常检测方法
技术领域
1.本发明属于建筑能耗异常检测技术领域,具体涉及一种基于gmm、elman神经网络和knn(也称knn算法)的建筑能耗集体异常检测方法。


背景技术:

2.建筑行业是全球主要的能源消费行业,全球约有40%左右的能源被建筑所消耗,建筑物在全生命周期内的二氧化碳排放量占据了全球排放总量的30%以上。但在建筑行业所消耗的大量能源消耗中,建筑运行过程中蕴含着极大的节能潜力。随着科技的发展,建筑能源管理系统(bems)已经成为现代建筑的重要组成部分,负责在保持居住者舒适度的同时最大限度地降低能耗。而在监测和记录用电量的过程中,会因为各种因素导致能耗数据异常,运营人员若能及时发现建筑中的异常能耗,对于节约运营成本、减少碳排放、保持建筑系统的稳定性、安全性具有重要意义。
3.异常检测是发现异常能耗的最重要方法之一,该技术用于识别大数据量中的异常模式。通常情况下,可根据异常类型分为三种情况:点异常(point anomalies)、上下文异常(contextual anomalies)和集体异常(collective anomalies)。点异常情况也可称为全局异常,即能耗数据点与全局大多数的能耗数据有明显的区别;上下文异常多为时间序列异常,即能耗数据在某个时间点的前后时间段存在较大的差异;集体异常是由多个能耗点或多条序列构成的异常情况,单独的分析能耗数据或序列是正常能耗,但是从整体能耗趋势进行分析为异常情况。而已有的建筑异常检测技术中多集中于能耗点异常检测,检测结果精确,但在点异常检测技术在处理处理时间序列和集体异常情况中存在明显不足。鉴于此,本文基于gmm、elman神经网络和knn发明一种建筑能耗集体异常检测方法,以便实现对能耗异常情况更精准有效地异常检测。


技术实现要素:

4.为了实现对建筑能耗时间序列集体异常的检测,本发明旨在提供一种精准客观和具有实际应用的基于gmm、elman神经网络和knn建筑能耗集体异常检测方法,以便改善以往建筑异常能耗检测技术对异常情况进行实际检测过程中的应用局限性。
5.为了实现以上技术目的,本发明采用以下技术方案:
6.基于gmm、elman神经网络和knn的建筑能耗集体异常检测方法,包括以下步骤:
7.步骤一:通过建筑能耗检测平台收集能耗数据进行集体异常检测;
8.步骤二:利用软件对历史能耗数据进行模型聚类分析,实现对建筑能耗历史数据分类;
9.步骤三:根据历史能耗聚类结果,对elman神经网络进行训练,构建实时能耗数据识别匹配机制,将相似能耗模式的数据匹配到同一类别中进行集体异常检测;
10.步骤四:当能耗数据序列达到最小检测序列后,应用动态时间规整算法将时间序列转换为点异常检测,对该时间序列进行集体异常检测,判断是否存在集体异常情况;
11.步骤五:应用k最近邻算法对时间序列进行异常检测,根据检测结果,对历史能耗数据集进行动态更新,输出标记异常时间序列。
12.进一步地,步骤二中所述软件为matlab软件。
13.进一步地,步骤二中所述模型为高斯混合模型。
14.进一步地,所述高斯混合模型是通过计算每个样本属于每个聚类的概率,将能耗数据划分到较高的概率的某一类中;对于n个能耗数据x={x1,x2…
,xn}中,样本的分布由k个具有高斯分布构成,对于每个高斯分布看成为一个簇,通过计算概率模型p(y|x),将每个高斯分布进行组合,构成高斯混合模型概率密度函数:
[0015][0016]
式中:k是高斯分布的个数;μk为第k类能耗数据的均值;θk表示第k类的权重系数,含义为能耗数据属于该类的概率且∑θk=1;σk表示第k类的标准差,k(x|μk,∑k)表示为第k个高斯分布。
[0017]
进一步地,步骤三中所述elman神经网络是一种对bp神经网络进行改进的动态型神经网络,其网络结构为四层:输入层、隐含层、承接层、输出层。
[0018]
进一步地,所述隐含层输出向量为:
[0019]
z(x)=f(ω1u(x-1) ω2zc(x) b1)
[0020]
zc(x)=z(x-1)
[0021]
y(x)=g(ω3z(x) b2)
[0022]
式中,y(x)为输出向量;g()为输出神经元的传递函数;f()为sigmoid函数;u(x-1)为输入向量集;zc(x)为承接层的输出向量;zc(x)为反馈状态向量;ω1为输入层与隐含层之间的权值矩阵;ω2为承接层与隐含层之间的权值矩阵;ω3为隐含层与输出层之间的权值矩阵;b1为隐含层的阈值向量;b2为输出层的阈值向量。
[0023]
进一步地,步骤四中所述时间序列采用dtw距离进行求解,将能耗时间序列距离转化为能耗点距离进行求解异常情况。
[0024]
进一步地,dtw距离进行求解是将不同长度的时间序列进行距离计算,对于两个时间序列可分为两个步骤:
[0025]
step1:计算之间各能耗点之间的欧氏距离,得到矩阵n
×
m大小的距离矩阵m,矩阵元素其中采用欧氏距离进行计算;
[0026]
step2:寻找距离矩阵m从m
11
到m
ij
的最短路径,即为dtw距离;
[0027]
两条序列之间经过用动态规整后的最短距离的dtw距离,其公式如下:
[0028]dtw
(i,j)=m(i,j) min(m(i-1,j-1),m(i,j-1),m(i-1,j))
[0029]
其中,i∈[2:n],j∈[2:m];d
tw
(i,j)表示为x1中长度为i的时间序列与x2中长度为j的时间序列之间的dtw距离,是两条不同长度的时间序列经过用动态时间规整后的最短距离;m(i,j)表示为时间序列x1中第i个能耗点与时间序列x2中第j个能耗点之间的欧氏距离;min(m(i-1,j-1),m(i,j-1),m(i-1,j))表示为第i行第j列能耗点,三个方向内最短的距离。
[0030]
进一步地,步骤五中所述应用k最近邻算法是依次计算每个能耗点与其相近的k个
能耗数据平均距离,通过设定阈值来进行异常检测,获得集体异常检测结果。
[0031]
进一步地,根据所述集体异常检测结果,对历史能耗数据集进行动态更新,将正常时间序列能耗加入到样本数据集中,剔除时间属性最早的能耗序列,异常能耗数据序列将会被标记并提醒运营人员。
[0032]
本发明具有以下优点:
[0033]
1.与现有技术相比,本发明采用高斯混合模型(gmm)聚类分析,能够准确分析能耗数据中的不同类型的特征情况,对能耗模式的分类更具科学意义。
[0034]
2.与现有的异常检测方式相比,现有的检测方法多集中于点异常检测,对集体异常检测的研究较少。本发明是对时间序列进行集体异常进行检测,通过调整dtw的时间序列长度可以实现对点异常检测和集体异常检测,丰富了建筑能耗异常检测的方法,具有较高的实用价值。
[0035]
3.本发明能够根据异常检测结果,对能耗数据集进行动态更新,从而保证能耗数据集的时效性,能够有效应对在面对节假日或气候变化所导致的能耗波动现象,从而避免造成误判情况,保障异常检测结果的有效性和稳定性。
[0036]
4.本发明是基于建筑能耗监测平台所记录的能耗数据的检测方法,能够与平台系统进行结合,具有较高的检测准确性,实用价值高。
附图说明
[0037]
图1为本发明的基于gmm、elman神经网络和knn的建筑能耗集体异常检测方法的工作流程图;
[0038]
图2为本发明的elman神经网络结构图;
[0039]
图3为本发明的各季度能耗数据聚类结果图;
[0040]
图4为本发明的能耗集体异常检测结果图。
具体实施方式
[0041]
为了使本发明的目的、技术方案和优点更加清楚和清楚,下面将结合具体实施例并参考附图来清楚和完整地描述本发明实施例中的技术方案。应当注意,本发明的所述实施例是说明性的,但是这不是对本发明的限制,因此本发明不限于上述实施例。基于本发明原理,凡是本领域普通技术人员在没有做出创造性劳动前提下所获得的其它实施方式,均视为在本发明的保护之内。
[0042]
本发明基于gmm、elman神经网络和knn建筑能耗集体异常检测方法主要可以分为三个部分,如图1本发明的建筑能耗集体异常检测方法的工作流程图所示。首先,通过对建筑能耗监测平台收集的历史能耗数据应用高斯混合模型进行聚类分析。然后,将具有类别标签的历史能耗数据对elman神经网络进行训练,建立实时能耗数据识别匹配机制。最后,将dtw方法和k最近邻算法进行结合,将时间序列之间的能耗数据异常检测转换为点异常检测,根据异常检测结果对历史能耗数据进行动态更新,标记输出异常检测结果。具体包括以下步骤:
[0043]
步骤一:通过建筑能耗检测平台收集能耗数据进行集体异常检测;
[0044]
步骤二:利用matlab软件对历史能耗数据进行高斯混合模型(gmm)进行聚类分析,
1)为输入向量集;zc(x)为承接层的输出向量;zc(x)为反馈状态向量;ω1为输入层与隐含层之间的权值矩阵;ω2为承接层与隐含层之间的权值矩阵;ω3为隐含层与输出层之间的权值矩阵;b1为隐含层的阈值向量;b2为输出层的阈值向量。
[0064]
步骤四中:
[0065]
时间序列集体检测不同于点异常检测,对于单一的能耗点检测可采用欧氏距离进行异常检测计算,而对于时间序列时,传统的欧氏距离无法准确求解序列之间的距离。因此本发明将时间序列之间采用dtw距离进行求解,将能耗时间序列距离转化为能耗点距离进行求解异常情况。
[0066]
dtw距离的优点是它对时间序列的同步性要求较低,能够将不同长度的时间序列进行距离计算。建筑能耗是一种按时间周期波动的时间序列,dtw距离进行求解是将不同长度的时间序列进行距离计算,对于两个时间序列可分为两个步骤:
[0067]
step1:计算之间各能耗点之间的欧氏距离,得到矩阵n
×
m大小的距离矩阵m,矩阵元素其中采用欧氏距离进行计算;
[0068]
step2:寻找距离矩阵m从m
11
到m
ij
的最短路径,即为dtw距离;
[0069]
两条序列之间经过用动态规整后的最短距离的dtw距离,其公式如下:
[0070]dtw
(i,j)=m(i,j) min(m(i-1,j-1),m(i,j-1),m(i-1,j))
[0071]
其中,i∈[2:n],j∈[2:m];d
tw
(i,j)表示为x1中长度为i的时间序列与x2中长度为j的时间序列之间的dtw距离,是两条不同长度的时间序列经过用动态时间规整后的最短距离;m(i,j)表示为时间序列x1中第i个能耗点与时间序列x2中第j个能耗点之间的欧氏距离;min(m(i-1,j-1),m(i,j-1),m(i-1,j))表示为第i行第j列能耗点,三个方向内最短的距离。通过该式递归计算,从而得到任意两条能耗时间序列之间的dtw距离,结合knn检测算法实现将两条时间序列之间的dtw距离转化为两个能耗点之间的欧氏距离,从而进行集体检测。
[0072]
步骤五中:
[0073]
k最近邻算法是一种无监督的异常检测算法,通常异常能耗点远离正常能耗点。k最近邻算法的基本思想就是依次计算每个能耗点与其相近的k个能耗数据平均距离,通过设定阈值来进行异常检测,获得集体异常检测结果。是将dtw距离与k最近邻算法进行结合,能耗集体异常检测过程可以分为三步。第一步,计算历史能耗数据中时间序列的dtw距离作为样本数据集;第二步,计算新输入的时间序列dtw距离与样本数据集中每条数据之间的距离,对所求的k条距离进行排序,选取最小的k条时间序列距离作为异常得分;第三步,通过将异常得分与阈值相比较,从而判定时间序列异常情况。其中,时间序列是转化为dtw距离后,在k最近邻算法中按照欧氏距离进行计算。
[0074]
根据集体异常检测结果,对历史能耗数据集进行动态更新,将正常时间序列能耗加入到样本数据集中,剔除时间属性最早的能耗序列,异常能耗数据序列将会被标记并提醒运营人员。
[0075]
本发明对某高校一栋实验楼2018年逐时记录的用电量数据作为数据样本,进行集体异常检测。经高斯混合模型gmm算法进行聚类分析,用电量数据聚类结果如图3所示。实时能耗数据经elman神经网络识别匹配,等待用电量数据达到最小周期后,计算用电量能耗数
据时间序列dtw距离,应用k最近邻算法进行集体异常检测,根据设置的阈值判定能耗数据中的集体异常情况,检测结果如图4所示。异常能耗将被标记并提醒运营人员,正常能耗数据将加入到历史能耗数据集中,实现能耗数据的动态更新,避免误检。
[0076]
尽管已经描述和叙述了被看作本发明的示范实施例,本领域技术人员将会明白,可以对其作出各种改变和替换,而不会脱离本发明的精神。另外,可以做出许多修改以将特定情况适配到本发明的教义,而不会脱离在此描述的本发明中心概念。所以,本发明不受限于在此披露的特定实施例,但本发明可能还包括属于本发明范围的所有实施例及其等。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献