一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于加权相关马氏距离的水文时间序列模式库构建方法

2022-06-11 11:52:11 来源:中国专利 TAG:

技术特征:
1.一种基于加权相关马氏距离的水文时间序列模式库构建方法,其特征在于:包括以下步骤:步骤s1、对原始多元水文时间序列进行数据预处理,补全水文时间序列当中的空缺值;步骤s2、利用分段线性表示(paa)方法,将多元时间序列分段,对于每一个特征,提取每个分段子序列的平均值,然后把每个分段的所有特征的特征向量进行组合形成多元时间序列特征向量,这种做法不但能抓取时间序列的主要特征,而且也降低了时间序列的维度;步骤s3、对马氏距离进行优化,使用critic权重法对不同时间序列的协方差矩阵中的变量加权处理,对加权后的矩阵求平均矩阵得到加权相关协方差矩阵,将加权相关协方差矩阵替代马氏距离中的协方差矩阵获得加权相关马氏距离;步骤s4、在获取多元时间序列的特征向量之后,使用基于加权相关马氏距离的层次聚类算法对数据集中的特征向量聚类并符号化表示,记录每个符号之间的距离构建符号距离表;步骤s5、利用动态时间弯曲距离算法计算符号化表示的时间序列之间的距离值,其中依据符号距离表替换动态时间弯曲距离算法中的欧氏距离度量,根据距离值进行聚类构建多元水文时间序列模式库。2.根据权利要求1所述的基于加权相关马氏距离的水文时间序列模式库构建方法,其特征在于:所述步骤s3中对马氏距离进行优化得到加权相关马氏距离,加权相关马氏距离能将各时间序列集合之间协方差矩阵的关联性考虑在内;其中,计算加权相关马氏距离具体步骤为:步骤s3.1、输入多元时间序列数据集r={x1,x2,x3,...,x
t
},将数据集r中的所有多元时间序列标准化预处理,去除序列中每个特征之间的量纲影响;步骤s3.2、计算数据集r中所有多元时间序列的协方差矩阵,设其特征维度依次记为x,y,z,记为u={m1,m2,m3,...,m
i
,...,m
n
},其表达式为:该矩阵中cov(x,y)表示特征x与y的协方差,其计算公式为:其中各维度的数据长度为n,表示x特征的平均值,表示y特征的平均值;步骤s3.3、对于需要计算的时间序列特征向量k1、k2,它们属于两个不同的时间序列数据集x
p
、x
q
,其对应的协方差矩阵为m
p
、m
q
,利用critic权重法计算出各个指标的权重,critic权重法是一种利用数据波动性大小计算权重的方法,它有两个指标分别为对比强度与冲突性指标,使用标准差表示对比强度指标,计算公式如下:
其中,表示第t个变量的平均值,s
t
表示第t个变量的标准差,n表示矩阵的行数,如果数据标准差越小则说明波动越小,权值也越小,使用相关系数表示冲突性指标,计算公式如下:其中,r
t
表示第t个变量的冲突性指标,r
gt
表示第g个变量与第t个变量之间的相关系数,如果与其他变量的相关系数值越小,说明冲突性越大,权值则越大,计算权值时,将对比强度s
t
与冲突性指标r
t
相乘获得信息量f
t
,则第t个变量的权重计算公式为:将计算出的权值与协方差矩阵中对应的变量相乘并替换原始协方差矩阵中的数据,最后对加权后的两个协方差矩阵求平均矩阵获得加权相关协方差矩阵;步骤s3.4、将马氏距离公式中的协方差矩阵替换成加权相关协方差矩阵计算多元特征向量之间的加权相关马氏距离,马氏距离如下:其中s-1
为协方差矩阵,g
i
,g
j
为样本向量。3.根据权利要求1所述的基于加权相关马氏距离的水文时间序列模式库构建方法:其特征在于:对层次聚类算法进行优化,将欧氏距离相似性度量改为加权相关马氏距离,所述步骤s4的详细内容为:步骤s4.1、获得将全部的多元时间序列特征向量视为单独的类,分别计算类与类之间的加权相关马氏距离;步骤s4.2、将加权相关马氏距离数值最小的两个类归并成一个新类;步骤s4.3、继续计算新类与其它类之间的距离;步骤s4.4、重复操作步骤s4.2与s4.3,当聚类稳定以后停止重复操作;步骤s4.5、输出聚类的结果和聚类中心;步骤s4.6、根据聚类中心的每个特征向量,计算两两特征向量之间的加权相关马氏距离作为相应符号之间的距离,从而构建符号距离表;步骤s4.7、对聚类中心赋予符号,属于同一类的特征向量符号一致,最终将多元特征向量符号化。

技术总结
本发明公开一种基于加权相关马氏距离的水文时间序列模式库构建方法,包括对马氏距离进行优化获得加权相关马氏距离;选取多元时间序列作为实验数据;对预处理数据集进行PAA分段降维获得多元时间序列特征向量;采用基于加权相关马氏距离的层次聚类方法对多元时间序列特征向量进行聚类并符号化表示,一个符号表示一个聚类中心,属于同一类的特征向量符号相同,将特征向量转换成字符串,根据各聚类中心的加权相关马氏距离记录符号之间的距离;利用动态时间弯曲距离算法计算各字符串之间的相似性距离;最后根据距离聚类构建多元水文时间序列模式库。本发明可以提高多元水文时间序列模式库结果的准确性。模式库结果的准确性。模式库结果的准确性。


技术研发人员:顾华杰 万定生 余宇峰
受保护的技术使用者:河海大学
技术研发日:2022.03.15
技术公布日:2022/6/10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献