一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于FLCSS与k-medoids的卫星信号群体事件挖掘方法与流程

2022-03-16 16:55:16 来源:中国专利 TAG:

技术特征:
1.一种基于flcss与k-medoids的卫星信号群体事件挖掘方法,其特征在于:所述挖掘方法包括:s1、提取每个信号发生各类事件对应的时间戳的时间序列数据,通过flcss算法并对不同信号时间序列数据进行相似度计算,得到相似度矩阵;s2、对相似度矩阵进行k-medoids聚类,得到若干聚类簇,对应若干个信号群体事件的划分。2.根据权利要求1所述的一种基于flcss与k-medoids的卫星信号群体事件挖掘方法,其特征在于:所述提取每个信号发生各类事件对应的时间戳的时间序列数据,通过flcss算法并对不同信号时间序列数据进行相似度计算,得到相似度矩阵包括:s11、查询设定时间窗口所有信号的id及其对应的事件类型和事件发生时间戳,并按照信号id将事件类型和事件发生时间戳进行归类并进行排序,设定查询到的信号id数量为n;s12、根据某一事件类型的时间序列数据计算两两信号之间的相似度,得到这一事件类型的n
×
n相似度矩阵;s13、重复步骤s12,得到所有事件类型的n
×
n相似度矩阵,将每个相似度矩阵正乘以对应事件类型的权重得到新矩阵,并将各个新矩阵相加并归一化,得到n
×
n的最终相似度矩阵。3.根据权利要求1所述的一种基于flcss与k-medoids的卫星信号群体事件挖掘方法,其特征在于:所述对相似度矩阵进行k-medoids聚类,得到若干聚类簇,对应若干个信号群体事件的划分包括:s21、设置最小质心数为2,最大质心数为max_k,以和已有质心相似度最大值最小的样本作为新质心的选择原则,如果选择的质心和任一已有质心相似度均大于阈值limit1,则不再添加新质心,并将最大质心数max_k更新为当前已有质心个数;s22、从最小质心数2到最大质心数max_k进行遍历,每个质心数按照第一组按kmeans 算法生成,剩余cn-1组随机生成的生成方式生成cn组质心,总共生成(max_k-2 1)
×
cn组质心;s23、利用相似度矩阵对每组质心分别进行k-medoids聚类,得到(max_k-2 1)
×
cn组结果,并通过轮廓系数选取最佳结果;s24、对最佳结果通过阈值limit2进行优化,以提升簇内内聚程度,并补上可能被遗漏的簇,最终确定各质心与对应簇内样本。4.根据权利要求3所述的一种基于flcss与k-medoids的卫星信号群体事件挖掘方法,其特征在于:所述对最佳结果通过阈值limit2进行优化包括:a1、剔除各个簇中与相应质心相似度小于阈值limiti2的样本,如果存在剔除样本后的簇中只剩下一个样本,则以此样本与其他簇质心依次查询相似度,如果存在相似度大于阈值limiti2的,则将此样本归入该簇,如果存在多个相似度都大于阈值limit2,则归入相似度最大的簇,如果存在相似度均小于等于阈值limit2,则剔除此样本并同时删除该簇;a2、剩余的各簇根据相似度矩阵重新选取各自质心,即寻找一个与簇内其他样本相似度之和最高的簇内样本作为质心,得到新的质心集合,并根据新的质心集合对所有数据重新选取各簇内样本,为每个样本x寻找大于limit2相似度的质心中相似度最高的质心c,并将此样本x归入质心c应的簇,与所有质心相似度均小于等于limit2的样本归入剔除集合t;
a3、从集合t中根据相似度矩阵确定一个质心st,即st与t内其它样本相似度之和最大,寻找t内与相似度大于阈值limit2的样本聚为一类,剩余的样本归为t

集合;a4、如t

样本个数为0或st无法找到任何相似度大于limit2的样本,则结束,否则将集合t

设为t,并重复步骤a3。5.根据权利要求2所述的一种基于flcss与k-medoids的卫星信号群体事件挖掘方法,其特征在于:根据时间序列数据计算相似度的计算方法包括:根据flcss算法计算两个时间序列的最长公共子序列,并以此子序列长度以及公共点对内距离差异为依据使用相似度评价公式计算相似度。6.根据权利要求5所述的一种基于flcss与k-medoids的卫星信号群体事件挖掘方法,其特征在于:所述改进的lcss算法公式包括:f(x)=0.5 (1-x/r)*0.5其中,a,b分别为信号a和信号b的时间序列数据,a={a1,a2,...,a
t
},b={b1,b2,...,b
i
};dist(a
t
,b
i
)为a
t
,b
i
对应时间戳之差的绝对值;f为dist的函数,定义如f(x)公式所示;r为原lcss算法中距离阈值参数。7.根据权利要求5所述的一种基于flcss与k-medoids的卫星信号群体事件挖掘方法,其特征在于:所述相似度评价公式包括:其中,flcss(a,b)为两个信号的最长公共子序列长度;len
a
、len
b
分别为信号a、信号b序列长度;sum(d)为公共序列中每对对应点时间戳差异之和。8.根据权利要求2所述的一种基于flcss与k-medoids的卫星信号群体事件挖掘方法,其特征在于:所述阈值limit1=0.6,阈值limit2=0.35,所述质心组数cn=12,所述最大质心数max_k=min(25,n/2)。

技术总结
本发明涉及一种基于FLCSS与k-medoids的卫星信号群体事件挖掘方法,包括:提取每个信号发生各类事件对应的时间戳的时间序列数据,对不同信号时间序列数据进行相似度计算,得到相似度矩阵;对相似度矩阵进行k-medoids聚类,得到若干聚类簇,对应若干个信号群体事件的划分。本发明通过对FLCSS算法使用动态规划从序列整体角度进行计算,在使寻找到的公共子序列尽量长的同时也使每对公共点距离尽量小,避免了原算法可能导致的每对公共点都处于距离阈值边界的不合理情况;对k-medoids聚类的结果进行进一步的调优,最大限度的利用原始数据,补上被遗漏的簇,并剔除掉不属于任何簇的样本。本。本。


技术研发人员:战永盛 余安东 王鹏珍
受保护的技术使用者:电信科学技术第五研究所有限公司
技术研发日:2021.12.14
技术公布日:2022/3/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献