一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于检验统计量的高维数据流变点检验方法及系统与流程

2022-03-26 16:37:14 来源:中国专利 TAG:

技术特征:
1.一种基于检验统计量的高维数据流变点检验方法,其特征在于,包括以下步骤:s110、获取高维数据流,利用数据集分割算法将所述高维数据流随机分成若干个完整的数据子集;s120、计算所述数据子集区间的检验统计量值l
t
,并输出最大检验统计量值的数据点位置,将所述数据点作为候选点添加至变点候选集中;s130、利用所述候选点将所述数据子集一分为二,在所述候选点的左右两侧再次递归抽取数据子集;s140、重复步骤s120-s130,直到所述数据子集的长度达到设定的最小长度阈值;s150、计算所述变点候选集中每个所述候选点对应的检验统计量值的累加和v,将所述累加和v除以标准差s
v
所得的商v/s
v
与检验阈值z
α
进行比较;以及s160、若所述所得的商v/s
v
大于所述检验阈值z
α
,则认定所述候选点为变点,输出所述变点的个数和位置。2.根据权利要求1所述的基于检验统计量的高维数据流变点检验方法,其特征在于,在步骤s120中,计算所述检验统计量l
t
的表达式为:其中,{x
i
∈r
p
,1≤i≤n}为一p维观测序列,任意的t∈{1,...,n-1},且f
t
(i)是一个(m 1)维的向量函数,f
n,m
为(m 1)
×
(m 1)维矩阵,u为(m 1)维随机向量。3.根据权利要求2所述的基于检验统计量的高维数据流变点检验方法,其特征在于,当i=1时,所述向量函数f
t
(1)=1;当i∈{2,

,m 1}时,所述向量函数f
t
(i)的表达式为:其中,i为示性函数,t∈{1,...,n-1}。4.根据权利要求2所述的基于基于检验统计量的高维数据流变点检验方法,其特征在于,所述矩阵f
n,m
第i行第j列元素的表达式为:其中,i为示性函数。5.根据权利要求2所述的基于基于检验统计量的高维数据流变点检验方法,其特征在于,(m 1)维随机向量u的第i个数的表达式为:其中,是数组{x
i
∈r
p
,1≤i≤n}的平均值。
6.根据权利要求1所述的基于基于检验统计量的高维数据流变点检验方法,其特征在于,在步骤s110中,利用数据集分割算法将所述高维数据流随机分成若干个数据子集,包括:设置数据子集最小长度阈值g;遍历所述高维数据流,利用数据集分割算法wbs2抽取若干个数据子集其中,所述数据子集的起点w
q
和终点e
q
随机、均匀且独立地从集合{1,

,n}中替换选取,所述数据子集的表达式为:其中,w≤b≤e,且n=e-w 1。7.根据权利要求1所述的基于基于检验统计量的高维数据流变点检验方法,其特征在于,在步骤s150中,计算所述变点候选集中每个所述候选点对应的检验统计量值的累加和v,所述检验统计量值的累加的表达式为:其中,l
t
为所述候选点对应的检验统计量值。8.根据权利要求7所述的基于基于检验统计量的高维数据流变点检验方法,其特征在于,步骤s110还包括利用假设检验的方法检验数组{x
i
∈r
p
,1≤i≤n}是否存在变点,具体包括以下子步骤:s111、假设其中,μ
i
为x
i
(i=1,...,n)的均值,{x
i
∈r
p
,1≤i≤n}为一p维观测序列,维度p大于样本长度n;s112、当n

∞时,收敛于标准正态分布,基于零假设h0下,v/s
v
也收敛于标准正态分布,若v/s
v
>z
α
,则拒绝零假设h0;其中,表示检验统计量l
t
的均值累计和,σ
n
表示总体标准差,v为每个所述候选点对应的检验统计量值的累加和,s
v
为总体标准差σ
n
的估计值,α为显著性水平,z
α
是标准正态分布n(0,1)的上α分位点;s113、拒绝零假设h0后,利用数据集分割算法将所述高维数据流随机分成若干个完整的数据子集。9.一种基于检验统计量的高维数据流变点检验系统,其特征在于,包括以下模块:获取模块,用以获取高维数据流,利用数据集分割算法将所述高维数据流随机分成若干个完整的数据子集;以及计算模块,用以计算所述数据子集区间的检验统计量值l
t
,并输出最大检验统计量值的数据点位置,将所述数据点作为候选点添加至变点候选集中;以及分割模块,用以利用所述候选点将所述数据子集一分为二,在所述候选点的左右两侧再次递归抽取数据子集;以及递归模块,用以重复计算模块、分割模块的操作,直到所述数据子集的长度达到设定的最小长度阈值;以及
比较模块,用以计算所述变点候选集中每个所述候选点对应的检验统计量值的累加和v,将所述累加和v除以标准差s
v
所得的商v/s
v
与检验阈值z
α
进行比较;以及输出模块,用以若所述所得的商v/s
v
大于所述检验阈值z
α
,则认定所述候选点为变点,输出所述变点的个数和位置。10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实施如权利要求1-8中任一项所述的方法。

技术总结
本申请提出了一种基于检验统计量的高维数据流变点检验方法及系统,包括:利用WBS2将高维数据流随机分成若干个完整的数据子集;计算数据子集区间的检验统计量值L


技术研发人员:毛佳慧 翟永强 金辉 朱熹 沈代明 倪艳玉
受保护的技术使用者:厦门市美亚柏科信息股份有限公司
技术研发日:2021.12.22
技术公布日:2022/3/25
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献