一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种复杂网络中的非平稳时间序列预测识别方法及系统与流程

2021-11-24 21:39:00 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,特别涉及一种复杂网络中的非平稳时间序列预测识别方法及系统。


背景技术:

2.时间序列反映了一组变量随时间变化的规律,其内含有许多挖掘的信息,比如,变量间的依赖关系、结构以及一些参数的取值等,而在多数的实际问题中,对非平稳时间序列的建模尤为看重,因其时间序列是非平稳的,故对其建模、挖掘演化信息及变量间行为交互的识别的研究也更困难和必要,现有的技术中,动态贝叶斯网络模型在处理非平稳时间序列方面的性能较差,通常假设网络参数和结构不变,在实际动态演变的场景中无法准确跟踪,而时变隐马尔可夫模型无法运用到变量间的依赖关系会变的情况中,其网络结构无法改变,交互模式识别单一。
3.因此,如何提供一种复杂网络的时间序列预测识别方法,是本领域技术人员亟待解决的问题。


技术实现要素:

4.本技术实施例提供了一种复杂网络中的非平稳时间序列预测识别方法及系统,旨在解决复杂网络中的非平稳时间序列预测识别的问题。
5.第一方面,本技术提供了一种复杂网络中的非平稳时间序列预测识别方法,该方法包括:
6.构建多任务时序动态贝叶斯网络模型;
7.对已有的模型数据进行滤波和重采样;
8.根据滤波和重采样的结果,估计得到网络参数和网络结构,利用已有的模型数据、网络参数和网络结构,完成对多任务时序动态贝叶斯网络模型的训练;
9.将待识别的非平稳时间序列输入训练好的多任务时序动态贝叶斯网络模型,输出预测识别结果。
10.第二方面,本技术还提供了一种复杂网络中的非平稳时间序列预测识别系统,该系统包括:
11.模型构建单元,用于构建多任务时序动态贝叶斯网络模型;
12.数据处理单元,用于对已有的模型数据进行滤波和重采样;
13.模型训练单元,用于根据滤波和重采样的结果,估计得到网络参数和网络结构,利用已有的模型数据、网络参数和网络结构,完成对多任务时序动态贝叶斯网络模型的训练;
14.识别输出单元,用于将待识别的非平稳时间序列输入训练好的多任务时序动态贝叶斯网络模型,输出预测识别结果。
15.第三方面,本技术还提供了一种计算机装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机
程序时,实现如上述第一方面中任一项所述的复杂网络中的非平稳时间序列预测识别方法。
16.第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时执行如上述第一方面中任一项所述的复杂网络中的非平稳时间序列预测识别方法。
17.本技术提出的一种复杂网络中的非平稳时间序列预测识别方法及系统,其方法包括:构建多任务时序动态贝叶斯网络模型;对已有的模型数据进行滤波和重采样;根据滤波和重采样的结果,估计得到网络参数和网络结构,利用已有的模型数据、网络参数和网络结构,完成对多任务时序动态贝叶斯网络模型的训练;将待识别的非平稳时间序列输入训练好的多任务时序动态贝叶斯网络模型,输出预测识别结果;本技术通过对动态贝叶斯网络模型进行改进,以及对现有的时间序列集合进行分析整理,进而训练数据来推断决定时序发展的参数,从而预测时间序列未来的走向趋势。
附图说明
18.为了更清楚的说明本技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍,显而易见的,下面的描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
19.图1为本技术实施例提供的一种复杂网络中的非平稳时间序列预测识别方法流程图;
20.图2为本技术实施例提供的一种节点元素关系图;
21.图3为本技术实施例提供的一种时序动态贝叶斯网络模型图。
具体实施方式
22.下面结合附图对本发明的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本发明,但并不构成对本发明的限定。此外,下面所描述的本发明各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。
23.参见图1实施例所示一种复杂网络中的非平稳时间序列预测识别方法流程图,包括:
24.s101、构建多任务时序动态贝叶斯网络模型。
25.动态贝叶斯网络是分析时间序列的非常成熟且成功的工具。动态贝叶斯网络是贝叶斯网络到时域的扩展,其在时隙内和跨时隙的随机变量之间对条件依赖性进行建模。但动态贝叶斯网络的结构和参数始终是固定的,对于本技术要解决的问题是一种限制因素,故要对原始的动态贝叶斯网络技术进行一些改进,以达到能够分析变化的网络结构和参数的要求。
26.首先,将每个时间序列分别定义为一个时序随机变量,表示为节点集合x={x1,x2,...,x
n
},同时定义网络结构g和网络参数θ,定义网络结构为一个有向无环图,图中的节点为时序随机变量,图中的有向边x
i

x
j
表示x
i
是x
j
的父节点,是一种依赖关系的体现。
27.参见图2实施例所示的一种节点元素关系图;
28.根据图2可知,网络参数决定着各个变量间的概率依赖关系,在离散变量中为条件
概率表,在连续变量中为概率密度函数;网络结构同时决定着网络参数的维度以及图中各个变量间的拓扑连接方式。
29.根据概率图模型中的条件独立性以及参数对节点的影响关系,x在t时刻的联合概率分布可表示为
[0030][0031]
在上述模型中,pa(x
i
[t])代表节点x
i
的父节点集合,定义为:pa(x
i
[t])≡{pa

(x
i
[t]),θ
i
[t]},pa

(x
i
[t])表示x
i
[t]的非参数父节点集合,网络参数集合θ[t]={θ1[t],θ2[t],...,θ
n
[t]}中的元素θ
i
[t]代表节点x
i
[t]的条件分布,即θ
i
[t]=p(x
i
[t]|pa

(x
i
[t]))。同时,假设节点服从齐次马尔科夫性质,即
[0032]
p(x[t 1]|x[0:t])=p(x[t 1]|x[t]),t=1,2,...
ꢀꢀ
(2)
[0033]
在本技术的模型中,不仅x[t]随时间变化,θ[t]和g[t]也有可能随时间变化,但单从数据上只有x[t]的数据,没有θ[t]和g[t]具体的数据,因此,定义x[t]为显性数据,θ[t]和g[t]为隐性数据。为非平稳时间序列x[t]建模完成后,接下来要解决演化推理以及行为交互识别的问题,因为θ[t]和g[t]决定着x[t]的变化,所以需要知道隐性数据θ[t]和g[t]的变化信息,然后才能推断出x[t]的变化。在的模型中,采用一阶马尔科夫模型为隐性数据θ[t]和g[t]建模,即
[0034][0035]
参见图3所示的一种时序动态贝叶斯网络模型图
[0036]
图3描述了一个由两个时间序列变量x1[t]和x2[t]构成的时序动态贝叶斯网络模型,在每个时间块内,有两个时序节点、两个对应于时序节点的参数节点以及一个结构节点,箭头3代表节点间的概率依赖关系,箭头1代表时序变量的拓扑关系由结构节点来决定,箭头2代表参数节点的维度由结构节点决定;在t

1时刻到t时刻的过渡中,各种节点的数据可能会发生变化,如图中t时刻x1[t]和x2[t]的依赖关系发生了变化等。
[0037]
式(3)中的依赖关系和化简可由图2和图3共同解释。图2在逻辑上说明了x[t]、θ[t]和g[t]之间的关系,即结构决定参数的维度信息,结构决定变量间的拓扑连接,参数决定变量间的概率依赖关系。
[0038]
在上述公式推导方面,运用了概率图模型的基本知识,简化了求概率的计算,而且,引入了概率图模型中条件独立性的内容,也可以帮助降维继而简化计算难度。
[0039]
在一实施例中,为了计算(3)式,将其拆分成两部分计算。第一部分为网络结构的转移概率p(g[t 1]|g[t]),第二部分为网络参数的转移概率p(θ
i
[t 1]|θ
i
[t],g[t 1])的乘积。分别介绍如何计算。
[0040]
首先,考虑网络结构的转移概率计算问题,为了使网络尽可能简单,同时兼顾可能会出现的数据匮乏问题,假设结构的转移概率如下计算方式
[0041]
p(g[t 1]=g
j
|g[t]=g
i
)

exp(

αc
j

βd
ij
)
ꢀꢀ
(4)
[0042]
其中,c
j
表示网络连接度,定义为表示网络结构g
j
中的边数),d={d
ij
}表示不同网络结构的差异矩阵,定义为
[0043]
在一实施例中,考虑网络参数转移概率的计算,因为不同的x
i
[t]数据对应的分布不同,导致p(θ
i
[t 1]|θ
i
[t],g[t 1])的形式也不同,所以网络参数转移概率的计算应该考虑时间序列的分布特点来进行,本技术列举两种较为常见的数据类型:多项分布和高斯分布
[0044]
(一)多项分布
[0045]
当x
i
[t]为离散变量时,一个最简单且常用的表示变量间依赖关系的分布就是多项分布,此时θ
i
[t]是一个由一组向量{θ
ij
[t]}构成的条件概率表,其中,θ
ij
[t]={θ
ij1
[t],θ
ij2
[t],...,θ
ijp
[t]},其内部的每一个元素定义为
[0046]
θ
ijk
[t]=p(x
i
[t]=s
k
|pa

j
(x
i
[t]))
ꢀꢀ
(5)
[0047]
其中,x
i
[t]的取值集合为{s1,s2,...,s
p
},pa

j
(x
i
[t])表示x
i
[t]父节点的第j个配置集合。
[0048]
假设{θ
ij
[t]}间相互独立,所以参数转移分布可进一步分解为
[0049][0050]
其中,n
i
[t 1]表示x
i
[t 1]的父节点的配置集合总数。可将(6)式乘积内的每一项定义为分层狄利克雷分布,即
[0051][0052]
其中,η为平滑系数,为θ
i
[t]的分布中心。当t 1时刻的结构相比于t时刻未发生变化时,有当t 1时刻的结构相比于t时刻发生了变化时,则需重新分析θ
ij
[t]。当结构发生变化时,主要影响的是x
i
[t 1]的非参父节点pa

(x
i
[t 1]),因此,可以先分析变化的非参父节点,设结构变化的过程中增加和移除的非参父节点集合分别a为和m,没有变化的非参父节点集合为pa

(x
i
[t,t 1])。由此可知
[0053]
pa

(x
i
[t])=pa

(x
i
[t,t 1])∪m[t]
ꢀꢀ
(8)
[0054]
pa

(x
i
[t 1])=pa

(x
i
[t,t 1])∪a[t 1]
ꢀꢀ
(9)
[0055]
假设模型变化是平滑的,经化简有
[0056][0057]
此时,可由下式算得
[0058]
[0059]
其中,l的取值满足pa

l
(x
i
[t])=pa

j
(x
i
[t,t 1])∪m
r
[t],m
r
[t]表示m[t]的第r个配置集合。
[0060]
(二)高斯分布
[0061]
当x[t]为连续变量时,可用高斯信念网络对其建模
[0062]
x[t]=f[t]x[t

1] v[t]
ꢀꢀ
(12)
[0063]
其中,f[t]是一个n
×
n的系数矩阵{f
ij
[t]}
n
×
n
,v[t]表示高斯噪声且有v[t]~n(0,∑[t])。
[0064]
x[t]的高斯信念网络可用其联合概率密度函数表示
[0065][0066]
其中,表示x
i
[t]的非条件均值;b
ij
[t]是一个线性因子,用于衡量x
i
[t]和x
j
[t]∈pa

(x
i
[t])之间依赖关系强度;v
i
[t]表示已知x
i
[t]的非参父节点pa

(x
i
[t])的情况下的条件方差。在这种高斯信念网络中,参数可定义为θ
i
[t]={{f
ij
[t]},{b
ij
[t]},v
i
[t]},其中,v
i
[t]>0,1≤i≤n,当时,有b
ij
[t]=0。
[0067]
假设θ
i
[t]中的参数间相互独立,故要计算的参数转移概率密度有
[0068][0069]
用时变自回归模型可以很容易地建模这三个时变参数,根据贝叶斯时变自回归理论,可用随机游走过程建模三个线性因子,即
[0070][0071][0072][0073]
由于v
i
[t]非负,故可用贝叶斯时变自回归理论中的乘法随机游走过程表示,有
[0074][0075]
p(η[t])~beta(a[t],b[t])
ꢀꢀ
(17)
[0076]
其中,δ∈(0,1]是折扣因子,a[t]和b[t]是beta分布的参数。
[0077]
以上就是参数的转移概率在不同数据特点时的表示方式。
[0078]
s102、对已有的模型数据进行滤波和重采样。
[0079]
在模型建立完成后,还需要进行在线推理,即时序演化推理及行为模式识别的工
作。
[0080]
在研究的网络中,主要针对未知的变量进行推理,包括未观测到的数据x[t],网络结构g[t]以及网络参数θ[t],用一个隐状态集合来表示他们,即z
t
=[x[t],g[t],θ[t]]。
[0081]
根据上文介绍的模型,可以将隐状态的转台转移分布表示为
[0082][0083]
在每个t时刻,可以利用一个观测值o
t
测量部分或全部数据节点。观测值o
t
和状态值z
t
之间的关系由观测分布p(o
t
|z
t
)描述。假设初始状态为z0,要利用已有的观测值来递归估计当前的状态后验概率p(z
t
|o
1:t
)。因为隐状态的数据类型可能有离散的和连续的,甚至维度不固定,操作起来复杂度很高,常不能得到封闭解,因此可以采用一些滤波方法来得到近似解;目前,适用于任何系统的并且性能好的滤波方法:序列蒙特卡洛方法,又称粒子滤波。利用粒子滤波的粒子集合及其权重来近似表示后验分布:
[0084][0085]
其中,n
z
表示粒子数,代表第i个粒子的权重,当n
z

∞时,就无限接近真实的后验分布。
[0086]
蒙特卡洛方法能够处理任意系统和观察模型,是一种很好的估计状态后验的方法。本技术运用大量粒子和权重来近似后验分布,对粒子和权重不断地更新,进而推断出想学习的参数和时间序列。
[0087]
在每个t时刻,用上一时刻的粒子和相应权重进行滤波,然后利用一个提议分布来更新粒子,即
[0088][0089]
然后进行例子权重的更新
[0090][0091]
在利用粒子滤波研究高维空间时,可能存在粒子权值退化问题,即粒子的方差越来越大,此时的粒子不能很好地逼近目标分布。因此,引入一个有效粒子n
eff
[t]的概念,对粒子进行重新采样,解决粒子退化问题。
[0092]
[0093]
当时,就需要对粒子进行重采样。采用的重采样方法是以粒子权重为一个离散分布,从该离散分布中进行采样。即一个粒子被重采样的概率和它的权重成正比。通过重采样生成的n
z
个粒子具有相同的权重,1≤i≤n
z
。此时,重采样完成。
[0094]
s103、根据滤波和重采样的结果,估计得到网络参数和网络结构,利用已有的模型数据、网络参数和网络结构,完成对多任务时序动态贝叶斯网络模型的训练。
[0095]
通过粒子滤波和重采样得到了近似的后验分布后,即可估计出隐状态集合中的x[t]和θ[t],再利用粒子滤波的结果进行最大后验估计,得到g[t],可以定义每种结构对应不同的交互行为模式,就解决了非平稳时间序列建模、演化推理及行为交互模式识别的问题。
[0096]
最大后验估计方法(map)能够共同考虑学习的参数和结构问题,得到一个概率上最好的结果,即网络参数和结构,便于后续的序列预测和交互识别问题的展开。
[0097]
在一实施例中,若某些数据的状态方程是线性的,则可以采用卡尔曼滤波;若状态方程是非线性的,也可以采用扩展卡尔曼滤波等方法。
[0098]
s104、将待识别的非平稳时间序列输入训练好的多任务时序动态贝叶斯网络模型,输出预测识别结果。
[0099]
多任务时序动态贝叶斯网络模型训练完成后,将待识别的非平稳时间数列输入训练好的模型,既可以进行预测识别,得到预测识别结果。
[0100]
以上结合附图对本发明的实施方式作了详细说明,但本发明不限于所描述的实施方式。对于本领域的技术人员而言,在不脱离本发明原理和精神的情况下,对这些实施方式进行多种变化、修改、替换和变型,仍落入本发明的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献