一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于概率图模型对序列进行分析的方法及装置与流程

2022-04-14 02:59:16 来源:中国专利 TAG:


1.本说明书一个或多个实施例涉及计算机信息处理领域,尤其涉及一种基于概率图模型对序列进行分析的方法及装置。


背景技术:

2.指标序列是指将业务指标的指标值按照时间顺序排列而成的数列。在许多场景下,需要对指标序列进行分析(比如,周期性分析),以解决实际问题。比如,在智能运维场景下,通过对指标序列进行分析,来进行弹性扩缩容。或者,通过对指标序列进行分析,确定出对应的波峰和基线,以实现容器的错峰部署。此外,运用指标的周期性分析结果,还可以进行时序预测和异常检测等等。
3.传统的指标序列分析方法,通常需要针对每条序列设置参数,且不能针对不规则的周期(如,月周期)进行分析,因此,需要提供一种更有效的序列分析方法,以便能够简单高效地对指标序列进行分析。


技术实现要素:

4.本说明书一个或多个实施例描述了一种基于概率图模型对序列进行分析的方法及装置,可以针对指标序列自动识别得到多种粒度的周期。
5.第一方面,提供了一种基于概率图模型对序列进行分析的方法,包括:获取指标的观测值序列,其中包括所述指标在连续的d个时段的d个观测值;获取针对目标参数设定的参数先验分布,以及针对所述指标的实际值设定的实际值先验分布;所述目标参数包括观测值和实际值之间的差异参数,以及d个相似性参数,所述d个相似性参数中的第i个相似性参数用于衡量相隔i个时段的两个实际值的相似性;所述实际值先验分布依赖于针对所述d个相似性参数设定的先验分布;基于所述观测值序列、所述参数先验分布和所述实际值先验分布,构建概率图模型,所述概率图模型至少包括对应于所述d个时段的d个实际值的d个节点,以及节点之间的连接边;根据所述概率图模型中的连接边,确定针对所述指标的实际值的周期性分析结果。
6.第二方面,提供了一种基于概率图模型对序列进行分析的装置,包括:获取单元,用于获取指标的观测值序列,其中包括所述指标在连续的d个时段的d个观测值;所述获取单元,还用于获取针对目标参数设定的参数先验分布,以及针对所述指标的实际值设定的实际值先验分布;所述目标参数包括观测值和实际值之间的差异参数,以及d个相似性参数,所述d个相似性参数中的第i个相似性参数用于衡量相隔i个时段的两个实际值的相似性;所述实际值先验分布依赖于针对所述d个相似性参数设定的先验分布;构建单元,用于基于所述观测值序列、所述参数先验分布和所述实际值先验分布,
构建概率图模型,所述概率图模型至少包括对应于所述d个时段的d个实际值的d个节点,以及节点之间的连接边;确定单元,用于根据所述概率图模型中的连接边,确定针对所述指标的实际值的周期性分析结果。
7.第三方面,提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
8.第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
9.本说明书一个或多个实施例提供的基于概率图模型对序列进行分析的方法及装置,先基于指标的观测值序列、目标参数的参数先验分布和指标的实际值先验分布,构建概率图模型。之后基于构建的概率图模型中的连接边,来进行指标的实际值的周期性分析。也就是说,本方案无需针对待分析的观测值序列设置参数,由此可以降低序列分析的复杂度。此外,本方案所获得的周期性分析结果可以包括多种粒度的周期,其中包括不规则的周期,由此可以提高序列分析的适用性。
附图说明
10.为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
11.图1示出以日为周期的指标序列对应的图结构示意图;图2示出以周为周期的指标序列对应的图结构示意图;图3a示出指标的观测值序列示意图;图3b示出指标的实际值序列示意图;图4为本说明书披露的一个实施例的实施场景示意图;图5示出根据一个实施例的基于概率图模型对序列进行分析的方法流程图;图6示出在一个实施例中概率图模型示意图;图7示出根据一个实施例的基于概率图模型对序列进行分析的装置示意图。
具体实施方式
12.下面结合附图,对本说明书提供的方案进行描述。
13.如前所述,为了解决实际问题,通常需要对指标序列(也称实际值序列,是指基于指标的实际值形成的序列)进行分析。这里的分析包括但不限于以下至少一项:周期性分析、异常点去除、降噪以及波峰位置确定等等。本方案主要针对周期性分析进行说明。
14.假设给定分钟粒度的数据,且假设s
d(t) 表示的是第d天的第t分钟的指标值(下文也称实际值),那么周期性分析就是判断出s
d(t) 与哪些天的第t分钟的指标值最像。换句话说,周期性分析就是以天为单位,针对指标在连续的d天的第t分钟的指标值可以拆解为哪几种周期。
15.当然,上述天也可以替换为小时或者分钟等其它时段,以及上述分钟也可以替换
为小时或秒等其它时刻,本说明书对此不作限定。
16.关于上述周期性分析,本方案的发明人将其转换为图结构学习的问题。比如,如果上述时段为天,时刻为分钟,那么以日为周期的指标序列对应的图结构可以如图1所示。图1中,第一个节点代表第1天的第t分钟的指标值,第二个节点代表第2天的第t分钟的指标值,依次类推。图1的含义可以为,任意一天的第t分钟的指标值只和前一天以及后一天的第t分钟的指标值相关(或相似),而和其它天的第t分钟的指标值没有直接的关联。
17.结合图1可以得到,日周期的分析就可以转换为判断相邻两个节点之间是否有边相连。
18.需要说明,正常情况下,满足日周期的条件应该是:d天中任意一天的每一分钟的指标值都与前一天和后一天相关,从而针对d天的每一分钟均需要进行判断。即判断对应于d天的每一分钟的图结构中相邻两个节点之间是否均存在连接边。由于一天包括1440分钟,从而需要针对1440个图结构进行判断。
19.再比如,如果上述时段为天,时刻为分钟,那么以周为周期的指标序列对应的图结构可以如图2所示。图2中,第一个节点代表第1天的第t分钟的指标值,第二个节点代表第2天的第t分钟的指标值,依次类推。图2的含义可以为,任意一天的第t分钟的指标值只和上一周以及下一周的同一天的第t分钟的指标值相关(或相似),而和其它天的第t分钟的指标值没有直接的关联。
20.结合图2可以得到,周周期的分析就可以转换为判断位置序号相差7的两个节点之间是否有边相连。
21.关于月周期,由于月周期是不规则周期,比如,2月与3月之间相差28天或者相差29天,3月与4月之间相差31天,4月与5月之间相差30天等等。为了能够对该不规则周期进行分析,本方案的发明人提出,月周期的分析转换为判断位置序号相差一个月(包括28天,29天,30天和31天)的两个节点之间是否有边相连。由此就可以解决,传统技术中通过stl(一种时间序列分解算法)进行周期性分析时,无法针对不规则周期进行分析的问题。
22.关于图1和图2示出的图结构,在带上概率上条件独立的语义之后,可以表达为如下公式:
ꢀꢀꢀꢀꢀꢀ
(公式1)其中,d表示d个时段中任一个时段。s
d(t) 表示第d个时段中第t时刻的指标值,s
d-k(t) 表示第d-k个时段中第t时刻的指标值,s
d k(t) 表示第d k个时段中第t时刻的指标值。s
d-k(t)
和s
d k(t)
各自对应的节点,也称为s
d(t) 对应节点的邻居节点。
23.上述公式1的含义是,s
d(t)
只和s
d-k(t)
以及s
d k(t)
相关。换句话说,如果已知s
d-k(t)
和s
d k(t)
,那么s
d(t)
和除邻居节点外的其它节点对应的指标值都条件独立。需要说明,基于上述公式可以得出,基于连续的d个时段中第t时刻的各指标值所形成的指标序列是以k为周期的。
24.基于上述公式,就可以将周期性分析的问题提炼成一个数学问题。
25.具体地,假设连续的d个时段中第t时刻的各指标值满足高斯分布,也即s
1(t)
,s
2(t)
,

,s
d(t) 满足高斯分布,那么上述条件独立性可以用该组指标值对应的协方差矩阵的逆矩阵k来表达:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(公式2)其中,k
ij
表示矩阵中的任一元素,i和j表示对应于该元素的下角标,该两者均为正整数,且取值范围为:[1,d]。上述k
ij
=0等价于s
i(t)
和s
j(t)
条件独立,同时也表示在图结构中s
i(t)
和s
j(t)
没有边相连。此外,零模式的k即为图结构的邻接矩阵。
[0026]
应理解,在通过k来表达上述条件独立性之后,周期性分析的问题就可以转化为学习k的问题。
[0027]
首先,将上述k表示如下:其中,在k中,k
i,i 1
表示s
i(t)
和s
i 1(t)
是否有边相连,k
i,i 7
表示s
i(t)
和s
i 7(t)
是否有边相连。为了能够实现对周期性的学习,可以将k参数化为如下形式:其中,上述参数化的具体方法可以为,将下角标相差1的元素设定为α1,如,将k
12
,k
21
,k
23
,k
32
等设定为α1。同理将下角标相差2的元素设定为α2,依次类推。
[0028]
需要说明,在上述参数化的过程中,可以将下角标一个月的元素均设定为α
28
,以用于进行月周期的识别。比如,将k
1,29
,k
1,30
,k
1,31
等设定为α
28

[0029]
此外,上述参数化后的k满足如下公式:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(公式3)应理解,在k中的矩阵元素满足上述公式时,可以在不设定均值的情况下,确保各指标值相接近。
[0030]
在得到参数化的k之后,可以直接基于αi来进行周期性分析,比如,如果只有α1和α7不为零,则上述指标序列(即s
1(t)
,s
2(t)
,

,s
d(t)
)可以同时拆解为日周期和周周期。换句话说,上述指标序列同时以日和周为周期。而如果α
28
不为0,则说明上述指标序列以月为周期。
[0031]
最后需要说明,上述针对指标序列的周期性分析方法,是基于s
d(t)
(即指标的实际值)进行的,而实际中,通常我们不能直接得到s
d(t)
,而只能得到x
d(t)
(称为指标的观测值)。
这里的x
d(t)
是在s
d(t)
中叠加噪声和异常点之后得到的。
[0032]
在一个示例中,基于连续的d个时段的d个观测值形成的观测值序列可以如图3a所示,而在针对该观测值序列去除噪声和异常点后得到的指标序列(即实际值序列)可以如图3b所示。
[0033]
对比图3a和图3b之后,可以得出,在不对观测值序列进行降噪和异常点去除的情况下,很难分析得到指标序列中存在的两个周期性成分。
[0034]
为了能够在噪声和异常点均存在的情况下,对指标序列进行周期性分析,本方案将指标的观测值表示如下,并统一建模。
[0035]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(公式4)其中,d表示d个时段中任一个时段。x
d(t) 表示第d个时段中第t时刻的观测值,s
d(t) 表示第d个时段中第t时刻的实际值(上文也称指标值),ε
d(t) 表示噪声,δ
d(t)
表示异常点。注意,这里的ε
d(t) 是服从高斯分布的,且该高斯分布的方差为1/β
(t)

[0036]
综合以上,针对指标序列的周期性分析实际上就是最小化如下公式5:其中,上述β为β
(t)
的省略表示。基于上述公式中的第一部分,可以使得s
d(t)
δ
d(t)
与x
d(t)
相近,也即可以最小化噪声。基于上述公式中的第二部分,可以使得δ
d(t)
满足稀疏性(即对于大部分时段,异常点均为0)。上述公式中的αj控制了相隔j个时段的两个实际值的相似性。具体地,如果αj等于0,表示相隔j个时段的两个实际值不相似,它们之间的差值可以任意的大,从而该指标序列的周期不可能是j。相反的,如果αj较大,那么在最小化上述公式的过程中,会强制使得相隔j个时段的两个实际值s
i(t)
和s
i j(t)
尽量相近。因此,αj不等于0表示该指标序列是以j为周期的。基于上述公式中的最后一部分,可以使得α=[α1,α2,

,αd]满足稀疏性。所以根据[α1,α2,

,αd]中的非零项,就可以得到周期性分析结果,同时根据非零项的大小,可以得到各周期所占的比重。
[0037]
至此,就针对周期性分析建立了对应的模型。然而,由于上述公式5中有很多的超参数(包括β,λ1和λ2,其中,λ1的维度等于指标序列的长度,λ2的维度等于d)都需要调节,才能得到理想的分析结果。为此,本方案进一步提出,基于概率图模型对序列进行分析。需要说明,在基于概率图模型(probabilistic graphical model,pgm)对序列进行分析时,可以基于观测值序列,同时学习得到公式5中的目标参数(包括β,α,δ)以及实际值序列(s
1(t)
,s
2(t)
,

,s
d(t)
)。此外,在基于概率图模型的分析方法中,观测值序列中的缺失值对最终建立的模型影响不大。实验证明,缺失值在50%以下时,模型的精度均较高。以及,利用概率图模型甚至可以在考虑周期性的同时学习得到缺失值。
[0038]
以下先对概率图模型进行简要说明。
[0039]
概率图模型是一种用图结构来描述多元随机变量(简称变量)之间条件独立关系的概率模型。概率图模型有三个基本问题:1)表示问题:对于一个概率模型,如何通过图结
构来描述变量之间的依赖关系。2)学习问题:图结构的学习和参数的学习。3)推断问题:在已知部分变量时,计算其它变量的条件概率分布。本说明实施例中,只关注推断问题。
[0040]
上述概率图模型可以由一组节点和节点之间的连接边组成,其中的每个节点对应一个随机变量,这个随机变量可以是观察变量,隐变量或是位置参数等。节点之间的连接边表示对应的两个随机变量之间的概率依赖关系。
[0041]
常见的概率图模型分为两类:有向图模型和无向图模型,其中,有向图模型使用有向非循环图来描述变量之间的关系。如果两个节点之间有连接边,表示对应的两个变量为因果关系,即不存在其它变量使得这两个节点对应的变量条件独立。很多经典的机器学习模型可以使用有向图模型来描述,比如,朴素贝叶斯模型、隐马尔可夫模型或深度信念网络等。
[0042]
无向图模型使用无向图来描述变量之间的关系。每条边代表两个变量之间有概率依赖关系,但是并不一定是因果关系。很多经典的机器学习模型可以使用无向图模型来描述,比如,对数线性模型、条件随机场或玻尔兹曼机等。
[0043]
以下对基于概率图模型的序列分析方法进行详细说明。
[0044]
图4为本说明书披露的一个实施例的实施场景示意图。图1中,首先可以获取输入数据:指标的观测值序列以及最小粒度(比如,天,小时或分钟等)。然后基于输入数据构建概率图模型,同时进行降噪和异常点去除。最后得到输出数据:周期性分析结果、异常点位置、波峰位置、波峰和基线值。
[0045]
图5示出根据一个实施例的基于概率图模型对序列进行分析的方法流程图。该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如图5所示,该方法至少可以包括如下步骤。
[0046]
步骤502,获取指标的观测值序列,其中包括该指标在连续的d个时段的d个观测值。
[0047]
这里的指标可以包括以下之一:流量、点击量、销量以及用电量等。此外,上述d个观测值可以是连续的d个时段对应于同一目标时刻采集的观测值。这里的d个时段例如可以为d天、d小时或者d分钟等,以及同一目标时刻可以为同一小时、同一分钟或者同一秒等,本说明书对此不作限定。
[0048]
在一个示例中,上述d个时段为d天,上述同一目标时刻为d天中的同一分钟。
[0049]
在一个具体例子中,上述观测值序列可以表示为:x
1(t)
,x
2(t)
,

,x
d(t)
。如前所述,观测值序列是通过在实际值序列(或者指标序列)中叠加噪声和异常点之后得到,从而上述观测值序列可以表示如下:(公式6)其中,x
d(t)
、s
d(t) 、δ
d(t)
的含义参见上文所述,1/β
(t)
表示对应于第t时刻的噪声所服从的高斯分布的方差。公式6的含义是,任意的观测值x
d(t)
服从均值为s
d(t)
δ
d(t)
,方差为1/β
(t)
的高斯分布。
[0050]
需要说明,通过对公式6求最大似然估计,就可以得到上述公式5的第一部分,由此可以得出基于概率图模型,对序列进行分析的方法与上述最小化公式5的方法的思路是相统一的。
[0051]
步骤504,获取针对目标参数设定的参数先验分布,以及针对指标的实际值设定的实际值先验分布。
[0052]
这里的目标参数包括观测值和实际值之间的差异参数,以及d个相似性参数。其中,d个相似性参数中的第i个相似性参数用于衡量相隔i个时段的两个实际值的相似性。应理解,这里的d个相似性参数即为上述α1,α2,

,αd。
[0053]
此外,上述实际值先验分布为多元高斯分布,该多元高斯分布对应的协方差矩阵包括d个相似性参数为矩阵元素。在一个示例中,该协方差矩阵为上述参数化后的k的逆矩阵,也即该协方差矩阵为k-1
,从而可以表示为:。
[0054]
由于多元高斯分布对应的协方差矩阵包括d个相似性参数为矩阵元素,从而实际值先验分布依赖于针对d个相似性参数设定的先验分布。如前所述,通常希望α=[α1,α2,

,αd]是稀疏的,因此针对d个相似性参数设定的先验分布可以为马蹄分布(horse-shoe prior)。通常情况下,服从马蹄分布的随机变量的概率密度值要么为0,要么离0较远,且多数情况下为0,符合针对α的稀疏性要求。
[0055]
上述差异参数可以包括噪声参数(即ε
d(t)
)和异常点参数(即δ
d(t)
)。其中,噪声参数的参数先验分布为第一高斯分布,该第一高斯分布的方差根据第一参数(如,β
(t)
)确定。在一个示例中,第一高斯分布的方差为1/β
(t)

[0056]
关于上述第一参数,其可以服从无信息量的jeffrey分布(jeffrey prior)。通常情况下,服从jeffrey分布的随机变量的概率密度值正相关于该随机变量的倒数。也就是说,第一参数的分布完全取决于观测值序列的分布。
[0057]
异常点参数的参数先验分布为马蹄分布,具体可以表示为如下公式:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(公式7)其中,c

(0,1)是标准的半柯西分布(half-cauchy distribution),v和σ
d(t)
分别表示全局收缩参数(global shrinkage parameter)和局部收缩参数(lobal shrinkage parameter)。其中,全局收缩参数会希望把所有的σ
d(t)
置零。但是由于局部收缩参数服从半柯西分布,从而会使得一些σ
d(t)
不为零。所以最后得到的σ
d(t)
会是稀疏的。基于半柯西分布的性质,最后学习的σ
d(t)
要么离零很近,要么比较远。也就是说,基于半柯西分布,可以自动区分出σ
d(t)
中的零元素和非零元素。
[0058]
另外,为了搭建完整的概率图模型,针对上述全局收缩参数也需要设定对应的先验分布。由于没有任何关于全局收缩参数的先验信息,从而可以将全局收缩参数的先验分布设定为无信息量的jeffrey分布。
[0059]
至此,针对实际值序列(即s
1(t)
,s
2(t)
,

,s
d(t)
)、d个相似性参数(即α1,α2,

,αd)、噪声参数(即ε
d(t)
)和异常点参数(即δ
d(t)
)均设定了对应的先验分布。
[0060]
步骤506,基于观测值序列、参数先验分布和实际值先验分布,构建概率图模型,该概率图模型至少包括对应于d个时段的d个实际值的d个节点,以及节点之间的连接边。
[0061]
上述构建概率图模型具体可以包括:基于观测值序列、参数先验分布和实际值先验分布,确定目标后验分布。该目标后验分布是在得到观测值序列的情况下,目标参数和实
际值的后验概率分布。根据目标后验分布的统计值,确定概率图模型中的d个节点以及连接边。
[0062]
在一个示例中,上述目标后验分布可以是通过变分推断(也称变分贝叶斯)的方式得到的。即将观测值作为已知变量,将目标参数和实际值作为其它变量,并计算其它变量的条件概率分布。
[0063]
上述变分推断具体是通过引入一个变分分布(通常是比较简单的分布)来近似这些条件概率,然后通过迭代的方法进行计算。首先是更新变分分布的参数来最小化变分分布和真实分布的差异(比如交叉熵或kl距离),然后再根据变分分布来进行推断。
[0064]
具体地,上述确定目标后验分布可以包括:根据参数先验分布和实际值先验分布,确定目标参数和实际值的近似联合分布。确定使得该近似联合分布和目标后验分布之间的kl散度最小化的分布参数。根据该分布参数得到目标后验分布。
[0065]
这里的分布参数可以是指位置参数(比如,均值)和尺度参数(比如,方差或标准差)。
[0066]
需要说明,上述目标后验分布通常是可以分解的,比如,可以分解为实际值的后验分布、噪声参数的后验分布以及异常点的后验分布等等。之后,根据分解得到的各个分布各自的统计值,就可以得到指标的实际值、噪声以及异常点等等。其中,这里的统计值可以为以下中的任一种:最大值、均值以及中位数等。
[0067]
应理解,基于指标的实际值、噪声以及异常点,就可以构建出概率图模型。具体地,可以针对对应于d个时段的d个实际值和d个观测值,以及噪声和异常点均构建对应的节点,然后基于d个相似性参数构建连接边。
[0068]
在一个示例中,所构建的概率图模型可以如图6所示。图6中,s1,s2,

,s
12
为指标的实际值序列(或称指标序列),x1,x2,

,x
12
为观测值序列,δ1, δ2,


12
为异常点,β为噪声。两个s之间不同形状的线条对应于不同的相似性参数。比如,图中的实线对应于相似性参数α1,点虚线对应于相似性参数α2,横线虚线对应于相似性参数α3。
[0069]
应理解,图6是基于连续的12个时段中某个时刻的观测值构建的。比如,基于连续的12天中每一天的某一分钟的观测值构建的。当然,在实际应用中,还可以基于连续的12个时段中其它时刻的观测值来构建得到对应于每个时刻的概率图模型,最后根据各个时刻的概率图模型,获取最终的概率图模型。
[0070]
步骤508,根据概率图模型中的连接边,确定针对指标的实际值的周期性分析结果。
[0071]
以图6为来说,如果两个s之间仅通过实线相连,那么周期性分析结果为:日周期。同样的,如果两个s之间仅通过点虚线相连,那么周期性分析结果为:两天周期。当然也可能同时存在实线和虚线,那么周期性分析结果为:日周期 两天周期。也就是说,本说明书实施例提供的分析方法(简称本方案)可以同时分析得到多种粒度的周期。
[0072]
综合以上,本方案可以在观测值序列有噪声,异常点,甚至是缺失值的情况下,零调参自动地识别出各种周期性的成分,且周期性的分析结果可以接入下游任务,比如时序预测和异常检测等。
[0073]
此外,本方案还可以对不规则的月周期进行分析。比如,如果概率图模型中存在对应于α
28
的连接边,那么确定针对指标的实际值的周期性分析结果为:月周期。再者,由于图6
中还包含对应于噪声和异常点的节点,从而本方案可以在针对序列进行周期性分析的同时进行降噪和去除异常点等处理,以及还可以识别波峰和基线等。最后,本方案无需调参,且可以在观测值序列中存在缺失值的情况下,构建概率图模型,以及甚至可以在获取周期性分析结果的同时学习得到缺失值。
[0074]
与上述基于概率图模型对序列进行分析的方法对应地,本说明书一个实施例还提供的一种基于概率图模型对序列进行分析的装置,如图7所示,该装置可以包括:获取单元702,用于获取指标的观测值序列,其中包括指标在连续的d个时段的d个观测值。
[0075]
其中,上述指标包括以下之一:流量、点击量、销量和用电量。
[0076]
上述d个观测值是在d个时段对应于同一目标时刻采集的观测值。在一个示例中,d个时段为d天,上述同一目标时刻为d天中的同一分钟。
[0077]
获取单元702,还用于获取针对目标参数设定的参数先验分布,以及针对指标的实际值设定的实际值先验分布。该目标参数包括观测值和实际值之间的差异参数,以及d个相似性参数,d个相似性参数中的第i个相似性参数用于衡量相隔i个时段的两个实际值的相似性。
[0078]
上述实际值先验分布依赖于针对d个相似性参数设定的先验分布。其中,针对d个相似性参数设定的先验分布为马蹄分布。
[0079]
上述实际值先验分布为多元高斯分布,该多元高斯分布对应的协方差矩阵包括d个相似性参数为矩阵元素。
[0080]
上述差异参数包括噪声参数和异常点参数,上述参数先验分布包括,噪声参数对应的第一高斯分布和异常点参数对应的马蹄分布。其中,第一高斯分布的方差根据第一参数确定,第一参数服从无信息量的jeffrey分布。
[0081]
构建单元704,用于基于观测值序列、参数先验分布和实际值先验分布,构建概率图模型,该概率图模型至少包括对应于d个时段的d个实际值的d个节点,以及节点之间的连接边。
[0082]
构建单元704具体用于:基于观测值序列、参数先验分布和实际值先验分布,确定目标后验分布。该目标后验分布是在得到观测值序列的情况下,目标参数和实际值的后验概率分布;根据目标后验分布的统计值,确定概率图模型中的d个节点以及连接边。
[0083]
构建单元704还具体用于:根据参数先验分布和实际值先验分布,确定目标参数和实际值的近似联合分布;确定使得近似联合分布和目标后验分布之间的kl散度最小化的分布参数;根据分布参数得到目标后验分布。
[0084]
确定单元706,用于根据概率图模型中的连接边,确定针对指标的实际值的周期性分析结果。
[0085]
本说明书上述实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本说明书一个实施例提供的装置的具体工作过程,在此不复赘述。
[0086]
本说明书一个实施例提供的基于概率图模型对序列进行分析的装置,无需针对待分析的观测值序列设置参数,由此可以降低序列分析的复杂度。
[0087]
根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图5所描述的方法。
[0088]
根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图5所述的方法。
[0089]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0090]
结合本说明书公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于ram存储器、闪存、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、移动硬盘、cd-rom或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于asic中。另外,该asic可以位于服务器中。当然,处理器和存储介质也可以作为分立组件存在于服务器中。
[0091]
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
[0092]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0093]
以上所述的具体实施方式,对本说明书的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书的具体实施方式而已,并不用于限定本说明书的保护范围,凡在本说明书的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献