一种时间序列趋势预测方法和装置与流程

2022-04-30 16:35:42 来源：中国专利 TAG：

1.本发明涉及计算机技术领域，特别涉及人工智能技术领域，尤其涉及一种时间序列趋势预测方法和装置。

背景技术：

2.对于时间序列的预测是许多经济活动中经常遇到的问题，相关技术中，通过超边迭代和权重进行模式识别，从而进行时间序列预测，但这种方法需要高度依赖超网络构建过程中的抽样过程，没有考虑到时间相关性，对噪声敏感度高，导致预测结果的准确度较低。

技术实现要素：

3.本发明的一个目的在于提供一种时间序列趋势预测方法，能够提高预测结果的准确率。本发明的另一个目的在于提供一种时间序列趋势预测装置。本发明的再一个目的在于提供一种计算机可读介质。本发明的还一个目的在于提供一种计算机设备。
4.为了达到以上目的，本发明一方面公开了一种时间序列趋势预测方法，包括：
5.对生成的时间序列训练样本构建超边，得到序列模式；
6.通过多重检验校正判别算法，对序列模式进行初始特征选择，得到判别序列；
7.通过卷积神经网络，对判别序列进行卷积运算，得到预测结果。
8.优选的，在对生成的时间序列训练样本构建超边，得到序列模式之前，还包括：
9.对获取的原始时间序列数据进行二进制处理，得到二进制时间序列数据集；
10.通过设置的时间窗口，对二进制时间序列数据集进行划分，得到多个时间序列训练样本。
11.优选的，时间序列训练样本中包括多个有序元素；
12.对生成的时间序列训练样本构建超边，得到序列模式，包括：
13.根据多个有序元素构建超边，得到超网络；
14.将时间序列训练样本中最后一位有序元素的二进制值作为训练标签；
15.将训练标签与超网络中的超边相关联，得到序列模式。
16.优选的，通过多重检验校正判别算法，对序列模式进行初始特征选择，得到判别序列，包括：
17.将二进制时间序列数据集划分为正样本集和负样本集；
18.通过超几何分布，对正样本集、负样本集和序列模式进行计算，得到训练模式对应的标签概率；
19.将多个标签概率按照指定顺序进行排列；
20.将排列后的标签概率对应的多个有序的序列模式确定为判别序列。
21.优选的，通过卷积神经网络，对判别序列进行卷积运算，得到预测结果，包括：通过卷积层以及非线性激活函数，对设置的模型参数和判别序列进行计算，生成高阶特征；
22.通过设置的全连接层，对高阶特征进行映射，得到预测结果。
23.本发明还公开了一种时间序列趋势预测装置，包括：
24.构建单元，用于对生成的时间序列训练样本构建超边，得到序列模式；
25.特征选择单元，用于通过多重检验校正判别算法，对序列模式进行初始特征选择，得到判别序列；
26.卷积单元，用于通过卷积神经网络，对判别序列进行卷积运算，得到预测结果。
27.优选的，装置还包括：
28.二进制单元，用于对获取的原始时间序列数据进行二进制处理，得到二进制时间序列数据集；
29.划分单元，用于通过设置的时间窗口，对二进制时间序列数据集进行划分，得到多个时间序列训练样本。
30.优选的，时间序列训练样本中包括多个有序元素；
31.构建单元，具体用于根据多个有序元素构建超边，得到超网络；将时间序列训练样本中最后一位有序元素的二进制值作为训练标签；将训练标签与超网络的超边相关联，得到序列模式。
32.本发明还公开了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述方法。
33.本发明还公开了一种计算机设备，包括存储器和处理器，所述存储器用于存储包括程序指令的信息，所述处理器用于控制程序指令的执行，所述处理器执行所述程序时实现如上所述方法。
34.本发明对生成的时间序列训练样本构建超边，得到序列模式；通过多重检验校正判别算法，对序列模式进行初始特征选择，得到判别序列；通过卷积神经网络，对判别序列进行卷积运算，得到预测结果，能够提高预测结果的准确率。
附图说明
35.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
36.图1为本发明实施例提供的一种时间序列趋势预测方法的流程图；
37.图2为本发明实施例提供的又一种时间序列趋势预测方法的流程图；
38.图3为本发明实施例提供的一种时间序列趋势预测装置的结构示意图；
39.图4为本发明实施例提供的一种计算机设备的结构示意图。
具体实施方式
40.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
41.需要说明的是，本技术公开的一种时间序列趋势预测方法和装置可用于人工智能技术领域，也可用于除人工智能技术领域之外的任意领域，本技术公开的一种时间序列趋势预测方法和装置的应用领域不做限定。
42.为了便于理解本技术提供的技术方案，下面先对本技术技术方案的相关内容进行说明。金融时间序列表现出高波动性和非平稳性，且金融时间序列本身具有不确定性，因此，对于金融时间序列的预测一直是具有挑战性的。对市场方向的准确预测可以为市场交易策略提供一定的信息，研究表明机器学习技术能够识别股票市场价格变动序列中的非线性依赖关系，股票时间序列的方向在一定条件下是可预测的。超网络可以存储从二进制时间序列中提取的金融模式，并且用于预测时间序列的未来演变。股票市场的时间序列变动可以被记录为二进制时间序列，将向上/向下编码为二进制值来表示发展趋势。本发明实施例提供的一种时间序列趋势预测方法基于超网络多重检验校正判别(discriminative sequential pattern mining with multiple testing correction，简称：dspm-mtc)的卷积神经网络(cnn)方法捕捉二进制金融时间序列中的潜在模式，从而预测未来时间内的时间序列的上升/下降趋势。
43.下面以时间序列趋势预测装置作为执行主体为例，说明本发明实施例提供的时间序列趋势预测方法的实现过程。可理解的是，本发明实施例提供的时间序列趋势预测方法的执行主体包括但不限于时间序列趋势预测装置。
44.图1为本发明实施例提供的一种时间序列趋势预测方法的流程图，如图1所示，该方法包括：
45.步骤101、对生成的时间序列训练样本构建超边，得到序列模式。
46.步骤102、通过多重检验校正判别算法，对序列模式进行初始特征选择，得到判别序列。
47.步骤103、通过卷积神经网络，对判别序列进行卷积运算，得到预测结果。
48.本发明实施例提供的技术方案中，对生成的时间序列训练样本构建超边，得到序列模式；通过多重检验校正判别算法，对序列模式进行初始特征选择，得到判别序列；通过卷积神经网络，对判别序列进行卷积运算，得到预测结果，能够提高预测结果的准确率。
49.图2为本发明实施例提供的又一种时间序列趋势预测方法的流程图，如图2所示，该方法包括：
50.步骤201、对获取的原始时间序列数据进行二进制处理，得到二进制时间序列数据集。
51.本发明实施例中，各步骤由时间序列趋势预测装置执行。
52.本发明实施例中，原始时间序列数据为历史时间段的数据，历史时间段的选取可以根据实际需求进行选择。若应用于股票时间序列趋势预测领域，则原始时间序列数据为历史时间段的股票时间序列数据。具体地，对股票时间序列数据进行二进制处理，得到二进制时间序列数据集b＝{b1,b2,b3,...,bn}，bi∈{0,1}，二进制时间序列数据集包括二进制值bi，1代表向上的变动趋势，0代表向下的变动趋势。
53.步骤202、通过设置的时间窗口，对二进制时间序列数据集进行划分，得到多个时间序列训练样本。
54.本命实施例中，时间窗口m可以根据实际需求进行设置，本发明实施例对此不作限
定。按照时间窗口m将二进制时间序列数据集b划分为多个时间序列训练样本
55.bi＝{bi，b
i 1
，...，b
i m-1
}，i的值依次为1，2，3，4，5，6,...,n-m-2,n-m-1,n-m。bi是原始时间序列数据转换的二进制值。
56.步骤203、对生成的时间序列训练样本构建超边，得到序列模式。
57.本发明实施例中，时间序列训练样本bi中包括多个有序元素(bi，b
i 1
，
……
，b
i m-1
)。
58.本发明实施例中，步骤203具体包括：
59.步骤2031、根据多个有序元素构建超边，得到超网络。
60.本发明实施例中，根据有序元素(bi，b
i 1
，
……
，b
i m-1
)构建超边，得到超网络e＝{b
e1
,b
e2
,...,b
ek
}，ej∈{i,i 1,...,i m-1}，超网络中包括多条超边。
61.步骤2032、将时间序列训练样本中最后一位有序元素的二进制值作为训练标签。
62.本发明实施例中，根据时间序列训练样本中的有序元素，确定出该超网络中的超边对应的训练标签。作为一种可选方案，将时间序列训练样本中最后一位有序元素的二进制值作为训练标签，即：b
i m-1
。例如：若b
i m-1
的二进制值为1，则训练标签te为1，表示向上的变动趋势。
63.值得说明的是，也可以通过其他方式确定出训练标签或确定其他位置的有序元素的二进制值为训练标签，本发明实施例对此不作限定。
64.步骤2033、将训练标签与超网络中的超边相关联，得到序列模式。
65.本发明实施例中，序列模式s包括超网络e中的超边和对应的训练标签te。
66.步骤204、通过多重检验校正判别(discriminative sequential pattern mining with multiple testing correction，简称：dspm-mtc)算法，对序列模式进行初始特征选择，得到判别序列。
67.本发明实施例，步骤204具体包括：
68.步骤2041、将二进制时间序列数据集划分为正样本集和负样本集。
69.本发明实施例中，二进制序列数据集中包括多个有序元素的二进制值，将二进制值为1的元素划分为正样集，将二进制值为0的元素划分为负样本集。若以d表示二进制序列数据集，则d＝{d

，d-}，其中，d

表示正样本集，d-表示负样本集。
70.步骤2042、通过超几何分布，对正样本集、负样本集和序列模式进行计算，得到训练模式对应的标签概率。
71.本发明实施例中，为了评估序列模式的统计显著性，将每个序列模式s作为一个假设模式，其中零假设模式是将每个序列模式s都视为非判别性的。如果零假设模式为真，表明序列模式s在不同类别(上升/下降)的支持度之间没有显著差异。因此，相应的假设检验问题可以表述为统计关联检验问题，其目标是确定序列模式s是否与类别在统计上相关或依赖。
72.二进制序列数据集d中序列模式s的分布如表1所示：
73.表1
74.occnon-occtotald

occ(s,d

)|d

|-occ(s,d

)|d

|
d-occ(s,d-)|d-|-occ(s,d-)|d-|totalocc(s,d)|d|-occ(s,d)|d|
75.其中，occ为出现次数，non-occ为其余出现次数，total为总数，d

为正样本集，d-为负样本集，occ(s,d

)为序列模式s在正样本集d

中出现的次数，occ(s,d-)为序列模式s在负样本集d-中出现的次数，occ(s,d)为序列模式s在二进制序列数据集d中出现的次数，|d|为二进制序列数据集中的元素数量，|d-|为负样本集的元素数量，|d

|为正样本集的元素数量。
76.在序列模式s和训练标签te之间没有关联的零假设模式下，occ(s,d

)单元格部分遵循超几何分布：
[0077][0078]
其中，d

为正样本集，d-为负样本集，occ(s,d

)为序列模式s在正样本集d

中出现的次数，occ(s,d-)为序列模式s在负样本集d-中出现的次数，occ(s,d)为序列模式s在二进制序列数据集d中出现的次数，|d|为二进制序列数据集中的元素数量，|d-|为负样本集的元素数量，|d

|为正样本集的元素数量，q(occ(s,d

|s)为在序列模式s条件下序列模式s在正样本集d

中出现的次数的概率。具体地，通过k＝min{occ(s,d-),|d

|-occ(s,d

)}，对q(occ(s,d

|s)进行累加计算，得到训练模式对应的标签概率。
[0079]
本发明实施例中，通过计算得到的标签概率p(s)可以量化序列模式s与训练标签的关联，p(s)越小，表明训练标签为真的可能性越小；p(s)越大，表明训练标签为真的可能性越大。
[0080]
本发明实施例中，通过费希尔精确概率检验(fisher)法对标签概率进行精确检验，其基本思想是保持周边合计数不变，计算现有样本的概率以及比它更极端的所有概率求和，直接求出单侧或双侧的累计概率进行推断，保证后续趋势预测结果的准确性。
[0081]
步骤2043、将多个标签概率按照指定顺序进行排列。
[0082]
本发明实施例，指定顺序可以根据实际需求进行设置，作为一种可选方案，指定顺序为非递减顺序，排列后的标签概率为：p(s1)≤p(s2)≤...≤p(sm)。
[0083]
步骤2044、将排列后的标签概率对应的多个有序的序列模式确定为判别序列。
[0084]
本发明实施例中，若排列后的标签概率为：p(s1)≤p(s2)≤...≤p(sm)，则对应的有序的序列模式为s1，s2，
……
，sm，得到的判别序列r
sg
为：
[0085][0086]
其中，m为有序模式的数量，α为显著性阈值，显著性阈值可以根据实际情况进行设置，本发明实施例对此不作限定。
[0087]
本发明实施例中，从大量序列模式中提取有意义的、有判别能力的序列模式来进行后续的卷积运算，而不是直接处理原始时间序列数据，能够可以有效的去除冗余的有噪音的模式数据，提高预测准确性。
[0088]
步骤205、通过卷积神经网络，对判别序列进行卷积运算，得到预测结果。
[0089]
本发明实施例中，步骤205具体包括：
[0090]
步骤2051、通过卷积层以及非线性激活函数，对设置的模型参数和判别序列进行计算，生成高阶特征。
[0091]
本发明实施例中，卷积层为两个连续的一维卷积层，非线性激活函数为sigmoid函数，模型参数可以根据实际情况进行设置，本发明实施例对此不作限定。
[0092]
具体地，通过对模型参数和判别序列进行计算，生成高阶特征，其中，权重wk和偏差bk均为线性滤波器的模型参数，hk为第k个特征集，特征集中为高阶特征。
[0093]
步骤2052、通过设置的全连接层，对高阶特征进行映射，得到预测结果。
[0094]
本发明实施例中，卷积神经网络(cnn)设置有全连接层，通过对全连接层对高阶特征进行一次卷积运算并将高阶特征映射到样本的标记空间，得到预测结果，预测结果为上升(1)或下降(0)。
[0095]
进一步地，在卷积神经网络中添加dropout层，以防止过拟合。
[0096]
进一步地，在线性滤波器训练过程中，选择随机优化(adam)作为模型的优化器以最小化损失函数，对于每个训练阶段，通过批量迭代更新模型参数，提高模型准确率。
[0097]
本发明实施例中，使用cnn利用选取模式的增强表达能力，使用k个卷积核，两个连续的一维卷积层来捕获所有特征；采用sigmoid函数作为非线性激活函数来改进模型的非线性表示，从中提取高阶抽象特征，考虑到超网络中的不同超边模式特性，通过利用一维卷积核从具有判别序列中提取特征，结合全连接神经网络进行股价趋势预测，利用cnn结合两个全连接层来捕捉历史趋势和当前趋势之间的空间相关性，实现模型性能的改进，提高预测结果的准确性。
[0098]
本发明实施例提供的时间序列趋势预测方法的技术方案中，对生成的时间序列训练样本构建超边，得到序列模式；通过多重检验校正判别算法，对序列模式进行初始特征选择，得到判别序列；通过卷积神经网络，对判别序列进行卷积运算，得到预测结果，能够提高预测结果的准确率。
[0099]
图3为本发明实施例提供的一种时间序列趋势预测装置的结构示意图，该装置用于执行上述时间序列趋势预测方法，如图3所示，该装置包括：构建单元11、特征选择单元12和卷积单元13。
[0100]
构建单元11用于对生成的时间序列训练样本构建超边，得到序列模式。
[0101]
特征选择单元12用于通过多重检验校正判别算法，对序列模式进行初始特征选择，得到判别序列。
[0102]
卷积单元13用于通过卷积神经网络，对判别序列进行卷积运算，得到预测结果。
[0103]
本发明实施例，装置还包括：二进制单元14和划分单元15。
[0104]
二进制单元14用于对获取的原始时间序列数据进行二进制处理，得到二进制时间序列数据集。
[0105]
划分单元15用于通过设置的时间窗口，对二进制时间序列数据集进行划分，得到多个时间序列训练样本。
[0106]
本发明实施例，构建单元11具体用于根据多个有序元素构建超边，得到超网络；将
时间序列训练样本中最后一位有序元素的二进制值作为训练标签；将训练标签与超网络中的超边相关联，得到序列模式。
[0107]
本发明实施例中，特征选择单元12具体用于将二进制时间序列数据集划分为正样本集和负样本集；通过超几何分布，对正样本集、负样本集和序列模式进行计算，得到训练模式对应的标签概率；将多个标签概率按照指定顺序进行排列；将排列后的标签概率对应的多个有序的序列模式确定为判别序列。
[0108]
本发明实施例中，卷积单元13具体用于通过卷积层以及非线性激活函数，对设置的模型参数和判别序列进行计算，生成高阶特征；通过设置的全连接层，对高阶特征进行映射，得到预测结果。
[0109]
本发明实施例的方案中，对生成的时间序列训练样本构建超边，得到序列模式；通过多重检验校正判别算法，对序列模式进行初始特征选择，得到判别序列；通过卷积神经网络，对判别序列进行卷积运算，得到预测结果，能够提高预测结果的准确率。
[0110]
上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机设备，具体的，计算机设备例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
[0111]
本发明实施例提供了一种计算机设备，包括存储器和处理器，存储器用于存储包括程序指令的信息，处理器用于控制程序指令的执行，程序指令被处理器加载并执行时实现上述时间序列趋势预测方法的实施例的各步骤，具体描述可参见上述时间序列趋势预测方法的实施例。
[0112]
下面参考图4，其示出了适于用来实现本技术实施例的计算机设备600的结构示意图。
[0113]
如图4所示，计算机设备600包括中央处理单元(cpu)601，其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram))603中的程序而执行各种适当的工作和处理。在ram603中，还存储有计算机设备600操作所需的各种程序和数据。cpu601、rom602、以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。
[0114]
以下部件连接至i/o接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(crt)、液晶反馈器(lcd)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如lan卡，调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口606。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装如存储部分608。
[0115]
特别地，根据本发明的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本发明的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，所述计算机程序包括用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。
[0116]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。
[0117]
为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本技术时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
[0118]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0119]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0120]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0121]
还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0122]
本技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
[0123]
本领域技术人员应明白，本技术的实施例可提供为方法、系统或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0124]
本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本技术，在这些分布式计算环境中，由
通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0125]
本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
[0126]
以上所述仅为本技术的实施例而已，并不用于限制本技术。对于本领域技术人员来说，本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本技术的权利要求范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种OLAP查询引擎动态cost评估方法及装置与流程

一种时间序列趋势预测方法和装置与流程

相关文献

最热文献