一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于同构卷积神经网络的金融时间序列预测与决策方法与流程

2021-10-27 21:45:00 来源:中国专利 TAG:卷积 同构 金融 神经网络 数据处理


1.本发明涉及金融数据处理技术领域,尤其涉及一种基于同构卷积神经网络的金融时间序列预测与决策方法。


背景技术:

2.随着信息技术的发展,时间序列数据正以惊人的速度产生于现实生活中的几乎每一个应用领域,如金融分析、气象研究、网络安全、航空航天数据处理等。围绕时间序列数据的相关研究是近年来数据挖掘领域的研究热点。由于时间序列的高噪声、维度多、可解释性差等原因,对于时间序列数据分析的难度远远大于视觉、音频或自然语言处理等领域,这些缺点也造成了研究与应用领域的巨大鸿沟。
3.现有的金融时间序列预测方法主要分为两类,一类基于数理统计和随机过程的时间序列分析技术,具备成熟的理论基础和预测方法,基于一定的经济学原理和数学假设将复杂的金融时间序列转换为单变量、线性时间序列进行分析和预测,并且近年来也得到了不断的改进,但针对现实世界中的多元混沌非线性非平稳高噪声金融时间序列,这类方法的总体的实用性仍然较低;另一类则是随着大数据时代的到来,基于海量金融数据的积累以及机器学习的迅速发展,大量基于机器学习的方法被应用于金融产品的运动趋势和金融市场波动进行预测,例如支持向量机、随机森林、聚类、神经网络、强化学习、深度学习等,基于机器学习的预测方法成为了当前的研究热点并取得了一系列的成果。但金融市场是一个极其复杂的、受外界因素影响大的大型社会系统,人为干预现象和突发事件随时发生,市场表现出极大的不确定性和复杂性,直接预测而不考虑金融市场的交易行为与现实情况仍然存在较大差异,以股市为例,假如两家机构基于预测认为品种a会大幅上涨,则从交易决策来说都可能会选择按照市价大量买入a,那么因为竞争原因,两家至少一家不能如愿买到原定的数量,其次,根据下单的时机和具体执行(例如是否拆单、如何拆等)价格本身又会因此而形成较大的波动,反过来影响到预测本身。因此,对于金融市场的异常波动和风险预警的研究,一定要考虑交易行为的复杂性以及交易执行对于价量波动性流动性等关键特性的影响。从本质上,交易都是为了获利,所前所述,基于预测的金融数据分析方法成功应用于金融产品的运动趋势预测问题,但是很多基于预测的方法并没有明确指出如何根据预测信息建立可盈利的策略,即没有显式说明如何使用预测信息,而基于强化学习的分析方法不需要建立预测模型,可以通过训练智能体来直接构建自动的金融交易决策系统,从而实现算法自动交易,因此,强化学习在金融交易决策方面取得了一系列的成果。
4.总而言之,基于深度学习或基于强化学习的金融时间序列预测和交易决策方面取得了令人瞩目的成就。但是,针对真实的在线实时算法交易系统,仍然存在三个困难,包括:
5.1)预测性能仍然不能满足真实在线交易应用,尤其是面向交易决策的金融产品价格波动预测;
6.2)实时性能在神经网络训练过程中会遇到多个问题,例如收敛失败、收敛缓慢以及模式崩溃,导致其实时性能无法满足在线交易;
7.3)金融产品的价格波动预测和动态决策相互独立,绝大多数方法仍然只是将深度学习用于特征提取,而未能将波动预测与交易决策有机结合。


技术实现要素:

8.本发明的目的在于克服现有技术的缺点,提供了一种基于同构卷积神经网络的金融时间序列预测与决策方法,解决了现有金融时间序列预测和交易决策方面存在的问题。
9.本发明的目的通过以下技术方案来实现:一种基于同构卷积神经网络的金融时间序列预测与决策方法,所述金融时间序列预测与决策方法包括:
10.读取最新数据,并根据同构卷积神经网络模型分别计算预测价格、趋势预测和分类概率、以及综合预测指标φ;
11.根据综合预测指标φ生成预测性交易策略,并通过直接强化学习模型强化学习交易策略得到交易决策函数d;
12.通过交易决策函数d计算交易决策并执行交易;
13.重复上述步骤,直到交易结束。
14.所述根据同构卷积神经网络模型分别计算预测价格、趋势预测和分类概率、以及综合预测指标φ包括:根据同构卷积神经网络模型中的预测器f计算预测价格;根据同构卷积神经网络模型中的分类器c计算趋势预测以及分类概率;根据所述预测器f计算得到的预测价格、所述分类器c计算的趋势类型以及分类概率得到综合预测指标其中表示预测器f预测的价格,表示分类器c预测的趋势。
15.所述根据综合预测指标φ生成预测性交易策略,并通过直接强化学习模型强化学习交易策略得到交易决策函数d包括:通过同构卷积神经网络的预测器f和分类器c的基于预测的启发式交易的加权组合以及具有深度特征的基于直接强化学习的执行器e的动态决策的加权组合定义交易决策函数其中,表示基于综合预测指标φ的状态s和时间t的启发式策略,表示来自状态s和时间t的直接强化学习的交易策略,f表示当前时间序列特征表示,表示趋势的分类概率。
16.所述根据综合预测指标φ生成预测性交易策略包括:
17.根据预测的价格和分类结果,选择最有利的交易决策,即预测结果为价格上涨,则预测性交易决策为买入,预测结果为价格下跌,则采取卖出,如果预测结果为平,则采取持仓观望,既不买入也不卖出,以免额外的交易手续费损失,在此基础之上,考虑到预测的准确性与可靠性,通过将预测性交易策略与基于直接强化学习模型的强化学习交易策略结合得到交易决策函数d,即如果预测模型的信任度高,则采取预测性交易策略,若信任度不足,则采取较能适应价格与环境动态变换的强化学习交易策略。
18.所述金融时间序列预测与决策方法还包括在读取最新数据之前执行以下步骤:
19.通过min

max标准化进行数据预处理;
20.进行时间序列滑动窗口处理,并拆分训练集与测试集;
21.训练同构卷积神经网络模型;
22.利用基于同构卷积神经网络模型提取的高价特征训练直接强化学习模型。
23.构建同构卷积神经网络模型包括:
24.首先建立深度卷积神经网络n,捕获时间依赖性并从输入的金融时间序列中提取特征表示;
25.其次,将其输出的高维特征作为金融特征表示输出到基于直接强化学习的执行器e;
26.最后,在n的基础上,连接两个不同的神经网络输出层形成预测器f和分类器c,它们共享除最后一层之外的所有神经网络层n,因此称为同构卷积神经网络。
27.基于不同的神经层和激活函数,预测器f和分类器c可以实现直接价格预测和具有相应似然的趋势多分类;并且,本同构卷积神经网络提取的特征表示还可以有助于的基于直接强化学习的执行器e。
28.本发明具有以下优点:一种基于同构卷积神经网络的金融时间序列预测与决策方法,提出一个预测器

分类器

执行器框架,利用基于深度学习的金融时间序列预测和基于强化学习的决策来实现更好的夏普比率和实时性能;捕捉金融时间序列数据规律,通过同构卷积神经网络架构进行预测与趋势分类,并提出了新颖的集成预测指标;改进的直接强化学习的策略可以实现更优的交易策略。
附图说明
29.图1为基于卷积神经网络的时间序列分析示意图;
30.图2为基于强化学习的决策示意图;
31.图3为标普500真实数据集示意图;
32.图4为基于同构卷积神经网络的预测器

分类器

执行器架构示意图;
33.图5为本发明与3种典型深度学习的时间序列预测方法在训练集的预测性能对比图;
34.图6为本发明与3种典型深度学习的时间序列预测方法在测试集上的预测性能对比图;
35.图7为本发明与3种典型深度学习的交易决策方法在测试集上的交易结果对比图;
36.图8为训练集的收敛性对比图。
具体实施方式
37.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下结合附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的保护范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。下面结合附图对本发明做进一步的描述。
38.本发明提出了基于预测同构卷积神经网络模型的在线金融预测与决策策略框架
(iff

bots)。iff

bots框架可以实现能满足真实在线交易系统的更好的预测性能和动态决策。采用了一种新颖的基于卷积神经网络的预测器

分类器

执行器架构,可以充分利用卷积神经网络强大的模式分类能力实现金融时间序列的特征捕获与识别,同构的预测器与分类器能同时进行金融产品价格的直接预测和趋势分类,并采用集成预测指标φ来利用预测和相应的分类精度,在此基础上,通过结合基于集成预测指标φ的启发式交易策略改进直接强化学习,从而实现了一种结合基于深度学习的预测模型与基于强化学习的交易策略的优化预测性交易策略。与大多数主要采用深度神经网络进行特征提取和金融时间序列表示的现有方法不同,本框架所提出的预测器

分类器

执行器架构可以将预测与交易决策有机结合。
39.1、基于卷积神经网络的时间序列分析;
40.如图1所示,对于时间序列x
n
=(x0,x1,

,x
n
‑1),给定具有参数值θ的预测器模型,其输出是以已知历史序列x0,x1,

,x
t
.的下一个预测值x
t 1
,这可以通过最大化似然函数来完成:
[0041][0042]
卷积神经网络(cnn)是由基于卷积运算的卷积层组成的深度神经网络。它是用于基于视觉和图像处理的分类问题(例如图像分类,对象检测,图像分割)的最常用模型。卷积神经网络的公式为:
[0043][0044]
y=softmax(z)
[0045][0046]
其中w表示权重,x表示输入,b表示偏移值,z表示神经元的输出,softmax函数用于获取输出,y表示输出。
[0047]
如图1所示的深度卷积神经网络n,捕获时间依赖性并从输入的金融时间序列中提取特征表示;其次,按照图4所示,将其输出的高维特征作为金融特征表示输出到基于直接强化学习的执行器e;最后,在n的基础上,连接两个不同的神经网络输出层形成预测器f和分类器c,它们共享除最后一层之外的所有神经网络层n,基于不同的神经层和激活函数,预测器f和分类器c可以实现直接价格预测和具有相应似然的趋势多分类,即{多头、中性、空头};
[0048]
2、基于强化学习的动态决策;
[0049]
如图2所示,强化学习主要基于马尔可夫决策过程(mdp)。mdp用于形式化rl环境。一个mdp由五个元组组成:状态s(一组有限的状态),动作a(一组有限的动作),奖励函数r(标量反馈信号),状态转移概率矩阵(p(s',r|s,a)和折扣因子γ,其中s'表示下一个状态。智能体旨在最大化累积奖励。回报g
t
是总折扣奖励。(5)说明总回报,其中t表示时间,k表示市场;
[0050][0051]
直接强化学习交易框架的性能优于基于预测和q学习的系统,直接强化学习的主要贡献在于提出如下交易策略(动作):
[0052]
δ
t
=tanh[<w,f
t
> b uδ
t
‑1].
[0053]
于是,直接强化学习的优化目标在于通过学习获得参数集θ={w,u,b}来最大化全局奖励函数。
[0054]
3、基于预测的在线交易策略综合框架;
[0055]
如图4所示,在基于cnn的时间序列预测和基于直接强化学习的动态决策模型的基础上,本发明提出了基于预测的在线交易策略集成框架(iff

bots)来融合这两种模型成为现实世界在线交易系统中算法交易框架。具体来说,该框架主要包含三个组件:预测器(f)、分类器(c)和执行器(e)。图4左侧部分包含基于同构卷积神经网络的预测器f和分类器c,可以实现直接价格预测和具有相应似然的趋势多分类。如图4右侧部分所示,iff

bots提出了一种改进的基于直接强化学习的交易策略。与通常的的直接强化学习不同,所提出的交易策略利用基于预测φ的启发式交易和直接强化学习的动态决策实现交易决策。
[0056]
左侧部分包含基于同构卷积神经网络的预测器f和分类器c,它们共享除最后一层之外的所有神经层。卷积神经网络可以捕获时间依赖性并从输入的金融时间序列中提取特征表示,基于不同的神经层和激活函数,预测器f和分类器c可以实现直接价格预测和具有相应似然的趋势多分类。从多分类器c获得的趋势与交易决策一致,即{多头、中性、空头}。并且,同构卷积神经网络提取的特征表示还可以作为传统的基于强化学习的交易决策方法的隐藏特征为执行器e做出贡献。这种集成的预测和特征提取框架可以为执行器e提供更多细节以做出更好的交易决策。
[0057]
具体地说,综合预测指标φ由预测器f的预测价格、趋势类型及其对应的分类器c的分类概率来衡量。一方面,预测价格和趋势越一致,预测越准确。另一方面,趋势的分类概率越大,预测效果越好。综合预测指标φ定义如下:
[0058][0059]
其中为f预测的价格,表示c预测的趋势。
[0060]
交易决策是一个离散时间马尔可夫决策过程,因此,如图4右半部分所示,iff

bots提出了一种改进的基于直接强化学习的交易策略。与通常的的直接强化学习不同,所提出的交易策略利用基于预测φ的启发式交易和直接强化学习的动态决策实现交易决策。即:交易决策函数d将通过来自预测器f和分类器c的基于预测的启发式交易的加权组合以及来自具有深度特征的基于直接强化学习的执行器e的动态决策的加权组合来适当地定义:
[0061][0062]
其中,表示基于综合预测指标φ的状态s和时间t的启发式策略,表
示来自状态s和时间t的直接强化学习的交易策略,f表示当前时间序列特征表示,示来自状态s和时间t的直接强化学习的交易策略,f表示当前时间序列特征表示,表示趋势的分类概率。可从分类器c的softmax函数中获得。
[0063]
为了对方法的正确性和精确性进行验证,如图3所示,本发明选择真实标普500股票价格为数据集,时间从2001

01

02至2018

12

26,其中2001

01

02至2017

05

17作为训练集,2017

05

18至2018

12

26作为测试集,在这段时间内其价格在不停地发生着或大或小的波动。
[0064]
具体的流程步骤如下:
[0065]
(1)数据预处理,在此采用min

max标准化;
[0066]
(2)时间序列滑动窗口处理;
[0067]
(3)拆分训练集与测试集;
[0068]
(4)训练同构卷积神经网络;
[0069]
(5)利用基于同构卷积神经网络提取的高阶特征训练直接强化学习模型;
[0070]
(6)读取最新数据;
[0071]
(7)利用基于同构卷积神经网络的预测器f计算预测价格;
[0072]
(8)利用基于同构卷积神经网络的分类器c计算趋势预测以及分类概率;
[0073]
(9)计算综合预测指标φ;
[0074]
(10)基于综合预测指标φ生成预测性交易策略;
[0075]
(11)基于直接强化学习模型计算强化学习交易策略;
[0076]
(12)基于交易决策函数d计算交易决策;
[0077]
(13)交易执行;
[0078]
(14)继续步骤(6)。
[0079]
其中,本发明用于实际的金融交易系统,与其他方法对比的主要的性能评估指标如下:
[0080]
(1)预测性能,主要采用mse、mape和f1

score;其中f1 score是精确率和召回率的调和平均值,计算公式为:
[0081][0082]
(2)交易决策性能,主要总收益tp和夏普比,定义如下:
[0083][0084]
其中,r
i
是i时刻的收益,pos
i
是i时刻的仓位,c是交易手续费;r
t
是t时刻的收益,mean(.)和std(.)是均值与标准差;
[0085]
(3)实时性能,计算训练时长。
[0086]
从图5、图6、图7、图8、表1和表2可以看出,与已有模型相比,本模型在真实数据集上的实验结果如下:
[0087]
本技术在预测和实时性能的指标上均优于典型的lstm

rnn(长短期记忆网络)、cnn

lstm(卷积长短期记忆网络)和dc

lstm模型(膨胀卷积长短期记忆网络),预测器f的直接价格预测的rmse与mape具备较大优势,训练时长也为对比模型的1/4

1/8。
[0088]
如表2所示,lstm

rnn、cnn

lstm和dc

lstm预测模型与基于预测的交易策略形成3
种对比交易策略,本技术与之相比,连续交易决策的总收益和夏普比均具备较大优势。
[0089]
如图5和图6所示,尽量在训练集上lstm

rnn、cnn

lstm和dc

lstm模型与本技术的预测性能较为接近,但在测试集上,本技术体现出较好的泛化性能,与真实价格曲线最为接近。
[0090]
如图7所示,lstm

rnn、cnn

lstm和dc

lstm预测模型与基于预测的交易策略形成3种对比交易策略,相较而言,本技术连续交易决策的总收益曲线总体比较稳健上升。
[0091]
如图8所示,本技术在收敛速度上略优于典型的lstm

rnn、cnn

lstm和dc

lstm模型。
[0092]
表1 本发明与典型深度学习的时间序列预测方法在真实数据集的预测与分类性能对比
[0093][0094]
表2 本发明与典型深度学习的交易决策方法在测试集上的交易结果对比
[0095][0096]
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜