一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基金仓位的预测方法及装置、设备与流程

2022-05-08 05:08:38 来源:中国专利 TAG:


1.本发明涉及数据处理领域,更具体地说,涉及一种基金仓位的预测方法及装置、设备。


背景技术:

2.基金仓位指的是公募基金的持股仓位,也就是基金投资组合中股票市值占基金资产净值的比例。公募基金是我国证券市场上的重要参与者,作为体量巨大的专业机构投资者,其持股仓位的变动反映了专业人士对当前和短期内市场状态的判断,是一个极好的投资者情绪类指标。按照规定,公募基金的持股仓位只有在每季度的季报中才会披露出来,不仅披露的频率低,而且时效性不高。
3.可见,对基金仓位进行预测的需求日益迫切。但目前的基金仓位的预测结果的准确性有待提高。


技术实现要素:

4.申请人在研究的过程中发现:目前的基金仓位预测结果的准确性不高的原因在于:目前存在多种针对股票的分类方式,而传统的预测模型通常只适用于一种分类方式,所以在分类方式多样性的情况下,预测结果的准确性不高。
5.本发明提出一种基金仓位的预测方法及装置、设备,目的在于提高基金仓位预测结果的准确性。
6.为了实现上述目的,现提出的方案如下:
7.一种基金仓位的预测方法,包括:
8.获取数据,所述数据包括:基金行情数据、指数行情数据、股票行情数据以及基金重仓股数据;
9.依据所述数据,筛选多种分类标准下的预测买入股票,其中,在每一种分类标准下,所述预测买入股票均被划分为预测买入的重仓股以及预测买入的其它股票,所述其它股票为除所述重仓股之外的股票,且所述其它股票按照目标分类标准划分,所述目标分类标准为任意一种分类标准;
10.依据所述数据,确定所述多种分类标准下的预测买入股票所占的仓位值;
11.依据所述多种分类标准下的预测买入股票所占的仓位值,确定所述基金的仓位值。
12.可选地,依据所述数据,筛选所述目标分类标准下的预测买入股票,包括:
13.依据所述股票行情数据以及所述基金重仓股数据,获取每一类股票的日收益率;
14.利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重;所述预设分解方式包括将所述基金的日收益率分解到每一类股票的日收益率;
15.将所述仓位配置权重不为零的股票,作为所述目标分类标准下预测买入的股票。
16.可选地,预设时间窗口的确定过程包括:
17.从预先设定的时长范围内,确定候选窗口;
18.获得所述候选窗口下的所述待测基金的仓位预测结果;
19.将所述仓位预测结果与所述待测基金在所述候选窗口下的历史仓位值的误差最小的候选窗口的长度,作为所述预设时间窗口的长度;
20.所述lasso回归算法的惩罚项系数的确定过程包括:
21.获取预设的各个待选惩罚系数下的所述待测基金在测试时间窗口下的仓位预测结果;
22.将所述仓位预测结果与所述待测基金在所述测试时间窗口下的历史仓位值的误差最小的待选惩罚系数,作为所述惩罚系数。
23.可选地,依据所述数据,确定所述目标分类标准下的预测买入股票所占的仓位值,包括:
24.依据预设约束条件以及预设样本误差权重,对按所述目标分类标准下的预测买入股票的仓位配置权重进行二次规划法求解。
25.可选地,多种分类标准包括:
26.按行业分类以及按板块分类;所述板块通过对所述行业在预设时间范围内的月收益率维度执行聚类得到。
27.可选地,多种分类标准还包括:
28.按风格分类、以及按规模分类中的至少一项。
29.一种基金仓位的预测装置,包括:
30.获取模块,用于获取数据,所述数据包括:基金行情数据、指数行情数据、股票行情数据以及基金重仓股数据;
31.多个学习器,其中,任意一个学习器用于依据所述数据,筛选一种分类标准下的预测买入股票,并且,确定所述一种分类标准下的预测买入股票所占的仓位值,其中,在每一种分类标准下,股票均被划分为历史重仓股以及其它股票,所述其它股票为除历史重仓股之外的股票,且所述其它股票按照目标分类标准划分,所述目标分类标准为多种分类标准中的任意一种分类标准;
32.确定模块,用于依据所述多种分类标准下的预测买入股票所占的仓位值,确定所述基金的仓位值。
33.可选地,任意一个学习器用于依据所述数据,筛选所述目标分类标准下的预测买入股票,包括:所述任意一个学习器具体用于:
34.依据所述股票行情数据以及所述基金重仓股数据,获取每一类股票的日收益率;
35.利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重;所述预设分解方式包括将所述基金的日收益率分解到每一类股票的日收益率;
36.将所述仓位配置权重不为零的股票,作为所述目标分类标准下预测买入的股票。
37.一种基金仓位的预测设备,包括:存储器和处理器;
38.所述存储器,用于存储程序;
39.所述处理器,用于执行所述程序,实现如上所述的基金仓位的预测方法的各个步
骤。
40.一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上所述的基金仓位的预测方法的各个步骤。
41.本技术提供的基金仓位的预测方法及装置、设备,依据获取的数据,筛选多种分类标准下的预测买入股票,并确定多种分类标准下的预测买入股票所占的仓位值,再依据多种分类标准下的可能预测股票所占的仓位值,确定基金的仓位值。因为考虑了多种分类标准,所以,能够适用于多种分类标准下基金仓位的预测,有利于提高预测结果的准确性。并且,在每一种分类标准下,遵循重仓股通常会继续持有这一客观规律,将股票划分为重仓股和其它股票,并对其它股票按照分类标准进行划分,所以,既符合现有的股票持有的客观规律,又能减轻分类方式对预测的影响程度,因此,能够进一步提升预测结果的准确性。
附图说明
42.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
43.图1为本发明实施例提供的一种基金仓位估算方法的流程示意图;
44.图2为本发明实施例提供的一种按行业分类下的买入股票所占的仓位值的预测方法的流程示意图;
45.图3为本发明实施例提供的一种按板块分类下的买入股票所占的仓位值的预测方法的流程示意图;
46.图4为本发明实施例提供的一种按风格分类下的买入股票所占的仓位值的预测方法的流程示意图;
47.图5为本发明实施例提供的一种按规模分类下的买入股票所占的仓位值的预测方法的流程示意图;
48.图6为本发明实施例提供的一种基金仓位估算装置的结构示意图;
49.图7为本发明实施例提供的一种基金仓位估算设备的结构示意图。
具体实施方式
50.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
51.图1为本实施例提供的一种基金仓位预测方法,包括以下步骤:
52.s11、获取数据。
53.其中,数据包括:基金行情数据、指数行情数据、股票行情数据以及基金重仓股数据。以上各种数据的定义以及具体内容,可以参见现有技术,这里不再赘述。可以理解的是,本步骤中所述的数据可以均为历史数据,即已经披露的数据。历史重仓股为历史披露的数据中待测基金买入的重仓股,例如,历史重仓股为上一季度待测基金买入的10支重仓股,即
持有仓位最高的 10支股票。
54.s12、依据数据,筛选多种分类标准下的预测买入股票。
55.本实施例中,至少包括两种分类标准。其中,在每一种分类标准下,预测买入股票均被划分为预测买入的重仓股以及预测买入的其它股票。
56.重仓股为历史披露的数据中待测基金买入的重仓股,如前所述,历史重仓股为上一季度待测基金买入的10支重仓股,即持有仓位最高的10支股票。
57.其它股票为除重仓股之外的股票,且其它股票按照目标分类标准划分,目标分类标准为任意一种分类标准。
58.s12的具体实现流程,将在以下实施例中详细说明。
59.s13、依据数据,确定多种分类标准下的预测买入股票所占的仓位值。
60.可以理解的是,任意一支预测买入股票所占的仓位值,为该支股票的仓位配置权重。
61.s14、依据多种分类标准下的预测买入股票所占的仓位值,确定基金的仓位值。
62.s14的具体实现方式可以参见现有技术,这里不再赘述。
63.在本实施例所述的流程中,将预测买入股票划分为重仓股和其它股票,因为由大数据分析可知,重仓股的持有通常具有连续性,即之前持有的重仓股在以后也会继续持有,所以,根据这一客观规律,划分股票类型,并仅针对其它股票划分类型,所以,不仅能够加大重仓股的预测权重,还能够弱化粗粒度的股票分类标准对预测的影响,所以,提高了预测结果对不同分类标准的适用程度。并且,通过汇总多种分类标准下的仓位值,预测基金的总仓位值,也使得预测结果适用于不同分类标准,从而提高准确性。
64.可选的,本技术的实施例中,多种分类标准包括:按行业分类以及按板块分类,可选的,还可以包括按风格分类、以及按规模分类中的至少一项。
65.在以下实施例中,以分类标准为:按行业分类、按板块分类、按风格分类、以及按规模分类为例,分别对s12以及s13进行详细说明。
66.图2为依据数据筛选按行业分类下的预测买入股票,并确定按行业分类下的预测买入股票所占的仓位值的具体流程,包括以下步骤:
67.s21、构建行业学习器。
68.其中,行业学习器为一种多元回归模型,其构建的原理如式(1):
[0069][0070]
其中,r
f,t
表示待测基金在t日的日收益率,b
sj
表示待测基金的第j支重仓股在最近一次季报中披露的仓位配置权重,β
sj
表示待测基金的第j个重仓股的仓位配置权重相对于最近一次季报中披露的仓位配置权重的变化量,r
sj,t
表示待测基金的第j个重仓股在t日的日收益率,β
ik
表示待测基金的按行业分类的第k类其它股票的仓位配置权重,r
ik,t
表示待测基金的按行业分类的第k 类股票在t日的整体日收益率,n表示股票按行业分类的类别个数。
[0071]
从式(1)可以看出,将待测基金的日收益率,线性分解至每一类股票的日收益率上,其中,每一类股票是指每一支重仓股以及按照行业分类标准划分的每一类其它股票。式
(1)中,表示每一支重仓股的日收益率之和,表示按照行业分类标准划分的每一类其它股票的日收益率之和。
[0072]
可以理解的是,按照上述原理构建行业学习器的具体过程,以及行业学习器的具体结构,均可参见现有技术,这里不再赘述。
[0073]
s22、依据股票行情数据以及基金重仓股数据,获取每一类股票的日收益率。
[0074]
s22的具体实现方式可以参见现有技术,这里不再赘述。
[0075]
s23、利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重。
[0076]
其中,预设分解方式如前所述,为:将待测基金的日收益率分解到每一类股票的日收益率。
[0077]
具体的,利用式(1)转换得到式(2):
[0078][0079]
其中,τ表示线性回归的时间窗口长度,单位为日;λ是lasso回归的l1 惩罚项系数;r
f,t
表示待测基金在t日的日收益率;βi表示待测基金的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;r
i,t
表示待测基金的股票项中的第i类在t日的日收益率;n表示待测基金的股票项的总数,具体是待测基金的重仓股的总数和股票的类别总数的总和,这里,股票的类别总数指的是股票按照行业分类标准划分的类别的总数。
[0080]
式子的含义是通过调整β1、β2、
……
、βn的值,使得的值最小;进而得到使得的值最小时,β1、β2、
……
、βn的值。
[0081]
本实施例中,预设时间窗口依据基金的换手率确定,具体的,对于换手率高的基金,其持仓周期较短,在较长的时间窗口内持仓变化较大,导致测量不准确。因此在建立分解基金日收益率的回归方程时,为了使模型测算更加贴近现实,应该选择较短的时间窗口长度。反之,对于换手率较低的基金,其持仓周期较长,在建立回归方程时就应该相应地选择较长的时间窗口长度以保证回归结果的稳定性。进一步的,利用待测基金在待测日之前每季度披露一次的真实基金仓位数据进行回测。
[0082]
即:预设时间窗口的确定流程为:对每个待测基金采用网格搜索的方法找到最佳的回归窗口长度。
[0083]
具体的,首先给待定回归窗口长度圈定一个范围,例如选择历史时长中半个月至2个月的窗口长度,过长则模型时效性较差,过短则预测不稳定。在10-40个工作日(可认为进一步圈定的回归窗口长度,简称为候选窗口)的窗口长度内进行遍历,得到在各候选窗口长度下,待测基金自发行以来每季度的基金仓位预测结果(使用图1所示的预测方法获得),将仓位预测结果与待测基金在候选窗口下的历史基金仓位平均预测误差最小的候选窗口,作为预设时间窗口。也就是说,对于任意一个候选窗口,获取该候选窗口的预测仓位结果,以及这个候选窗口下的历史仓位值,获取预测仓位结果与历史仓位值之间的误差,满足最优
化条件即误差最小的候选窗口的长度就是最适用于该待测基金产品换手率的回归分析时间窗口长度。
[0084]
除了基金的换手率,不同基金的持股集中度也存在较大差异。以行业模型为例,有的基金信奉投资“能力圈”的理念,采取自下而上的投资逻辑,紧密跟踪投资经理及研究员重点关注和擅长的领域和标的,当标的出现好的投资机会时果断出击,因此会专注于投资最擅长、最熟悉的少数几个行业;而有的基金例如一些量化基金或一些灵活配置基金为了分散风险,遵从自上而下的投资逻辑,先从宏观经济的角度出发对基金产品进行战略资产配置,确定各大类资产以及资产内部的行业配比等数据,再向下展开寻找领域内的优质标的,将资金广泛投资到大量行业当中,避免个别行业出现的群体性利空事件对基金业绩带来巨大冲击,因此投资的股票类型数量相对比较广泛。
[0085]
lasso回归的目标函数含有l1惩罚项,使得回归结果产生稀疏解,也就是一些回归系数的结果为0,利用lasso回归解的这个性质能够进行特征选择,剔除基金未投资的上季度重仓股或特定股票分类标准下的某些股票类别。并且l1惩罚项的系数越大,产生的稀疏解就越多,剔除的个股及股票类别就越多,反之亦然。
[0086]
为了适应各基金不同的持股集中度,采用网格搜索的方法找到各基金的最佳lasso回归l1惩罚项系数,以合适的惩罚力度剔除基金未投资的股票类别。网格搜索的方法与确定回归窗口长度的方法相似,对多个预设的待选惩罚系数进行遍历,分别得到在该惩罚系数下,待测基金自发行以来每季度(历史时长,可以称为测试时间窗口)的基金仓位预测结果。最后选择一个使得待测基金对历史基金仓位平均预测误差最小的l1惩罚项系数,这个满足最优化条件的l1惩罚项系数就是最适用于该待测基金产品持股集中度的l1惩罚项系数。
[0087]
需要说明的是,依据基金的换手率确定预设时间窗口以及对每一只基金产品利用其历史真实持仓数据进行回测搜索得到l1惩罚项系数,目的在于增强行业学习器的普适性,降低行业学习器的预测误差,从而提高行业学习器针对于每一基金的预测结果的准确性。
[0088]
s24、将仓位配置权重不为零的股票,作为按行业分类下的预测买入的股票。
[0089]
执行步骤s23后,某些βi的值为零,表示待测基金对该重仓股或者该类股票的持仓百分比为零,即不可能买入的股票,将其进行剔除,从而达到特征选择的效果,实现了按行业分类下,对预测买入的重仓股和预测买入的其它股票的确定。
[0090]
至此,筛选出按行业分类下的预测买入股票,以下步骤用于预测每类股票所占的仓位值。
[0091]
s25、依据预设约束条件以及预设样本误差权重,对按行业分类下的预测买入的股票的仓位配置权重进行最优化求解。
[0092]
具体的,利用式(1)转换得到式(3):
[0093][0094]
本步骤中的预设约束条件为:
[0095]
[0096][0097]
其中,τ表示预设时间窗口长度,单位为日;w
t
表示t日的样本误差的权重;r
f,t
表示待测基金在t日的日收益率,b
sj
表示待测基金预测买入的第j个重仓股在最近一次季报中披露的仓位配置权重,r
sj,t
表示待测基金预测买入的第j个重仓股在t日的日收益率,β
sj
表示待测基金预测买入的第j 个重仓股的仓位配置权重相对于最近一次季报中披露的仓位配置权重的变化量;p表示待测基金预测买入的重仓股的总个数,即经过步骤s21进行特征选择后剩余的重仓股的总个数;r
ik,t
表示待测基金预测买入的第k类其它股票在 t日的整体日收益率,β
ik
表示待测基金预测买入的第k类其它股票的仓位配置权重;q表示待测基金预测买入的其他股票的类别个数。
[0098]
以上最优化问题,属于带有线性约束的最小二乘问题,普通的最小二乘法已经无法解决这种带有线性约束的问题,通常采用常规的二次规划方法即可完成求解。
[0099]
通常求解线性回归的最小二乘法或二次规划法目标函数是最小化样本均方误差,均方误差意味着回归窗口内每天的预测误差都被给予了相同程度的重视。可实际上日期越早,距离待测日越久,其仓位权重配置比例发生变化的可能性就越大,这些数据给模型提供的信息增益就越少;反之,日期越晚,距离待测日越近,其仓位权重配置比例发生变化的可能性就越小,这些数据给模型提供的信息增益就越大。换言之,在建立回归方程时,新样本数据比老样本数据蕴含的价值更大,在建模的过程中反映出样本价值的差异,让新样本发挥更大的价值,就能够让模型测算出更符合最新持仓的仓位权重结果。
[0100]
因此我们在常规二次规划方法的基础上进行了改进,沿着时间线对不同日期的样本误差给予一个随着样本逐渐过时而指数衰减的误差权重,半衰期为窗口长度的一半。换言之每经过一半的回归窗口,老样本权重就逐渐衰减为新样本的二分之一,在整个时间窗口内,最老样本的权重是最新样本的四分之一。
[0101]
经过改进后,以上最优化问题的含义是指:在满足个股仓位约束条件 0≤b
sj
β
sj
≤10%,以及单类股票仓位约束条件0≤β
ik
≤95%,的同时,调整各类股票项的仓位配置权重使得样本加权均方误差的值最小;进而得到使得样本加权均方误差的值最小时,各类股票项的最优化仓位配置权重,即待测基金预测买入的每类其它股票以及每个重仓股的仓位配置权重。
[0102]
需要说明的是,在待测基金为偏股混合型基金时,预测买入的所有股票项的约束条件,还包括总体仓位约束条件:
[0103][0104]
其中,βi表示待测基金预测买入的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;p表示待测基金预测买入的重仓股的总个数;q表示待测基金预测买入的其它股票的类别个数。
[0105]
在待测基金为普通股票型基金时,预测买入的所有股票项的约束条件,还包括总体仓位约束条件:
[0106][0107]
其中,βi表示待测基金预测买入的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;p表示待测基金预测买入的重仓股的总个数;q表示待测基金预测买入的其它股票的类别个数。
[0108]
为了直观地表达目标函数,同时便于计算机求解,将其由一般形式转化为矩阵形式:
[0109][0110]
其中,β是待测基金预测买入的各支股票项的仓位配置权重组成的(p q) 维向量;x是待测基金预测买入的每支股票项各自在这τ天的日收益率,x是维度为τ
×
(p q)的矩阵;y表示测算日前τ天的待测基金日收益率减去最近一季度披露的十大重仓股收益率组成的时间序列;w=diag(w1,w2,...,w
τ
),w是以w
t
为主对角线元素的对角矩阵。
[0111]
至此,得到按行业分类下的各支股票的仓位配置权重。按行业分类下的各支股票的仓位配置权重求和,即得到在行业分类标准下的预测买入股票所占的仓位值。
[0112]
从图2所示的流程可以看出,在按行业分类下,本方法遵循重仓股通常会继续持有这一客观规律,将股票划分为重仓股和其它股票,并对其它股票按行业分类进行划分,又由于,本方法所依据的数据包括:基金行情数据、指数行情数据、股票行情数据以及基金重仓股数据,均为客观数据,所以,本方法既符合现有的股票持有的客观规律,又能在测算中使用到比指数行情更加精确的个股行情数据(包括股价数据以及重仓股的日收益率数据),减轻分类方式对预测的影响程度,能够提升预测结果的准确性。
[0113]
图3为依据数据筛选按板块分类下的预测买入股票,并确定按板块分类下的预测买入股票所占的仓位值的具体流程,包括以下步骤:
[0114]
s31、通过对行业执行聚类,得到各类板块。
[0115]
具体地,通过对行业执行在预设时间范围内例如自2005年行业指数编制以来的月收益率的聚类,得到各类板块。其中,行业指的是按行业分类划分的各类行业,本步骤通过对行业聚类得到各类板块,进一步得到各支股票按板块分类划分的类别,表1示出了一种聚类结果。
[0116]
表1、聚类结果表
[0117][0118]
[0119]
具体的聚类过程参见现有技术。
[0120]
s32、构建板块学习器。
[0121]
其中,板块学习器为一种多元回归模型,其构建的原理如式(4):
[0122][0123]
其中,r
f,t
表示待测基金在t日的日收益率,b
sj
表示待测基金的第j个重仓股在最近一次季报中披露的仓位配置权重,β
sj
表示待测基金的第j个重仓股的仓位配置权重相对于最近一次季报中披露的仓位配置权重的变化量,r
sj,t
表示待测基金的第j个重仓股在t日的日收益率,β
ik
表示待测基金的按板块分类的第k类其它股票的仓位配置权重,r
ik,t
表示待测基金的按板块分类的第k 类股票在t日的整体日收益率,n表示股票按板块分类的类别个数,需要说明的是,n仅作为类别个数的标识,在不同分类标准下,n的具体数值可能不同也可能相同,本技术对此不做限定。
[0124]
从式(4)可以看出,将待测基金的日收益率,线性分解至每一类股票的日收益率上,其中,每一类股票是指每一支重仓股以及按照板块分类标准划分的每一类其它股票。式(4)中,表示每一支重仓股的日收益率之和,表示按照板块分类标准划分的每一类其它股票的日收益率之和。
[0125]
可以理解的是,按照上述原理构建板块学习器的具体过程,以及板块学习器的具体结构,均可参见现有技术,这里不再赘述。
[0126]
s33、依据股票行情数据以及基金重仓股数据,获取每一类股票的日收益率。
[0127]
s33的具体实现方式可以参见现有技术,这里不再赘述。
[0128]
s34、利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重。
[0129]
其中,预设分解方式如前所述,为:将待测基金的日收益率分解到每一类股票的日收益率。
[0130]
具体的,利用式(4)转换得到式(5):
[0131][0132]
其中,τ表示线性回归的时间窗口长度,单位为日;λ是lasso回归的l1 惩罚项系数;r
f,t
表示待测基金在t日的日收益率;βi表示待测基金的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;r
i,t
表示待测基金的股票项中的第i类在t日的日收益率;n表示待测基金的股票项的总数,具体是待测基金的重仓股的总数和股票的类别总数的总和,这里,股票的类别总数指的是股票按照板块分类标准划分的类别的总数。
[0133]
式子的含义是通过调整β1、β2、
……
、βn的值,使得的值最小;进而得到使得的值最小时,β1、β2、
……
、βn的值。
[0134]
本实施例中,预设时间窗口依据基金的换手率确定,具体的确定方法可以参见上述实施例,在此不做赘述。且,对每一只基金产品利用其历史真实持仓数据进行回测搜索,可以找到最适合该基金的l1惩罚项系数,具体的搜索方法可以参见上述实施例,在此不做赘述。
[0135]
s35、将仓位配置权重不为零的股票,作为按板块分类下的预测买入的股票。
[0136]
执行步骤s34后,某些βi的值为零,表示待测基金对该重仓股或者该类股票的持仓百分比为零,即不可能买入的股票,将其进行剔除,从而达到特征选择的效果,实现了按板块分类下,对预测买入的重仓股和预测买入的其它股票的确定。
[0137]
至此,筛选出按板块分类下的预测买入股票,以下步骤用于预测每类股票所占的仓位值。
[0138]
s36、依据预设约束条件以及预设样本误差权重,对按板块分类下的预测买入的股票的仓位配置权重进行最优化求解。
[0139]
具体的,利用式(4)转换得到式(6):
[0140][0141]
本步骤中的预设约束条件为:
[0142][0143][0144]
其中,τ表示预设时间窗口长度,单位为日;w
t
表示t日的样本误差的权重;r
f,t
表示待测基金在t日的日收益率,b
sj
表示待测基金预测买入的第j个重仓股在最近一次季报中披露的仓位配置权重,r
sj,t
表示待测基金预测买入的第j个重仓股在t日的日收益率,β
sj
表示待测基金预测买入的第j 个重仓股的仓位配置权重相对于最近一次季报中披露的仓位配置权重的变化量;p表示待测基金预测买入的重仓股的总个数,即经过步骤s32进行特征选择后剩余的重仓股的总个数;r
ik,t
表示待测基金预测买入的第k类其它股票在 t日的整体日收益率,β
ik
表示待测基金预测买入的第k类其它股票的仓位配置权重;q表示待测基金预测买入的其他股票的类别个数。
[0145]
以上最优化问题,属于带有线性约束的最小二乘问题,普通的最小二乘法已经无法解决这种带有线性约束的问题,通常采用常规的二次规划方法即可完成求解,为了能够让模型测算出更符合最新持仓的仓位权重结果,本实施例进一步在常规二次规划方法的基础上进行了改进。
[0146]
经过改进后,以上最优化问题的含义是指:在满足个股仓位约束条件 0≤b
sj
β
sj
≤10%,以及单类股票仓位约束条件0≤β
ik
≤95%,的同时,调整各类股票项的仓位配置权重使得样本加权均方误差的值最小;进而得到使得样本加权均方误差
的值最小时,各类股票项的最优化仓位配置权重,即待测基金预测买入的每类其它股票以及每个重仓股的仓位配置权重。
[0147]
需要说明的是,在待测基金为偏股混合型基金时,预测买入的所有股票项的约束条件,还包括总体仓位约束条件:
[0148][0149]
其中,βi表示待测基金预测买入的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;p表示待测基金预测买入的重仓股的总个数;q表示待测基金预测买入的其它股票的类别个数。
[0150]
在待测基金为普通股票型基金时,预测买入的所有股票项的约束条件,还包括总体仓位约束条件:
[0151][0152]
其中,βi表示待测基金预测买入的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;p表示待测基金预测买入的重仓股的总个数;q表示待测基金预测买入的其它股票的类别个数。
[0153]
为了直观地表达目标函数,同时便于计算机求解,将其由一般形式转化为矩阵形式:
[0154][0155]
其中,β是待测基金预测买入的各支股票项的仓位配置权重组成的(p q) 维向量;x是待测基金预测买入的每支股票项各自在这τ天的日收益率,x是维度为τ
×
(p q)的矩阵;y表示测算日前τ天的待测基金日收益率减去最近一季度披露的十大重仓股收益率组成的时间序列;w=diag(w1,w2,...,w
τ
),w是以w
t
为主对角线元素的对角矩阵。
[0156]
至此,得到按板块分类下的各支股票的仓位配置权重。按板块分类下的各支股票的仓位配置权重求和,即得到在板块分类标准下的预测买入股票所占的仓位值。
[0157]
图3所示的流程可以看出,在按板块分类下,本方法遵循重仓股通常会继续持有这一客观规律,将股票划分为重仓股和其它股票,并对其它股票按板块分类进行划分,又由于,本方法所依据的数据包括:基金行情数据、指数行情数据、股票行情数据以及基金重仓股数据,均为客观数据,所以,本方法既符合现有的股票持有的客观规律,又能在测算中使用到比指数行情更加精确的个股行情数据,减轻分类方式对预测的影响程度,能够提升预测结果的准确性。
[0158]
图4为依据数据筛选按风格分类下的预测买入股票,并确定按风格分类下的预测买入股票所占的仓位值的具体流程,包括以下步骤:
[0159]
s41、构建风格学习器。
[0160]
其中,风格学习器为一种多元回归模型,其构建的原理如式(7):
[0161][0162]
其中,r
f,t
表示待测基金在t日的日收益率,b
sj
表示待测基金的第j个重仓股在最近一次季报中披露的仓位配置权重,β
sj
表示待测基金的第j个重仓股的仓位配置权重相对于最近一次季报中披露的仓位配置权重的变化量,r
sj,t
表示待测基金的第j个重仓股在t日的日收益率,β
ik
表示待测基金的按风格分类的第k类其它股票的仓位配置权重,r
ik,t
表示待测基金的按风格分类的第k 类股票在t日的整体日收益率,n表示股票按风格分类的类别个数。
[0163]
从式(7)可以看出,将待测基金的日收益率,线性分解至每一类股票的日收益率上,在图4所示的流程中,每一类股票是指每一支重仓股以及按照风格分类标准划分的每一类其它股票。式(7)中,表示每一支重仓股的日收益率之和,表示按照风格分类标准划分的每一类其它股票的日收益率之和。
[0164]
可以理解的是,按照上述原理构建风格学习器的具体过程,以及风格学习器的具体结构,均可参见现有技术,这里不再赘述。
[0165]
s42、依据股票行情数据以及基金重仓股数据,获取每一类股票的日收益率。
[0166]
s42的具体实现方式可以参见现有技术,这里不再赘述。
[0167]
s43、利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重。
[0168]
其中,预设分解方式如前所述,为:将待测基金的日收益率分解到每一类股票的日收益率。
[0169]
具体的,利用式(7)转换得到式(8):
[0170][0171]
其中,τ表示线性回归的时间窗口长度,单位为日;λ是lasso回归的l1 惩罚项系数;r
f,t
表示待测基金在t日的日收益率;βi表示待测基金的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;r
i,t
表示待测基金的股票项中的第i类在t日的日收益率;n表示待测基金的股票项的总数,具体是待测基金的重仓股的总数和股票的类别总数的总和,这里,股票的类别总数指的是股票按照风格分类标准划分的类别的总数。
[0172]
式子的含义是通过调整β1、β2、
……
、βn的值,使得的值最小;进而得到使得的值最小时,β1、β2、
……
、βn的值。
[0173]
本实施例中,预设时间窗口依据基金的换手率确定,具体的确定方法可以参见上述实施例,在此不做赘述。且,对每一只基金产品利用其历史真实持仓数据进行回测搜索,可以找到最适合该基金的l1惩罚项系数,具体的搜索方法可以参见上述实施例,在此不做
赘述。
[0174]
s44、将仓位配置权重不为零的股票,作为按风格分类下的预测买入的股票。
[0175]
执行步骤s43后,某些βi的值为零,表示待测基金对该重仓股或者该类股票的持仓百分比为零,即不可能买入的股票,将其进行剔除,从而达到特征选择的效果,实现了按风格分类下,对预测买入的重仓股和预测买入的其它股票的确定。
[0176]
至此,筛选出按风格分类下的预测买入股票,以下步骤用于预测每类股票所占的仓位值。
[0177]
s45、依据预设约束条件以及预设样本误差权重,对按风格分类下的预测买入的股票的仓位配置权重进行最优化求解。
[0178]
具体的,利用式(7)转换得到式(9):
[0179][0180]
本步骤中的预设约束条件为:
[0181][0182][0183]
其中,τ表示预设时间窗口长度,单位为日;w
t
表示t日的样本误差的权重;r
f,t
表示待测基金在t日的日收益率,b
sj
表示待测基金预测买入的第j个重仓股在最近一次季报中披露的仓位配置权重,r
sj,t
表示待测基金预测买入的第j个重仓股在t日的日收益率,β
sj
表示待测基金预测买入的第j 个重仓股的仓位配置权重相对于最近一次季报中披露的仓位配置权重的变化量;p表示待测基金预测买入的重仓股的总个数,即经过步骤s41进行特征选择后剩余的重仓股的总个数;r
ik,t
表示待测基金预测买入的第k类其它股票在 t日的整体日收益率,β
ik
表示待测基金预测买入的第k类其它股票的仓位配置权重;q表示待测基金预测买入的其他股票的类别个数。
[0184]
以上最优化问题,属于带有线性约束的最小二乘问题,普通的最小二乘法已经无法解决这种带有线性约束的问题,通常采用常规的二次规划方法即可完成求解,为了能够让模型测算出更符合最新持仓的仓位权重结果,本实施例进一步在常规二次规划方法的基础上进行了改进。
[0185]
经过改进后,以上最优化问题的含义是指:在满足个股仓位约束条件 0≤b
sj
β
sj
≤10%,以及单类股票仓位约束条件0≤β
ik
≤95%,的同时,调整各类股票项的仓位配置权重使得样本加权均方误差的值最小;进而得到使得样本加权均方误差的值最小时,各类股票项的最优化仓位配置权重,即待测基金预测买入的每类其它股票以及每个重仓股的仓位配置权重。
[0186]
需要说明的是,在待测基金为偏股混合型基金时,预测买入的所有股票项的约束
条件,还包括总体仓位约束条件:
[0187][0188]
其中,βi表示待测基金预测买入的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;p表示待测基金预测买入的重仓股的总个数;q表示待测基金预测买入的其它股票的类别个数。
[0189]
在待测基金为普通股票型基金时,预测买入的所有股票项的约束条件,还包括总体仓位约束条件:
[0190][0191]
其中,βi表示待测基金预测买入的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;p表示待测基金预测买入的重仓股的总个数;q表示待测基金预测买入的其它股票的类别个数。
[0192]
为了直观地表达目标函数,同时便于计算机求解,将其由一般形式转化为矩阵形式:
[0193]
其中,β是待测基金预测买入的各支股票项的仓位配置权重组成的(p q) 维向量;x是待测基金预测买入的每支股票项各自在这τ天的日收益率,x是维度为τ
×
(p q)的矩阵;y表示测算日前τ天的待测基金日收益率减去最近一季度披露的十大重仓股收益率组成的时间序列;w=diag(w1,w2,...,w
τ
),w是以w
t
为主对角线元素的对角矩阵。
[0194]
至此,得到按风格分类下的各支股票的仓位配置权重。按风格分类下的各支股票的仓位配置权重求和,即得到在风格分类标准下的预测买入股票所占的仓位值。
[0195]
图4所示的流程可以看出,在按风格分类下,本方法遵循重仓股通常会继续持有这一客观规律,将股票划分为重仓股和其它股票,并对其它股票按风格分类进行划分,又由于,本方法所依据的数据包括:基金行情数据、指数行情数据、股票行情数据以及基金重仓股数据,均为客观数据,所以,本方法既符合现有的股票持有的客观规律,又能在测算中使用到比指数行情更加精确的个股行情数据,减轻分类方式对预测的影响程度,能够提升预测结果的准确性。
[0196]
图5为依据数据筛选按规模分类下的预测买入股票,并确定按规模分类下的预测买入股票所占的仓位值的具体流程,包括以下步骤:
[0197]
s51、构建规模学习器。
[0198]
其中,规模学习器为一种多元回归模型,其构建的原理如式(10):
[0199][0200]
其中,r
f,t
表示待测基金在t日的日收益率,b
sj
表示待测基金的第j个重仓股在最近
一次季报中披露的仓位配置权重,β
sj
表示待测基金的第j个重仓股的仓位配置权重相对于最近一次季报中披露的仓位配置权重的变化量,r
sj,t
表示待测基金的第j个重仓股在t日的日收益率,β
ik
表示待测基金的按规模分类的第k类其它股票的仓位配置权重,r
ik,t
表示待测基金的按规模分类的第k 类股票在t日的整体日收益率,n表示股票按规模分类的类别个数。
[0201]
从式(10)可以看出,将待测基金的日收益率,线性分解至每一类股票的日收益率上,在图5所示的流程中,每一类股票是指每一支重仓股以及按照规模分类标准划分的每一类其它股票。式(10)中,表示每一支重仓股的日收益率之和,表示按照规模分类标准划分的每一类其它股票的日收益率之和。
[0202]
可以理解的是,按照上述原理构建规模学习器的具体过程,以及规模学习器的具体结构,均可参见现有技术,这里不再赘述。
[0203]
s52、依据股票行情数据以及基金重仓股数据,获取每一类股票的日收益率。
[0204]
s52的具体实现方式可以参见现有技术,这里不再赘述。
[0205]
s53、利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重。
[0206]
其中,预设分解方式如前所述,为:将待测基金的日收益率分解到每一类股票的日收益率。
[0207]
具体的,利用式(10转换得到式(11):
[0208][0209]
其中,τ表示线性回归的时间窗口长度,单位为日;λ是lasso回归的l1 惩罚项系数;r
f,t
表示待测基金在t日的日收益率;βi表示待测基金的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;r
i,t
表示待测基金的股票项中的第i类在t日的日收益率;n表示待测基金的股票项的总数,具体是待测基金的重仓股的总数和股票的类别总数的总和,这里,股票的类别总数指的是股票按照规模分类标准划分的类别的总数。
[0210]
式子的含义是通过调整β1、β2、
……
、βn的值,使得的值最小;进而得到使得的值最小时,β1、β2、
……
、βn的值。
[0211]
本实施例中,预设时间窗口依据基金的换手率确定,具体的确定方法可以参见上述实施例,在此不做赘述。且,对每一只基金产品利用其历史真实持仓数据进行回测搜索,可以找到最适合该基金的l1惩罚项系数,具体的搜索方法可以参见上述实施例,在此不做赘述。
[0212]
s54、将仓位配置权重不为零的股票,作为按规模分类下的预测买入的股票。
[0213]
执行步骤s53后,某些βi的值为零,表示待测基金对该重仓股或者该类股票的持仓百分比为零,即不可能买入的股票,将其进行剔除,从而达到特征选择的效果,实现了按规模分类下,对预测买入的重仓股和预测买入的其它股票的确定。
[0214]
至此,筛选出按规模分类下的预测买入股票,以下步骤用于预测每类股票所占的仓位值。
[0215]
s55、依据预设约束条件以及预设样本误差权重,对按规模分类下的预测买入的股票的仓位配置权重进行二次规划法求解。
[0216]
具体的,利用式(10)转换得到式(12):
[0217][0218]
本步骤中的预设约束条件为:
[0219][0220][0221]
其中,τ表示预设时间窗口长度,单位为日;w
t
表示t日的样本误差的权重;r
f,t
表示待测基金在t日的日收益率,b
sj
表示待测基金预测买入的第j个重仓股在最近一次季报中披露的仓位配置权重,r
sj,t
表示待测基金预测买入的第j个重仓股在t日的日收益率,β
sj
表示待测基金预测买入的第j 个重仓股的仓位配置权重相对于最近一次季报中披露的仓位配置权重的变化量;p表示待测基金预测买入的重仓股的总个数,即经过步骤s51进行特征选择后剩余的重仓股的总个数;r
ik,t
表示待测基金预测买入的第k类其它股票在t日的整体日收益率,β
ik
表示待测基金预测买入的第k类其它股票的仓位配置权重;q表示待测基金预测买入的其他股票的类别个数。
[0222]
以上最优化问题,属于带有线性约束的最小二乘问题,普通的最小二乘法已经无法解决这种带有线性约束的问题,通常采用常规的二次规划方法即可完成求解,为了能够让模型测算出更符合最新持仓的仓位权重结果,本实施例进一步在常规二次规划方法的基础上进行了改进。
[0223]
经过改进后,以上最优化问题的含义是指:在满足个股仓位约束条件 0≤b
sj
β
sj
≤10%,以及单类股票仓位约束条件0≤β
ik
≤95%,的同时,调整各类股票项的仓位配置权重使得样本加权均方误差的值最小;进而得到使得样本加权均方误差的值最小时,各类股票项的最优化仓位配置权重,即待测基金预测买入的每类其它股票以及每个重仓股的仓位配置权重。
[0224]
需要说明的是,在待测基金为偏股混合型基金时,预测买入的所有股票项的约束条件,还包括总体仓位约束条件:
[0225][0226]
其中,βi表示待测基金预测买入的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;p表示待测基金预测买入的重仓股的总个数;q表示待测基金预测买入的其
它股票的类别个数。
[0227]
在待测基金为普通股票型基金时,预测买入的所有股票项的约束条件,还包括总体仓位约束条件:
[0228][0229]
其中,βi表示待测基金预测买入的股票项中的第i类的仓位配置权重,股票项包括股票和重仓股;p表示待测基金预测买入的重仓股的总个数;q表示待测基金预测买入的其它股票的类别个数。
[0230]
为了直观地表达目标函数,同时便于计算机求解,将其由一般形式转化为矩阵形式:
[0231][0232]
其中,β是待测基金预测买入的各支股票项的仓位配置权重组成的(p q) 维向量;x是待测基金预测买入的每支股票项各自在这τ天的日收益率,x是维度为τ
×
(p q)的矩阵;y表示测算日前τ天的待测基金日收益率减去最近一季度披露的十大重仓股收益率组成的时间序列;w=diag(w1,w2,...,w
τ
),w是以w
t
为主对角线元素的对角矩阵。
[0233]
至此,得到按规模分类下的各支股票的仓位配置权重。按规模分类下的各支股票的仓位配置权重求和,即得到在规模分类标准下的预测买入股票所占的仓位值。
[0234]
图5所示的流程可以看出,在按规模分类下,本方法遵循重仓股通常会继续持有这一客观规律,将股票划分为重仓股和其它股票,并对其它股票按规模分类进行划分,又由于,本方法所依据的数据包括:基金行情数据、指数行情数据、股票行情数据以及基金重仓股数据,均为客观数据,所以,本方法既符合现有的股票持有的客观规律,又能在测算中使用到比指数行情更加精确的个股行情数据,减轻分类方式对预测的影响程度,能够提升预测结果的准确性。
[0235]
可以理解的是,在获得各种分类标准下的预测买入股票所占的仓位值后,可以将各种分类标准下的预测买入股票所占的仓位值求均值,得到最终的基金仓位的预测结果。
[0236]
图6位本技术实施例提供的一种基金仓位的预测装置的结构示意图,如图6所示,本装置包括:获取模块61、多个学习器62、确定模块63。
[0237]
获取模块61,用于获取数据,数据包括:基金行情数据、指数行情数据、股票行情数据以及基金重仓股数据。
[0238]
多个学习器62,其中,任意一个学习器用于依据数据,筛选一种分类标准下的预测买入股票,并且,确定一种分类标准下的预测买入股票所占的仓位值,其中,在每一种分类标准下,股票均被划分为历史重仓股以及其它股票,其它股票为除历史重仓股之外的股票,且其它股票按照目标分类标准划分,目标分类标准为任意一种分类标准。
[0239]
确定模块63,用于依据多种分类标准下的预测买入股票所占的仓位值,确定基金
的仓位值。
[0240]
可选地,任意一个学习器用于依据数据,筛选目标分类标准下的预测买入股票,包括:任意一个学习器具体用于:
[0241]
依据股票行情数据以及基金重仓股数据,获取每一类股票的日收益率。
[0242]
利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重。预设分解方式包括将基金的日收益率分解到每一类股票的日收益率。
[0243]
将仓位配置权重不为零的股票,作为目标分类标准下预测买入的股票。
[0244]
可选地,任意一个学习器用于依据数据,确定目标分类标准下的预测买入股票所占的仓位值,包括:任意一个学习器具体用于:
[0245]
依据预设约束条件以及预设样本误差权重,对按目标分类标准下的预测买入股票的仓位配置权重进行二次规划法求解。
[0246]
可选地,本装置还包括训练模块,训练模块用于确定预设时间窗口和回归算法的惩罚项系数,包括:训练模块具体用于:
[0247]
从预先设定的时长范围内,确定候选窗口;
[0248]
获得所述候选窗口下的所述待测基金的仓位预测结果;
[0249]
将所述仓位预测结果与所述待测基金在所述候选窗口下的历史仓位值的误差最小的候选窗口的长度,作为所述预设时间窗口的长度;
[0250]
获取预设的各个待选惩罚系数下的所述待测基金在测试时间窗口下的仓位预测结果;
[0251]
将所述仓位预测结果与所述待测基金在所述测试时间窗口下的历史仓位值的误差最小的待选惩罚系数,作为所述惩罚系数。
[0252]
可选地,多种分类标准包括:按行业分类以及按板块分类。板块通过对行业,执行在预设时间范围内的月收益率的聚类得到。可选地,多种分类标准还包括:按风格分类、以及按规模分类中的至少一项。
[0253]
需要说明的是,以多种分类标准包括按行业分类、按板块分类、按风格分类、以及按规模分类为例,图6示例了包括行业学习器621、板块学习器 622、风格学习器623以及规模学习器624的基金仓位的预测装置的结构示意图。
[0254]
其中,行业学习器621用于依据数据,筛选按行业分类下的预测买入股票,并且,确定按行业分类下的预测买入股票所占的仓位值,其中,在按行业分类下,股票被划分为历史重仓股以及其它股票,其它股票为除历史重仓股之外的股票,且其它股票按照行业分类标准划分。
[0255]
可选地,行业学习器用于依据数据,筛选按行业分类下的预测买入股票,包括:行业学习器具体用于:
[0256]
依据股票行情数据以及基金重仓股数据,获取每一类股票的日收益率。
[0257]
利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重。预设分解方式包括将基金的日收益率分解到每一类股票的日收益率。
[0258]
将仓位配置权重不为零的股票,作为按行业分类下预测买入的股票。
[0259]
可选地,行业学习器用于依据数据,确定按行业分类下的预测买入股票所占的仓位值,包括:行业学习器具体用于:
[0260]
依据预设约束条件以及预设样本误差权重,对按行业分类下的预测买入股票的仓位配置权重进行二次规划法求解。
[0261]
板块学习器622用于依据数据,筛选按板块分类下的预测买入股票,并且,确定按板块分类下的预测买入股票所占的仓位值,其中,在按板块分类下,股票被划分为历史重仓股以及其它股票,其它股票为除历史重仓股之外的股票,且其它股票按照板块分类标准划分。
[0262]
可选地,板块学习器用于依据数据,筛选按板块分类下的预测买入股票,包括:板块学习器具体用于:
[0263]
依据股票行情数据以及基金重仓股数据,获取每一类股票的日收益率。
[0264]
利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重。预设分解方式包括将基金的日收益率分解到每一类股票的日收益率。
[0265]
将仓位配置权重不为零的股票,作为按板块分类下预测买入的股票。
[0266]
可选地,板块学习器用于依据数据,确定按板块分类下的预测买入股票所占的仓位值,包括:板块学习器具体用于:
[0267]
依据预设约束条件以及预设样本误差权重,对按板块分类下的预测买入股票的仓位配置权重进行二次规划法求解。
[0268]
风格学习器623用于依据数据,筛选按风格分类下的预测买入股票,并且,确定按风格分类下的预测买入股票所占的仓位值,其中,在按风格分类下,股票被划分为历史重仓股以及其它股票,其它股票为除历史重仓股之外的股票,且其它股票按照风格分类标准划分。
[0269]
可选地,风格学习器用于依据数据,筛选按风格分类下的预测买入股票,包括:风格学习器具体用于:
[0270]
依据股票行情数据以及基金重仓股数据,获取每一类股票的日收益率。
[0271]
利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重。预设分解方式包括将基金的日收益率分解到每一类股票的日收益率。
[0272]
将仓位配置权重不为零的股票,作为按风格分类下预测买入的股票。
[0273]
可选地,风格学习器用于依据数据,确定按风格分类下的预测买入股票所占的仓位值,包括:风格学习器具体用于:
[0274]
依据预设约束条件以及预设样本误差权重,对按风格分类下的预测买入股票的仓位配置权重进行二次规划法求解。
[0275]
规模学习器624用于依据数据,筛选按规模分类下的预测买入股票,并且,确定按规模分类下的预测买入股票所占的仓位值,其中,在按规模分类下,股票被划分为历史重仓股以及其它股票,其它股票为除历史重仓股之外的股票,且其它股票按照规模分类标准划分。
[0276]
可选地,规模学习器用于依据数据,筛选按规模分类下的预测买入股票,包括:规
模学习器具体用于:
[0277]
依据股票行情数据以及基金重仓股数据,获取每一类股票的日收益率。
[0278]
利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重。预设分解方式包括将基金的日收益率分解到每一类股票的日收益率。
[0279]
将仓位配置权重不为零的股票,作为按规模分类下预测买入的股票。
[0280]
可选地,规模学习器用于依据数据,确定按规模分类下的预测买入股票所占的仓位值,包括:规模学习器具体用于:
[0281]
依据预设约束条件以及预设样本误差权重,对按规模分类下的预测买入股票的仓位配置权重进行二次规划法求解。
[0282]
图7示出了该基金仓位的预测设备的结构示意图,该设备可以包括:至少一个处理器701,至少一个通信接口702,至少一个存储器703和至少一个通信总线704;
[0283]
在本技术实施例中,处理器701、通信接口702、存储器703、通信总线704 的数量为至少一个,且处理器701、通信接口702、存储器703通过通信总线704 完成相互间的通信;
[0284]
处理器701可能是一个中央处理器cpu,或者是特定集成电路asic (application specific integrated circuit),或者是被配置成实施本发明实施例的一个或多个集成电路等;
[0285]
存储器703可能包含高速ram存储器,也可能还包括非易失性存储器 (non-volatile memory)等,例如至少一个磁盘存储器;
[0286]
其中,存储器存储有程序,处理器可执行存储器存储的程序,实现本技术实施例提供的一种基金仓位的预测方法的各个步骤,如下:
[0287]
一种基金仓位的预测方法,包括:
[0288]
获取数据,所述数据包括:基金行情数据、指数行情数据、股票行情数据以及基金重仓股数据;
[0289]
依据所述数据,筛选多种分类标准下的预测买入股票,其中,在每一种分类标准下,所述预测买入股票均被划分为预测买入的重仓股以及预测买入的其它股票,所述其它股票为除所述重仓股之外的股票,且所述其它股票按照目标分类标准划分,所述目标分类标准为任意一种分类标准;
[0290]
依据所述数据,确定所述多种分类标准下的预测买入股票所占的仓位值;
[0291]
依据所述多种分类标准下的预测买入股票所占的仓位值,确定所述基金的仓位值。
[0292]
可选地,依据所述数据,筛选所述目标分类标准下的预测买入股票,包括:
[0293]
依据所述股票行情数据以及所述基金重仓股数据,获取每一类股票的日收益率;
[0294]
利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重;所述预设分解方式包括将所述基金的日收益率分解到每一类股票的日收益率;
[0295]
将所述仓位配置权重不为零的股票,作为所述目标分类标准下预测买入的股票。
[0296]
可选地,预设时间窗口的确定过程包括:
[0297]
从预先设定的时长范围内,确定候选窗口;
[0298]
获得所述候选窗口下的所述待测基金的仓位预测结果;
[0299]
将所述仓位预测结果与所述待测基金在所述候选窗口下的历史仓位值的误差最小的候选窗口的长度,作为所述预设时间窗口的长度;
[0300]
所述回归算法的惩罚项系数的确定过程包括:
[0301]
获取预设的各个待选惩罚系数下的所述待测基金在测试时间窗口下的仓位预测结果;
[0302]
将所述仓位预测结果与所述待测基金在所述测试时间窗口下的历史仓位值的误差最小的待选惩罚系数,作为所述惩罚系数。
[0303]
可选地,依据所述数据,确定所述目标分类标准下的预测买入股票所占的仓位值,包括:
[0304]
依据预设约束条件以及预设样本误差权重,对按所述目标分类标准下的预测买入股票的仓位配置权重进行二次规划法化求解。
[0305]
可选地,多种分类标准包括:
[0306]
按行业分类以及按板块分类;所述板块通过对所述行业在预设时间范围内的月收益率执行聚类得到。
[0307]
可选地,多种分类标准还包括:
[0308]
按风格分类、以及按规模分类中的至少一项。
[0309]
本技术实施例还提供一种可读存储介质,该可读存储介质可存储有适于处理器执行的计算机程序,计算机程序被处理器执行时,实现本技术实施例提供的一种基金仓位的预测方法的各个步骤,如下:
[0310]
一种基金仓位的预测方法,包括:
[0311]
获取数据,所述数据包括:基金行情数据、指数行情数据、股票行情数据以及基金重仓股数据;
[0312]
依据所述数据,筛选多种分类标准下的预测买入股票,其中,在每一种分类标准下,所述预测买入股票均被划分为预测买入的重仓股以及预测买入的其它股票,所述其它股票为除所述重仓股之外的股票,且所述其它股票按照目标分类标准划分,所述目标分类标准为任意一种分类标准;
[0313]
依据所述数据,确定所述多种分类标准下的预测买入股票所占的仓位值;
[0314]
依据所述多种分类标准下的预测买入股票所占的仓位值,确定所述基金的仓位值。
[0315]
可选地,依据所述数据,筛选所述目标分类标准下的预测买入股票,包括:
[0316]
依据所述股票行情数据以及所述基金重仓股数据,获取每一类股票的日收益率;
[0317]
利用lasso回归算法,获取在回归期限的预设时间窗口内,预设分解方式下样本均方误差最小的仓位配置权重;所述预设分解方式包括将所述基金的日收益率分解到每一类股票的日收益率;
[0318]
将所述仓位配置权重不为零的股票,作为所述目标分类标准下预测买入的股票。
[0319]
可选地,预设时间窗口的确定过程包括:
[0320]
从预先设定的时长范围内,确定候选窗口;
[0321]
获得所述候选窗口下的所述待测基金的仓位预测结果;
[0322]
将所述仓位预测结果与所述待测基金在所述候选窗口下的历史仓位值的误差最小的候选窗口的长度,作为所述预设时间窗口的长度;
[0323]
所述回归算法的惩罚项系数的确定过程包括:
[0324]
获取预设的各个待选惩罚系数下的所述待测基金在测试时间窗口下的仓位预测结果;
[0325]
将所述仓位预测结果与所述待测基金在所述测试时间窗口下的历史仓位值的误差最小的待选惩罚系数,作为所述惩罚系数。
[0326]
可选地,依据所述数据,确定所述目标分类标准下的预测买入股票所占的仓位值,包括:
[0327]
依据预设约束条件以及预设样本误差权重,对按所述目标分类标准下的预测买入股票的仓位配置权重进行最优化求解。
[0328]
可选地,多种分类标准包括:
[0329]
按行业分类以及按板块分类;所述板块通过对所述行业自2005年行业指数编制以来的月收益率维度执行聚类得到。
[0330]
可选地,多种分类标准还包括:
[0331]
按风格分类、以及按规模分类中的至少一项。
[0332]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0333]
在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0334]
本说明书中各个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可,且本说明书中各实施例中记载的特征可以相互替换或者组合。
[0335]
对本发明所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献