一种基于信息论的投资组合普适优化配置方法

2022-11-28 10:28:32 来源：中国专利 TAG：

1.本发明涉及量化投资与投资组合优化配置领域，特别是涉及一种基于信息论的投资组合普适优化配置方法。

背景技术：

2.股票投资领域中，如何通过合理的选股和配置投资组合以降低投资风险一直是被高频研究的问题。
3.基于基本面分析选股能帮助投资者获得一些收益稳定的个股，然而，基本面分析过于主观，过于依赖投资者的本身的选股能力，但并不是所有投资者都具有基本面分析的素质，且基本面选股效率不是很高，特别是a股市场股票涨跌与基本面没有直接关系。技术面分析选股虽然客观、直接、容易量化，其分析假设前提是价格以趋势方式波动，历史会重演，然而股票历史是否的确会重演难以确定，且技术面分析的一大缺点是滞后，对重大事件无法进行前瞻性的预判，只能在事件发生之后反映到技术面。
4.除了选股，对所选股票的合理的组合策略可以达到分散风险的目的。然而，传统金融理论下的各种投资组合理论模型都离不开收益率服从正态分布的假设，导致模型前提存在过于理想化的问题，使得模型在现实环境的实用性会受到限制；其次，投资者对市场建模后，通常假设资产组合模型中的参数是确定的，是由当下时间点之前所获得的所有数据计算出来的估计值，但由于时间推移带来的新数据信息，参数的更新与计算是不确定的，这导致模型存在参数错误指定的风险。即使部分模型放松了部分前提与参数的假设，仍然存在一些不符合部分证券市场规律的假设与限制，难以适用各种不同的证券市场。
5.因此，对于投资者来说，如何在不同的证券市场，或同一证券市场的不同形态中，都能探索市场中基本面与技术面中蕴藏的复杂的非线性信息，实时选择有涨势潜力的股票，同时对所选股票的投资配置进行实时调整，分散风险，在尽可能小的风险下获取更大的利益，是非常必要的。

技术实现要素：

6.有鉴于此，本发明的目的在于提供一种基于信息论的投资组合普适优化配置方法，用以实现适用于各种不同的证券市场和同一证券市场不同形态的通用的选股及投资组合配置的方法。本发明通过将多个具有逻辑背景的股票因子策略相结合，通过对的检验以证实股票因子的可靠性，同时选取在各个股票因子上综合得分较高的股票构建投资组合，能够同时综合基本面分析选股和技术分析选股的优势，同时，因为在不同的市场情况下，总有一些股票因子会发挥作用，因此多股票因子选股结果的表现相对而言也更通用与稳定。除此之外，利用基于信息论的投资组合普适优化配置方法对所选股票进行投资配置，可以动态瞄准并跟进投资组合中收益增长率更高的股票，动态调整投资组合配置的权重，从而增加了投资获利的机会，规避市场风险；与传统的投资组合优化模型相比，本发明的所用的方法在能获得更高收益的情况下并未对未来市场的表现做任何假设，因此更为通用与稳
健。
7.为了实现上述目的，本发明采用如下技术方案：
8.一种基于信息论的投资组合普适优化配置方法，包括如下步骤：
9.步骤1，对目标投资股票池剔除不合格股票，所述不合格股票包括停牌股票、st股票、 *st股票、以及上市不满一个季度的股票。
10.步骤2，依据基本面信息，选取对股票收益产生影响或能反映股票收益的选股因子；所述股票因子包括估值类因子、经营有效性因子、成长能力因子、盈利能力因子和技术类因子；
11.获取股票历史价量数据以及对应选股因子的历史数据；所述历史价量数据包括每日开盘价、收盘价、最高价、最低价和成交量。
12.对数据进行清洗，包括缺失值处理、异常值处理、标准化、行业市值中性化；
13.步骤3，通过因子检验方法确定对股票收益影响较大的若干个选股因子，作为有效选股因子，组合所有有效的选股因子作为股票筛选的依据。
14.步骤4、根据选取的有效选股因子组合，对股票池中剩余的股票进行打分，选出得分大于预设值的k支股票，构成投资组合。
15.步骤5，对所选的k支股票在首个交易日平均初始化权重，利用基于信息论的投资组合普适优化配置方法，在随后的交易日内定期动态调整投资组合的权重配置，跟进收益增长率更高的股票，赋予其更高的投资权重，生成新的股票投资组合权重配置方案。
16.进一步的，所述缺失值处理具体方法为：用自第一个交易日起的历史因子数据均值填充缺失值；
17.所述异常值处理方法为：中位数去极值法；
18.找出每个选股因子的中位数x
median
，求出每个选股因子与该选股因子的中位数的绝对偏差值x
i-x
median
，得到绝对偏差值的中位数mad,设定去除异常值倍数的参数scale，从而确定选股因子合理的范围为[x
median-scale
×
mad,x
median
scale
×
mad]，并针对超出合理范围的选股因子值进行调整，超出最大值的用最大值x
median
scale
×
mad代替，小于最小值的用最小值x
median-scale
×
mad代替；
[0019]
所述标准化处理方法为：对股票历史数据的每一列选股因子数据进行标准化，公式为
[0020][0021][0022][0023]
其中num为剔除不合格股票后股票池内股票的数量，y1,y2,
…ynum
为原始数据序列， x1,x2,
…
x
num
为原始数据序列标准化后的序列，为原始数据序列的均值，s为原始数据序列的方差；
[0024]
所述行业市值中性化处理方法为：使用选股因子值做因变量，用所属行业的虚拟变量做自变量进行rlm回归，用回归之后的残差值代替选股因子值。
[0025]
进一步的的，步骤3具体包括如下步骤：
[0026]
步骤301、对完成数据清洗后的股票数据集设定每一期交易的时长t
p
日，即每一个交易期为t
p
个交易日；
[0027]
步骤302、对完成数据清洗后的股票数据集按交易期时长t
p
计算每一期的收益率，截取每一期最后一个交易日的因子截面数据，构成分期股票数据集；
[0028]
步骤303、分别对每一个选股因子的每一个交易期，计算信息系数(informationcoefficient，ic)，方法为：
[0029]
计算某时点某选股因子在全部股票的暴露值与其下期回报的截面相关系数：
[0030]
ic＝corr(factor
t-1
,return
t
)(4)
[0031]
其中，factor
t-1
为t-1期的因子值，return
t
为t期的收益率；
[0032]
步骤304、分别对每一个选股因子的每一个交易期，计算信息比率(informationratio，ir)，方法为：
[0033]
计算年化超额收益与跟踪误差的比值，ir还可以根据ic近似计算，公式为：
[0034][0035]
其中，为t期ic的均值，std(ic
t
)为t期ic的标准差，该公式是从超额收益出发，逐步推导得出的；
[0036]
步骤305、分别对每一个选股因子的每一个交易期，计算单样本t检验下的p-value，t检验统计量公式为：
[0037][0038]
其中，a是交易期内因子样本均值，b是目前交易期数量，s是交易期内因子样本的标准差，μ是交易期内选股因子样本的均值，p-value值可由对照表获得；
[0039]
步骤306、分别对每一个选股因子的每一个交易期，将第t期的因子值与t 1期的股票收益进行rlm线性回归，所得到的回归系数即为选股因子在t期的因子收益率，得到该因子收益率在本期回归中的显著度水平t值，t值指的是对单个回归系数的t检验统计量，描述的是单个变量显著性，再计算|t|的均值；
[0040]
步骤307、对分期股票数据集的各个选股因子进行打分，打分依据为满足如下任一条件时，该选股因子可获得一分，满分四分，保留分数为三分及以上的选股因子；
[0041][0042]
其中，value1、value2、value3、value4为预先设定的阈值；
[0043]
步骤308、计算保留的选股因子的相关系数矩阵函数，对于一对相关性系数较高的选股因子，保留值较高的选股因子，剔除值较低的选股因子，将所有剩余选股因子等权重的作为有效的选股因子组合；
[0044]
进一步的，步骤4中根据选取的有效选股因子组合，对股票池中剩余的股票进行打分，选出得分大于预设值的k支股票，构成投资组合。具体包括如下步骤：
[0045]
步骤401、预先设定期望选股的数量k；
[0046]
步骤402、对所述目标股票池剔除不合格股票后剩下的每一只股票获取前一天的有效选股因子数据；
[0047]
步骤403、对每一只股票的每一个选股因子值计算综合得分，即将所有个股分别按
照各单个选股因子值进行排序，并分为5档，第一档得5分，第二档4分，依此类推，第5档得 1分，由于选股因子是等权重的，累加所有选股因子的得分即为个股的综合得分；
[0048]
步骤404、保留得分为前k名的股票作为构成投资组合；
[0049]
进一步的，步骤5具体包括如下步骤：
[0050]
步骤s501、利用k支股票的投资组合的价格数据表示为一个列向量x，表达式为：
[0051]
x＝(x1，x2，...，xk)
t
ꢀꢀꢀꢀ
(8)
[0052]
其中，股票市场x中的每一个分量xi表示为由n天的相对价格构成的向量，表达式为：
[0053]
xi＝(x
i1
，x
i2
，...，x
in
)
t
，其中x
ij
≥0，j＝1，2，...，n
ꢀꢀꢀꢀ
(9)
[0054]
公式(9)中，n为投资交易日的总天数，x
ij
为第i天中在第j只股票的相对价格，即第j只股票在第i天的收盘价与第1天收盘价之比；例如，假设第一天收盘价为x
1j
＝1，若第j只股票在第2天相对第1天上涨了2％，即收盘价为1.02，则若第j只股票在第3天相对第2天仍上涨了2％，即收盘价为1.02
×
1.02＝1.0404，则
[0055]
步骤s502、将n个交易日中的投资组合权重配置表示为由每一天的投资组合d组成的向量，表达式为：
[0056]
d＝(d1，d2，...，dk)
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0057]di
＝(d
i1
，d
i2
，...，d
in
)
t
，其中dij≥0，∑
jdij
＝1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0058]
其中d
ij
表示第j只股票在第i天的权重。
[0059]
步骤503、将相对收益y表示为过去n个交易日的相对收益yi之和：
[0060][0061]
步骤504、将过去总共n个交易日相对收益yn由和的乘积形式转换成为乘积之和：
[0062][0063]
公式(13)中的每一项对应于第i个交易日第一只或者第二只股票的相对价格乘以比例d
ij
的序列，其中，比例d
ij
为投资组合在第i个交易日分配到第j只股票的权重；
[0064]
步骤505、利用r(jn)表示公式(13)中的乘积利用x(jn)表示公式(13)中的乘移表达式为：
[0065][0066][0067]
由步骤504得到可知，yn的公式表示使得具有k只股票的交易日为n期的股票市场简化为一个特殊的具有kn只虚拟股票的1期市场，即，将r(jn)总量的资金投入股票jn，得到的收益回报是x(jn)，总的相对收益yn为：
[0068][0069]
步骤s506、对前k名的股票构成的投资组合，设定第1个交易日的初始投资权重配置，公式为：
[0070][0071]
步骤507、在第i个交易日(i＞1)，单独计算每一只股票的投资方案：
[0072]
假定当前计算的股票为股票l，l可以取1-kn中的任意一个值，首先计算在第i个交易日，资金在kn只股票序列上的合理分配r(jil)：
[0073][0074]
其中，l为一个小于等于kn的正整数常量，变量j遍历所有股票，此时变量ji为代表第i天时所有股票的整体序列，ji∈{1，2，...，k}i，m1、m2、m3、
…
、mk是股票1、2、3、
…
、k在ji序列中出现的次数，ai是使r(jil)成为概率密度函数的归一化选股因子，由基于信息论的投资组合普适优化配置方法给出的公式，计算出ai，计算公式为(取n＝i，m＝m
l
)：
[0075][0076]
其中，n表示共经历了n个交易日，m表示当前计算的此只股票在ji序列中出现的次数，特别地，对于第一个交易日，有
[0077]
其次，计算在前i-1个交易日，资金在当前只股票上的分配r(j
i-1
l)：
[0078][0079]
其中，m1、m2、m3、...、mk是股票1、2、3、
…
、k在ji序列的前i-1个位置出现的次数；
[0080]
步骤508、根据步骤506设定的初始投资权重配置、式(17)，和步骤507计算的经过i-1天的交易日后的投资权重配置，以及投资组合价格前i-1天的收益，为第l只股票计算第i天的投资权重配置，公式为：
[0081][0082]
其中，根据步骤507，分子的计算公式为：
[0083][0084]
根据步骤507，分母的计算公式为：
[0085][0086]
其中，m＝m
l
表示当前计算的股票l在ji序列中出现的次数， x
il
＝1为未执行第i天策略时第l只股票的收益，是模拟第ji只股票第i天的收益，因为目前还未执行第i天的投资策略，所以可以看作相对收益是
[0087]
步骤509、根据式(21)计算得到所有股票在第i天的投资权重配置后，进行投资组合的资金分配，进行调仓。
[0088]
本发明的有益效果是：
[0089]
1、本发明提出的对单个选股因子的检验与复合，使得alpha收益来源更丰富，多元选股因子之间相关性低，因而更加持续稳定。
[0090]
2、本发明提出的多选股因子组合模型选股，紧密跟随市场环境的变化选取最优选股因子和股票组合，保证了发明的生命力。
[0091]
3、本发明提出的使用基于信息论的投资组合普适优化配置方法配置股票组合的投资权重，不对未来市场的形态做任何假设，适用于各种不同的证券市场和同一证券市场不同形态，有良好的适应性和推广能力。
附图说明
[0092]
图1为本发明的基于信息论的投资组合普适优化配置方法的流程图；
具体实施方式
[0093]
为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0094]
实施例1
[0095]
参见图1，本实施例提出一种基于信息论的投资组合普适优化配置方法，具体如图1所示，包括以下步骤：
[0096]
步骤1、对目标投资股票池剔除不合格股票
[0097]
步骤1.1、获取目标股票池中所有成分股的股票代码
[0098]
步骤1.2、去除所述目标股票池中的停牌股票对应的股票代码；
[0099]
步骤1.3、去除所述目标股票池中的选股日的st、*st的股票对应的股票代码；
[0100]
步骤1.4、去除所述目标股票池中的上市不满一个季度的股票对应的股票代码。
[0101]
具体的说，本实施例中，采用沪深300指数成分股作为目标股票池，以2021年的第一个交易日作为策略的第一个选股日，获取300个成分股，去除停牌、选股日的st、*st的股票和上市不满一个季度的股票对应的股票后，保留下300只股票。
[0102]
步骤2、选取各类选股因子，获取股票历史价量数据和选股因子数据并对数据进行清洗，具体包括：
[0103]
步骤2.1、给定含300只股票的股票池，选取各类选股因子，分别包括估值类因子、经营有效性因子、成长能力因子、盈利能力因子、技术类因子；
[0104]
步骤2.2、给定含300只股票的股票池和选取的各类选股因子，获取股票历史数据价量数据，包括每日开盘价、收盘价、最高价、最低价、成交量，并获取所述选股因子的每日历史数据；
[0105]
步骤2.3、给定300只股票的价量数据和选股因子数据，进行清洗，包括缺失值处理、异常值处理、标准化处理、行业市值中性化处理；
[0106]
具体的说，本实施例中，选定的选股因子为：
[0107]
估值类因子：市净率、市盈率、市销率、市现率(分别取倒数)、peg；
[0108]
经营有效性因子：固定资产周转率、流动资产周转率、总资产周转率、应收账款周转率、长期借款比营业成本；
[0109]
成长能力因子：净利润同比增长率、营业利润同比增长率、营业总收入同比增长
value4＝2，将相关性系数大于0.9的一对选股因子定义为相关性系数较高的选股因子。
[0129]
更具体的说，在本实施例中，经过选股因子检验后，保留选股因子为营业利润同比增长率、每股收益率、总资产收益率、净资产收益率、净利润率、毛利润率、销售费用占比、换手率选股因子。
[0130]
步骤4、给定保留的多选股因子组合，给定对股票池中的300只股票，进行打分，选出得分大于预设值的股票，构成投资组合
[0131]
步骤4.1、预先设定期望选股的数量k；
[0132]
步骤4.2、对所述目标股票池筛选后剩下的每一只股票获取前一天选股因子数据；
[0133]
步骤4.3、对每一只股票的每一个选股因子值计算综合得分，即将所有个股分别按照各单个选股因子值进行排序，并分为5档，第一档得5分，第二档4分，依此类推，第5档得1分，由于选股因子是等权重的，累加所有选股因子的得分即为个股的综合得分；
[0134]
步骤s4.4、保留得分为前k名的股票作为构成投资组合；
[0135]
具体的说，本实施例中，k＝2；
[0136]
更具体的说，在本实施例中，选取出的具体股票代码为601225.xshg和000661.xshe。
[0137]
步骤5、给定选中的两只股票，设定首个交易日平均初始化权重，利用基于信息论的投资组合普适优化配置方法，在随后的交易日内定期动态调整投资组合的权重配置，瞄准并跟进收益增长率更高的股票，赋予其更高的投资权重，生成新的股票投资组合权重配置方案。
[0138]
具体的说，本实施例中，投资组合的初始权重为：
[0139][0140]
更具体的说，在本实施例中，第一只股票在第i天的权重为：
[0141][0142]
其中特别地，对于第一个交易日，有m表示第一只股票在ji序列中出现的次数。
[0143]
由于只有两只股票，第二只股票在第i天的权重为：d
i2
＝1-d
i1
，若需直接计算d
i2
，只需要把第一只股票出现的位置换为第二只即可；计算得到所有股票在第i天的投资权重配置后，重新进行投资组合的资金分配，进行调仓。
[0144]
综上所述，本发明提供的一种基于信息论的投资组合普适优化配置方法，能够实现将多个具有逻辑背景的选股因子策略相结合，通过对选股因子的检验以证实选股因子的可靠性，同时选取在各个选股因子上综合得分较高的股票构建投资组合，能够同时综合基本面分析选股和技术分析选股的优势，同时，因为在不同的市场情况下，总有一些选股因子会发挥作用，因此多选股因子选股结果的表现相对而言也更通用与稳定。除此之外，利用基于信息论的投资组合普适优化配置方法对所选股票进行投资配置，可以动态瞄准并跟进投
资组合中收益增长率更高的股票，动态调整投资组合配置的权重，从而增加了投资获利的机会，规避市场风险；与传统的投资组合优化模型相比，本发明的所用的方法在能获得更高收益的情况下并未对未来市场的表现做任何假设，更为通用与稳健。
[0145]
本发明未详述之处，均为本领域技术人员的公知技术。
[0146]
以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：预估方法和装置、检测方法和装置、存储介质及处理器与流程

一种基于信息论的投资组合普适优化配置方法

相关文献

最热文献