一种投资组合生成的方法、装置、设备及存储介质与流程

2022-10-13 08:16:45 来源：中国专利 TAG：

1.本技术涉及人工智能技术领域，特别是涉及一种投资组合生成的方法、装置、设备及存储介质。

背景技术：

2.投资组合管理是基金管理的一种，是不断将资金重新分配到许多不同的金融资产中的决策过程，旨在抑制风险的同时最大化收益。由于影响决策过程的复杂因素很多，如宏观经济、投资者心理等因素，因此很难建立合适的投资组合管理模型。随着深度学习的兴起，研究人员开始将深度学习应用至投资组合管理中。
3.大多基于深度学习的投资组合方法是直接给定一组资产信息构成投资组合，通过调整这一组给定的投资组合中各资产信息所占的比例以实现投资组合的优化，其并没有考虑外部市场环境对投资组合内部资产信息的影响，不论外部市场环境如何，投资组合中的资产信息构成是一定的。
4.为了能够在抑制风险的同时，使得收益最大化，外部市场环境也是需要考虑的重要因素之一，而现有技术并不能根据外部市场环境状态动态调整投资组合的资产信息构成和比例，导致该投资组合不能长期满足风险低，收益大的需求。

技术实现要素：

5.基于上述问题，本技术提供了一种投资组合生成的方法、装置、设备及存储介质。
6.本技术实施例公开了如下技术方案：
7.一种投资组合生成的方法，包括：
8.确定目标函数、多个市场资产信息、目标资产信息数量为k和目标交易成本；
9.将目标环境指标参数输入第一循环强化学习模型，获得目标市场环境状态；所述第一循环强化学习模型是根据历史环境指标参数、历史市场环境状态以及所述目标函数训练得到的；
10.将所述目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第二循环强化学习模型，获得k个目标资产信息以及所述k个目标资产信息的权重；所述k个目标资产信息是从所述多个市场资产信息中选取的，所述第二循环强化学习模型是根据历史市场环境状态、历史市场资产信息、历史交易成本、历史投资资产信息以及所述目标函数训练得到的；
11.根据所述k个目标资产信息和所述k个目标资产信息的权重，确定所述k个目标资产信息的交易信号，获得优化的投资组合。
12.进一步地，所述将所述目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第二循环强化学习模型，获得k个目标资产信息以及所述k个目标资产信息的权重，包括：
13.将所述目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第
二循环强化学习模型，得到使得适应度函数值符合预设条件的k 个目标资产信息以及所述k个目标资产信息的权重。
14.进一步地，所述目标函数的确定步骤包括：
15.根据用户的风险偏好，确定所述目标函数。
16.进一步地，所述根据用户的风险偏好，确定所述目标函数，包括：
17.若所述用户的风险偏好为对波动性敏感，确定所述目标函数为第一目标函数；
18.若所述用户的风险偏好为对波动性非敏感，确定所述目标函数为第二目标函数。
19.进一步地，所述根据所述k个目标资产信息和所述k个目标资产信息的权重，确定所述k个目标资产信息的交易信号，获得优化的投资组合之后，还包括：
20.若所述投资组合的收益与风险的比值小于或等于止损阈值，则触发平仓止损机制；
21.根据所述平仓止损机制，将所述目标环境指标参数输入第三循环强化学习模型，获得更新后的目标市场环境状态；所述第三循环强化学习模型是根据更新后的历史环境指标参数、更新后的历史市场环境状态以及所述目标函数训练得到的；
22.将所述更新后的目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第四循环强化学习模型，获得k个更新后的目标资产信息以及所述k个更新后的目标资产信息的权重；所述k个更新后的目标资产信息是从所述多个市场资产信息中选取的，所述第四循环强化学习模型是根据更新后的历史市场环境状态、更新后的历史市场资产信息、更新后的历史交易成本、更新后的历史投资资产信息以及所述目标函数训练得到的；
23.根据所述k个更新后的目标资产信息和所述k个更新后的目标资产信息的权重，确定所述k个更新后的目标资产信息的交易信号，获得优化的投资组合。
24.为解决上述技术问题，本技术还提供一种投资组合生成的装置，包括：
25.第一确定模块，用于确定目标函数、多个市场资产信息、目标资产信息数量为k和目标交易成本；
26.第一获得模块，用于将目标环境指标参数输入第一循环强化学习模型，获得目标市场环境状态；所述第一循环强化学习模型是根据历史环境指标参数、历史市场环境状态以及所述目标函数训练得到的；
27.第二获得模块，将所述目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第二循环强化学习模型，获得k个目标资产信息以及所述k个目标资产信息的权重；所述k个目标资产信息是从所述多个市场资产信息中选取的，所述第二循环强化学习模型是根据历史市场环境状态、历史市场资产信息、历史交易成本、历史投资资产信息以及所述目标函数训练得到的；
28.第二确定模块，用于根据所述k个目标资产信息和所述k个目标资产信息的权重，确定所述k个目标资产信息的交易信号，获得优化的投资组合。
29.进一步地，所述第一确定模块，用于将所述目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第二循环强化学习模型，得到使得适应度函数值符合预设条件的k个目标资产信息以及所述k个目标资产信息的权重。
30.进一步地，所述投资组合生成的装置，还包括：触发模块；
31.所述触发模块，用于若所述投资组合的收益与风险的比值小于或等于止损阈值，
则触发平仓止损机制；
32.所述第一获得模块，还用于根据所述平仓止损机制，将所述目标环境指标参数输入第三循环强化学习模型，获得更新后的目标市场环境状态；所述第三循环强化学习模型是根据更新后的历史环境指标参数、更新后的历史市场环境状态以及所述目标函数训练得到的；
33.所述第二获得模块，还用于将所述更新后的目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第四循环强化学习模型，获得k个更新后的目标资产信息以及所述k个更新后的目标资产信息的权重；所述k个更新后的目标资产信息是从所述多个市场资产信息中选取的，所述第四循环强化学习模型是根据更新后的历史市场环境状态、更新后的历史市场资产信息、更新后的历史交易成本、更新后的历史投资资产信息以及所述目标函数训练得到的；
34.所述第二确定模块，还用于根据所述k个更新后的目标资产信息和所述k个更新后的目标资产信息的权重，确定所述k个更新后的目标资产信息的交易信号，获得优化的投资组合。
35.进一步地，所述第一确定模块，用于根据用户的风险偏好，确定所述目标函数；确定多个市场资产信息、目标资产信息数量为k和目标交易成本。
36.进一步地，所述第一确定模块，用于若所述用户的风险偏好为对波动性敏感，确定所述目标函数为第一目标函数；若所述用户的风险偏好为对波动性非敏感，确定所述目标函数为第二目标函数；确定多个市场资产信息、目标资产信息数量为k和目标交易成本。
37.本技术还提供一种计算机设备，所述计算机设备包括处理器以及存储器：
38.所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；
39.所述处理器用于根据所述程序代码中的指令执行如上所述的一种投资组合生成的方法的步骤。
40.本技术还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的一种投资组合生成的方法的步骤。
41.相较于现有技术，本技术具有以下有益效果：
42.本技术通过利用循环强化学习模型，获得目标市场环境状态，根据所述目标市场环境状态，多个市场资产信息以及目标交易成本，可以获得构成投资组合的多个目标资产信息以及所述多个目标资产信息的权重，进而根据所述多个目标资产信息以及所述多个目标资产信息的权重，生成优化的投资组合。由于本技术中考虑了市场环境对投资组合的目标资产信息构成及比例的影响，能够根据当前市场环境状态动态选择投资组合中的资产信息构成，配置各资产信息所占的比例，以实现投资组合的优化。该投资组合方式能够适应不同的外部市场环境，能够长期满足投资风险低，收益大的需求。
附图说明
43.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可
以根据这些附图获得其他的附图。
44.图1为本技术实施例提供的一种应用场景的示意图；
45.图2为本技术实施例提供的一种投资组合生成方法的流程图；
46.图3为本技术实施例提供的一种确定目标函数的流程图；
47.图4为本技术实施例提供的一种平仓止损机制的流程图；
48.图5为本技术实施例提供的一种投资组合生成装置的结构示意图。
具体实施方式
49.正如前文描述，目前如何使得投资组合生成方法能够适应外部市场环境变化，成为本领域技术人员亟待解决的技术问题。
50.发明人经过研究发现，现有技术一般是直接给定一组资产信息构成投资组合，通过调整这一组给定的投资组合中各资产信息所占的比例以实现投资组合的优化，外部市场环境的变化不会改变投资组合中的资产信息构成。但是为了能够在抑制风险的同时，使得收益最大化，则需要考虑外部市场环境的因素，现有的投资组合方法并不能根据外部市场环境动态调整投资组合的资产信息构成和比例，从而导致现有的投资组合生成技术不能长期满足风险低，收益大的需求。
51.基于此，发明人所提供的本技术实施例中，通过利用循环强化学习模型，获得目标市场环境状态，根据所述目标市场环境状态，多个市场资产信息以及目标交易成本，可以获得构成投资组合的多个目标资产信息以及所述多个目标资产信息的权重，进而根据所述多个目标资产信息以及所述多个目标资产信息的权重，生成优化的投资组合。由于本技术实施例能够根据当前市场环境状态动态选择投资组合中的资产信息构成，配置各资产信息所占的比例，实现投资组合的优化。该投资组合生成方法能够适应不同的外部市场环境，能够长期满足投资风险低，收益大的需求。
52.举例来说，本技术实施例的场景之一，可以是应用到如图1所示的场景中。该场景包括信息获取设备101和投资组合生成设备102，信息获取设备101和投资组合生成设备102之间进行交互。
53.信息获取设备101获取目标函数、多个市场资产信息、目标资产信息数量为k、目标环境指标参数和目标交易成本发送至投资组合生成设备 102，投资组合生成设备102将目标环境指标参数输入第一循环强化学习模型，获得目标市场环境状态；所述第一循环强化学习模型是根据历史环境指标参数、历史市场环境状态以及所述目标函数训练得到的；将所述目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第二循环强化学习模型，获得k个目标资产信息以及所述k个目标资产信息的权重；所述k个目标资产信息是从所述多个市场资产信息中选取的，所述第二循环强化学习模型是根据历史市场环境状态、历史市场资产信息、历史交易成本、历史投资资产信息以及所述目标函数训练得到的；根据所述k 个目标资产信息和所述k个目标资产信息的权重，确定所述k个目标资产信息的交易信号，获得优化的投资组合。
54.首先，在上述应用场景中，虽然将本技术实施例提供的实施方式的动作描述由投资组合生成设备102执行；但是，本技术实施例在执行主体方面不受限制，只要执行了本技术实施例提供的实施方式所公开的动作即可。
55.其次，上述场景仅是本技术实施例提供的一个场景示例，本技术实施例并不限于此场景。
56.为了使本技术领域的人员更好地理解本技术方案，下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
57.本技术提供一种投资组合生成的方法，参见图2，该图为本技术实施例提供的一种投资组合生成方法的流程图，包括步骤201～步骤204。
58.步骤201：确定目标函数、多个市场资产信息、目标资产信息数量为k 和目标交易成本。
59.具体地，目标函数的选取影响投资策略，从而通过确定不同的目标函数，可以生成不同的投资组合。通过确定多个市场资产信息、目标资产信息数量为k和目标交易成本，以便后续从所述多个市场资产信息中，获取 k个目标资产信息。
60.进一步地，可以设定目标资产信息数量k＝9。这个目标资产信息数量对于个人投资组合交易而言，是合理、经济且符合现实的。
61.步骤202：将目标环境指标参数输入第一循环强化学习模型，获得目标市场环境状态；所述第一循环强化学习模型是根据历史环境指标参数、历史市场环境状态以及所述目标函数训练得到的。
62.具体地，根据历史环境指标参数、历史市场环境状态以及所述目标函数训练得到第一循环强化学习模型，如式(1)-(3)。
63.g
t
＝{1 exp[-γ(q
t-c)]}-1
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0064]ft
＝y
t,1gt
y
t,2
(1-g
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0065][0066]
其中，c表示体制转换阈值；γ表示转换的平滑性；g
t
代表不同的循环强化学习神经网络的权重，g
t
∈[0,1]；q
t
为指示变量，其主要作用为实现模型能够在不同市场环境之间进行有效转换，以适应不同的市场环境；y
t,1
和 y
t,2
分别表示两个不同的循环强化学习神经网络；r
t
为对数收益率，可以表示为r
t
＝log[pricet/(pricet-1)]；ω
i,j
表示对应的神经网络权重，即神经网络中不同单元之间连接的强度；ν为神经网络的阈值。
[0067]
具体地，目标环境指标参数指能够体现市场风格变化的指标参数，可以是波动率、成交量、日内信息到达率或股票指数等。通过将目标环境指标参数输入第一循环强化学习模型，能够获得目标市场环境状态，以实现根据当前市场环境状态自动转换投资组合生成模式。
[0068]
步骤203：将所述目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第二循环强化学习模型，获得k个目标资产信息以及所述k个目标资产信息的权重；所述k个目标资产信息是从所述多个市场资产信息中选取的，所述第二循环强化学习模型是根据历史市场环境状态、历史市场资产信息、历史交易成本、历史投资资产信息以及所述目标函数训练得到的。
[0069]
具体地，将通过步骤202获得的所述目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第二循环强化学习模型，可以获得构成投资组合的k个目标资产
信息以及所述k个目标资产信息的权重。
[0070]
进一步地，可以从多个市场资产信息选取使得适应度函数值符合预设条件的k个市场资产信息作为目标资产信息，以实现投资组合的优化。
[0071]
由此，投资组合中的资产信息构成及权重配置可以根据市场环境状态的变化进行调整。
[0072]
步骤204：根据所述k个目标资产信息和所述k个目标资产信息的权重，确定所述k个目标资产信息的交易信号，获得优化的投资组合。
[0073]
具体地，如式(4)-(7)：
[0074]ft
＝tanh(x'
t
θ)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0075]
df
t
/dθ＝[1-log sig(x'
t
θ)2]
×
(x
t
θ
m 2
df
t-1
/dθ)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0076]fit
＝logsig(x'
it
θi)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0077]fit
＝softmax(f
it
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0078]
其中，f
t
为激活函数，θ表示训练模型的一系列参数，x
t
为一个向量，m表示交易周期，i表示目标资产信息，f
it
表示在时刻t对目标资产信息i 的动作，f
it
为目标资产信息i的交易信号。
[0079]
根据从多个市场资产信息中挑选出的k个目标资产信息，和所述k个目标资产信息的权重生成相应的交易信号，从而产生优化的投资组合。
[0080]
综上所述，本技术通过利用循环强化学习模型，获得目标市场环境状态，根据所述目标市场环境状态，多个市场资产信息以及目标交易成本，可以获得构成投资组合的多个目标资产信息以及所述多个目标资产信息的权重，进而根据所述多个目标资产信息以及所述多个目标资产信息的权重，生成优化的投资组合。由于本技术中考虑了市场环境对投资组合的目标资产信息构成及比例的影响，能够根据当前市场环境状态动态选择投资组合中的资产信息构成，配置各资产信息所占的比例，以实现投资组合的优化。该投资组合方式能够适应不同的外部市场环境，能够长期满足投资风险低，收益大的需求。
[0081]
在本技术一实施例中，上述步骤201中，所述目标函数可以通过以下方式确定：
[0082]
根据用户的风险偏好，确定所述目标函数。
[0083]
具体地，投资收益的增加会伴随着更大的风险，根据用户的风险偏好，确定所述目标函数，意味着将风险因素增加到投资组合优化的过程中，以满足不同投资者的投资需要。
[0084]
在本技术一实施例中，参见图3，该图为本技术实施例提供的一种确定目标函数的流程图，上述根据用户的风险偏好，确定所述目标函数，可以通过步骤301～步骤302实现：
[0085]
步骤301：判断所述用户的风险偏好为对波动性敏感或对波动性非敏感。
[0086]
具体地，以从衡量投资组合绩效指标中选取的两个比较常用且具有代表性的收益-风险指标，夏普比率和卡玛比率为例，如果用户注重投资的稳健性，厌恶市场波动率，认为任何形式的波动都会为自己带来不利的影响，可以判定此类用户的风险偏好为对波动性敏感；而如果用户更在意市场下行风险而不太在意市场上行带来的波动，可以判定此类用户的风险偏好为对波动性非敏感。
[0087]
步骤302：若所述用户的风险偏好为对波动性敏感，确定所述目标函数为第一目标函数；若所述用户的风险偏好为对波动性非敏感，确定所述目标函数为第二目标函数。
[0088]
具体地，根据上述判断结果，可以为所述用户确定相应的目标函数，进而生成不同
的投资组合，以满足所述用户的投资需要。同样以夏普比率和卡玛比率为例，对于注重投资的稳健性，厌恶市场波动率，认为任何形式的波动都会为自己带来不利的影响的用户，可以选择夏普比率作为目标函数；对于更在意市场下行风险而不太在意市场上行带来的波动的用户，可以选择卡玛比率作为目标函数。
[0089]
综上所述，将风险因素增加到投资组合优化的过程中，根据用户的风险偏好，确定所述目标函数，可以满足不同投资者的投资需要。
[0090]
在本技术一实施例中，参见图4，该图为本技术实施例提供的一种平仓止损机制的流程图，上述步骤204之后，还包括步骤401～步骤404。
[0091]
步骤401：若所述投资组合的收益与风险的比值小于或等于止损阈值，则触发平仓止损机制。
[0092]
具体地，在每次交易决策的最后阶段加入动态止损机制，如式(8)所示：
[0093]rt-1
/σ
t-1
≤-n
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0094]
其中，r
t-1
为到时间点t-1的累计收益，而σ
t-1
为到时间点t-1的累计收益的移动波动率，n为触发动态止损机制的波动日的天数。
[0095]
若所述投资组合的收益与风险的比值小于或等于止损阈值，则触发平仓止损机制。重新训练循环强化学习模型，模型参数也将被更新。
[0096]
步骤402：根据所述平仓止损机制，将所述目标环境指标参数输入第三循环强化学习模型，获得更新后的目标市场环境状态；所述第三循环强化学习模型是根据更新后的历史环境指标参数、更新后的历史市场环境状态以及所述目标函数训练得到的。
[0097]
触发平仓止损机制之后，将所述目标环境指标参数输入第三循环强化学习模型，获得更新后的目标市场环境状态。
[0098]
步骤403：将所述更新后的目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第四循环强化学习模型，获得k个更新后的目标资产信息以及所述k个更新后的目标资产信息的权重；所述k个更新后的目标资产信息是从所述多个市场资产信息中选取的，所述第四循环强化学习模型是根据更新后的历史市场环境状态、更新后的历史市场资产信息、更新后的历史交易成本、更新后的历史投资资产信息以及所述目标函数训练得到的。
[0099]
步骤404：根据所述k个更新后的目标资产信息和所述k个更新后的目标资产信息的权重，确定所述k个更新后的目标资产信息的交易信号，获得优化的投资组合。
[0100]
综上所述，本技术通过增加平仓止损机制，使得用户在投资过程中出现亏空时，可以及时止损出局；没有出现亏空的情况下，可以最大程度的继续获取盈利。
[0101]
本技术还提供了一种投资组合生成的装置，参见图5，该图为本技术实施例提供的一种投资组合生成装置的结构示意图，其具体实现方式与上述方法的实施例中记载的实施方式、所达到的技术效果一致，部分内容不再赘述。
[0102]
一种投资组合生成的装置1100，包括：
[0103]
第一确定模块1101，用于确定目标函数、多个市场资产信息、目标资产信息数量为k和目标交易成本；
[0104]
第一获得模块1102，用于将目标环境指标参数输入第一循环强化学习模型，获得目标市场环境状态；所述第一循环强化学习模型是根据历史环境指标参数、历史市场环境
状态以及所述目标函数训练得到的；
[0105]
第二获得模块1103，将所述目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第二循环强化学习模型，获得k个目标资产信息以及所述k个目标资产信息的权重；所述k个目标资产信息是从所述多个市场资产信息中选取的，所述第二循环强化学习模型是根据历史市场环境状态、历史市场资产信息、历史交易成本、历史投资资产信息以及所述目标函数训练得到的；
[0106]
第二确定模块1104，用于根据所述k个目标资产信息和所述k个目标资产信息的权重，确定所述k个目标资产信息的交易信号，获得优化的投资组合。
[0107]
本技术提供的装置，通过利用循环强化学习模型，获得目标市场环境状态，根据所述目标市场环境状态，多个市场资产信息以及目标交易成本，可以获得构成投资组合的多个目标资产信息以及所述多个目标资产信息的权重，进而根据所述多个目标资产信息以及所述多个目标资产信息的权重，生成优化的投资组合。由于本技术中考虑了市场环境对投资组合的目标资产构成及资产比例的影响，能够根据当前市场环境状态动态选择投资组合中的资产构成，配置各资产所占的比例，以实现投资组合的优化。该投资组合方式能够适应不同的外部市场环境，能够长期满足投资风险低，收益大的需求。
[0108]
在本技术一实施例中，所述第一确定模块1101，用于将所述目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第二循环强化学习模型，得到使得适应度函数值符合预设条件的k个目标资产信息以及所述k个目标资产信息的权重。
[0109]
在本技术一实施例中，所述第一确定模块1101，用于根据用户的风险偏好，确定所述目标函数；确定多个市场资产信息、目标资产信息数量为k 和目标交易成本。
[0110]
在本技术一实施例中，所述第一确定模块1101，用于若所述用户的风险偏好为对波动性敏感，确定所述目标函数为第一目标函数；若所述用户的风险偏好为对波动性非敏感，确定所述目标函数为第二目标函数；确定多个市场资产信息、目标资产信息数量为k和目标交易成本。
[0111]
在本技术一实施例中，所述装置，还包括触发模块1105；
[0112]
所述触发模块1105，用于若所述投资组合的收益与风险的比值小于或等于止损阈值，则触发平仓止损机制；
[0113]
所述第一获得模块1102，还用于根据所述平仓止损机制，将所述目标环境指标参数输入第三循环强化学习模型，获得更新后的目标市场环境状态；所述第三循环强化学习模型是根据更新后的历史环境指标参数、更新后的历史市场环境状态以及所述目标函数训练得到的；
[0114]
所述第二获得模块1103，还用于将所述更新后的目标市场环境状态，所述多个市场资产信息以及所述目标交易成本输入第四循环强化学习模型，获得k个更新后的目标资产信息以及所述k个更新后的目标资产信息的权重；所述k个更新后的目标资产信息是从所述多个市场资产信息中选取的，所述第四循环强化学习模型是根据更新后的历史市场环境状态、更新后的历史市场资产信息、更新后的历史交易成本、更新后的历史投资资产信息以及所述目标函数训练得到的；
[0115]
所述第二确定模块1104，还用于根据所述k个更新后的目标资产信息和所述k个更新后的目标资产信息的权重，确定所述k个更新后的目标资产信息的交易信号，获得优化的
投资组合。
[0116]
本技术实施例中，通过增加平仓止损机制，使得用户在投资过程中出现亏空时，可以及时止损出局；没有出现亏空的情况下，可以最大程度的继续获取盈利。
[0117]
本技术还提供了一种计算机设备，所述计算机设备包括处理器以及存储器：所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；所述处理器用于根据所述程序代码中的指令执行上述的一种投资组合生成的方法的步骤。
[0118]
本技术还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上所述的一种投资组合生成的方法的步骤。
[0119]
该计算机可读存储介质可以包括：u盘、移动硬盘、只读存储器 (read-only memory，rom)、随机存取存储器(random access memory， ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0120]
需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备及存储介质实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置、设备及存储介质实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元提示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。
[0121]
以上所述，仅为本技术的一种具体实施方式，但本技术的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本技术揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本技术的保护范围之内。因此，本技术的保护范围应该以权利要求的保护范围为准。
[0122]
需要说明的是，本发明提供的一种投资组合生成方法、装置、设备及存储介质可用于人工智能领域、区块链领域、分布式领域、云计算领域、大数据领域、物联网领域、移动互联领域、网络安全领域、芯片领域、虚拟现实领域、增强现实领域、全息技术领域、量子计算领域、量子通信领域、量子测量领域、数字孪生领域或金融领域。上述仅为示例，并不对本发明提供的一种投资组合生成的方法、装置、设备及存储介质的应用领域进行限定。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种发动机涡轮叶片质量检测的分析计算方法与流程

一种投资组合生成的方法、装置、设备及存储介质与流程

相关文献

最热文献