一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种数据处理的方法、装置、存储介质及计算机程序产品与流程

2022-12-19 23:20:10 来源:中国专利 TAG:


1.本发明涉及机器学习技术领域,尤其是涉及一种数据处理的方法、装置、存储介质及计算机程序产品。


背景技术:

2.随着对投资风险的管控要求越来越高,各资产管理机构通常需要对其理财产品的投资集中度进行预警,并根据预警调整投资结构,来实现风控管理。
3.对理财产品进行风险管理一方面要使理财产品符合金融监管要求,另一方面又要最大化提高理财产品的资产流动性、交易成功率、投资收益率。现有的管控规则中,以投资集中度作为最核心的管控因素,然而现有技术中通常只能对单一理财产品的投资集中度进行预警,并且投资集中度处理方法大多依赖于专家经验和事后补偿机制,这导致投资集中度预警的准确率不高。
4.鉴于此,如何高效、准确的对投资集中度进行预警,成为一个亟待解决的技术问题。


技术实现要素:

5.本发明提供一种数据处理的方法、装置、存储介质及计算机程序产品,用以解决现有技术中存在的投资集中度预警不够高效、准确的技术问题。
6.第一方面,为解决上述技术问题,本发明实施例提供的一种数据处理的方法的技术方案如下:
7.获取资产管理机构管理的每个投资理财产品中与投资集中度相关的关联数据集;
8.对所述关联数据集进行归一化处理,并用每个投资理财产品中每个业务所属业务品种上次使用的预测模型,根据对应投资理财产品归一化处理后的关联数据集预测当前对应投资理财产品中各业务投资集中度的第一预警阈值;其中,预设模型是基于集成学习投票算法训练得到的;
9.根据每个投资理财产品中所有业务的第一预警阈值及所述资产管理机构中不同投资层级对应的权重,构建所述资产管理体系的多层投资预警体系;其中,所述第一预警阈值对应所述多层投资预警体系的底层预警;
10.用所述多层投资预警体系,对所述资产管理机构中不同层级对应的投资集中度进行预警。
11.一种可能的实施方式,获取资产管理机构管理的每个投资理财产品中与投资集中度相关的关联数据集,包括:
12.采集所述资产管理机构中每个投资理财产品对应的投资交易流水数据;并按所述业务品种,从所述投资交易流水数据中提取每个业务品种对应的投资交易特征数据;
13.采集每个投资理财产品的产品基础信息;
14.采集所述每个投资理财产品中单一业务品种的集中度占比数据;
15.采集每个业务品种的监管条款数据;
16.采集同业发布的资产比例数据;
17.将所述投资交易特征数据、所述监管条款数据、所述产品基础信息、所述集中度占比数据、所述同业发布的资产比例数据,构建为所述关联数据集。
18.一种可能的实施方式,对所述关联数据集进行归一化处理,包括:
19.按所述业务品种包含的投资交易特征,构建成由所述业务品种包含的所有投资交易特征的数据组成的一维数组,并作为第一数据集;
20.将所述每个投资理财产品的各业务品种的资产估值占比构建为第二数据集;
21.将所述每个投资理财产品的产品类型与对应的监管数据构建为由二维数组组成的第三数据集;
22.将所述每个投资理财产品对应的同业发布的资产占比数据,作为对应投资理财产品的预测模型的参考影响因子,构建为第四数据集;
23.对所述第一数据集、所述第二数据集、所述第三数据集、所述第四数据集分别进行归一化处理;
24.将归一化后的第一数据集、归一化后的第二数据集、归一化后的第三数据集、归一化后的第四数据集分别与对应的预设参考权重进行积运算,得到归一化处理后的第一数据集、归一化处理后的第二数据集、归一化处理后的第三数据集、归一化处理后的第四数据集。
25.一种可能的实施方式,所述预测模型的获得方式,包括:
26.获取所述业务品种的历史关联数据集;
27.对所述历史关联数据集进行归一化处理;
28.将归一化处理后的历史关联数据集,按预设比例分为训练集和验证集;
29.用训练集对由集成学习投票算法构建的分类业务预警模型进行训练,并用验证集对训练后的分类业务预警模型进行验证,直至训练后的分类业务预警模型预测对应业务品种的集中度预警阈值的准确率达到设定值,获得所述业务品种的训练好的预测模型。
30.一种可能的实施方式,根据所有业务品种的第一预警阈值及所述资产管理机构中不同投资层级对应的权重,构建所述资产管理体系的多层投资预警体系,包括:
31.根据所述每个投资理财产品中各业务的第一预警阈值及每个投资理财产品中每个业务品种的频率权重,确定每个投资理财产品的投资集中度的第二预警阈值;
32.根据所述每个投资理财产品的第二预警阈值及资产管理机构中各投资理财产品的规模权重,确定所述资产管理机构的投资集中度的第三预警阈值;
33.根据所述第一预警阈值、第二预警阈值、第三预警阈值,构建所述多层投资预警体系。
34.一种可能的实施方式,用所述多层投资预警体系,对所述资产管理机构中不同层级对应的投资集中度进行预警之后,还包括:
35.获取使用所述多层预警体系期间产生的关联数据集;
36.对使用所述多层预警体系后产生的关联数据集进行关联性分析,获得与所述多层预警体系触发告警的告警关联数据集正相关且未触发告警的未告警关联数据集;
37.用所述已告警关联数据集,及所述未触告警关联数据集,对所述上次使用的预测
模型进行迭代训练,获得迭代后的预测模型,并更新第一预警阈值、第二预警阈值、第三预警阈值。
38.一种可能的实施方式,对使用所述多层预警体系期间产生的关联数据集进行关联性分析,获取与所述多层预警体系触发告警的告警关联数据集正相关且未触发告警的未告警关联数据集,包括:
39.将使用所述多层预警体系期间产生的关联数据集为已告警关联数据集和未告警数据集;
40.计算所述已告警数据集中已告警关联数据与所述未告警数据集中未告警关联数据之间的余弦相似度;
41.将余弦相似度大于设定阈值对应的未告警关联数据作为对应已告警关联数据的正相关数据;
42.将所有正相关数据组成的集合确定为所述未告警关联数据集。
43.第二方面,本发明实施例提供了一种数据处理的装置,包括:
44.获取单元,用于获取资产管理机构管理的每个投资理财产品中与投资集中度相关的关联数据集;
45.处理单元,用于对所述关联数据集进行归一化处理,并用每个投资理财产品中每个业务所属业务品种上次使用的预测模型,根据对应投资理财产品归一化处理后的关联数据集预测当前对应投资理财产品中各业务投资集中度的第一预警阈值;其中,预设模型是基于集成学习投票算法训练得到的;
46.构建单元,用于根据每个投资理财产品中所有业务的第一预警阈值及所述资产管理机构中不同投资层级对应的权重,构建所述资产管理体系的多层投资预警体系;其中,所述第一预警阈值对应所述多层投资预警体系的底层预警;
47.预警单元,用于用所述多层投资预警体系,对所述资产管理机构中不同层级对应的投资集中度进行预警。
48.一种可能的实施方式,所述获取单元还用于:
49.采集所述资产管理机构中每个投资理财产品对应的投资交易流水数据;并按所述业务品种,从所述投资交易流水数据中提取每个业务品种对应的投资交易特征数据;
50.采集每个投资理财产品的产品基础信息;
51.采集所述每个投资理财产品中单一业务品种的集中度占比数据;
52.采集每个业务品种的监管条款数据;
53.采集同业发布的资产比例数据;
54.将所述投资交易特征数据、所述监管条款数据、所述产品基础信息、所述集中度占比数据、所述同业发布的资产比例数据,构建为所述关联数据集。
55.一种可能的实施方式,所述处理单元还用于:
56.按所述业务品种包含的投资交易特征,构建成由所述业务品种包含的所有投资交易特征的数据组成的一维数组,并作为第一数据集;
57.将所述每个投资理财产品的各业务品种的资产估值占比构建为第二数据集;
58.将所述每个投资理财产品的产品类型与对应的监管数据构建为由二维数组组成的第三数据集;
59.将所述每个投资理财产品对应的同业发布的资产占比数据,作为对应投资理财产品的预测模型的参考影响因子,构建为第四数据集;
60.对所述第一数据集、所述第二数据集、所述第三数据集、所述第四数据集分别进行归一化处理;
61.将归一化后的第一数据集、归一化后的第二数据集、归一化后的第三数据集、归一化后的第四数据集分别与对应的预设参考权重进行积运算,得到归一化处理后的第一数据集、归一化处理后的第二数据集、归一化处理后的第三数据集、归一化处理后的第四数据集。
62.一种可能的实施方式,所述构建单元还用于:
63.获取所述业务品种的历史关联数据集;
64.对所述历史关联数据集进行归一化处理;
65.将归一化处理后的历史关联数据集,按预设比例分为训练集和验证集;
66.用训练集对由集成学习投票算法构建的分类业务预警模型进行训练,并用验证集对训练后的分类业务预警模型进行验证,直至训练后的分类业务预警模型预测对应业务品种的集中度预警阈值的准确率达到设定值,获得所述业务品种的训练好的预测模型。
67.一种可能的实施方式,所述构建单元还用于:
68.根据所述每个投资理财产品中各业务的第一预警阈值及每个投资理财产品中每个业务品种的频率权重,确定每个投资理财产品的投资集中度的第二预警阈值;
69.根据所述每个投资理财产品的第二预警阈值及资产管理机构中各投资理财产品的规模权重,确定所述资产管理机构的投资集中度的第三预警阈值;
70.根据所述第一预警阈值、第二预警阈值、第三预警阈值,构建所述多层投资预警体系。
71.一种可能的实施方式,所述构建单元还用于:
72.在用所述多层投资预警体系,对所述资产管理机构中不同层级对应的投资集中度进行预警之后,获取使用所述多层预警体系期间产生的关联数据集;
73.对使用所述多层预警体系后产生的关联数据集进行关联性分析,获得与所述多层预警体系触发告警的告警关联数据集正相关且未触发告警的未告警关联数据集;
74.用所述已告警关联数据集,及所述未触告警关联数据集,对所述上次使用的预测模型进行迭代训练,获得迭代后的预测模型,并更新第一预警阈值、第二预警阈值、第三预警阈值。
75.一种可能的实施方式,所述构建单元还用于:
76.将使用所述多层预警体系期间产生的关联数据集为已告警关联数据集和未告警数据集;
77.计算所述已告警数据集中已告警关联数据与所述未告警数据集中未告警关联数据之间的余弦相似度;
78.将余弦相似度大于设定阈值对应的未告警关联数据作为对应已告警关联数据的正相关数据;
79.将所有正相关数据组成的集合确定为所述未告警关联数据集。
80.第三方面,本发明实施例还提供一种数据处理的装置,包括:
81.至少一个处理器,以及
82.与所述至少一个处理器连接的存储器;
83.其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如上述第一方面所述的方法。
84.第四方面,本发明实施例还提供一种可读存储介质,包括:
85.存储器,
86.所述存储器用于存储指令,当所述指令被处理器执行时,使得包括所述可读存储介质的装置完成如上述第一方面所述的方法。
87.第五方面,本发明实施例还提供一种计算机程序产品,包含有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面所述的方法。
88.通过本发明实施例的上述一个或多个实施例中的技术方案,本发明实施例至少具有如下技术效果:
89.在本发明提供的实施例中,通过获取资产管理机构管理的每个业务品种中与投资集中度相关的关联数据集;对关联数据集进行归一化处理,并用每个投资理财产品中每个业务所属业务品种上次使用的预测模型,根据归一化处理后的关联数据集预测当前对应投资理财产品中各业务投资集中度的第一预警阈值;其中,预设模型是基于集成学习投票算法训练得到的,这样可以根据不同的业务品种用集成学习投票算法构建对应的预测模型,并用最新迭代后的预测模型预测对应业务投资集中度的第一预警阈值;进而根据投资理财产品中所有业务的第一预警阈值及资产管理机构中不同投资层级对应的权重,构建资产管理体系的多层投资预警体系;其中,第一预警阈值对应多层投资预警体系的底层预警;用多层投资预警体系,对资产管理机构中不同层级对应的投资集中度进行预警。从而自适应的调整多层投资预警体系中不同层级的投资集中度的预警阈值,提高集中度风险预警的准确性,降低资产管理机构中各层级触发集中度风险的概率,并提高投资成功率,使资产管理机构管理的投资理财产品具有更好的流动性。同时,由于上述多层投资预警体系不依赖于人工经验和事后补偿的集中度控制,也不再局限于单一业务品种或产品,因此能够全面的对资产管理机构的不同层级进行集中度控制,提高集中度风险管理的效率。
附图说明
90.图1为本发明实施例提供的一种数据处理方法的流程图;
91.图2为本发明实施例提供的多层预警体系的结构示意图;
92.图3为本发明实施例提供的迭代预测模型及更新多层预警体系的示意图;
93.图4为本发明实施例提供的一种数据处理装置的结构示意图。
具体实施方式
94.本发明实施列提供一种数据处理的方法、装置、存储介质及计算机程序产品,用以解决现有技术中存在的投资集中度预警不够高效、准确的技术问题。申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
95.为了更好的理解上述技术方案,下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详
细的说明,而不是对本发明技术方案的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互组合。
96.请参考图1,本发明实施例提供一种数据处理的方法,该方法的处理过程如下。
97.步骤101:获取资产管理机构管理的每个投资理财产品中与投资集中度相关的关联数据集。
98.资产管理机构可以是证券公司、保险资产管理公司、公募基金公司、私募基金公司等,具体不做限制。投资理财产品可以包括一个或多个业务,每个业务属于一个业务品种,业务品种可以包括股票、基金、债券、期货、期权、现金存款、回购、非标准资产等。
99.在一些实施例中,获取资产管理机构管理的每个投资理财产品中与投资集中度相关的关联数据集,可以通过下列方式实现:
100.采集所述资产管理机构中每个投资理财产品对应的投资交易流水数据;并按业务品种,从所述投资交易流水数据中提取每个业务品种对应的投资交易特征数据。
101.投资理财产品中各业务对应的投资交易流水数据,按业务所属的业务品种,形成对应业务品种的投资交易流水,并从中提取对应业务品种的投资交易特征数据,投资交易特征数据例如可以是交易价格、交易数量等。
102.采集每个投资理财产品的产品基础信息。
103.投资理财产品的产品基础信息,包括投资理财产品的产品类型数据、产品押品数据,产品投资方向信息等。其中,产品类型数据包括现金管理类投资理财产品、权益类投资理财产品、固收类投资理财产品、货币基金类投资理材产品等等。
104.采集所述每个投资理财产品中单一业务品种的集中度占比数据。
105.投资理财产品中单一业务品种的集中度占比数据,包括:单一产品投资债券集中度占比,单一产品投资权益类证券集中度占比,单一产品投资现金类资产集中度占比,机构投资银行大额存单集中度占比等等。
106.上述投资交易流水数据、产品基础信息、单一业务品种的集中度占比数据等内部数据,可以通过登录对应资产管理机构的服务器数据库获取,如登录资产管理机构的服务器从其中的数据库中获取股票、债券、基金、回购、投标、期货、期权、现金存款、非标准资产等业务品种的投资流水、成交流水和理财产品资产明细披露流水数据等。
107.采集每个业务品种的监管条款数据;
108.采集同业发布的资产比例数据,如同业各投资理财产品期限内披露的精致、投资理财产品投资资产类型占比、违规处罚明细信息等等。
109.上述监管条款数据、同业发布资产比例等外部数据,可以通过接口调用、邮件网络光学字符识别(optical character recognition,ocr)识别等方式获取。
110.需要理解的是,不同资产管理机构提供的投资理财产品不同,相应的构成上述关联数据集也存在差异,不能理解为关联数据集包括上述示例中的所有类型。
111.将所述投资交易特征数据、所述监管条款数据、所述产品基础信息、所述集中度占比数据、所述同业发布的资产比例数据,构建为所述关联数据集。
112.在采集得到上述关联数据集后,便可执行步骤102。
113.步骤102:对关联数据集进行归一化处理,并用每个投资理财产品中每个业务所属上次使用的预测模型,根据对应投资理财产品归一化处理后的关联数据集预测当前对应投
资理财产品中各业务品种的投资集中度的第一预警阈值;其中,预设模型是基于集成学习投票算法训练得到的。
114.对关联数据集进行归一化处理,可以通过下列方式实现:
115.按业务品种包含的投资交易特征,构建由业务品种包含的所有投资交易特征的数据组成的一维数组,并作为第一数据集;如,业务品种1为股票,股票的所有投资交易特征包括成交价格、成交数量等,这些投资交易特征的数据构成一个一维数组[a1,a2,..,an],该一维数组可以称之为业务品种1的第一数据集a,其中,a1为业务品种1的投资交易特征1的数据(可以称之为投资交易特征数据1),a2为业务品种1的投资交易特征2的数据(可以成为投资交易特征数据2),

,an为业务品种2的投资交易特征n的数据(可以诚挚为投资交易特征数据n)。
[0116]
将各投资理财产品的各业务品种的资产估值占比构建为第二数据集;如投资理财产品包括业务品种a1~业务品种an,将业务品种a1~业务品种an的资产估计值占比构建为第二数据集b。
[0117]
将每个投资理财产品的产品类型与对应的监管数据构建为由二维数组组成的第三数据集;如将产品类型作为二维数组的横向数据,产品类型对应的监管数据作为纵向数据,这样便能构建出第三数据集c[m’][n’],m’为二维数组的行数、n’为二维数组的列数。
[0118]
将每个投资理财产品对应的同业发布的资产占比数据作为预测模型的参考影响因子,构建为第四数据集(假设记为d);
[0119]
针对每个投资理财产品,对第一数据集(a)、第二数据集(b)、第三数据集(c)、第四数据集(d)分别进行归一化处理;
[0120]
将归一化后的第一数据集(记为a’)、归一化后的第二数据集(记为b’)、归一化后的第三数据集(记为c’)、归一化后的第四数据集(记为d’)分别与对应的预设参考权重进行积运算,得到归一化处理后的第一数据集、归一化处理后的第二数据集、归一化处理后的第三数据集、归一化处理后的第四数据集。
[0121]
如归一化后的第一数据集(记为a’)、归一化后的第二数据集(记为b’)、归一化后的第三数据集(记为c’)对应的预设权重均为产管理机构的内部权重(记为w1),归一化后的第四数据集(记为d’)对应的预设权重为同业参考权重(记为w2),通常w1》w2,如w1可以设置为0.8,w2可以设置为0.2。
[0122]
将a’、b’、c’分别与w1相乘便能得到归一化后的第一数据集(a
’×
w1)、归一化后的第二数据集(b
’×
w1)、归一化后的第三数据集(c
’×
w1),将d’与w2相乘便能得到归一化后的第四数据集(d
’×
w2)。
[0123]
当然,也可以先将a、b、c分别与w1相乘,d与w2相乘,再对得到各个相乘结果进行归一化处理,得到归一化处理后的第一数据集、归一化处理后的第二数据集、归一化处理后的第三数据集、归一化处理后的第四数据集,这些数据集构成对应投资理财产品归一化处理后的关联数据集。
[0124]
在得到对应业务品种归一化处理后的关联数据集后,便可以用对应业务品种上次使用的预测模型,根据对应投资理财产品归一化处理后的数据集预测当前对应投资产品中各业务投资集中度的第一预警阈值。
[0125]
上述每个业务品种的预测模型可以通过下列方式获得:
[0126]
获取每个业务品种的历史关联数据集;对每个业务品种的历史关联数据集进行归一化处理;将归一化处理后的历史关联数据集,按预设比例分为训练集和验证集;用训练集对由集成学习投票算法构建的分类业务预警模型进行训练,并用验证集对训练后的分类业务预警模型进行验证,直至训练后的分类业务预警模型预测对应业务品种的集中度预警阈值的准确率达到设定值,获得对应业务品种训练好的预测模型(即业务品种的预测模型)。
[0127]
例如,预设比例为9:1,设定值为90%,按前述关联数据集的获取方式,获取业务品种1在指定历史时间对应的历史关联数据集,并按对前述关联数据集进行归一化处理的方式,对业务品种1的历史关联数据集进行归一化处理,得到归一化处理后的历史关联数据集,进而将归一化处理后的历史关联数据集按9:1分为训练集和验证集,然后用训练集对由集成学习投票算法构建的分类业务预警模型进行训练,得到训练后的分类业务预警模型,用验证集对训练后的分类业务预警模型进行验证,直至训练后的分类业务预警模型预测对应业务品种的集中度预警阈值的准确率达到90%,得到业务品种1的训练好的预测模型。使用业务品种1训练好的预测模型根据业务品种1对应归一化处理后的关联数据,预测业务品种1的第一预警值。对于资产管理机构包括的其它业务品种对应的预测模型的训练方式与上述方式类似不再一一赘述。
[0128]
在另一些实施例中,对于非首次预测,可以使用上次使用的预测模型根据归一化处理后的关联数据,预测对应业务品种当前次对应第一预警值。这样可以提高预测的准确度。上次使用的预测模型可以是初次训练后得到的预测模型,也可以是上次使用的预测模型,具体迭代后的预测模型的获得方式在后续介绍。
[0129]
在获得每个投资理财产品中各业务的第一预警阈值之后,便可执行步骤103。
[0130]
步骤103:根据每个投资理财产品中所有业务的第一预警阈值及资产管理机构中不同投资层级对应的权重,构建资产管理体系的多层投资预警体系;其中,第一预警阈值对应多层投资预警体系的底层预警。
[0131]
步骤104:用多层投资预警体系,对资产管理机构中不同层级对应的投资集中度进行预警。
[0132]
在步骤103中,根据每个投资理财产品中所有业务的第一预警阈值及资产管理机构中不同投资层级对应的权重,构建资产管理体系的多层投资预警体系,可以通过下列方式实现:
[0133]
根据每个投资理财产品中各业务品种的第一预警阈值及每个投资理财产品投资中每个业务品种的频率权重,确定每个投资理财产品投资集中度的第二预警阈值;根据每个投资理财产品的第二预警阈值及资产管理机构中各投资理财产品的规模权重,确定资产管理机构的投资集中度的第三预警阈值;根据第一预警阈值、第二预警阈值、第三预警阈值,构建多层投资预警体系。
[0134]
请参见图2为本发明实施例提供的多层预警体系的结构示意图。
[0135]
如图2所示,一资产管理机构管理有多个投资理财产品,投资理财产品包括多个业务(业务1、业务2

),所有投资理财产品包含的业务可以被分为n种业务品种(业务品种1~业务品种n),每个业务品种具有对应的预测模型,这些预测模型都是采用对应业务品种的关联数据集对集成学习投票算法进行训练得到的,用投资理财产品中的业务对应的预测模型根据对应业务的关联数据,可以预测对应业务投资集中度的第一预警阈值,在预测出每
个投资理财产品中每个业务的第一预警阈值后,结合每个业务品种的频率权重进行加权计算,可以得到对应投资理财产品投资集中度的第二预警阈值;在得到资产管理机构管理的每个投资理财产的第二预警阈值后,结合每个投资理财产品的规模权重进行加权计算,可以得到此资产管理机构投资集中度的第三预警阈值,这样就能将上述各业务投资集中度的第一预警阈值(属于第一层级预警阈值即底层预警)、各投资理财产品投资集中度的第二预警阈值(属于第二层级预警阈值)、资产管理机构投资集中度的第三预警阈值(属于第三层级预警阈值),构建成多层预警体系。
[0136]
例如,假设资产管理机构a管理的投资理财产品包括投资理财产品1、投资理财产品2、投资理财产品3,投资理财产品1包括业务1、业务2、业务3,它们依次所属的业务品种为股票、债券、回购,投资理财产品2包括业务4、业务5、业务6,它们依次所属的业务品种为期货、期权、现金存款,投资理财产品3包括业务7、业务8、业务9,它们依次所属的业务品种为基金、现金存款、债券。采用股票对应的上次使用的预测模型根据业务1的关联数据集,预测业务1投资集中度的第一预警阈值k1,采用债券对应的上次使用的预测模型根据业务2的关联数据集,预测业务2投资集中度的第一预警阈值k2,采用回购对应的上次使用的预测模型根据业务3的关联数据集,预测业务3投资集中度的第一预警阈值k3;同理可以得到其余投资理财产品包含业务的投资集中度的第一预警阈值,在此不再一一赘述。
[0137]
若股票、债券、回购的频率权重依次为m1、m2、m3,将上述频率权重与投资理财产品1包含的业务对应第一预警阈值进行加权计算,得到投资理财产品1投资集中度的第二预警阈值(记为p1,p1=k1
×
m1 k2
×
m2 k3
×
m3);同理可以得到其余投资理财产品投资集中度的第二预警阈值,在此不再赘述,将投资理财产品2投资集中度的第二预警阈值记为p2,投资理财产品3投资集中度的第二预警阈值记为p3。
[0138]
若投资理财产品1、投资理财产品2、投资理财产品3的规模权重依次为n1、n2、n3,则结合上述各投资理财产品投资集中度的第二预警阈值进行加权计算,可以得到资产管理机构a投资集中度的第三预警阈值(p1
×
n1 p2
×
n2 p3
×
n3)。
[0139]
这样通过上述各业务对应的第一预警阈值、各投资理财产品对应的第二预警阈值、资产管理机构对应的第三预警阈值,便构建出资产管理机构a的多层投资预警体系。
[0140]
在构建出上述多层投资预警体系后,便可用上述多层投资预警体系对资产管理机构中不同层级对应的投资集中度进行预警,如业务超出对应的第一预警阈值后可以发出告警信息提示相关人员及时处理。告警信息包括在显示屏上弹出提示窗、声光报警、向对应的管理人员发送短信息等,具体以何种形式发出告警信息在此不做限定。
[0141]
在用多层预警体系对资产管理机构中不同层级对应的投资集中度进行预警之后,还可以根据预警信息迭代上次使用的预测模型,并更新多层预警体系,具体可以通过下列方式实现:
[0142]
获取使用多层预警体系期间产生的关联数据;对使用多层预警体系期间产生的关联数据进行关联性分析,获得使用多层预警体系触发告警的告警关联数据正相关且未触发告警的未告警关联数据;用告警关联数据,及未告警关联数据,对上次使用的预测模型进行迭代训练,获得迭代后的预测模型,并更新第一预警阈值、第二预警阈值、第三预警阈值。
[0143]
在一些实施例中,对多层预警体系触发告警的数据进行关联性分析,获取与多层预警体系触发告警的告警关联数据正相关且未触发告警的未告警关联数据,可以通过下列
方式实现:
[0144]
将使用多层预警体系期间产生的关联数据分为已告警关联数据集和未告警数据集;计算已告警关联数据集中已告警关联数据与未告警数据集中未告警关联数据之间的余弦相似度;将余弦相似度大于设定阈值对应的未告警关联数据作为对应已告警关联数据的正相关数据;将所有正相关数据组成的集合确定为未告警关联数据集。
[0145]
在一些实施例中,计算已告警关联数据集中已告警关联数据与未告警数据集中未告警关联数据之间的余弦相似度,可以通过下列方式实现:
[0146]
提取已告警关联数据和未告警关联数据各自的投资交易特征数据,计算每个已告警关联数据对应的投资交易特征数据,与未告警数据集中每个未告警关联数据对应的投资交易特征数据的余弦相似度,余弦相似度的计算公式如下:
[0147][0148]
其中,cosθ为余弦相似度,取值范围为[0,1],a为未告警关联数据对应的投资交易特征数据,b为已告警关联数据对应的投资交易特征数据,n为未告警关联数据与已告警关联数据包含的投资交易特征的总数,ai为未告警关联数据的投资交易特征数据中的第i条投资交易特征的数据,bi为已告警关联数据中第i条投资交易特征的数据,i的取值范围为[1,n]。
[0149]
请参见图3为本发明实施例提供的迭代预测模型及更新多层预警体系的示意图。
[0150]
步骤301:获取多层预警体系。
[0151]
步骤302:实时采集实时关联数据。
[0152]
步骤303:用多层预警体系中各层级对应的预警阈值判断实时关联数据对应的业务是否告警。
[0153]
步骤304a:若为是,则获取已告警关联数据的投资交易特征数据。
[0154]
将用多层投资体系确定出已告警业务对应的实时关联数据作为已告警关联数据,所有已告警关联数据组成的集合即为已告警关联数据集。
[0155]
步骤304b:若为否,则获取未告警关联数据的投资交易特征数据。
[0156]
将用多层投资体系确定出未告警业务对应的实时关联数据作为未告警关联数据,所有未告警关联数据组成的集合即为未告警数据集。
[0157]
步骤305:进行关联性分析。
[0158]
对已告警关联数据集中每个已告警关联数据的投资交易特征数据,与未告警数据集中每个未告警关联数据进行相关性分析,如对它们进行余弦相似度计算,将计算结果大于设定阈值的未告警关联数据确定为与对应的已告警关联数据相关(此时对应的未告警关联数据可以被称之为正相关数据),否则不相关(此时对应的未告警关联数据可以被称之为负相关数据)。
[0159]
步骤306:若不相关,则结束。
[0160]
步骤307:若相关,则获取已告警关联数据集的投资交易特征数据集和未告警关联数据集的投资交易特征数据。
[0161]
将前述已告警关联数据组成的集合作为已告警关联数据集,提取已告警关联数据
集的投资交易特征数据,将前述正相关数据组成的集合作为未告警关联数据集,提取未告警关联数据集的投资交易特征数据。
[0162]
步骤308:迭代上次使用的预测模型。
[0163]
用获取已告警关联数据集的投资交易特征数据集和未告警关联数据集的投资交易特征数据对上次使用的预测模型进行迭代训练,得到迭代后的预测模型,进而利用迭代后的预测模型更新对应业务品种的。
[0164]
例如,以前述资产管理机构a的例子为例,在获得多层预警体系后,获取使用多层预警体系期间产生的关联数据集,并根据关联数据集中的关联数据在多层预警体系下是否发生告警,将发生告警的关联数据作为已告警关联数据,将未发生告警的关联数据作为未告警关联数据,将所有的已告警关联数据组成的集合称之为已告警关联数据集,将所有未告警的关联数据组成的集合称之为未告警数据集,进而计算已告警关联数据集中每个已告警关联数据与未告警数据集中每个未告警关联数据的余弦相似度,将余弦相似度大于设定阈值对应的未告警关联数据作为对应已告警关联数据的正相关数据,将所有正相关数据组成的集合作为未告警关联数据集;之后,对未告警关联数据集和用已告警关联数据集进行归一化处理,具体归一化处理的过程与前述介绍的归一化处理过程类似,在此不再赘述,将归一化处理后的未告警关联数据集和归一化处理后的已告警关联数据集输入上次使用的预测模型对其进行迭代训练,这样就能得到迭代后的预测模型,通过迭代后的预测模型可以更新第一预警阈值,结合前述介绍的第二预警阈值、第三预警阈值的获得方案,可以更新第二预警阈值、第三预警阈值,这样不仅能及时迭代预测模型并且还能利用迭代后的预测模型自适应调整多层预警体系,这样随着使用时间的推移预测模型被越来越多的样本数据训练,从而不断提高预测模型的预测准确度,相应的由于第一预警阈值、第二预警阈值、第三预警阈值会随着预测模型的迭代而不断更新,从而能够提高由第一预警阈值、第二预警阈值、第三预警阈值构建的多层预警体系的对不同层级的集中度风险预警的准确度,降低各层级触发集中度风险的概率,提高投资成功率,使投资理财产品具有更好的流动性。
[0165]
在本发明提供的实施例中,通过获取资产管理机构管理的每个业务品种中与投资集中度相关的关联数据集;对关联数据集进行归一化处理,并用每个投资理财产品中每个业务所属业务品种上次使用的预测模型,根据归一化处理后的关联数据集预测当前对应投资理财产品中各业务投资集中度的第一预警阈值;其中,预设模型是基于集成学习投票算法训练得到的,这样可以根据不同的业务品种用集成学习投票算法构建对应的预测模型,并用最新迭代后的预测模型预测对应业务投资集中度的第一预警阈值;进而根据投资理财产品中所有业务的第一预警阈值及资产管理机构中不同投资层级对应的权重,构建资产管理体系的多层投资预警体系;其中,第一预警阈值对应多层投资预警体系的底层预警;用多层投资预警体系,对资产管理机构中不同层级对应的投资集中度进行预警。从而自适应的调整多层投资预警体系中不同层级的投资集中度的预警阈值,提高集中度风险预警的准确性,降低资产管理机构中各层级触发集中度风险的概率,并提高投资成功率,使资产管理机构管理的投资理财产品具有更好的流动性。同时,由于上述多层投资预警体系不依赖于人工经验和事后补偿的集中度控制,也不再局限于单一业务品种或产品,因此能够全面的对资产管理机构的不同层级进行集中度控制,提高集中度风险管理的效率。
[0166]
基于同一发明构思,本发明一实施例中提供一种数据处理的装置,该装置的数据
处理方法的具体实施方式可参见方法实施例部分的描述,重复之处不再赘述,请参见图4,该装置包括:
[0167]
获取单元401,用于获取资产管理机构管理的每个投资理财产品中与投资集中度相关的关联数据集;
[0168]
处理单元402,用于对所述关联数据集进行归一化处理,并用每个投资理财产品中每个业务所属业务品种上次使用的预测模型,根据对应投资理财产品归一化处理后的关联数据集预测当前对应投资理财产品中各业务投资集中度的第一预警阈值;其中,预设模型是基于集成学习投票算法训练得到的;
[0169]
构建单元403,用于根据每个投资理财产品中所有业务的第一预警阈值及所述资产管理机构中不同投资层级对应的权重,构建所述资产管理体系的多层投资预警体系;其中,所述第一预警阈值对应所述多层投资预警体系的底层预警;
[0170]
预警单元404,用于用所述多层投资预警体系,对所述资产管理机构中不同层级对应的投资集中度进行预警。
[0171]
一种可能的实施方式,所述获取单元401还用于:
[0172]
采集所述资产管理机构中每个投资理财产品对应的投资交易流水数据;并按所述业务品种,从所述投资交易流水数据中提取每个业务品种对应的投资交易特征数据;
[0173]
采集每个投资理财产品的产品基础信息;
[0174]
采集所述每个投资理财产品中单一业务品种的集中度占比数据;
[0175]
采集每个业务品种的监管条款数据;
[0176]
采集同业发布的资产比例数据;
[0177]
将所述投资交易特征数据、所述监管条款数据、所述产品基础信息、所述集中度占比数据、所述同业发布的资产比例数据,构建为所述关联数据集。
[0178]
一种可能的实施方式,所述处理单元402还用于:
[0179]
按所述业务品种包含的投资交易特征,构建成由所述业务品种包含的所有投资交易特征的数据组成的一维数组,并作为第一数据集;
[0180]
将所述每个投资理财产品的各业务品种的资产估值占比构建为第二数据集;
[0181]
将所述每个投资理财产品的产品类型与对应的监管数据构建为由二维数组组成的第三数据集;
[0182]
将所述每个投资理财产品对应的同业发布的资产占比数据,作为对应投资理财产品的预测模型的参考影响因子,构建为第四数据集;
[0183]
对所述第一数据集、所述第二数据集、所述第三数据集、所述第四数据集分别进行归一化处理;
[0184]
将归一化后的第一数据集、归一化后的第二数据集、归一化后的第三数据集、归一化后的第四数据集分别与对应的预设参考权重进行积运算,得到归一化处理后的第一数据集、归一化处理后的第二数据集、归一化处理后的第三数据集、归一化处理后的第四数据集。
[0185]
一种可能的实施方式,所述构建单元403还用于:
[0186]
获取所述业务品种的历史关联数据集;
[0187]
对所述历史关联数据集进行归一化处理;
[0188]
将归一化处理后的历史关联数据集,按预设比例分为训练集和验证集;
[0189]
用训练集对由集成学习投票算法构建的分类业务预警模型进行训练,并用验证集对训练后的分类业务预警模型进行验证,直至训练后的分类业务预警模型预测对应业务品种的集中度预警阈值的准确率达到设定值,获得所述业务品种的训练好的预测模型。
[0190]
一种可能的实施方式,所述构建单元403还用于:
[0191]
根据所述每个投资理财产品中各业务的第一预警阈值及每个投资理财产品中每个业务品种的频率权重,确定每个投资理财产品的投资集中度的第二预警阈值;
[0192]
根据所述每个投资理财产品的第二预警阈值及资产管理机构中各投资理财产品的规模权重,确定所述资产管理机构的投资集中度的第三预警阈值;
[0193]
根据所述第一预警阈值、第二预警阈值、第三预警阈值,构建所述多层投资预警体系。
[0194]
一种可能的实施方式,所述构建单元403还用于:
[0195]
在用所述多层投资预警体系,对所述资产管理机构中不同层级对应的投资集中度进行预警之后,获取使用所述多层预警体系期间产生的关联数据集;
[0196]
对使用所述多层预警体系后产生的关联数据集进行关联性分析,获得与所述多层预警体系触发告警的告警关联数据集正相关且未触发告警的未告警关联数据集;
[0197]
用所述已告警关联数据集,及所述未触告警关联数据集,对所述上次使用的预测模型进行迭代训练,获得迭代后的预测模型,并更新第一预警阈值、第二预警阈值、第三预警阈值。
[0198]
一种可能的实施方式,所述构建单元403还用于:
[0199]
将使用所述多层预警体系期间产生的关联数据集为已告警关联数据集和未告警数据集;
[0200]
计算所述已告警数据集中已告警关联数据与所述未告警数据集中未告警关联数据之间的余弦相似度;
[0201]
将余弦相似度大于设定阈值对应的未告警关联数据作为对应已告警关联数据的正相关数据;
[0202]
将所有正相关数据组成的集合确定为所述未告警关联数据集。
[0203]
基于同一发明构思,本发明实施例中提供了一种投资集中度的预警装置,包括:至少一个处理器,以及
[0204]
与所述至少一个处理器连接的存储器;
[0205]
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述至少一个处理器通过执行所述存储器存储的指令,执行如上所述的数据处理的方法。
[0206]
基于同一发明构思,本发明实施例还提供一种可读存储介质,包括:
[0207]
存储器,
[0208]
所述存储器用于存储指令,当所述指令被处理器执行时,使得包括所述可读存储介质的装置完成如上所述的数据处理的方法。
[0209]
基于同一发明构思,本发明实施例还提供一种计算机程序产品,包含有计算机可执行指令,所述计算机可执行指令用于使计算机执行如上所述的数据处理的方法。
[0210]
本领域内的技术人员应明白,本发明实施例可提供为方法、系统、或计算机程序产
品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0211]
本发明实施例是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0212]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0213]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0214]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献