一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种化学品历史价格数据补充方法与流程

2022-09-07 22:11:46 来源:中国专利 TAG:


1.本发明涉及数据监管领域,尤其涉及一种化学品历史价格数据补充方法。


背景技术:

2.在商品交易中,每天都会有大量交易数据记录在各种系统中。虽然总体数据量很大,但对于单一产品来说交易数据并不连续,会频繁出现交易价格数据断点。这些断点的产生,有可能是化学品交易记录在其他平台系统中或者存在于纸质合同中引起的。如果数据出现缺失情况,就无法判断化学品价格的变化情况,同时也会使某些算法模型无法使用。目前处理缺失方法主要包括:补充均值、补充前值或插值处理。这三种方法虽然是不错的缺失值补充方法,但会影响化学品价格间的相互作用。


技术实现要素:

3.鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种化学品历史价格数据补充方法。
4.根据本发明的一个方面,提供了一种化学品历史价格数据补充方法包括:
5.获取化学品历史价格数据集;
6.将所述化学品历史价格数据标准化,获得标准化历史价格数据;
7.根据所述标准化历史价格数据计算历史价格走势相似性;
8.筛选相似趋势化学品集合;
9.将缺失历史数据进行补充;
10.将缺失历史数据进行修正。
11.可选的,所述获取化学品历史价格数据集具体包括:
12.获取历史化学品历史交易数据集a,所述历史交易数据集a列名包括:时间、交易均价、化学品名;
13.调整所述历史交易数据集a的间列为时间和交易均价的化学品名;
14.调整所述历史交易数据集a的间列为连续时间,无交易均价时填充空值;
15.获取所述历史交易数据集a包括全部化学品名集合b。
16.可选的,所述将所述化学品历史价格数据标准化具体包括:
17.计算所述全部化学品名集合b中的每种化学品交易总均价计算所述全部化学品名集合b中的每种化学品交易总均价n为化学品有交易均价天数;
18.计算每种化学品交易样本标准差
19.计算每种化学品的标准化日交易均价得到标准价格集x。
20.可选的,所述根据所述标准化历史价格数据计算历史价格走势相似性具体包括:
21.穷尽所述全部化学品名集合b中化学品名两两组合方式c;
22.根据所述组合方式c中的组合,从所述标准价格集x中取出两种品价格记录x,y;
23.取x,y中连续3天均有交易均价数据集,计算余弦相似性cos(x,y);
[0024][0025]
可选的,所述筛选相似趋势化学品集合具体包括:
[0026]
计算化学品组合历史平均余弦相似性n为满足3天均有交易均价数据条数;
[0027]
保留或的化学品产品组合c。
[0028]
可选的,所述将缺失历史数据进行补充具体包括:
[0029]
取x为连续三天中,包含一天为空值数据片段,取所有相似组合y,且y该时间片段均不为空值,求解所有可能缺失值z;
[0030]
对所有可能缺失值z进行加权计算得到缺失值z;
[0031][0032][0033]
使用缺失值z代替空值,重复进行以上两个步骤至所有缺失值得到补充;
[0034]
对所有化学品的交易均价空值进行以上步骤,至所有化学品均有连续的交易均价。
[0035]
可选的,所述将缺失历史数据进行修正具体包括:
[0036]
取化学平真实交易均价最大值x
max
和最小值x
min

[0037]
计算补充缺失值后化学品均价总体标准差n为化学品为有交易均价天数;
[0038]
当所述缺失值z》x
max
σ,则取z=x
max
σ;
[0039]
当所述缺失值z《x
min-σ,则取z=x
min-σ。
[0040]
本发明提供的一种化学品历史价格数据补充方法包括:获取化学品历史价格数据集;将所述化学品历史价格数据标准化,获得标准化历史价格数据;根据所述标准化历史价格数据计算历史价格走势相似性;筛选相似趋势化学品集合;将缺失历史数据进行补充;将缺失历史数据进行修正。在未发生突发时间的情况下,实现对化学品价格走势误差为3%的走势拟合,实现对缺失历史交易价格的合理补充。
[0041]
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够
更明显易懂,以下特举本发明的具体实施方式。
附图说明
[0042]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0043]
图1为本发明实施例提供的一种化学品历史价格数据补充方法的流程图;
[0044]
图2为本发明实施例提供的一种化学品历史价格数据补充方法的详细步骤示意图。
具体实施方式
[0045]
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0046]
本发明的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
[0047]
下面结合附图和实施例,对本发明的技术方案做进一步的详细描述。
[0048]
如图1所示,一种化学品历史价格数据补充方法包括:
[0049]
获取化学品历史价格数据集;
[0050]
历史价格数据标准化;
[0051]
历史价格走势相似性计算;
[0052]
相似趋势化学品集合筛选;
[0053]
缺失历史数据补充;
[0054]
缺失历史数据修正。
[0055]
如图2所示,获取化学品历史价格数据集具体包括:
[0056]
由系统中获取历史化学品历史交易数据集a,数据集a列名包括:时间、交易均价、化学品名;
[0057]
调整数据集a的间列为时间和交易均价的化学品名,例如:时间、甲苯、甲烷;
[0058]
调整数据集a的间列为连续时间(天),无交易均价时填充空值。
[0059]
获取数据集a包含全部化学品名集合b。
[0060]
历史价格数据标准化具体包括:
[0061]
计算每种化学品交易总均价n为化学品有交易均价天数;
[0062]
计算每种化学品交易样本标准差n为化学品有交易均价天数;
[0063]
计算每种化学品的标准化日交易均价得到标准价格集x。
[0064]
历史价格走势相似性计算具体包括:
[0065]
穷尽化学品名b中化学品名两两组合方式c;
[0066]
根据组合方式c中的组合,从标准价格集x中取出两种品价格记录x,y;
[0067]
取x,y中连续3天均有交易均价数据集,由下式计算余弦相似性cos(x,y);
[0068][0069]
历相似趋势化学品集合筛选具体包括:
[0070]
计算化学品组合历史平均余弦相似性n为满足3天均有交易均价数据条数;
[0071]
保留或的化学品产品组合c。
[0072]
缺失历史数据补充具体包括:
[0073]
取x为连续三天中,包含一天为空值数据片段,取所有相似组合y,且y该时间片段均不为空值,根据下式,求解所有可能缺失值z;
[0074][0075]
根据下式对所有可能缺失值z进行加权计算得到缺失值z;
[0076][0077]
使用缺失值z代替空值,重复进行以上两个步骤至所有缺失值得到补充;
[0078]
对所有化学品的交易均价空值进行以上步骤,至所有化学品均有连续的交易均价;
[0079]
缺失历史数据修正包括:
[0080]
取化学平真实交易均价最大值x
max
和最小值x
min

[0081]
计算补充缺失值后化学品均价总体标准差n为化学品为有交易均价天数;
[0082]
当缺失值z》x
max
σ则取z=x
max
σ;
[0083]
当缺失值z《x
min-σ则取z=x
min-σ。
[0084]
有益效果:采用本发明的方法,在未发生突发时间的情况下,实现对化学品价格走势误差为3%的走势拟合,实现对缺失历史交易价格的合理补充。
[0085]
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明
的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献