一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于间隔提取方法的数据预测方法与流程

2022-02-22 19:38:45 来源:中国专利 TAG:


1.本发明涉及数据处理及数据预测技术领域,具体涉及一种基于间隔提取方法的数据预测方法。


背景技术:

2.目前,通过经验判断、公式计算或者通过实际数据对各种数据预测模型进行训练,得到预测数据是目前普遍采用的数据预测技术手段;因此,为了取得更佳的预测结果许多学者及技术人员都更加注重在公式推导、发明或改进各种数据预测模型等方面做工作;而基于实际数据的处理来增大数据预测长度和提高预测精确度的成果却鲜有报道。
3.通过实际数据对各种数据预测模型进行训练最终得到预测数据的技术方案中,实际数据是数据预测技术的基础数据,在数据预测技术领域中对实际数据的处理属于至关重要的环节,实际数据的处理方法及处理效果对数据预测具有直接影响。实际数据中隐藏着大量的数据特征,其中包含了一些具有某种规律性、可用于数据预测的数据特征以及一些无规律性、对数据预测会造成影响的数据特征;后者因其会对数据预测造成干扰所以也称为噪声。数据处理即是从实际数据中尽可能的剔除噪声而保留那些具有规律性的数据特征的过程。因此,在一定程度上加强对实际数据的处理可使数据预测模型从实际数据中获取更多的有效数据特征从而改善数据预测的精确度。
4.随着人工智能技术在数据预测技术领域中的广泛应用,数据预测的精确度得到了进一步提高;然而现有技术中数据预测的长度仍然十分有限,甚至不能实现数据的长期预测;且对于如何解决随着数据预测长度的增加预测结果的精确度逐渐降低的难题也没有较好的技术方案。因此,如何实现数据长期预测以及同时保障数据长期预测的精确度仍然是目前数据预测技术领域中的重大难题。综上,开发出一种以处理实际数据为基础的,使在增加数据预测长度实现数据长期预测的同时又可保障数据长期预测精确度的数据长期预测方法是十分有益的。


技术实现要素:

5.针对现有数据预测技术在数据长期预测以及数据长期预测精确度方面存在的不足,本发明公开的技术方案增大了对实际数据中隐藏信息的挖掘程度;解决了现有数据预测技术难以实现数据长期预测以及数据长期预测精确度难以保障的难题。
6.为了实现上述目的,本发明提供了一种基于间隔提取方法的数据预测方法;该方法是基于所述间隔提取方法从单组实际数据中提取若干个不同的间隔数据集和预测样本集而实现的,包括以下实施步骤:a.将单组实际数据分割为前段实际数据及后段实际数据;b.基于间隔提取方法ⅰ以不同的提取间隔数从前段实际数据中提取得第一级数据集;c.从第一级数据集中提取得第二级数据集;d.以第二级数据集对数据预测模型群进行训练;e.基于间隔提取方法ⅱ从后段实际数据中提取得第三级数据集;f.将第三级数据集输入已训练完成的数据预测模型群进行数据预测;g.将数据预测模型群中各独立模型所得的各独立
模型预测结果数据组合并构成第四级数据集。
7.进一步地,所述间隔提取方法由间隔提取方法ⅰ及间隔提取方法ⅱ组成;间隔提取方法ⅰ用于从前段实际数据中提取第一级数据集,间隔提取方法ⅱ用于从后段实际数据中提取第三级数据集。
8.进一步地,所述间隔提取方法ⅱ从后段实际数据中提取第三级数据集时采用的提取间隔数取值与所述间隔提取方法ⅰ从前段实际数据中提取第一级数据集时采用的提取间隔数取值是保持一致的。
9.进一步地,所述第一级数据集由若干个间隔数据集组成,每个间隔数据集又由若干组间隔相同的单次提取数据组构成;所述第二级数据集由若干个训练样本集组成,训练样本集又由若干个训练样本数据组构成;所述第三级数据集由一个预测样本集组成,预测样本集又由若干组间隔不同的预测样本数据组构成;第四级数据集由若干个独立模型预测结果数据组构成。
10.进一步地,所述若干个独立模型预测结果数据组构成第四级数据集的组合依据为:根据每个独立模型预测结果数据组对应的提取间隔数值的大小,按由小到大的顺序组合。
11.进一步地,所述第四级数据集即为最终实现的数据长期预测结果。
12.相较于现有技术,本发明提供的一种基于间隔提取方法的数据预测方法具有以下突出优势。
13.a.基于所述间隔提取方法对单组实际数据进行处理,增大了对实际数据中隐藏信息的挖掘程度。
14.b.基于所述间隔提取方法对单组实际数据的处理,在没有改变各种传统的数据预测模型结构的前提下实现了数据的长期预测。
15.c.实现数据的长期预测的同时还提高了数据长期预测的精确度。
16.d.在实施数据预测过程中,更加充分的应用了实际数据。
17.因此,本发明所提供的技术方案具有突出的实质性特点和显著的进步;并且在实际运用时能够产生积极效果。
附图说明
18.图1为一种基于间隔提取方法的数据预测方法的实施示意图。
19.图2为间隔提取方法ⅰ实施示意图。
20.图3为间隔提取方法ⅱ实施示意图。
21.图中:1-单组实际数据;2-单个数据;3-前段实际数据;4-后段实际数据;5-间隔提取方法ⅰ;6-间隔提取方法ⅱ;7-第一级数据集;8-单次提取数据组;9-间隔数据集;10-第二级数据集;11-训练样本集;12-训练样本数据组;13-数据预测模型群;14-独立模型;15-第四级数据集;16-独立模型预测结果数据组;17-预测样本数据组;18-预测样本集;19-第三级数据集;20-提取间隔数;21-空数据;22-提取操作。
具体实施方式
22.以下将结合本发明实施例中的附图,对本发明实施例中的技术方案进行细致、完
整地描述。需声明的是:以下所描述的实施例及附图仅用于帮助理解本发明的方法及其核心思想,仅为本发明的部分实施例而已;对于本领域的其他技术人员,依据本发明提供的思想,在具体实施方式及应用范围上均会有改变之处;因此,本说明书内容不应理解为对本发明的限制;本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,均属于本发明保护的范围。
23.在本发明中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本发明所描述的实施例可以与其它实施例相结合。本发明所描述的实施例中所述第一、第二、第三、第四级数据集仅用于区分不同的数据集,而不用于描述各数据集的层级关系或者对各数据集的顺序进行限制。
24.为解决现有技术的不足,本发明提供了一种基于间隔提取方法的数据预测方法;该方法是基于所述间隔提取方法从单组实际数据1中提取若干个不同的间隔数据集9和预测样本集18而实现的;参照图1,图1是本发明提供的一种基于间隔提取方法的数据预测方法的实施示意图。以下通过具体的实施步骤对本发明提供的技术方案进行详细的描述。
25.步骤一、将单组实际数据1分割为前段实际数据3及后段实际数据4。
26.按照一定的比例将由若干个单个数据2构成的单组实际数据1分割为前段实际数据3以及后段实际数据4。
27.其中,前段实际数据3中所含的单个数据2数量要远大于后段实际数据4中所含的单个数据2;且前段实际数据3与后段实际数据4中单个数据2的数量和与单组实际数据1中单个数据2的数量相等。
28.步骤二、基于间隔提取方法ⅰ5以不同的提取间隔数20从前段实际数据3中提取得第一级数据集7。
29.参照图2,图2为间隔提取方法ⅰ5实施示意图,图中空数据21仅作为占位,该位置上实际没有数据。基于所述间隔提取方法ⅰ5,以不同间隔提取数20(提取间隔数20为n,且n=1,2,3,

,n)按由小到大的顺序对前段实际数据3进行提取;每个提取间隔数20从前段实际数据3中提取的次数为n 1,每个提取间隔数20可从前段实际数据3中提取出n 1个单次提取数据组8构成1个间隔数据集9。例子如下。
30.当间隔提取数20为1(即n=1)时,总共需从前段实际数据3中提取2次:第1次提取以前段实际数据3的第1个单个数据2为起点,每间隔1个数据做1次提取操作22(即每间隔1个数据提取1个数据)直至无法再次执行提取操作22时即完成第1次提取,得到第1个单次提取数据组8;第2次提取以前段实际数据3的第2个单个数据2为起点,每间隔1个数据做1次提取操作22(即每间隔1个数据提取1个数据)直至无法再次执行提取操作22时即完成第2次提取,得到第2个单次提取数据组8;第1个单次提取数据组8和第2个单次提取数据组8即构成了间隔提取数20为1(即n=1)时的间隔数据集9,至此以间隔提取数20为1(即n=1)从前段实际数据3中的数据提取即完成。
31.当间隔提取数20为2(即n=2)时,总共需从前段实际数据3中提取3次:第1次提取以前段实际数据3的第1个单个数据2为起点,每间隔2个数据做1次提取操作22(即每间隔2个数据提取1个数据)直至无法再次执行提取操作22时即完成第1次提取,得到第1个单次提取
数据组8;第2次提取以前段实际数据3的第2个单个数据2为起点,每间隔2个数据做1次提取操作22(即每间隔2个数据提取1个数据)直至无法再次执行提取操作22时即完成第2次提取,得到第2个单次提取数据组8;第3次提取以前段实际数据3的第3个单个数据2为起点,每间隔2个数据做1次提取操作22(即每间隔2个数据提取1个数据)直至无法再次执行提取操作22时即完成第3次提取,得到第3个单次提取数据组8;第1个单次提取数据组8、第2个单次提取数据组8和第3个单次提取数据组8共同构成了间隔提取数20为2(即n=2)时的间隔数据集9,至此以间隔提取数20为2(即n=2)从前段实际数据3中的数据提取即完成。
32.当间隔提取数20为3(即n=3)时,总共需从前段实际数据3中提取4次:第1次提取以前段实际数据3的第1个单个数据2为起点,每间隔3个数据做1次提取操作22(即每间隔3个数据提取1个数据)直至无法再次执行提取操作22时即完成第1次提取,得到第1个单次提取数据组8;第2次提取以前段实际数据3的第2个单个数据2为起点,每间隔3个数据做1次提取操作22(即每间隔3个数据提取1个数据)直至无法再次执行提取操作22时即完成第2次提取,得到第2个单次提取数据组8;第3次提取以前段实际数据3的第3个单个数据2为起点,每间隔3个数据做1次提取操作22(即每间隔3个数据提取1个数据)直至无法再次执行提取操作22时即完成第3次提取,得到第3个单次提取数据组8;第4次提取以前段实际数据3的第4个单个数据2为起点,每间隔3个数据做1次提取操作22(即每间隔3个数据提取1个数据)直至无法再次执行提取操作22时即完成第4次提取,得到第4个单次提取数据组8;第1个、第2个、第3个和第4个单次提取数据组8共同构成了间隔提取数20为3(即n=3)时的间隔数据集9,至此以间隔提取数20为3(即n=3)从前段实际数据3中的数据提取即完成。
33.以此类推。以间隔提取数20为4~n(即n=4~n)从前段实际数据3中提取间隔数据集9。
34.最终由各提取间隔数20从前段实际数据3中提取所得各间隔数据集9构成第一级数据集7。
35.步骤三、从第一级数据集7中提取得第二级数据集10。
36.从第一级数据集7中提取第二级数据集10的实现过程为:第一级数据集7由若干个间隔数据集9构成,每个间隔数据集9由若干个单次提取数据组8构成。因此,对各间隔数据集9中的各单次提取数据组8以一定的提取方式依次进行提取;1个单次提取数据组8可提取得若干个训练样本数据组12。其中,所有训练样本数据组12中单个数据2的数量应相等,在本技术中,设各训练样本数据组12中单个数据2的数量为x。则某个间隔数据集9中的所有单次提取数据组8提取所得的所有训练样本数据组12即构成1个训练样本集11;若干个训练样本集11构成第二级数据集10。
37.步骤四、以第二级数据集10对数据预测模型群13进行训练。
38.第二级数据集10由若干个训练样本集11构成,数据预测模型群13由若干个独立模型14构成,且第二级数据集10中训练样本集11的数量与数据预测模型群13中独立模型14的数量相同。以第二级数据集10中的1个训练样本集11对应数据预测模型群13中的1个独立模型14,使训练样本集11与独立模型14形成一一对应的关系。每个独立模型14通过其所对应的训练样本集11完成训练;以此完成数据预测模型群13的训练。
39.步骤五、基于间隔提取方法ⅱ6从后段实际数据4中提取得第三级数据集19。
40.参照图3,图3为间隔提取方法ⅱ6实施示意图,图中空数据21仅作为占位,该位置
上实际没有数据。基于所述间隔提取方法ⅱ6,以不同间隔提取数20(提取间隔数20为n,且n=1,2,3,

,n)按由小到大的顺序对后段实际数据4进行提取;其中,从后段实际数据4中提取第三级数据集19所采用的各间隔提取数20应与从前段实际数据3中提取第一级数据集7时采用的各间隔提取数20保持一致;以保障第三级数据集19中的各预测样本数据组17与数据预测模型群13中的各独立模型14能够一一对应。每个提取间隔数20仅从后段实际数据4中提取出1个预测样本数据组17,即每个提取间隔数20从后段实际数据4中提取的次数为1。因各预测样本数据组17中单个数据2的数量应与各训练样本数据组12中单个数据2的数量(已设为x)一致;所以基于间隔提取方法ⅱ6从后段实际数据4中提取各预测样本数据组17时提取操作22的次数依据各预测样本数据组17中单个数据2的数量而确定为x-1。若干个预测样本数据组17构成1个预测样本集18,也即第三级数据集19。例子如下。
41.当间隔提取数20为1(即n=1)时,第1个预测样本数据组17的提取以后段实际数据4的末尾单个数据2为起点,每间隔1个数据执行1次提取操作22(即每间隔1个数据提取1个数据)。当执行x-1次提取操作22后,间隔提取数20为1(即n=1)时的预测样本数据组17提取即完成。
42.当间隔提取数20为2(即n=2)时,第2个预测样本数据组17的提取以后段实际数据4的末尾单个数据2为起点,每间隔2个数据执行1次提取操作22(即每间隔2个数据提取1个数据)。当执行x-1次提取操作22后,间隔提取数20为2(即n=2)时的预测样本数据组17提取即完成。
43.当间隔提取数20为3(即n=3)时,第3个预测样本数据组17的提取以后段实际数据4的末尾单个数据2为起点,每间隔3个数据执行1次提取操作22(即每间隔3个数据提取1个数据)。当执行x-1次提取操作22后,间隔提取数20为3(即n=3)时的预测样本数据组17提取即完成。
44.以此类推。以间隔提取数20为4~n(即n=4~n)从后段实际数据4中提取第4~n个预测样本数据组17。
45.最终,所有从后段实际数据4中提取得的预测样本数据组17构成预测样本集18,即第三级数据集19。
46.步骤六、将第三级数据集19输入已训练完成的数据预测模型群13进行数据预测。
47.第三级数据集19也即预测样本集18,依据提取间隔数20将预测样本集18中的各预测样本数据组17与数据预测模型群13中的各独立模型14一一对应,并依次独立进行数据预测,得到若干个独立模型预测结果数据组16,各独立模型预测结果数据组16由至少1个单个数据2构成。
48.步骤七、所述各独立模型预测结果数据组16组合构成第四级数据集15。
49.依据提取间隔数20(提取间隔数20为n,n=1,2,3,

,n)按由小到大的顺序将各独立模型预测结果数据组16进行组合,所得即为第四级数据集15。
50.第四级数据集15即为最终的数据长期预测结果。
51.可以看出,所述第四级数据集15中各独立模型预测结果数据组16的数量与所述提取间隔数20的最大取值相等;且第四级数据集15中各独立模型预测结果数据组16的产生过程是独立的。当提取间隔数20的最大取值为n(n=n)时,所述第四级数据集15中各独立模型预测结果数据组16的数量为n;即最终数据预测结果的长度至少为n;进而实现了数据的长
期预测。且因所述第四级数据集15中各独立模型预测结果数据组16的产生过程是独立的,所以各独立模型预测结果数据组16的精确度可通过各种技术手段独立提高;使得最终数据长期预测的精确度得以保障。
52.因此,本发明提供的技术方案在实现数据的长期预测的同时,又可有效保障数据长期预测的精确度;解决了现有技术的不足,在实际运用时能够产生积极效果。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献