一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种粮堆温度插值预测方法及装置与流程

2022-09-08 08:42:35 来源:中国专利 TAG:


1.本发明涉及一种粮堆温度插值预测方法,具体为一种基于系统聚类和主成分分析算法的粮堆温度插值预测方法及装置,属于粮食行业的粮堆温度预测技术领域。


背景技术:

2.粮食行业决定人民利益,保证国家粮食安全。长久以来,粮食是保证人民群众生活的基本资料。虽然我国粮食产量富足,但是因为贮藏不当导致的损失量很大。
3.改善贮藏条件,减少粮食损失,保证国家粮食安全,是当前粮食行业急需解决的问题。因此,对粮堆温度的预测有利于改善粮食贮藏条件和行业可持续健康发展。


技术实现要素:

4.本发明的目的就在于为了解决上述问题而提供一种基于系统聚类和主成分分析算法的粮堆温度插值预测方法及装置。
5.本发明通过以下技术方案来实现上述目的:一种基于系统聚类和主成分分析算法的粮堆温度插值预测方法,包括以下步骤
6.步骤一、整理并汇总粮堆温度的影响因素,并将每个影响因素看作一类,计算两两之间的最小距离;
7.步骤二、将距离最小的两个影响因素合并成一个新类;重新计算新类与所有类之间的距离;然后判断所剩类别是否可以再分;若所剩类别可以再分,则继续合并新类;若所剩类别不可再分,则得到数据处理后的几类影响因素;
8.步骤三、将几类影响因素作为变量数据输入,并将各变量数据标准化;
9.步骤四、对变量矩阵进行均值归零处理,计算相关系数矩阵;
10.步骤五、计算特征值和特征向量,将特征向量组成的矩阵作为变换矩阵;
11.步骤六、计算主成分贡献率及累计贡献率,得到主要影响因素;
12.步骤七、利用三次样条插值将主要影响因素中可能缺失的数据进行数据填充;
13.步骤八、完成时间预测模型,并得到贡献值函数,从而推测粮堆温度。
14.作为本发明再进一步的方案:所述步骤一中,从数据库中整理并汇总粮堆温度的影响因素,该数据库中存储的粮堆相关各种信息包括粮堆温度以及粮堆各个影响因素,且粮堆各个影响因素包括粮堆体积、粮食种类、单位体积通风情况、空气温湿度及其几年内相关数据。
15.作为本发明再进一步的方案:所述步骤一中,计算两两之间的最小距离采用数据降维处理的方法,选择适当的样本距离和类间距离计算方法,便可从每样本作为单独类开始逐渐合并,最终去除相关性比较高的影响因素中的一个;
16.利用欧氏距离:
[0017][0018]
作为衡量样本间距离的标准;
[0019]
其中x
ik
={x
i1
,x
i2
,x
i3
,...,x
ik
}表示粮堆影响价格的第i个影响因素,其中k表示该影响因素有k个观测值;
[0020]
以最短距离法:
[0021]dpq
=min d
ij
(xi∈g
p
,xj∈gq)
[0022]
作为衡量类间距离的标准,来说明系统聚类的计算过程;
[0023]
其中,g
p
和gq表示两个不同的类,d
pq
则表示这两个类的距离,即上面所说的类间距离;
[0024]
计算过程如下:
[0025]
将每个样本单独看成一类,计算各类之间的距离,得距离矩阵d
(0)

[0026]
求出矩阵d
(0)
中的最小元素,它是与之间的距离,并进行合并从而得到新类;计算各类之间的距离,得到矩阵d
(1)
,因由与合并而成,按最短距离法,分别计算与之间以及与之间的两两距离,并选出最小者作为两类之间的距离;
[0027]
得到矩阵d
(1)
中的最小元素,它是与之间的距离,将他们合并,得到新类;计算各类之间的距离,得距离矩阵d
(2)
,同理计算类间距离;
[0028]
得到矩阵d
(2)
中的最小元素,它是与之间的距离,将他们合并,得到新类;计算各类之间的距离,得距离矩阵d
(3)
,同理计算类间距离。得到矩阵d
(3)
中的最小元素,它是与之间的距离,将他们合并,得到新类;根据距离大小,从而判定相关性关系,去除相互之间相关性较大的元素之一。
[0029]
作为本发明再进一步的方案:所述步骤二中,所得到的几类影响因素为相似程度较高的两个影响因素,并只留下一个影响因素作为参考影响因素,以尽可能使得影响粮堆温度的因素之间的交集最小化,进而,将之前已经聚类处理的几类影响因素z={z1,z2,z3,...,zn}作为变量数据进行输入。
[0030]
作为本发明再进一步的方案:所述步骤三中,将各变量数据标准化时,采用基于主成分分析法的处理方法;
[0031]
主成分分析法是一种把多个影响因素化为少数几个主成分的分析方法.在前面系统聚类算法的降维基础下,直接用主成分分析法可以得到粮堆温度的主要影响因素。
[0032]
作为本发明再进一步的方案:所述步骤四中,对变量矩阵进行均值归零处理具体包括:
[0033]
首先,将之前已经聚类处理的几类影响因素z={z1,z2,z3,...,zn}作为变量数据
进行输入。
[0034]
其中,列向量z中的每一个zn代表一个特征,n代表样本个数。
[0035]
中心化数据,求出每个特征的均值为:
[0036][0037]
之后利用影响因素的数据减去均值后得到新的向量为:
[0038]
x={z
1-u1,z
2-u2,z
3-u3,

,z
n-un}
[0039]
利用中心化之后的数据,能找出方差最大的方向d1。
[0040]
作为本发明再进一步的方案:所述步骤五中,具体包括:
[0041]
设d1是单位向量,则最大化下式为:
[0042][0043]
目标函数是:
[0044][0045]
易证xx

(用x

代替转置符号)得到的矩阵是一个半正定的对称阵,对于半正定阵的二次型,存在最大值;
[0046]
选择使用奇异值分解(svd)来求最大方向,向量x的模长的平方为:
[0047]
||x||2=《x,x》=x

x
[0048]
因此
[0049][0050]
在一个矩阵在对对一个向量做变换时,引入下式:
[0051][0052]
使得变换前后的向量的模长伸缩比例可以达到最大;
[0053]
其中σ1(a)表示矩阵a的最大奇异值;
[0054]
对此定理的证明如下:
[0055]
对于对称阵a
t
a∈cn×n,假设λ1≥λ2≥

≥λn≥0是它的n个特征值,令与之对应的单位特征向量为
[0056]
ξ1,ξ2,

,ξn[0057]
这组特征向量构成了空间中的一组单位正交基。
[0058]
任取一个向量x,表示为:
[0059]
[0060]
那么
[0061][0062]
将代入上式可得:
[0063][0064][0065]
根据特征值的大小关系得:
[0066][0067]
所以
[0068][0069]
由此,定理得证;
[0070]
易知当x=ξ1时取得最大值σ1[0071][0072][0073]
因此,需要最大化:
[0074][0075]
将x

代入矩阵a,则显然,a

a=(x

)

x

=xx

最大特征值对应的特征向量的方向即为我们所求的d1的方向。
[0076]
作为本发明再进一步的方案:所述步骤六中,将特征值最大的设为第一主轴,第二大的为第二主轴,以此类推,得到影响指数较高的几大影响因素作为主要影响因素。
[0077]
一种基于系统聚类和主成分分析算法的粮堆温度插值预测装置,包括:
[0078]
数据收集及整理模块,用于整理并汇总粮堆温度的影响因素;
[0079]
系统聚类算法处理模块,用于将整理得到的影响因素进行处理,降低影响因素之间的相似程度,实现交集最小化,得到处理后的相似程度最小的几类影响因素;
[0080]
数据输入模块,用于将几类影响因素作为变量数据输入;
[0081]
pca数据处理模块,用于将输入数据进行标准化,归零处理等操作,计算主成分贡献率及累计贡献率;
[0082]
插值预测模块,用于对主要影响因素中可能缺失的数据进行数据填充,完成时间预测模型;
[0083]
粮堆温度预测模块,用于利用贡献值函数合理预测粮堆温度。
[0084]
本发明的有益效果是:该发明具有很好的通用性和普适性,反映不同种类的粮堆温度在其影响因素的作用下价格的变化情况及未来情况的预测,可以帮助国家或者各种粮
食产业改善贮藏条件,保障我国未来粮食市场的平稳发展。
附图说明
[0085]
图1为本发明流程示意图;
[0086]
图2为本发明系统聚类算法建模得到的近似值矩阵图;
[0087]
图3为本发明主成分分析算法建模得到的各个影响因素对粮堆温度的贡献率分布图;
[0088]
图4为本发明预测装置结构示意图。
具体实施方式
[0089]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0090]
实施例一
[0091]
请参阅图1,一种粮堆温度插值预测方法,包括以下步骤
[0092]
步骤一、整理并汇总粮堆温度的影响因素,并将每个影响因素看作一类,计算两两之间的最小距离;
[0093]
步骤二、将距离最小的两个影响因素合并成一个新类;重新计算新类与所有类之间的距离;然后判断所剩类别是否可以再分;若所剩类别可以再分,则继续合并新类;若所剩类别不可再分,则得到数据处理后的几类影响因素;
[0094]
步骤三、将几类影响因素作为变量数据输入,并将各变量数据标准化;
[0095]
步骤四、对变量矩阵进行均值归零处理,计算相关系数矩阵;
[0096]
步骤五、计算特征值和特征向量,将特征向量组成的矩阵作为变换矩阵;
[0097]
步骤六、计算主成分贡献率及累计贡献率,得到主要影响因素;
[0098]
步骤七、利用三次样条插值将主要影响因素中可能缺失的数据进行数据填充;
[0099]
步骤八、完成时间预测模型,并得到贡献值函数,从而推测粮堆温度。
[0100]
在本发明实施例中,所述步骤一中,从数据库中整理并汇总粮堆温度的影响因素,该数据库中存储的粮堆相关各种信息包括粮堆温度以及粮堆各个影响因素,且粮堆各个影响因素包括粮堆体积、粮食种类、单位体积通风情况、空气温湿度及其几年内相关数据。
[0101]
在本发明实施例中,所述步骤一中,计算两两之间的最小距离采用数据降维处理的方法,选择适当的样本距离和类间距离计算方法,便可从每样本作为单独类开始逐渐合并,最终去除相关性比较高的影响因素中的一个;
[0102]
利用欧氏距离:
[0103][0104]
作为衡量样本间距离的标准;
[0105]
其中x
ik
={x
i1
,x
i2
,x
i3
,...,x
ik
}表示粮堆影响价格的第i个影响因素,其中k表示该影响因素有k个观测值;
[0106]
以最短距离法:
[0107]dpq
=min d
ij
(xi∈g
p
,xj∈gq)
[0108]
作为衡量类间距离的标准,来说明系统聚类的计算过程;
[0109]
其中,g
p
和gq表示两个不同的类,d
pq
则表示这两个类的距离,即上面所说的类间距离;
[0110]
计算过程如下:
[0111]
将每个样本单独看成一类,计算各类之间的距离,得距离矩阵d
(0)

[0112]
求出矩阵d
(0)
中的最小元素,它是与之间的距离,并进行合并从而得到新类;计算各类之间的距离,得到矩阵d
(1)
,因由与合并而成,按最短距离法,分别计算与之间以及与之间的两两距离,并选出最小者作为两类之间的距离;
[0113]
得到矩阵d
(1)
中的最小元素,它是与之间的距离,将他们合并,得到新类;计算各类之间的距离,得距离矩阵d
(2)
,同理计算类间距离;
[0114]
得到矩阵d
(2)
中的最小元素,它是与之间的距离,将他们合并,得到新类;计算各类之间的距离,得距离矩阵d
(3)
,同理计算类间距离。得到矩阵d
(3)
中的最小元素,它是与之间的距离,将他们合并,得到新类;根据距离大小,从而判定相关性关系,去除相互之间相关性较大的元素之一。
[0115]
在本发明实施例中,所述步骤二中,所得到的几类影响因素为相似程度较高的两个影响因素,并只留下一个影响因素作为参考影响因素,以尽可能使得影响粮堆温度的因素之间的交集最小化,进而,将之前已经聚类处理的几类影响因素z={z1,z2,z3,...,zn}作为变量数据进行输入。
[0116]
在本发明实施例中,所述步骤三中,将各变量数据标准化时,采用基于主成分分析法的处理方法;
[0117]
主成分分析法是一种把多个影响因素化为少数几个主成分的分析方法.在前面系统聚类算法的降维基础下,直接用主成分分析法可以得到粮堆温度的主要影响因素。
[0118]
在本发明实施例中,所述步骤四中,对变量矩阵进行均值归零处理具体包括:
[0119]
首先,将之前已经聚类处理的几类影响因素z={z1,z2,z3,...,zn}作为变量数据进行输入。
[0120]
其中,列向量z中的每一个zn代表一个特征,n代表样本个数。
[0121]
中心化数据,求出每个特征的均值为:
[0122]
[0123]
之后利用影响因素的数据减去均值后得到新的向量为:
[0124]
x={z
1-u1,z
2-u2,z
3-u3,

,z
n-un}
[0125]
利用中心化之后的数据,能找出方差最大的方向d1。
[0126]
在本发明实施例中,所述步骤五中,具体包括:
[0127]
设d1是单位向量,则最大化下式为:
[0128][0129]
目标函数是:
[0130][0131]
易证xx

(用x

代替转置符号)得到的矩阵是一个半正定的对称阵,对于半正定阵的二次型,存在最大值;
[0132]
选择使用奇异值分解(svd)来求最大方向,向量x的模长的平方为:
[0133]
||x||2=《x,x》=x

x
[0134]
因此
[0135][0136]
在一个矩阵在对对一个向量做变换时,引入下式:
[0137][0138]
使得变换前后的向量的模长伸缩比例可以达到最大;
[0139]
其中σ1(a)表示矩阵a的最大奇异值;
[0140]
对此定理的证明如下:
[0141]
对于对称阵a
t
a∈cn×n,假设λ1≥λ2≥

≥λn≥0是它的n个特征值,令与之对应的单位特征向量为
[0142]
ξ1,ξ2,

,ξn[0143]
这组特征向量构成了空间中的一组单位正交基。
[0144]
任取一个向量x,表示为:
[0145][0146]
那么
[0147][0148]
将代入上式可得:
[0149]
[0150][0151]
根据特征值的大小关系得:
[0152][0153]
所以
[0154][0155]
由此,定理得证;
[0156]
易知当x=ξ1时取得最大值σ1[0157][0158][0159]
因此,需要最大化:
[0160][0161]
将x

代入矩阵a,则显然,a

a=(x

)

x

=xx

最大特征值对应的特征向量的方向即为我们所求的d1的方向。
[0162]
在本发明实施例中,所述步骤六中,将特征值最大的设为第一主轴,第二大的为第二主轴,以此类推,得到影响指数较高的几大影响因素作为主要影响因素。
[0163]
实施例二
[0164]
请参阅图2~3,一种粮堆温度插值预测方法及装置,其在实施例一的基础上对已有数据库中的数据进行建模分析;
[0165]
在数据库中提取不同粮仓粮堆温度历史数据以及粮堆吨位,粮食种类,粮仓通风情况,天气变化情况,空气中温湿度的历史数据对粮食温度进行预测。
[0166]
首先,对历史数据进行量化分析,为避免影响因素之间的信息重叠程度高,即相关性较大的问题,我们采用系统聚类算法对数据进行处理,将给定指标中相关性较大的影响因素剔除,尽可能使得影响因素之间的交集最小化。
[0167]
根据聚类建模算法,得到近似值矩阵如图2所示。
[0168]
其中,规定将相似程度ω≥0.7认为是相似程度较高得两个影响因素,从而只留下一个影响因素作为参考影响因素.
[0169]
由图可得,天气和空气温湿度相关系数0.88,粮堆体积与粮堆吨位相关系数0.745,均为相似程度较高的影响因素.因此,我们去掉天气和粮堆吨位。
[0170]
最后通过聚类算法保留降维之后的影响粮堆温度的因素分别为:粮堆体积,粮食种类,空气温湿度,单位体积通风量。
[0171]
接着,采用基于主成分分析法对聚类算法处理后的数据进行二次处理。
[0172]
主成分分析法是一种通过把多个影响因素化为少数几个主成分的分析方法。在前
面系统聚类算法的降维基础下,直接用主成分分析法可以得到粮堆温度的主要影响因素。
[0173]
根据主成分分析法,处理后得到的各个影响因素对粮堆温度的贡献率如图3所示,并且通过贡献率可以得到相关性的函数式如下:
[0174]
f(x)=0.472001x1 0.287877x2 0.162336x3 0.077785x4 δ
[0175]
(*注:x1,...,xi,i=1~4分别表示粮堆体积,粮食种类,空气温湿度,单位体积通风量等四项影响因素)
[0176]
得到结论:影响某粮仓粮堆温度的主要因素的按影响程度由高到低的排序为单位体积通风量》空气温湿度》粮堆体积》粮食种类。
[0177]
最后,对四种影响因素进行三次样条插值,得到粮食种类的预测曲线。
[0178]
得到四种影响因素随时间变化的预测模型分别为:
[0179]
x1=[-0.9604(x
0-11)
3-0.4995(x
0-11)2 1.1207(x
0-11) 4.2332]
×
103[0180]
x2=[0.1951(x
0-11)3 0.4175(x
0-11)
2-0.2513(x
0-11) 3.1576]
×
104[0181]
x3=[0.2952(x
0-11)3 0.2217(x
0-11)
2-0.4210(x
0-11) 1.3850]
×
104[0182]
x4=[-0.0731(x
0-11)
3-0.4864(x
0-11)2 0.5293(x
0-11) 2.4300]
×
104[0183]
(*注:x1,x2,x3,x4分别代表粮堆体积,粮食种类,空气温湿度,单位体积通风量四种影响因素的预测模型)
[0184]
通过时间预测模型,可以得到未来三十一天的四种影响因素的预测值,之后将贡献指标带入第一问推出的贡献值函数为:
[0185]
f(x)=0.472001x1 0.287877x2 0.162336x3 0.077785x4 δ
[0186]
进而根据贡献值函数对未来的粮堆温度进行合理预测。
[0187]
实施例三
[0188]
请参阅图4,一种基于系统聚类和主成分分析算法的粮堆温度插值预测装置,包括
[0189]
数据收集及整理模块,用于整理并汇总粮堆温度的影响因素;
[0190]
系统聚类算法处理模块,用于将整理得到的影响因素进行处理,降低影响因素之间的相似程度,实现交集最小化,得到处理后的相似程度最小的几类影响因素;
[0191]
数据输入模块,用于将几类影响因素作为变量数据输入;
[0192]
pca数据处理模块,用于将输入数据进行标准化,归零处理等操作,计算主成分贡献率及累计贡献率;
[0193]
插值预测模块,用于对主要影响因素中可能缺失的数据进行数据填充,完成时间预测模型;
[0194]
粮堆温度预测模块,用于利用贡献值函数合理预测粮堆温度。
[0195]
工作原理:通过整理汇总粮堆温度的相关影响因素,将每个影响因素看作一类,计算每两个影响因素之间的最小距离,然后将距离最小,即相关性较高的两个影响因素合并成一个新类,之后计算新类与所有类之间的距离,判断所剩类别是否可以再分,最后得到降维处理后的几类影响因素。随后将所得的几类影响因素作为变量数据输入,并将其标准化,再对变量矩阵进行均值归零处理,计算相关系数矩阵,特征值和特征向量,并将特征向量组成的矩阵作为变换矩阵,再根据主成分贡献率及累计贡献率得到主要影响因素,最后,利用三次样条插值将主要影响因素中可能缺失的数据进行数据填充,完成了时间预测模型,得到了贡献值函数,据此,对粮堆温度完成准确预测。
[0196]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0197]
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献