一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于机器学习融合卫星与天气数据的大豆产量预测方法与流程

2021-10-24 09:41:00 来源:中国专利 TAG:大豆 融合 产量 机器 天气


1.本发明涉及智慧农业领域,具体为基于机器学习融合卫星与天气数据的大豆产量预测方法。


背景技术:

2.大豆产量预测对市场行为、推动政府政策和提高全球粮食安全具有重要意义。大豆产量数据通常需要在收获后的接下来几个月进行各种修正,这表明产量预测的准确性和时间还有提高的空间。
3.随着计算处理能力的提高,在探索更大的时空数据集时,更复杂的数据分析算法也变得越来越流行。大豆产量、冠层反射率和天气数据之间的经验关系通常呈现非线性,并且使用随时间记录变量集合的产量预测模型易于过度拟合。由于这些原因,机器学习算法能够更稳健地处理非线性数据,防止过度拟合。随机森林(random forest,rf)和人工神经网络(artificial neural networks,anns)等机器学习算法已成功用于使用遥感植被指数预测作物产量。随机森林是一个集成分类器,它引导训练样本和变量在聚合单个树的结果后生成多个决策树执行预测。神经网络由高度互连的处理单元(神经元)层组成。数据通过加权连接在这些层中移动,每个内部神经元都与一个激活函数相关联,通常负责非线性变换。神经网络的一种特定变体,即长短期记忆网络(long short

term memory,lstm),因其处理时序数据的强大能力而受到关注。


技术实现要素:

4.本发明的目的在于提供基于机器学习融合卫星与天气数据的大豆产量预测方法,以解决上述背景技术中提出的问题。
5.为实现上述目的,本发明提供如下技术方案:基于机器学习融合卫星与天气数据的大豆产量预测方法,包括如下步骤:
6.s1:获取历史区域的大豆产量及影响因素数据库,大豆产量数据及影响因素数据库中包含大豆作物范围数据、降雨量数据、大豆产量数据、归一化植被指数、增强植被指数、地表温度数据;
7.s2:提取大豆作物范围数据、降雨量数据、归一化植被指数、增强植被指数、地表温度数据并与卫星图像、天气数据整合,并将整合数据以及大豆产量数据进行数据预处理;
8.s3:基于预处理数据进行模型的构建以及训练;
9.s4:基于模型算法测试已训练模型的性能并进行筛选,基于筛选的模型进行大豆产量预测。
10.优选的,s2中数据预处理包括对数据进行初筛和归一化,即将数据库内数据按比例划分为训练集和测试集对数据进行初筛和归一化处理。
11.优选的,s3中模型的构建以及训练过程之前还包括:基于训练集建立多组基础模型,在多组基础模型的超参数下评估挑选网络模型超参数,确定大豆产量预测模型的参数。
12.优选的,s3中模型的训练过程包括将所述训练集投入到参数确定的大豆产量预测模型中进行训练,得到训练好的大豆产量预测模型。
13.优选的,s4中基于lstm神经网络测试已训练模型的性能并进行筛选,使用mae、mse和rmse指标评价模型,并根据指标选取最佳模型。
14.与现有技术相比,本发明的有益效果是:
15.本发明的预测方法基于多元线性回归、rf模型和lstm模型,并使用归一化植被指数(ndvi)、增强植被指数(evi)、地表温度和降水作为自变量预测大豆产量的性能,能在大豆生长季节以合理的准确度预测产量,将统计技术、遥感、天气与实地调查数据相结合的好处,以便进行更可靠的当季大豆产量预测,而且预测结果更为准确。
附图说明
16.图1为本发明的预测方法流程图;
17.图2为本发明实施例的算法模型结构图。
具体实施方式
18.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
19.请参阅图1,本发明提供一种技术方案:基于机器学习融合卫星与天气数据的大豆产量预测方法,包括:
20.s1:获取历史区域的大豆产量及影响因素数据库,大豆产量数据及影响因素数据库中包含大豆作物范围数据、降雨量数据、大豆产量数据、归一化植被指数、增强植被指数、地表温度数据;
21.s2:提取大豆作物范围数据、降雨量数据、归一化植被指数、增强植被指数、地表温度数据并与卫星图像、天气数据整合,并将整合数据以及大豆产量数据进行数据预处理;
22.s3:基于预处理数据进行模型的构建以及训练;
23.s4:基于模型算法测试已训练模型的性能并进行筛选,基于筛选的模型进行大豆产量预测。
24.在本实施例中,s2中数据预处理包括对数据进行初筛和归一化,即将数据库内数据按比例划分为训练集和测试集对数据进行初筛和归一化处理。
25.在本实施例中,s3中模型的构建以及训练过程之前还包括:基于训练集建立多组基础模型,在多组基础模型的超参数下评估挑选网络模型超参数,确定大豆产量预测模型的参数。
26.在本实施例中,s3中模型的训练过程包括将所述训练集投入到参数确定的大豆产量预测模型中进行训练,得到训练好的大豆产量预测模型。
27.优选的,s4中基于lstm神经网络测试已训练模型的性能并进行筛选,使用mae、mse和rmse指标评价模型,并根据指标选取最佳模型。
28.请参阅图2,本发明使用mlr、rf和lstm来描述产量、植被指数(vi)、地表温度(lst)
和降水之间的关系,其中植物指数(vi)包括归一化植被指数(ndvi)、增强植被指数(evi);
29.本实施例选择mlr算法(多元线性回归)作为相对于两种机器学习算法的基准是因为它代表了在因变量和自变量之间建立经验关系的最简单形式之一;
30.本实施例选择了rf模型(随机森林)来探索非线性模型。rf模型易于训练,对异常值的敏感性低,计算效率高,并且对过度拟合具有鲁棒性;
31.本实施例使用lstm神经网络测试模型性能。lstm神经网络准备接收时间序列数据作为输入,并且能够提取与时间序列数据相关的重要特征,因为它构建且训练了一个带有时间步长的链结构,类似于作物生长建模的工作方式。每一步都从上一步和外部输入(新输入的ndvi、evi、lst和降水值特征)获取信息,并为下一步提供输出。此外,在训练过程中,该算法能够保留输入信号的关键信息,而忽略不太重要的部分。
32.对于mlr和rf,测试了两类预测变量:
33.(1)多时相evi、ndvi、lst和降水;
34.(2)季节性综合evi、ndvi、lst和降水(在生长季节累积)。
35.因此,对于这两种算法,年度城市级大豆产量预测模型可以写成以下函数:
36.y
ij
=f(x
ij
) e
ij
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
37.其中,上述y
ij
是第i个市第j年的大豆产量,x是用户选择的预测变量向量,f是用户选择的具体算法,e
ij
是与预测相关的误差。
38.lstm神经网络同时接收两类输入,分为动态数据和静态数据。动态数据与vi、lst和降水时间序列相关,并以三维数组(样本、时间步长和特征)进行组织。静态数据是季节性综合变量。全连接层则用于处理这些不同的输入维度。
39.对于所有算法,模型性能使用留出一年数据量的交叉验证方法进行评估,并使用三个指标来评估模型准确性:平均绝对误差(mae)、均方误差(mse)和(rmse),其表达式见式(2)、(3)和(4)。
[0040][0041][0042][0043]
对于所有模型,都进行时序敏感性分析,以检查预测产量模型可以在作物生长季节的早期实施及其对整体模型性能的影响。为此,随后从模型中删除了在生长季节后期收集的数据,并使用上述相同的验证方法来计算mae、mse和rmse。
[0044]
本发明实施例考虑的整个地区(所有城市的平均值)的长期产量数据(1972

2017)是从ibge收集的。使用年份作为自变量,产量作为因变量进行回归分析。这种关系的残差(产量异常)用于r程序中的蒙特卡罗模拟,旨在估计任何特定事件发生的可能性。假设产量
异常服从正态分布,均值和标准差从数据中估计。使用拟合模型的残差而不是使用绝对产量值来解释多年间的遗传和演变。
[0045]
使用天气数据,从r语言的nasa power中提取本发明中考虑的所有城市的长期(1982

2018)温度和降水信息,这些信息被总结到8天的时间内(温度的平均值和降水的总和)。在所有8天的降水、温度和产量之间进行了皮尔逊相关性分析,以便找到这些天气变量和产量之间的高相关性的连续时期。在确定了这个时期后总结整个时期的降水和温度,并假设降水和温度遵循多元正态分布,进行蒙特卡罗模拟μ1、μ2和σ的分布,其中:μ1是降水平均值,μ2是温度平均值,σ是降水和温度之间的方差

协方差矩阵。当维数很大且样本量适中时,使用二元正态分布以避免维数灾难相关的问题。
[0046]
因此,本发明使用一年中的第16天(1月16日)、第32天(2月1日)、第48天(2月17日)和第64天(3月5日)之前的数据测试模型。
[0047]
下表为实施例中mlr、rf和lstm神经网络之间的模型评价指标对比
[0048][0049]
在本实施例中,包括lst和降水等附加变量使mae、rmse和mse分别降低了16%、15%和30%。热量、蒸汽压亏缺的负相关性和降水的正相关性已经成功地结合多时相vi(植被指数)进行了探索,以提供更准确的数据,对不同作物的近实时预测。
[0050]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜