一种基于深度学习网络的山火预测方法与流程

2021-10-27 21:11:00 来源：中国专利 TAG：深度山火学习预测方法

1.本发明涉及深度学习技术领域，更具体地，涉及一种基于深度学习网络的山火预测方法。

背景技术：

2.森林资源不仅可以为人类的生产、生活提供宝贵的原材料，还可以调节气候、保持水土和净化空气，是人类最为重要的资源之一，有着“地球之肺”的美誉，同时也对整个国民经济的可持续发展起着极为重要的作用。但是近年来，随着全球气候变暖，世界范围内森林火灾呈现上升趋势。全球每年平均发生森林火灾超过十万次，烧毁森林面积达数百万公顷。
3.另一方面，输电线路是电网运行的命脉，是关系国计民生的“生命线”。随着我国经济的快速发展，电力需求显著增加，电力基础设施建设取得快速发展。而架空输电线路大都穿越地表植被覆盖率较高、地形条件恶劣的森林或者山地，每到春耕和秋收，或者是清明重阳等野外用火高发期，电网周边就容易发生大范围山火。在山火产生的高温、浓烟条件下，使得线路绝缘水平下降，引发输电线路跳闸事故。因此，随着电网附近植被密度的明显增加，火灾引起的输电线路跳闸事故持续增加，山火被认为是高压输电网络安全稳定运行的主要威胁之一。
4.因此，对山火进行准确的风险评估，提前预警火灾的发生，对火灾高风险区提前调度人力物力开展隐患防止工作，做好消防准备具有重要的意义。
5.目前山火评估大部分都是基于传统的统计模型或者机器学习模型。传统的统计模型对山火的预测精度相对较低，或是要求具备专家知识对山火影响因子重要程度进行打分，对专业知识要求高。机器学习模型对山火的预测比传统统计模型精度更高，但是基于像元对山火进行识别的，忽略了当前像元以外的上下文信息，片面的考虑了问题。学者们对深度学习在山火预领域的发掘探索还相对较少，而深度学习模型能够提取山火影响因子的更多信息，不但可以考虑当前像元周围的信息来预测当前像元是否为山火，还能考虑当前像元前后时间是否发生了山火的信息，能够发掘更深层次的线性和非线性关系，可以更加有效地预测山火。
6.公开号为cn106295871a，公开日：2017
‑
01
‑
04，提出的气象因子与输电线路山火发生概率的关联性计算方法，通过针对计算区域内各自的山火发生特点和气象因子特点，将气象因子之间的关系解耦，计算输电线路山火发生概率与气象因子之间的定量关联关系，但对气象因子的权重缺乏合理的设置，预测精度较低。

技术实现要素：

7.本发明为克服上述技术问题，提供一种更全面设置影响因子，且预测精度较高的一种基于深度学习网络的山火预测方法。
8.本发明技术方案如下：
9.一种基于深度学习网络的山火预测方法，包括步骤：
10.s1：选取研究区域山火的直接或者间接的影响因子，并剔除影响因子中相关性较高的冗余因子，得到影响因子栅格数据；
11.s2：建立山火影响因子栅格数据集和火点栅格数据集；
12.s3：利用山火影响因子栅格数据集和火点栅格数据集构建样本数据库，得到样本数据，并把样本数据分割成训练集和验证集；
13.s4：构建山火预测网络模型，所述山火预测网络模型包括输入模块、cnn卷积神经网络、convlstm卷积长短期记忆网络，所述输入模块、cnn卷积神经网络、convlstm卷积长短期记忆网络依次连接；
14.s5：利用训练集和验证集的数据训练和验证山火预测网络模型，并对模型的超参数进行优化，计算模型的预测准确率和loss值，训练完成，得到准确率最高、loss值最小的山火预测网络模型；
15.s6：实际应用时将研究区域采集到的待测数据输入到训练完成的山火预测网络模型，得到山火火点预测结果。
16.上述技术方案，火点是指卫星侦测到发生山火的地点。
17.本技术方案的深度学习模型同时引入了卷积神经网络cnn和卷积长短期记忆网络convlstm对山火进行预测，不仅考虑了山火在时间上的时序规律，也能够提取山火像元以及山火附近像元的空间特征；利用山火时空维度的信息，使预测精度更高，并且本技术方案通过深度学习自动构建山火预测模型，调节影响因子权重，无需过高的专家知识设置影响因子权重，通用性更好。
18.进一步地，步骤s1所述影响因子包括以下类型，分别为：遥感、地形、气象、人类活动；所述遥感影响因子包括：地表温度、植被含水率、归一化植被指数、土地类型；所述地形影响因子包括：高程、坡度、坡向；所述气象影响因子包括：降水量、最高气温、空气湿度、最大阵风风速、最大阵风风向；所述人类活动影响因子包括：栅格与道路间距离、栅格与河流间距离、栅格与村庄间距离。
19.进一步地，步骤s1所述剔除影响因子中相关性较高的冗余因子是通过多重共线性检验实现的。
20.进一步地，所述多重共线性检验的评价指标包括方差膨胀系数vif和容忍度tolerance。
21.进一步地，步骤s2所述山火影响因子栅格数据集中每一天的数据包括15个波段，每个波段代表一个当天的山火影响因子，15个山火影响因子的空间分辨率统一为500m，时间分辨率为1天；所述火点栅格数据集通过遥感卫星传感器modis和viirs获得。
22.进一步地，步骤s3构建样本数据库并分割训练集和验证集步骤包括：
23.s31：在得到的火点和山火影响因子栅格数据集后，以火点为中心，定义一个t*25*25像元大小的窗口，用于提取火点对应日期及前t天的对应位置的山火影响因子，其中t表示时间步；最终提取得到m个t*15*25*25的火点样本数组；
24.s32：从火点对应日期及前t天中每天随机选取m/(t 1)个非火点，定义一个t*25*25像元大小的窗口，提取得到m个非火点样本数组；
25.s33：利用m个t*15*25*25的火点样本数组和m个非火点样本数组构建一个具有2m个样本的样本数据库，其中火点样本数组和非火点样本数组的数量相同；
26.s34：对样本数据库进行分层抽样，将样本数据库分割为训练集和验证集。
27.进一步地，步骤s4所述山火预测网络模型，还包括：bn层、relu层、池化层、全连接层、softmax激活函数；具体连接关系为：
28.所述cnn卷积神经网络共有3个cnn层，每个cnn层输出端均连接bn层、relu层和池化层构成一个空间特征提取模块，三个空间特征提取模块依次相连；所述convlstm卷积长短期记忆网络包括一个convlstm层，所述输入模块连接第一个空间特征提取模块的输入端，第三个空间特征提取模块的输出端连接convlstm层的输入端，convlstm层的输出端连接bn层然后再连接3个全连接层，每个全连接层分别有128、64和32个神经元，最后再接一个具有2个神经元的全连接层，2个神经元的全连接层输出端连接softmax激活函数，softmax激活函数输出模型的预测结果。
29.上述技术方案中，所述bn层是一种正则化技术，它不但可以使得网络更快的收敛，而且还能提升模型的准确率；池化层采用最大池化策略，可以提取非线性关系，每个池化层特征图的宽高将减半。cnn层用于提取样本的空间特征得到特征图。
30.进一步地，三个cnn层的卷积核数量分别是32、64和128，卷积之后用0填充边界，使得卷积前后特征图大小一致。
31.进一步地，植被含水率通过归一化红外指数ndii7表示。
32.进一步地，所述归一化植被指数和植被含水率使用遥感卫星传感器modis获取，其中归一化植被指数由modis探测得到的mod13a1数据进行表示，植被含水率由modis探测得到的mod09a1数据进行表示；
33.mod13a1和mod09a1的比例系数都为0.0001，因此对mod13a1和mod09a1每个波段的每个像素值乘以0.0001，mod09a1数据包含7个波段，其中归一化红外指数ndii7的计算公式如下：
34.ndii7＝(ρ2‑
ρ7)/(ρ2 ρ7)
35.其中ρ2为第二波段，即近红外波段，ρ7为第七波段，即短波红外波段。
36.本技术方案的深度学习模型同时引入了卷积神经网络cnn和卷积长短期记忆网络convlstm对山火进行预测，不仅考虑了山火在时间上的时序规律，也能够提取山火像元以及山火附近像元的空间特征；利用山火时空维度的信息，使预测精度更高，并且本技术方案通过深度学习自动构建山火预测模型，调节影响因子权重，无需过高的专家知识设置影响因子权重，通用性更好。
附图说明
37.图1为本发明山火预测网络模型结构图；
38.图2为建立山火预测网络模型的流程图；
39.图3为cnn
‑
convlstm模型训练过程的准确率；
40.图4为cnn模型训练过程的准确率；
41.图5为convlstm模型训练过程的准确率；
42.图6为cnn模型预测效果图；
43.图7为convlstm模型预测效果图；
44.图8为cnn
‑
convlstm模型预测效果图；
45.图9为道路距离栅格图；
46.图10为最大阵风风向栅格图；
47.图11为河流距离栅格图；
48.图12为村庄距离栅格图；
49.图13为海拔栅格图；
50.图14为坡度栅格图；
51.图15为坡向栅格图；
52.图16为地表温度栅格图；
53.图17为归一化红外指数栅格图；
54.图18为归一化植被指数栅格图；
55.图19为土地类型栅格图；
56.图20为降水量栅格图；
57.图21为空气湿度栅格图；
58.图22为最高气温栅格图；
59.图23为最大阵风风速栅格图。
具体实施方式
60.为清楚地说明本发明一种基于深度学习网络的山火预测方法，结合实例和附图对本发明作进一步说明，但不应以此限制本发明的保护范围。
61.实施例1
62.一种基于深度学习网络的山火预测方法，如图2所示，所述方法包括以下步骤：
63.s1：选取研究区域山火的直接或者间接的影响因子，并剔除影响因子中相关性较高的冗余因子，得到影响因子栅格数据；
64.s2：建立山火影响因子栅格数据集和火点栅格数据集；
65.s3：利用山火影响因子栅格数据集和火点栅格数据集构建样本数据库，得到样本数据，并把样本数据分割成训练集和验证集；
66.s4：构建山火预测网络模型，所述山火预测网络模型包括输入模块、cnn卷积神经网络、convlstm卷积长短期记忆网络，所述输入模块、cnn卷积神经网络、convlstm卷积长短期记忆网络依次连接；
67.s5：利用训练集和验证集的数据训练和验证山火预测网络模型，并对模型的超参数进行优化，计算模型的预测准确率和loss值，训练完成，得到准确率最高、loss值最小的山火预测网络模型；
68.s6：实际应用时将研究区域采集到的待测数据输入到训练完成的山火预测网络模型，得到山火火点预测结果。
69.本技术方案的深度学习模型同时引入了卷积神经网络cnn和卷积长短期记忆网络convlstm对山火进行预测，不仅考虑了山火在时间上的时序规律，也能够提取山火像元以及山火附近像元的空间特征；利用山火时空维度的信息，使预测精度更高，并且本技术方案通过深度学习自动构建山火预测模型，调节影响因子权重，无需过高的专家知识设置影响因子权重，通用性更好。
70.实施例2
71.一种基于深度学习网络的山火预测方法，建立本实施例山火预测网络模型的流程图如图2所示，包括以下步骤：
72.s1：选取研究区域山火的直接或者间接的影响因子，并剔除影响因子中相关性较高的冗余因子，得到影响因子栅格数据；
73.所述影响因子包括以下类型，分别为：遥感、地形、气象、人类活动；所述遥感影响因子包括：地表温度、植被含水率、归一化植被指数、土地类型；所述地形影响因子包括：高程、坡度、坡向；所述气象影响因子包括：降水量、最高气温、空气湿度、最大阵风风速、最大阵风风向；所述人类活动影响因子包括：栅格与道路间距离、栅格与河流间距离、栅格与村庄间距离。通过多重共线性检验剔除影响因子中相关性较高的冗余因子，所述多重共线性检验的评价指标包括方差膨胀系数vif和容忍度tolerance。
74.所述植被含水率通过归一化红外指数ndii7表示，所述归一化植被指数和归一化红外指数ndii7使用遥感卫星传感器modis获取，其中归一化植被指数由modis探测得到的mod13a1数据进行表示，归一化红外指数ndii7由modis探测得到的mod09a1数据进行表示；
75.mod13a1和mod09a1的比例系数都为0.0001，因此对mod13a1和mod09a1每个波段的每个像素值乘以0.0001，mod09a1数据包含7个波段，其中归一化红外指数ndii7的计算公式如下：
76.ndii7＝(ρ2‑
ρ7)/(ρ2 ρ7)
77.其中ρ2为第二波段，即近红外波段，ρ7为第七波段，即短波红外波段。
78.s2：建立山火影响因子栅格数据集和火点栅格数据集；
79.所述山火影响因子栅格数据集中每一天的数据包括15个波段，每个波段代表一个当天的山火影响因子，15个山火影响因子的空间分辨率统一为500m，时间分辨率为1天；所述火点栅格数据集通过遥感卫星传感器modis和viirs获得。
80.s3：利用山火影响因子栅格数据集和火点栅格数据集构建样本数据库，得到样本数据，并把样本数据分割成训练集和验证集；
81.构建样本数据库并分割训练集和验证集步骤包括：
82.s31：在得到的火点和山火影响因子栅格数据集后，以火点为中心，定义一个t*25*25像元大小的窗口，用于提取火点对应日期及前t天的对应位置的山火影响因子，其中t表示时间步；最终提取得到m个t*15*25*25的火点样本数组；
83.s32：从火点对应日期及前t天中每天随机选取m/(t 1)个非火点，定义一个t*25*25像元大小的窗口，提取得到m个非火点样本数组；
84.s33：利用m个t*15*25*25的火点样本数组和m个非火点样本数组构建一个具有2m个样本的样本数据库，其中火点样本数组和非火点样本数组的数量相同；
85.s34：对样本数据库进行分层抽样，将样本数据库分割为训练集和验证集。
86.s4：构建山火预测网络模型，所述山火预测网络模型包括输入模块、cnn卷积神经网络、convlstm卷积长短期记忆网络，所述输入模块、cnn卷积神经网络、convlstm卷积长短期记忆网络依次连接；
87.所述山火预测网络模型，还包括：bn层、relu层、池化层、全连接层、softmax激活函数；具体连接关系为：
88.所述cnn卷积神经网络共有3个cnn层，每个cnn层输出端均连接bn层、relu层和池化层构成一个空间特征提取模块，三个空间特征提取模块依次相连；所述convlstm卷积长短期记忆网络包括一个convlstm层，所述输入模块连接第一个空间特征提取模块的输入端，第三个空间特征提取模块的输出端连接convlstm层的输入端，convlstm层的输出端连接bn层然后再连接3个全连接层，每个全连接层分别有128、64和32个神经元，最后再接一个具有2个神经元的全连接层，2个神经元的全连接层输出端连接softmax激活函数，softmax激活函数输出模型的预测结果。
89.s5：利用训练集和验证集的数据训练和验证山火预测网络模型，并对模型的超参数进行优化，计算模型的预测准确率和loss值，训练完成，得到准确率最高、loss值最小的山火预测网络模型；
90.s6：实际应用时将研究区域采集到的待测数据输入到训练完成的山火预测网络模型，得到山火火点预测结果。
91.实施例3
92.一种基于深度学习网络的山火预测方法，如图1所示，包括步骤：
93.s1：选取研究区域山火的直接或者间接的影响因子，并剔除影响因子中相关性较高的冗余因子，得到影响因子栅格数据；
94.所述影响因子包括以下类型，分别为：遥感、地形、气象、人类活动；所述遥感影响因子包括：地表温度、植被含水率、归一化植被指数、土地类型；所述地形影响因子包括：高程、坡度、坡向；所述气象影响因子包括：降水量、最高气温、空气湿度、最大阵风风速、最大阵风风向；所述人类活动影响因子包括：栅格与道路间距离、栅格与河流间距离、栅格与村庄间距离，本实施例选择云南作为研究区域，图9至图23分别为道路距离栅格图；最大阵风风向栅格图；河流距离栅格图；村庄距离栅格图；海拔栅格图；坡度栅格图；坡向栅格图；地表温度栅格图；归一化红外指数栅格图；归一化植被指数栅格图；土地类型栅格图；降水量栅格图；空气湿度栅格图；最高气温栅格图；最大阵风风速栅格图。
95.所述影响因子和山火火点的具体说明如表1所示：
96.[0097][0098]
表1
[0099]
所述遥感、地形、人类活动统一采用arcgis 10.2进行处理。由于山火影响因子的空间分辨率大小不一，结合实际情况，本实施例中，把所有山火影响因子的空间分辨率统一为500m大小。
[0100]
与地形相关的影响因子包括高程、坡度、坡向。通过高程可以计算得到海拔、坡向和坡度，海拔越高，植被的湿度越大，可燃物的含水率和空气湿度就越大，山火发生的风险就越小。坡度的大小直接影响可燃物含水率的变化，在坡度陡峭的地区，土壤的保水能力差，水分流失严重，植被往往比较干燥，山火风险高；同时，坡度还会影响火灾的蔓延速度，对于上坡山火，上部的可燃物受到下方山火的烘烤，使得水分大量流失，加速山火蔓延。坡向的不同，植被接受阳光照射的程度、照射时常也不一样，影响植被状况和空气湿度。
[0101]
地形影响因素通过数字高程模型(digital elevation model,dem)计算得到，本实施例采用的数字高程模型是(advanced spaceborne thermal emission and reflection radiometer globe digital elevation model)aster gdem version 2。
[0102]
气象类的山火影响因子包括降水量、最高气温、空气湿度、最大阵风风速、最大阵风风向。降水量和空气湿度的大小会影响可燃物含水率，降水量越大，空气湿度越大，空气中的含水量越大，植被的水分流失则越少，山火风险越低。气温是野外火灾发生和蔓延的重要因素之一，当气温升高时，空气湿度下降，植被的蒸腾作用增强，导致可燃物含水率降低，山火风险上升。风可以带走空气中的水分，加速植被的蒸腾作用，减少可燃物含水率；另外一方面，风还能加速植被大火的蔓延和传播。
[0103]
本实施例从中国科学院资源环境科学数据中心(http://www.resdc.cn)获取了研究区域125个气象站2018
‑
2019年的上述几个气象要素记录，并通过anusplin对125个气象站的气象要素进行批量插值。最终得到研究区域2018
‑
2019年每日的500m空间分辨率的气象栅格数据集。
[0104]
遥感影响因子包括归一化植被指数(ndvi)和植被含水率(fmc)。ndvi是近红外波段的反射值(nir)与红光波段的反射值(r)之差比上两者之和。ndvi的范围是[
‑
1,1]，因为不同地表对近红外波段和红光波段的反射率有较大差异，所以可以通过ndvi来判断地表覆盖物。ndvi负值表示地面覆盖为云、水、雪等；0表示有岩石或裸土等，nir和r近似相等；正值，表示有植被覆盖，且数值随覆盖度增大而增大。ndvi被认为是山火中的一个重要变量火灾建模。ndvi值反映植被的健康状况和燃料负荷分布。fmc对植被着火的难易程度直接相关，与此同时影响火势蔓延速度。现有研究文献表明第7波段的归一化红外指数(ndii7)可以用来表征可燃物含水率。因此，本实施例从数据的可获得性考虑，采用ndii7来代替可燃物含水率。ndvi和ndii7分别采用modis产品mod13a1和mod09a1。mod13a1是16天时间周期的500m空间分辨率科学数据集，mod09a1是时间周期为8天的500m空间分辨率科学数据集。mod13a1和mod09a1的比例系数都为0.0001，因此要对每个波段的每个像素值乘以0.0001。mod09a1数据包含7个波段，其中ndii7的计算公式如下：
[0105]
ndii7＝(ρ2‑
ρ7)/(ρ2 ρ7)
[0106]
其中，ρ2为第2波段，即近红外波段，ρ7为第7波段，即短波红外波段波段。
[0107]
另外，本实施例选取了栅格距离道路的距离、距离河流距离、距离村庄的距离来表征人类活动对山火的影响。
[0108]
由于人类工业化活动加快，进入林区和使用森林的人数不断增加，对森林的影响加剧，道路建设加重了沿路的毁林开荒用火，山火由此而诱发。村庄一般依附在山区，再村庄人类活动频繁，对于祭祀、烧荒等活动很可能会引发山火。河流则可以保存土壤中的水分和增加空气湿度，使得附件植被含水量不至流失，另外可以有效阻断火势的蔓延。
[0109]
遥感影响因子还包括土地类型和地表温度，不同的土地类型引起山火的难易程度不尽相同，对于水体和贫瘠地等类型是不可能引发山火的，而不同的植被类型引发山火的的可能性也不一样，草地的火险等级是最高的，次之的是灌木林、阔叶林，最低的是落叶阔叶林。本实施例从全国地理信息资源目录服务系统(http://www.webmap.cn/main.do？method＝index)获取了全国道路、河流、村庄矢量图，并用掩膜裁剪出研究区域的道路、河流、村庄。在此基础上，通过arcgis计算每个栅格距离道路、河流、村庄的欧氏距离，最终得
到研究区域的道路、河流、村庄的栅格数据。土地类型则使用modis提供的土地覆盖分类产品mcd12q1，它具有5个分类标准，本实施例采取其中的igbp全球植被分类标准。
[0110]
在选取山火影响因子后，确定影响因子之间是否具有多重共线性。多重共线性是指两个预测变量之间具有强相关性，这可能导致错误的分析结果。本实施例采用方差膨胀系数(vif)和容忍度(tolerance)判断变量之间是否具有强相关性。在统计学上，vif>10或者tolerance<0.1时认为变量之间存在潜在的多重线性相关。vif和tolerance值如表2所示：
[0111][0112][0113]
表2
[0114]
s2：建立山火影响因子栅格数据集和火点栅格数据集；
[0115]
通过上述山火影响因子的选取以及数据的预处理，得到了各个山火影响因子的栅格数据，但是各种因子的栅格数据时间和空间分辨率不尽相同。本实施例通过arcgis统一各个因子的栅格空间分辨率为500m，即每个栅格大小代表500m*500m的实际空间区域。
[0116]
气象影响因子和地表温度的时间分辨率是每日的，归一化红外指数的时间分辨率是8天，归一化植被指数的时间分辨率是16天。海拔、坡度、坡向、距道路距离、距河流距离、
距村庄距离则是静态的因子。为了统一山火影响因子的时间分辨率，本实施例制作了时间分辨率为1天的山火影响因子栅格数据集，制作的栅格数据包含15个波段，每个波段代表着一个当天的山火影响因子。考虑到归一化红外指数和归一化植被指数在一个周期内的变化是比较小的，而对于静态数据则是不变的，因此如果在一段时间内没有对应日期的数据，则将该段时间的数据作为每一日的数据。
[0117]
火点栅格数据集的建立需要获取近期研究区域发生的山火事件，包括山火的空间位置等信息。从而构建研究区域的山火样本数据库。为此，本实施例获取了modis和viirs2018
‑
2019年的遥感热点产品(http://earthdata.nasa.gov/firms)，如果研究区域某个地理位置存在热异常，modis和viirs传感器则会将此热异常记录下来。另外一方面，电力部门巡检人员记录的历史火点信息也作为本实施例的山火样本数据。为了筛选和清理不合理的火点信息，比如固定热源，本实施例获取了研究区域的发电厂和工业场所的地理位置，并剔除了这些固定热源附近5km内被modis和viirs记录的火点，最终只保留了植被大火类型的火点。经过筛选和清理后得到2018
‑
2019年每日的火点。
[0118]
s3：利用山火影响因子栅格数据集和火点栅格数据集构建样本数据库，得到样本数据，并把样本数据分割成训练集和验证集；
[0119]
对山火样本数据库按日期进行随机抽样，分割为2个子数据集，第一个子数据集包含584天(80％)的火点，用于训练和验证山火概率模型。第二个子数据集包含剩下146天(20％)的火点，用于测试山火概率模型。
[0120]
在得到的火点和山火影响因子栅格数据集后，以火点为中心，定义一个t*25*25像元大小的窗口，用于提取第一个子数据集中火点对应日期及前t天的对应位置的山火影响因子，其中t表示时间步，最终提取得到8750个用于训练和验证模型的t*15*25*25火点样本数组。与此同时，每天随机选取了相同数量的非火点，与处理火点同样的方式获取了8750个非火点样本数组。最终得到一个具有17500个样本的样本数据库。
[0121]
s4：构建山火预测网络模型，所述山火预测网络模型包括输入模块、cnn层、convlstm层，所述输入模块、cnn层、convlstm层依次连接；
[0122]
本实施例的山火预测网络模型如图1所示，cnn网络可以提取火点的空间特征，而convlstm可以提取火点的时间特征，每个输入都是4维的t*15*25*25的数组，总共由17500个样本。其中共有3个cnn卷积层，3个卷积层的卷积核数量分别是32、64和128，卷积处理之后用0填充边界，使得卷积前后特征图大小一致。每个卷积层后面接bn层、relu层和池化层。其中，bn层是一种正则化技术，它不但可以使得网络更快的收敛，而且还能提升模型的准确率；池化层采用最大池化策略，可以提取非线性关系，每个池化层特征图的宽高将减半。经过cnn层提取样本的空间特征得到特征图后，将特征图输入convlstm层进一步提取时间特征，然后再连接3个全连接层，每个全连接层分别有128、64和32个神经元，最后再连接一个2个神经元的全连接层，这个全连接层输出端会接一个softmax激活函数，对每个输入数据计算火点和非火点的得分，选取得分大的作为模型的预测结果。
[0123]
其中cnn被广泛应用于图像处理领域的分类和识别中，通过反向传播算法对参数进行训练，具有很强的非线性学习能力。通常，cnn由卷积层、池化层和全连接层组成。不同层次具有不同的功能，卷积层执行输入和一组滤波器之间的卷积运算，输出各个滤波器对应的特征图。通常，每个特征图之后会有一个非线性激活函数。校正线性单元(relu)是最常
用的激活函数，能够对卷积层产生的特征图进行非线性变换，将非线性引入系统。卷积层的功能是提取不同的输入，实现权重共享。卷积层可以用以下公式表示：
[0124]
y
j
＝f(b
j
∑
i
k
i
*x
ij
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0125]
其中y
j
表示卷积层的第j个输出，x
i
代表卷积层具有i个通道的第j个输入，k
i
代表具有i个通道卷积核，*表示离散卷积操作，b
j
表示偏置值，f是非线性激活函数。
[0126]
cnn的缺点是缺少对山火数据时序关系的建模。本实施例引入convlstm层追踪一些随时间变化的状态。convlstm的核心是convlstm细胞。对于输入中的每个时间步，由以下一组公式更新得到：
[0127]
i
t
＝σ(w
xi
*x
t
w
hi
*h
t
‑1 w
ci
c
t
‑1 b
i
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0128]
f
t
＝σ(w
xf
*x
t
w
hf
*h
t
‑1 w
cf
c
t
‑1 b
f
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0129]
c
t
＝f
t
c
t
‑1 i
t
tanh(w
xc
*x
t
w
hc
*h
t
‑1 b
c
)
ꢀꢀ
(4)
[0130]
o
t
＝σ(w
xo
*x
t
w
ho
*h
t
‑1 w
co
c
t
‑1 b
o
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0131]
h
t
＝o
t
tanh(c
t
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0132]
其中，i
t
是时间t的输入门，f
t
是时间t的遗的门，c
t
是时间t的单元状态，o
t
是时间t的输出门，h
t
是时间t的输出，x
t
是时间t的输入，各个矩阵w和向量b是在模型训练过程中待学习的权重和偏置值，σ和tanh是激活函数，*代表卷积运算。
[0133]
s5：利用训练集和验证集的数据训练和验证山火预测网络模型，并对模型的超参数进行优化，计算模型的预测准确率和loss值，训练完成，得到准确率最高、loss值最小的山火预测网络模型；
[0134]
将17500个样本数据以8：2分为训练集和验证集，输入到设计好的模型中训练和验证，并计算模型在两个数据集的预测准确率和loss值。准确率越大，loss值越小，说明整个数据集中模型的预测结果和实际情况越符合。整个模型的参数将在训练过程自动学习，训练网络是一个寻找适当的参数，以最小化预测结果和真实类别误差的过程。模型将每个输入转化为对各个类别的得分，最终将得分最高的类别作为预测结果。损失函数将通过前向传播计算预测结果和真实结果的误差，并通过反向传播算法更新参数。本实施例中比较了cnn
‑
convlstm和cnn、convlstm模型的准确率和loss值。各个模型的训练过程如图3、图4、图5所示，准确率如表3所示：
[0135]
模型cnnconvlstmcnn
‑
convlstm训练集准确率0.9990.9320.996训练集loss0.0060.1740.023验证集准确率0.8920.8750.906
[0136]
表3
[0137]
模型经过训练后，建立了一个可识别山火的分类模型。利用测试集中的数据对模型的性能进行评估，选取将测试集中任一天的山火影响因子栅格数据输入到训练好的模型。测试集中的山火影响因子栅格数据集被滑动窗口分割成25*25的图像块，每个图像块分别输入到训练好的预测模型，模型输出每个图像块可能发生山火的概率，最后将每个输出概率重新组合成研究区域对应位置的山火概率得到山火风险图。
[0138]
以2018.1.17日为例，制作了3个模型的山火风险图，图6是cnn模型的山火风险图，图7是convlstm模型的山火风险图，图8是cnn
‑
convlstm模型的山火风险图。其中，黑色三角
标记表示实际发生的被卫星侦测的山火。利用arcgis中的自然断点法将风险分为5个等级，其中白色表示发生山火风险低的区域，灰色表示发生山火风险高的区域。然后统计各个火点在各个等级的分布，如表4所示。
[0139][0140][0141]
表4
[0142]
从表4中3个模型火点的分别等级可以看出，有6个火点是超出云南省范围的，所以它们的值是nodata，cnn模型的预测结果中，有46个火点处于等级1的低风险，convlstm模型有20个火点处于等级1的低风险，cnn
‑
convlstm则有34个火点处于等级1的低风险，从这个角度来看，cnn模型的预测结使得更多的火点落在了风险极低的区域，convlstm的预测结果使得更少的火点落在低风险区域，可以看出，cnn模型的预测是偏向保守的，convlstm模型的预测是偏向激进的，而cnn
‑
convlstm模型则结合了两者的特点，其预测结果使得火点落在山火风险极低的区域有34个，介于另外两个模型之间。从另一个角度看，cnn模型中有22个火点处于等级5的高风险，convlstm模型中有26个火点处于等级5的高风险，cnn
‑
convlstm有33个火点处于等级5的高风险，虽然convlstm模型是偏向激进的，但是并没有使得更多的火点落在等级风险极高的区域，cnn
‑
convlstm模型的预测结果使得更多的火点落在高风险区域，在三个模型中是最好的。
[0143]
s6：实际应用时将研究区域采集到的待测数据输入到训练完成的山火预测网络模型，得到山火火点预测结果。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：芯片的内核切换方法、芯片、电子设备及存储介质与流程

一种基于深度学习网络的山火预测方法与流程

相关文献

最热文献