一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种环境信息预测的方法、装置及设备与流程

2022-09-14 18:40:38 来源:中国专利 TAG:


1.本发明属于地理信息技术应用领域,尤其涉及一种环境信息预测的方法、装置及设备。


背景技术:

2.随着人类对地球环境的关注度不断提高,各个国家和地区设立了越来越多的监测点,用于监测各类环境数据。由于各类条件的限制,现有环境监测点存在密度不均衡等问题,难以实现全范围的均匀覆盖。为了分析整个参考区域中的环境信息,研究人员基于监测点数据,建立该环境信息和影响因子之间的关系,从而预测该环境信息在整个参考区域中的估值,揭示该环境信息在空间上的分布规律,为支撑环境污染的预警、治理,以及活动保护人类健康与社会可持续发展等活动,具有重大的现实意义和指导价值。


技术实现要素:

3.本技术提供了一种环境信息预测的方法、装置、设备、计算机可读存储介质以及计算机程序产品,能够提升环境信息预测结果的准确性。
4.第一方面,本技术提供了一种环境信息预测的方法。该方法包括:获取待预测的目标地点的地理信息,并根据该目标地点和多个采样地点之间的差异信息以及设置的环境信息的影响因子获得该目标地点的环境信息的预测值。其中,该多个采样地点均匀分布在参考区域中,该差异信息包括该目标地点的地理信息与所述多个采样地点的地理信息的差异。
5.本发明实施例提供的环境信息预测的方法考虑了全空间对每个样本点的影响,根据均匀的采样点和目标地点之间的差异信息获得预测结果,有效解决了现有技术中,由于样本点分布不均导致的样本点稀疏的区域预测精度较低的问题,提升了环境信息预测结果的准确性。
6.第一方面一种可能的设计,该参考区域包括多个均匀分布的空间网格,每个空间网格指向的区域包括该多个采样地点中的至少一个采样地点。
7.本方法通过划分空间网格帮助选取合适的采样地点,可以使采样点均匀地分布在整个参考区域中。可选的,每一个网格的大小是相同的(边缘的网格除外)。
8.第一方面一种可能的设计,该多个采样地点中的每个采样点分别对应于该多个空间网格的一个空间网格指向的区域的中心位置。
9.第一方面一种可能的设计,该地理信息包括该目标地点的地理位置,该差异信息包括该目标地点与该多个采样地点之间的地理位置的差异。
10.可选的,该地理位置可以是目标地点在地球上的经纬度坐标或是在参考区域中划分的坐标系中的坐标。
11.可选的,该地理位置差异可以是空间中目标地点和采样地点之间的欧氏距离。
12.可选的,该差异信息记录在和上述网格一一对应的邻近关系矩阵中。
13.第一方面一种可能的设计,该地理信息包括所述目标地点的地理位置和地理属性信息,该差异信息还包括该目标地点和该多个采样地点之间的地理位置的差异和一种或多种地理属性的差异。
14.本方法还将地理属性空间的考虑也纳入了环境信息预测的方法中,更充分的揭示了环境信息在空间和地理属性空间上的关系,有效解决了现有技术对空间非平稳关系表征不充分的现象,可以实现了对环境信息更高精度预测。
15.可选的,该地理位置差异可以是空间中目标地点和采样地点之间的欧氏距离。
16.可选的,该地理属性信息可以是地理要素在时空范围内所具有的属性特征。
17.可选的,该地理属性差异可以是该地理属性在地理属性空间中的距离。
18.第一方面一种可能的设计,将所述地理位置差异和该一种或多种地理属性差异输入到第一神经网络中,获得所述目标地点和多个采样地点之间的所述差异信息。
19.本方法还支持引入一种或多种地理属性的情况,可以将地理位置差异和该一种或多种地理属性差异进行融合,利用神经网络强大的特征提取能力将多种差异融合。
20.可选的,融合后的差异信息记录在和上述网格一一对应的邻近关系矩阵中。
21.第一方面一种可能的设计,根据该目标地点和多个采样地点之间的差异信息以及设置的环境信息的影响因子获得该目标地点的环境信息的预测值包括:将该差异信息输入第二神经网络,得到该目标地点的空间特性权重;根据该空间特性权重以及设置的环境信息的影响因子,获得该目标地点的环境信息的预测值。
22.一种可能的实施方式,根据回归模型确定所述环境信息和所述影响因子之间的回归系数;然后再根据前述的空间特性权重、该回归系数以及所述影响因子观测值三者的乘积求和,获得所述目标地点的环境信息的预测值。可选的,该回归模型可以是普通线性回归模型(olr)。
23.第一方面一种可能的设计,该第一神经网络包括卷积层。
24.由于上述根据网格生成的差异信息具有图像的特征,可以采用卷积神经网络将它们进行融合。
25.第一方面一种可能的设计,该第二神经网络包括卷积层、池化层和全连接层。
26.由于上述根据网格生成的差异信息具有图像的特征,可以采用卷积神经网络提取特征并求解上述空间特性权重。
27.第一方面一种可能的设计,该环境信息包括气象环境信息和海洋环境信息。
28.第二方面,本技术提供了一种环境信息预测的装置。该装置包括的多个功能模块,用于实现第一方面或第一方面的任意可能设计提供的方法的不同步骤。
29.第三方面,本技术提供一种设备,该设备包括处理器和存储器。该处理器执行该存储器存储的指令,使得该设备执行上述第一方面或者第一方面的各种可能设计提供的方法。
30.本技术提供一种设备,该设备包括处理器和存储器。该处理器执行该存储器存储的指令,使得该设备部署第二方面提供的装置。
31.第四方面,本技术提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当设备的处理器执行该指令时,该设备执行上述第一方面或者第一方面的各种可能设计提供的方法。
32.本技术提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当设备的处理器执行该指令时,该服务器实现第二方面提供的装置。
33.第五方面,本技术提供一种计算机程序产品,该计算机程序产品包括指令,该指令存储在计算机可读存储介质中。设备的处理器可以从计算机可读存储介质读取该指令;该处理器执行该指令,使得该设备执行上述第一方面或者第一方面的各种可能设计提供的方法。
34.本技术提供一种计算机程序产品,该计算机程序产品包括指令,该指令存储在计算机可读存储介质中。设备的处理器可以从计算机可读存储介质读取该指令;该处理器执行该指令,该设备实现第二方面提供的装置。
附图说明
35.图1是本技术实施例提供的一种网络架构举例示意图。
36.图2是本技术实施例提供的一种部署方式举例示意图。
37.图3是本技术实施例提供的一种部署方式举例示意图。
38.图4是本技术实施例提供的一种空间非平稳性分析的方法流程举例示意图。
39.图5是本技术实施例提供的一种空间网格划分举例示意图。
40.图6是本技术实施例提供的一种空间邻近关系矩阵结构举例示意图。
41.图7是本技术实施例提供的一种融合方式举例示意图。
42.图8是本技术实施例提供的一种神经网络结构举例示意图。
43.图9是本技术实施例提供的一种计算预测结果的方法流程举例示意图。
44.图10是本技术实施例提供的一种计算预测结果的举例示意图。
45.图11是本技术实施例提供的一种预测pm2.5的方法流程举例示意图。
46.图12是申请实施例提供的一种方法举例示意图。
47.图13是申请实施例提供的一种装置举例示意图。
48.图14是申请实施例提供的一种设备600举例示意图。
具体实施方式
49.本发明实施例描述的网络架构以及业务场景是为了更加清楚的说明本发明实施例的技术方案,并不构成对于本发明实施例提供的技术方案的限定,本领域普通技术人员可知,随着网络架构的演变和新业务场景的出现,本发明实施例提供的技术方案对于类似的技术问题,同样适用。需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。
50.本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。另外,本发明的权利要求书中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。“步骤310”、“步骤320|”等作为步骤的区别代号,需要结合实际实施场景判断,不用于限定任何特定的顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
51.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
52.为了便于理解本技术实施例,首先,对本技术涉及的部分术语进行解释说明。
53.数字地球分析平台:一种基于大数据、云计算和人工智能等新一代信息技术、地理信息技术与航空航天产业深度融合的行业全方位数字化平台,可以提供气象预警、环境保护、应急防控、智慧城市建设等方面的服务。
54.地理要素:对地球表面上一定时间内分布的复杂地物、现象和事件的空间位置以及它们相互的空间关系进行抽象简化表达的结果,称为地理要素或地理空间实体。地理要素有一个典型的特征即空间特征,就是地理要素肯定存在于地理空间的某个位置,具有一定的空间形状、空间分布以及彼此之间的相互空间关系。地理要素根据其性质,可以分为自然地理要素和社会经济要素两大类。
55.环境信息:指上述地理要素中可以用来表征地球环境特征的要素,环境信息可以包括:空气污染要素(例如pm2.5)和海洋污染要素(例如赤潮)。
56.地理属性:指地理要素在时空范围内所具有的属性特征。
57.地理属性空间(spatial attribute space):地理属性在空间上的差异结合地理时空分布可以帮助揭示复杂的地理现象。例如,森林中相邻树木直径就属于地理空间中地理要素的属性特征。
58.空间非平稳性(spatial non-stationarity):被视为地理学第二定律,是地理关系在空间上固有的特性。例如:前述环境信息的空间关系在空间上可能是不稳定的,即描述空间关系的参数会在空间上发生变化。可见,空间非平稳性解算精度直接决定了地理模型对于环境信息预测的准确性与可靠性。
59.为了更精准地预测环境信息,地理学家通过考虑已有样本点对待预测点的空间特性的影响,以及各类影响因子和待测点环境信息之间的关联关系,来预测参考区域中所有地点的环境信息。例如,通过已有样本点和待预测点之间的地理距离揭示对上述空间特性的影响,还通过建立数学回归模型揭示各类影响因子和待测点环境信息之间的关联关系。
60.在实际中,由于现有样本点在全空间上普遍存在样本分布不均的情况,导致样本点分布密集的区域的环境信息预测精度较高,而样本点稀疏的区域精度受到了很大的影响。以中国的国家城市环境空气质量监测点为例,虽然点位逐年优化和增加,但在整个中国地图范围内,建成区点位密度仍然存在不均衡等问题。例如,我国西部地区的空气质量监测点密集度明显比东部地区小,导致西部地区的环境预测数据准确性受到了很大限制。
61.有鉴于此,为了解决上述问题,本技术实施例提供了一种环境信息预测的方法。该预测方法通获取采样区域中均匀分布的采样点,揭示整个参考区域对待预测点的空间特性影响,有效提高了对整个参考区域中环境信息预测的精准度。
62.本技术实施例中的环境信息预测的方法可以由一台或多台计算设备完成。
63.在一种可能的实施方式中,图1是本技术实施例提供一种网络架构举例示意图。图中包括数字地球分析平台100、服务器101(一或多台)、网络102、数据采集设备103。
64.数字地球分析平台100可以基于该一台或多台服务器101提供空间非平稳性分析的功能。本技术实施例还提供一种环境信息预测装置201,该装置部署在数字地球分析平台100上。装置201可以包含一个或多个模块(图中未示出),可以实现环境信息预测的功能。
65.服务器101可以是具备较强计算能力的服务器设备,用于提供环境信息预测的功
能或服务。一种可能的实施方式中,该一台或多台服务器101可以部署在服务器集群或数据中心中。
66.数据采集设备102可以是各类地面监测设备(地面监测站的设备、车载监测设备、物联网设备等等),还可以是遥感卫星、通讯卫星、航空遥感设备、无人机遥感设备等任何用于采集天气、环境等任何地理或空天数据信息的设备。一种可能的实施方式,数据采集设备102可以通过网络103直接或间接将数据实时传输到服务器101中。可选的,数据采集设备102还可以是不具备和系统通讯功能的数据采集设备,诸如普通测绘设备或其他不具备网络通讯功能的监测设备,需要人工导入到数字地球分析平台100中。可选的,数据采集设备102还可以是其他移动智能设备,诸如手机。
67.网络103可以是诸如互联网这类的公有网络,或者是公有网络和私有网络存共的混合型网络,或者是可实现数据传输的其它通信网络。在网络103中,可以采用如下协议的一种或多种组合来实现数据传输,例如传输控制协议/网际协议(transmission control protocol/internet protocol,tcp/ip)、用户数据报协议(user datagram protocol,udp)和其他类型的协议。从技术角度看,网络130可以包括有线网络和无线网络,诸如有线网络、无线网络、移动通信网络(例如3g、4g和5g)、广域网、局域网等其他网络,以及它们各类的组合形式。此外,网络103还可以包括支撑网络的硬件基础设备,诸如交换机、网关、接入点、防火墙、路由器、基站、无线接入点(wireless access point,wap)等等。
68.图2和图3是本技术实施例提供的两种部署方式举例示意图。图2中,服务器101部署用于实现环境信息预测功能的实例104,该实例104可以是虚拟机或者容器,环境信息预测装置201部署在实例104中。或者如图3,服务器101没有部署实例,而是直接部署环境信息预测装置201。
69.一种可能的实施方式,环境信息预测装置201中可以包括一个用于对某个地理位置上某个环境信息进行估计或预测的ai(artificial intelligence)模型(图中未示出),称为环境信息预测模型,可以实现对环境信息预测的精确预测和分析。或者,环境信息预测装置201可以通过接口调用该ai模型,以实现对地球某个地理位置上的环境信息进行估计或预测的功能。
70.一种可能的应用场景举例,环境信息预测装置201根据某个确定地理位置q点处的经纬度坐标,基于上述ai模型求解或计算出q点的环境信息的指标。例如,该环境信息可以是诸如pm2.5浓度或赤潮等。
71.一种可能的实施方式,环境信息预测装置201包括一个或多个模块(图中未示出),可以用于实现对环境信息预测的精确预测和分析,以及,生成上述ai模型。
72.图4是本技术实施例提供的一种环境信息预测的方法流程举例示意图,该方法可以实现对环境信息的预测和分析。该方法可以由服务器101或其他具备较强计算能力的计算设备来执行。图4所示的方法包括步骤310至340,下面分别对这几个步骤进行详细的介绍。
73.步骤310、获取目标地点的地理信息。
74.服务器101获取到目标地点的地理信息,其中,地理信息指地理数据所蕴含和表达的地理含义,是与地理要素有关的物质的数量、质量、性质、分布特征、联系和规律的数字、文字、图像和图形等的总称。一种可能的实施方式,该目标地点的地理信息是存储在上述数
字地球分析平台100上的。
75.一种应用场景举例,服务器获取到目标地点的地理信息可以包括至少一种下述信息:地理位置信息和地理属性信息。具体的,该地理位置信息可以是目标地点处的地理位置坐标,例如,用户可以在数字地球分析平台中选择或输入某个经纬度坐标。具体的,该地理属性信息可以是诸如风向、树木年轮等任何地理要素在时间或空间范围中具有的属性特征。
76.步骤320、计算目标地点和采样点之间的差异信息。
77.服务器101根据上一步获取到的目标地点的地理信息,以在及参考区域中采样地点的地理信息,来计算它们之间的差异信息。
78.这里的采样地点均匀分布在参考区域中,换句话说,本技术实施例选择了在参考区域中均匀分布的点作为采样地点。
79.本技术实施例的方法考虑了全空间对每个样本点的影响,根据均匀的采样点和目标地点之间的差异信息获得预测结果,有效解决了现有技术中,由于样本点分布不均导致的样本点稀疏的区域预测精度较低的问题,提升了环境信息预测结果的准确性。
80.一种可能的实施方式,这些均匀的采样点中的每个采样点和相邻的采样点之间的距离大小,至少在一个方向及其反方向上是相同的。举例说明,当该方向是正西方向时,每个采样点和其正西方向上或正东方向上的相邻点的距离都是相同的。可选的,该方向可以设置为任何方向。可选的,该方向可以是坐标轴的方向。当有多个该方向时,通常存在以下情况:n维空间的参考区域当中均匀采样点可以存在1~n个该方向(包含其反方向),例如二维空间里,上述均匀采样点最多可在2个方向(及其反方向)上和其相邻采样点距离相同。
81.这里的差异信息包括了每个采样地点和目标地点在各类地理信息上的差异。
82.一种可能的实施方式,该差异信息可以是地理位置信息的差异,具体的,指两个地理位置之间的距离,例如空间中的两点的欧式距离。
83.一种可能的实施方式,该差异信息包括地理位置信息的差异和地理属性信息的差异。其中,地理属性信息的差异可以是标量信息的数值差异、矢量信息的矢量差异、多维信息的数理差异乃至一些特殊形式数据的自定义化差异。
84.通过引入地理属性信息,可以更充分的揭示了环境信息在空间和地理属性空间上的关系,有效解决了现有技术对空间非平稳关系表征不充分的现象,可以实现了对环境信息更高精度预测。
85.一种可能的实施方式,当有两种以上的差异信息时,可以将它们通过计算的方式,合并为一种差异信息。合并方式可以包括基于地理信息原理的数理融合方式,也可以是基于深度学习进行融合的黑盒方式。
86.为了进一步介绍上述均匀采样点,及其和目标地点之间的差异信息,这里提供一个具体的实施方式举例。本举例通过划分网格的方式选取上述均匀的采样点,并根据这些采样点计算差异信息,下面进行详细介绍:
87.首先,通过划分空间网格,获得均匀分布在参考区域中的多个采样点,这些采样点也均匀分布在每一个网格中,一种可选的方式,每个网格中包括一个或多个采样点。通过建立目的地点和采样点之间的邻近关系表征量,计算出上述差异信息,并使用和上述网格尺寸相同大小的矩阵表示该差异信息。
88.具体的,假定本次研究的待预测的环境信息为k,参考区域范围是ω。选定网格划分的尺寸为(w,h),其中w,h分别代表横向和纵向的网格数量,则网格可通过如下方式进行划分:
89.图5是本技术实施例提供的一种空间网格划分方法的举例示意图,图中l1、l2、l3都是参考区域ω所在的范围。其中,l1层的是原始的数据样本点的位置分布示意层,这些样本点的数据可以是来自地面监测站采集的环境信息k的数据,l2层是进行网格划分方式的示意层,l3层是均匀采样点在ω中的位置分布示意层,下面将依次介绍:
90.如图5中l1所示,l1所在的范围为上述ω,l1上的点称作数据样本点。这些样本点上的数据包括:环境信息k的数值和其他一个或多个影响因子的数值{e1,e2,...,er},r为影响因子的数量。
91.一种可选的实施方式,上述样本点的数据在步骤1之前已经进行了数据预处理。
92.如图5中l2所示,l2为根据上述尺寸(w,h)均匀划分后的空间网格图,每一个网格都表征研究区域内的一个局部地理区域,每个网格的大小是相同的(边缘网格不做限制)。一种实施方式举例,如图5中l3所示,选取l2中每个网格的中心点作为一个采样点,用x和y表示l3中和l2第x行、第y列所在网格的中心点对应的采样点的坐标。其中,x=1,2,3,..,w,y=1,2,3,...h。这些采样点上的数据包括地理信息,例如地理位置信息和地理属性信息。
93.需要说明的是,上述生成参考区域的空间网格仅作为一种实施方式的举例,其目的是为了获得在空间中均匀分布的空间采样点,进而计算空间邻近关系。
94.建立观测点i与l3空间采样点(p,q)的空间邻近关系表征量d
ipq
(对应空间邻近关系的空间网格l3-d,图5中未示出,请见图7),用于表征每个局部地理区域对观测点i的影响。举例说明,这里的观测点i是前述l1上的数据样本点。一种可能的实施方式,该表征量d
ipq
可以被记录为如图6(a)所示的空间邻近关系矩阵d,表示观测点i到l3中w*h个空间采样点的空间距离。一种可能的实施方式,该空间距离是欧氏距离,例如地球上两个地理位置之间的直线距离。
95.可选的,还可以根据空间采样点处的地理属性信息,建立观测点p到l3中w*h个空间采样点的地理属性空间邻近关系表征量g
ipq
(对应地理属性空间邻近关系的地理属性网格l3-g,图中未示出),该表征量g
ipq
可以被记录为如图6(b)所示的地理属性空间邻近关系矩阵g,表示在地理属性空间中,观测点p与空间采样点之间的地理属性距离。该地理属性是某种地理要素在时空范围内所具有的属性特征,例如本技术实施例在后文应用场景举例中选取的风速。一种可能的实施方式,该地理属性距离可以是待估点i与空间采样的地理属性要素之间的差值的模或绝对值。
96.一种可能的实施方式,可以根据多种地理属性要素,建立多个地理属性网格,其对应的地理属性空间邻近关系矩阵为{g1,g2,...}。
97.可选的,由于上述空间网格和地理属性网格具有图像的特征,本举例采用卷积神经网络将它们进行融合。如图7所示,当生成了一个空间网格l3-d和一个或多个地理属性网格{l3-g}时,可以将每个样本点对应的空间与地理属性空间格网用一个融合神经网络进行非线性融合得到融合格网l3-m,其中,该融合神经网络包括卷积层。图7中,融合后的观测点i和空间采样点(p,q)的邻近关系表征m
ipq
是由原空间网格在该点处的空间邻近关系表征量d
ipq
和地理属性空间邻近关系表征量g
ipq
融合得到的。
98.具体的,以一个空间网格和一个地理属性网格作为举例:
99.将待估点i的空间邻近关系矩阵d和地理属性空间邻近关系矩阵g作为融合神经网络中的输入,以融合后的融合关系矩阵m为输出。其中,m为和d、g尺寸大小相同的矩阵,且矩阵m中的每个数值都和l3中每个空间采样点一一对应,用于表征观测点和空间采样点之间的邻近关系,该邻近关系融合了空间和地理属性空间的邻近关系。一种可能的实施方式,该融合神经网络为卷积神经网络。
100.另一种可能的实施方式,当只生成了一个空间网格,没有生成地理属性网格时,则不进行前述的融合操作。举例说明,可以直接将空间网格对应的空间邻近关系矩阵d作为本步骤的输出的差异信息。
101.步骤330、根据差异信息和影响因子,计算环境信息在目标地点的预测值。
102.依据地理学第二定律的空间非平稳性,在本技术实施例中,环境信息预测的考虑包含两方面:(1)目标地点和多个采样地点之间的差异信息(2)环境信息和影响因子之间的关联关系。
103.其中,这里的差异信息描述了整个参考区域空间对待测点的影响,可以用于描述地理要素在该点的空间特性。需要说明的是,影响因子、环境信息都属于可以是这里的地理要素。
104.一种可能的实施方式,环境信息k和影响因子{e11e2,...,er}之间的关系可以通过建立数学回归模型来求解,从而得到每个影响因子的回归系数。
105.一种可能的实施方式,可以根据差异信息得到一种空间特性权重表征量,这种空间权重可以用于表征每个影响因子对预测的环境信息影响的不同。
106.进一步的,可以结合上述空间特征权重和影响因子的回归系数,计算求得环境信息在目标地点的预测值。
107.为了进一步介绍环境信息预测的计算过程,这里通过一个具体举例进行讲解。本举例采用了深度学习作为拟合工具,将中环境信息和差异信息、影响因子之间的复杂非线性问题,转换为神经网络的拓扑设计与优化学习问题,从而得到更精准的预测结果,详细介绍如下:
108.首先,利用空间网格或是融合关系网格经邻近关系神经网络求解空间权重矩阵,然后采用线性回归模型求解的回归系数,最终计算得到地理元素k的预测值。图8是本技术实施例提供的一种计算环境预测值的方法流程举例示意图,进一步介绍了步骤330包括子步骤331至333:
109.步骤331、计算空间特征权重。
110.一种可选的实施方式举例,根据前述差异信息,通过神经网络计算得到空间特性权重。
111.例如,如图9是本技术实施例提供的一种神经网络举例示意图,结合步骤310和320中的举例进行讲解。图9提供了一种邻近关系加权神经网络,可以将前述的邻近关系网格作为神经网络的输入,得到最终的空间特性权重,其中,邻近关系网格是差异信息的一种表征方式。该邻近关系加权神经网络包括卷积层。
112.这里的邻近关系网格可以包括两种情况:(1)空间网格(2)融合了空间网格和地理属性网格后的融合网格,一种可能的实施方式,该地理属性网格包括一个或多个。
113.具体的,经过邻近关系加权神经网络可以求解出空间权重矩阵w,w中包括和r个影响因子数量一一对应的权重值以及一个常数项的权重值,即{w0,w1,

,wr}。
114.一种可能的神经网络结构举例,如图9所示,该邻近关系加权神经网络包括一个或多个二维卷积层和池化层、一个或多个全连接层以及根据建模需要选取适当的隐藏层数量。
115.步骤332、计算回归系数
116.为了获得环境信息和影响因子之间的关联关系,一种可能的实施方式,根据样本点上的影响因子的数据,利用回归模型求解在研究区域的范围ω中,地理要素k和影响因子{e1,e2,...,er}的回归系数β={β0,β1,...,βr}。
117.一种可能的实施方式举例,该回归模型可以是线性回归系数。
118.步骤333、计算环境信息的预测值。
119.一种可能的实施方式,环境信息的预测值是通过、空间特性权重、影响因子回归系数以及影响因子的观测值三者的乘积之和求解得到的:
120.地理要素k的在点i上的预测值为如图10所示,是根据影响因子{e1,e2,...,er}在i点的观测值{x1,x2,...,xr}和非平稳性系数的相乘求和得到的:
[0121][0122]
其中,i点的观测值还包括一个常数项x0=1,本技术实施例可以获得任意点的环境信息预测值(又叫拟合值)。
[0123]
本技术实施例中创新地引入全空间的邻近关系,考虑了全空间对每个样本点的影响。通过生成全空间中均匀的采样点,构建相关的空间邻近关系网格,有效解决了样本分布不均的问题。由于表征全空间的邻近关系的网格自身具有图像特征,本方法采用了卷积神经网络对空间权重进行拟合,结合回归模型求解的系数,更有效的刻画了环境信息和影响因子之间复杂的非线性问题,进而实现对环境信息的精确预测和分析。
[0124]
本技术实施例还将地理属性空间的考虑也纳入了环境信息预测的方法中,基于前述空间邻近关系网格,构建地理属性空间邻近关系格网。通过融合这两类格网,更充分的揭示了环境信息在空间和地理属性空间上的关系,有效解决了现有技术对空间非平稳关系表征不充分的现象,实现了对环境信息更高精度的分析与预测。
[0125]
本技术还提供了一个应用场景举例:以预测整个中国区域的pm2.5浓度为例,本技术实施例还提供了一个环境信息的预测方法举例。该方法举例选取了气溶胶(aod)、2m温度(temp)、相对湿度(r)、降水量(tp)、10m风速(ws)、高程(dem)作为影响因子(自变量x),预测地理要素pm2.5浓度的(自变量y)。同时选取风向(wd)作为pm2.5浓度的地理属性空间要素。pm2.5指在空气动力学领域中直径不大于2.5微米的可吸入颗粒物,是空气质量评价的主要指标之一。
[0126]
如图11所示的一个实施例流程举例示意图所示,包括步骤410至步骤460,具体的实施方式如下:
[0127]
步骤410、数据预处理。
[0128]
由于数据的来源不一,导致各类数据在格式上难以统一。因此,在实际中,为了规范化输入数据,还需要对上述数据进行预处理。预处理操作可以包括:数据抽取、格式转换、
投影转换、范围裁剪、空间匹配、时间匹配等等,最终得到上述气溶胶、温度、相对湿度、降水量、风速、高程、风向等数据的规范格式,再用于本技术实施例中的方法。
[0129]
将包含上述参数的样本点数据集随机划分为交叉验证集和测试集,整个训练过程采用交叉验证训练法。其中,交叉验证集合包括训练集和验证集。
[0130]
步骤420、将中国区域进行格网划分,生成空间邻近关系矩阵和地理属性空间邻近关系矩阵。
[0131]
一种实施方式举例,选取30*40的尺寸,将中国区域进行格网划分成1200个网格,选取网格的中心点为实验中的空间采样点。
[0132]
用i代表交叉验证集中的观测点,其空间坐标为(ui,vi)。i点和格网划分后的空间采样点(p,q)之间的空间距离可以表达为:
[0133][0134]
一种实施方式举例,i点和空间采样点(p,q)之间的风向属性空间距离可以表达为:
[0135][0136]
其中和分别代表为i点和空间采用点的风向矢量。
[0137]
根据上述空间距离公式和风向属性空间距离公式,得到空间邻近关系矩阵d和地理属性空间邻近关系矩阵g。
[0138]
步骤430、将训练集中样本点的邻近关系矩阵和地理属性空间邻近关系矩阵输入到融合网络中,得到融合邻近关系矩阵。
[0139]
一种可能的网络设计方式举例,如图12中融合网络431所示,该神经网络中包括2个二维卷积层和一个或多个隐藏层,隐藏层采用了he参数初始化方法和激活函数prelu。
[0140]
融合网络431的输入层501的数据是前述空间邻近关系矩阵d和地理属性空间邻近关系矩阵g,在输出层502得到融合邻近关系矩阵m。
[0141]
步骤440、将融合邻近关系矩阵输入到邻近关系加权卷积神经网络中,得到空间权重矩阵。
[0142]
一种可能的网络设计方式举例,如图12中441所示,该邻近关系加权卷积神经网络中包括2个二维卷积层、2个池化层和3个全连接层,隐藏层采用了he参数初始化方法和激活函数prelu。其中,全连接层之间还采用批量归一化技术和dropout技术提高网络泛化性能和解决梯度消失的问题。网络各层之间的结构和顺序请参考图12,此处不再赘述。
[0143]
将前述融合邻近关系矩阵输入到邻近关系加权卷积神经网络411中,可以在输出层503得到空间权重矩阵w。
[0144]
此外,本技术实施例还提出了一种变学习率的训练方法,进一步增强神经网络的计算能力。实际训练中,由于学习率过大,导致损失函数在极值附近剧烈震荡,甚至梯度发散;学习率过小导致收敛速度很慢,延长了神经网络训练的时间,甚至梯度消失。针对空间与属性融合神经网络加权回归模型,本技术实施例自定义了一套基于变学习率的梯度下降法,通过改变学习率,达到加快收敛速度与网络稳定训练的目的,具体实施方式如下:
[0145]
首先,设置起始学习率η_start,并以α的速率缓慢增加学习率,学习率缓慢增加避免了学习率不合适导致损失函数剧烈震荡与梯度发散的现象。当学习率到达设置的最大学
习率η_max,保持学习率训练n个epoch,在这个过程中模型可以迅速学习特征,有效提升学习效率。随后以β速率的指数形式逐步下降直到训练完成,这样可以用较小的学习率继续学习样本的细微特征,在最短的时间内到达最优解,提高了网络模型的训练性能。
[0146]
步骤450、根据预先计算的回归系数矩阵和空间权重矩阵求解pm2.5浓度的拟合值。
[0147]
此处的pm2.5浓度拟合值的求解公式如下:
[0148][0149]
其中p=6,和代表前述影响因子的数量,(ui,vi)代表点的横纵坐标。因变量x
ik
代表前述6个影响因子在i点的观测值。wk(ui,vi)表示回归系数βk的空间权重,为根据最小二乘方法求解的回归系数估计值
[0150]
步骤460、结果的验证和测试。
[0151]
训练数据集用于优化神经网络训练中的权重和偏差,验证数据集用于确定模型在每个训练期后是否过拟合。训练完成后,使用测试数据集通过类似的验证过程,例如计算相关指标,来评估模型的泛化和预测能力。
[0152]
图13是本技术实施例提供的一种环境信息预测装置210的结构举例示意图。图中环境信息预测装置210包括获取单元211、差异信息计算单元212、预测单元213。所述环境信息包括气象环境信息和海洋环境信息。
[0153]
获取单元211,用于获取待预测的目标地点的地理信息。一种可能的实施方式,该地理信息可以包括:目标地点的地理位置和目标地点的地理属性信息。具体的,地理信息可以包括目标地点处的经纬度坐标,还可以包括在该坐标点上其他地理信息,例如风向、温度、污染物指标等其他任何地理信息。
[0154]
差异信息计算单元212,用于根据前述的地理信息和参考区域中的采样点计算差异信息。该差异信息可以包括所述目标地点的地理信息与所述多个采样地点的地理信息的差异。这些采样点均匀分布在参考区域中,并且,至少在一个或多个方向上相邻的采样点之间的距离是相同的。
[0155]
一种可能的实施方式,通过划分空间网格,获得均匀分布的多个采样点,建立它们之间的邻近关系表征量,计算出上述差异信息,并使用和上述网格尺寸相同大小的矩阵表示该差异信息。可选的,可以选取每个网格的中心点作为一个采样地点。
[0156]
一种可能的实施方式,前述邻近关系表征量可以表达的是两点之间的空间距离,还可以是地理属性空间的距离。可选的,空间距离可以是欧式距离,例如地球上两个地理位置之间的直线距离。
[0157]
一种实施方式距离,差异信息求解方式包括以下两种情况之一:
[0158]
将空间距离和所述一种或多种地理属性空的距离输入到一个融合神经网络中,得到所述目标地点和多个采样地点之间的所述差异信息;
[0159]
或者,直接将空间距离为目标地点和多个采样地点之间的差异信息输出。
[0160]
可选的,这里的融合神经网络中包括卷积层。
[0161]
预测单元213,用于根据该目标地点和多个采样地点之间的差异信息以及设置的
环境信息的影响因子获得该目标地点的环境信息的预测值,其中,该多个采样地点均匀分布在参考区域中。
[0162]
这里的多个采样地点和差异信息可以参考差异信息计算单元212中的相关描述。
[0163]
一种可选的实施方式,将前述差异信息输入邻近关系加权神经网络,得到所述目标地点的空间特性权重;根据空间特性权重以及设置的环境信息的影响因子,获得所述目标地点的环境信息的预测值。
[0164]
可选的,在求解前述预测值之前,根据回归模型,确定所述环境信息和所述影响因子之间的回归系数,然后根据空间特性权重、回归系数以及影响因子观测值三者的乘积求和,获得目标地点的环境信息的预测值。
[0165]
可选的,邻近关系加权神经网络包括卷积层、池化层和全连接层。
[0166]
图13是本技术实施例提供了一种设备600的结构举例示意图,该设备可以是诸如数字地球分析平台上的服务器101或其任何计算设备。图中的计算设备600包括总线601、处理器602、存储器603和接口604。处理器602、存储器603之间通过总线601通信。
[0167]
总线601用以连接处理器602、存储器603和接口604以及其他可能的组件,可以包括地址总线、数据总线、控制总线、扩展总线、局部总线中的一种或多种。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。总线601应用外设部件互连标准(peripheral component interconnect,pci)总线或扩展工业标准结构(extended industry standard architecture,eisa)总线等标准。
[0168]
处理器602可以为中央处理器(central processing unit,cpu),此外,还可以有图形处理器(graphics processing unit,gpu)、神经网络处理器(neural network processing unit,npu)、fpga(field programmable gate array)等其他类型处理器芯片中的一种或多种。处理器602可以执行本技术实施例中预测环境信息的方法的步骤。
[0169]
存储器603可以包括随机存取存储器(random access memory,ram)、只读存储器(read-only memory,rom)、快闪存储器(flash eprom)、机械硬盘(hard disk drive,hdd)或固态硬盘(solid state drive,ssd)等任何可以用来存储并保存信息的其他存储器、存储设备、存储介质中的一种或多种。存储器403中存储有可执行的程序代码,该可执行的程序代码可通过处理器602执行以实现本技术实施例中预测环境信息的方法的步骤。
[0170]
接口604可以为网络接口卡(networking interface card,nic)或其他类型的收发机设备、主机总线适配器(host bus adaptor,hba)等。
[0171]
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分可互相参考,每个实施例重点说明的都是与其他实施例的不同之处,部分实施例描述简略的地方可以参考其他实施例的描述。
[0172]
以上为本技术的具体实现方式。应当理解,以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献