一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于地理格网模型矿区生态演变大数据多尺度查询方法与流程

2022-02-25 21:55:48 来源:中国专利 TAG:


1.本发明涉及采矿领域、生态学领域、遥感及地理信息领域,尤其涉及一种基于地理格网模型矿区生态演变大数据多尺度查询方法。


背景技术:

2.矿区是伴随资源开采活动而衍生出的特殊地域场所,其生态系统是人类活动与自然资源环境相互影响的有机整体。人类在开采煤炭、石油等自然资源过程中不可避免地会造成矿区生态环境的破坏,而随着生态文明建设的日益推进,矿区生态环境破坏、脆弱性等问题得到国家及社会各界的重视。因此,如何利用遥感技术、地理信息技术、大数据技术等对矿区生态开采前、中、后进行全天候、全方位、全过程的监测和评估是我国实现绿色矿山乃至碳中和的重要命题。生态环境是一种典型的复杂巨系统,其涵盖生态要素众多、涉及时间序列长且空间尺度多样,导致现有技术难以实现海量生态演变大数据的高性能、多尺度管理与查询,为矿区生态环境的监测和评估带来巨大困难。因此,亟需一种新的数据模型以实现矿区生态演变大数据的高性能、多尺度查询,为矿区生态环境的监测、评估、治理提供技术支撑。


技术实现要素:

3.本发明的目的在于克服现有,提供一种基于地理格网模型矿区生态演变大数据多尺度查询方法,通过地理格网模型实现多源生态演化大数据的融合统一和高效灵巧管理,提高数据检索效率,并满足空间上多尺度查询场景的应用需求。基于多源生态数据融合及环境影响因子反演构建得到生态演变大数据立方体,并以地理格网模型的网格属性关联存储数据库,而且以网格地理编码和时间编码两个数据列构建时空复合索引结构,地理格网模型各个网格就对应关联有分层、分片存储管理的生态数据,实现了生态演化大数据任意空间、任意时间、任意尺度的快速检索与查询。
4.本发明的目的通过下述技术方案实现:
5.一种基于地理格网模型矿区生态演变大数据多尺度查询方法,其方法如下:
6.a、构建含有经度线和纬度线的地理格网模型:采用四叉树格网剖分结构首次剖分地球得到八个四边形,剖分层级记为level=0;对地理格网模型首次剖分的四边形按照四叉树方式进一步剖分,每个四边形剖分出四个子四边形,剖分层级记为level=1;
……
按照上述方式依次递归剖分,得到满足矿区空间分辨率要求的地理格网模型,剖分层级记为level=n,地理格网模型的总网格单元数量为8
×2n
×2n
,每个网格带有经纬度区间范围;
7.b、基于z-order空间填充曲线对地理格网模型进行地理编码,其方法如下:
8.b1、地理格网模型首次剖分的八个四边形基于z-order空间填充曲线按照“z”型规则进行编码,八个四边形对应的地理编码为0~7;基于z-order空间填充曲线按照“z”型规则对剖分层级level=1的网格进行编码,“z”型规则为:按照左上、右上、左下、右下的顺序对四个格网单元进行分别编码0、1、2、3;
……
按照上述方式逐级编码,最后得到所有网格的
地理编码;
9.c、采集具有时间、地理维度信息的生态演变大数据,生态演变大数据包括基础地理信息数据、多源遥感大数据、人类活动数据,提取生态演变大数据的时间信息并按照“y1y2y3y4m1m2d1d2h1h2f1f2s1s
2”的规则进行时间编码,其中y1y2y3y4为年的编码,m1m2为月的编码,d1d2为日的编码,h1h2为时的编码,f1f2为分的编码,s1s2为秒的编码;
10.d、根据生态环境的影响因子建立包括自然地理因子和人类活动因子在内的生态因子体系,自然地理因子、人类活动因子分别包括多个生态因子;
11.f、基于基础地理信息数据、多源遥感大数据、人类活动数据并利用gis空间分析方法对各个生态因子进行定量反演得到长时间序列和精细空间下的生态演化大数据,生态演化大数据包括各个自然地理因子和各个人类活动因子在每个精细格网上的量化值,生态演化大数据为多源生态演化数据的融合且以地理编码和时间编码为信息载体,并由此构建得到生态演变大数据立方体ee-cube;
12.g、生态演变大数据立方体ee-cube在同一网格上以“积木”形式堆叠且以时间编码为标识进行分层,然后以地理编码和时间编码为基准构建数据表结构,将生态演变大数据立方体ee-cube或/和生态演化大数据以格网属性值的形式写入数据表结构并存储数据库;对数据库以地理编码的空间多尺度特性实现生态演化大数据的“分层-分片”多层级高效组织管理;对数据库以地理编码和时间编码两个数据列构建时空复合索引结构;
13.h、生态演变大数据多尺度查询:查询区域采用不同空间尺度下对矿区任意时间、任意空间下生态演变数据的快速检索、读取、展示及分析,具体方法如下:
14.h1、查询区域的地理编码表达:提取查询区域所覆盖网格区域并收集所有网格所对应的地理编码;
15.h2、查询区域的时间编码表达:根据所要查询数据的目标时间得到时间编码,并结合查询区域的地理编码得到查询区域的编码集合d
code

16.h3、以查询区域的编码集合d
code
为查询条件通过多层级数据组织结构和时空复合索引结构快速查询对应的生态演变数据,将查询得到的生态演变数据按照编码层级在地理格网模型上进行网格展示或参与上层计算分析,网格展示包括时空分布展示、生态因子体系展示、某一个或几个生态因子展示;上层计算分析包括生态驱动因子分析、多要素联合对比分析。
17.本发明地理编码第二种优选方法(整个发明除包括步骤a~步骤h,步骤b还包括步骤b2):可按照网格行号、列号来进行地理编码,其优选的地理编码方法如下:步骤b还包括:
18.b2、将步骤b1中所有网格按照行号i和列号j的二进制交叉排列表达,i=i1i2i3…
ik,j=j1j2j3…jk
,二进制交叉排列表达为i1j1i2j2i3j3…ikjk
,二进制交叉排列表达公式如下:morton=2
×
i j,其中i,j分别为二进制表达下的网格单元的行号和列号,morton为二进制交叉排列表达;
19.行号i、列号j的表达式如下:
20.其中level为网格所在层级,lon
min
、lat
min
分别为所在全球初始八个四边形的最小经度和最小纬度,d
lon
为网格单元的经度差,d
lat
为网格
单元的纬度差,d
lon
、d
lat
作为网格单元的空间分辨率,lon、lat分别为网格单元内任意位置信息;
21.将二进制交叉排列表达morton作为地理编码并参与步骤d~h运算处理。
22.优选地,在步骤a中,采用四叉树格网剖分结构首次剖分地球时,经度线选择主子午线0
°
、90
°
、180
°
、270
°
为分割线,纬度线则选择赤道0
°
;递归剖分完成后,每个网格的经度差d
lat
与纬度差d
lon
公式如下:
23.其中level为剖分层级,层级level越大,空间分辨率越高,表示的空间位置越精确。
24.在第二种优选地理编码技术方案下优选的技术方案为:在步骤h1中,查询区域空间地理编码表达采用边界代数法将矢量面转为网格区域,边界代数法方法如下:以地理格网模型的地理格网阵列为参考坐标轴,由矢量多边形上某点开始顺时针搜索边界线,当边界上行时,位于该边界左侧的具有相同行号的所有网格单元值减去1;当边界下行时,该边界前进方向的右侧所有网格单元值加上1,当边界搜索完毕后,值为1的网格单元则为矢量多边形的覆盖网格,然后收集所有网格所对应的地理编码。
25.优选地,在步骤h3中,编码层级包括地理编码层级和时间编码层级,地理编码层级为网格所属剖分层级,以首次四叉树格网剖分为最高,以最后四叉树格网剖分为最低,时间编码层级按照年月日时分秒从高至低排列;
26.h31、当查询区域的编码集合d
code
的编码层级高于生态演变大数据的编码层级时,通过粗粒度地理编码查询、基于时间编码锁定时间编码层级并将生态演变大数据进行聚合运算,聚合运算表达式如下:fv
factori
=operate(sv0,sv1,sv2,sv3,......,svi),其中fv
factor
是第i个因子在父级网格上的聚合值,sv0、sv1、sv2、sv3……
svi为同一父网格下的i个子网格的因子量化值,operate为聚合计算函数,聚合计算函数包括均值计算average、求和计算sum、最大值计算max、最小值计算min或数量统计计算count;
27.h32、当查询区域的编码集合d
code
的编码层级与生态演变大数据的编码层级相同时,以查询区域的编码集合d
code
为查询条件通过时空复合索引结构快速匹配对应的生态演变数据。
28.优选地,在步骤h中,查询区域包括空间数据、时间数据、查询编码层级,查询编码层级包括地理编码层级和时间编码层级。
29.优选地,在步骤g中,时空复合索引结构在地理编码和时间编码两个数据列上构建复合索引结构b
-tree或hash,并与地理格网模型的网格内所有生态演变数据对应关联。
30.优选地,在步骤f中,在生态演化大数据中利用目标矿区地理最小外包网格单元的地理编码进行标识得到目标矿区生态演化大数据,并由此构建得到矿区生态演变大数据立方体ee-cube并依次进行步骤g~h,由此实现针对矿区的生态演变大数据多尺度查询。
31.优选地,在步骤d中,自然地理因子包括自然地理条件数据、土壤参数反演数据、水体参数反演数据、植被参数反演数据、大气参数反演数据、生态系统功能参数,自然地理条
件数据包括气温temp、降水rainf、地形landf,土壤参数反演数据包括含水量soilw、温度soilt,水体参数反演数据包括悬浮物susp、叶绿素wchlor,植被参数反演数据包括叶绿素chlor、水分moist,生态系统功能参数包括蒸发量evap、生态价值量ecol;人类活动因子包括采矿活动数据、其他活动数据,采矿活动数据包括采矿量minq、采矿距离mind、采矿面积mina,其他活动数据包括城镇人口urbanp、城镇gdp、城镇距离urband、放牧活动graz。
32.优选地,在步骤b中,地理编码采用四进制编码。
33.本发明较现有技术相比,具有以下优点及有益效果:
34.(1)本发明基于地理格网模型进行地理编码并综合时间编码规则,能够将多源生态数据进行时空编码融合,同时建立时空复合索引结构对应映射数据的数据库以方便数据检索,实现了生态演化大数据任意空间、任意时间、任意尺度的快速检索、查询与分析。
35.(2)本发明通过地理格网模型实现多源生态演化大数据的融合统一和高效灵巧管理,提高数据检索效率,并满足空间上多尺度查询场景的应用需求。基于多源生态数据融合及环境影响因子反演构建得到生态演变大数据立方体,并以地理格网模型的网格属性关联存储数据库,而且以网格地理编码和时间编码两个数据列构建时空复合索引结构,地理格网模型各个网格就对应关联有分层、分片存储管理的生态数据,可以实现基于查询多时空层级的数据查询、网格展示、各项分析。
36.(3)本发明通过地理格网模型关联地理编码、时间编码对含有时空信息生态演化数据进行统计表达,实现了二维空间型数据以一维编码关联存储表达,实现数据表达维度的降低,简化了数据表达、组织及管理的复杂度;多尺度特性实现海量生态演化数据的分层、分片组织与管理,并基于地理编码和时间编码建立结构简单的时空索引结构,提高数据检索效率;实现了生态演化大数据任意空间、任意时间、任意尺度的快速检索与查询,为上层数据计算与分析提供了高效的数据结构基础。
37.(4)本发明基于地理格网编码的尺度特性构建数据组织结构和时空索引,实现不同空间尺度下对矿区生态演变数据的检索,快速搜寻目标区域、特定时间下所需要的生态演变数据。
附图说明
38.图1为实施例中的原理流程示意图;
39.图2为实施例中矿区格网剖分与编码原理图;
40.图3为实施例二中地理编码计算原理图;
41.图4为实施例中生态因子体系示意图;
42.图5为实施例中生态演化大数据组织管理示意图;
43.图6为实施例中查询区域矢量面转为网格区域的边界代数法原理图;
44.图7为实施例中生态价值量多尺度查询结果示意图。
具体实施方式
45.下面结合实施例对本发明作进一步地详细说明:
46.实施例一
47.如图1~图7所示,一种基于地理格网模型矿区生态演变大数据多尺度查询方法,
其方法如下:
48.a、构建含有经度线和纬度线的地理格网模型:采用四叉树格网剖分结构首次剖分地球(优选地,地球地图或全球平面地图,本实施例采用全球平面地图)得到八个四边形,剖分层级记为level=0;对地理格网模型首次剖分的四边形按照四叉树方式进一步剖分,每个四边形剖分出四个子四边形,剖分层级记为level=1(共计32个四边形);
……
按照上述方式依次递归剖分(如:对剖分层级level=1所剖分的四边形按照四叉树方式进一步剖分,剖分层级记为level=2(此时共计8
×22
×22
个四边形);依次类推,对剖分层级level=m-1所剖分的四边形按照四叉树方式进一步剖分,剖分层级记为level=m(此时共计8
×2m
×2m
个四边形)),得到满足矿区空间分辨率要求(地理格网模型的网格剖分越多,其分辨率越高,根据实际矿区空间分辨率要求进行设置剖分层级)的地理格网模型,剖分层级记为level=n(即按照上述方法由level=n-1剖分得到),地理格网模型的总网格单元数量为8
×2n
×2n
,每个网格带有经纬度区间范围(相邻上下剖分层级的网格带有经纬度区间范围成2的倍数关系,即剖分层级level=n-1中网格经纬度区间范围与剖分层级level=n-2中网格经纬度区间范围成2倍关系)。本发明地理格网模型是按照一定的规则组合而形成的对地理实体位置的表达体系,是一种新型地理数据表达模型,具有统一性、离散化、多尺度、多分辨率以及编码计算等优势,尤其是在多源异构数据融合、多尺度时空管理与查询、高性能地理计算等方面,本发明地理格网模型的统一性和多尺度等特性为实现矿区生态演化大数据的高性能、多尺度管理与查询提供了新的可能。
49.根据本发明一个优选实施例,在步骤a中,采用四叉树格网剖分结构首次剖分(剖分层级level=0)地球(本实施例采用带经纬度信息的全球平面地图)时,四叉树格网剖分结构在剖分时采用经纬度线进行剖分,本实施例经度线选择主子午线0
°
、90
°
、180
°
、270
°
为分割线,纬度线则选择赤道0
°
,四叉树格网剖分结构首次剖分后参见图2(后续首次剖分的地理编码也如图2所示);递归剖分完成后,每个网格的经度差d
lat
与纬度差d
lon
公式如下:
50.其中level为剖分层级(又称剖分层级level或层级),层级level越大,空间分辨率越高,表示的空间位置越精确。
51.b、基于z-order空间填充曲线对地理格网模型进行地理编码,地理编码优选采用四进制编码(当然也可以采用二进制或十进制编码),其方法如下:
52.b1、地理格网模型首次剖分的八个四边形基于z-order空间填充曲线按照“z”型规则进行编码,八个四边形对应的地理编码为0~7(参见图2)。基于z-order空间填充曲线按照“z”型规则对剖分层级level=1的网格进行编码,“z”型规则为:按照左上、右上、左下、右下的顺序对四个格网单元进行分别编码0、1、2、3。
……
按照上述方式逐级编码,最后得到所有网格的地理编码(如地理编码二进制下的数据结构为g1g2g3q1q2q3q4q5q6…
,g1g2g3为全球首次剖分得到的8个四边形的编码,q1q2q3q4q5q6…
为后续剖分层级所得得到的编码)。
53.c、采集具有时间、地理维度信息的生态演变大数据,生态演变大数据包括基础地理信息数据、多源遥感大数据、人类活动数据等,提取生态演变大数据的时间信息并按照“y1y2y3y4m1m2d1d2h1h2f1f2s1s
2”的规则进行时间编码,其中y1y2y3y4为年的编码,m1m2为月的编码,d1d2为日的编码,h1h2为时的编码,f1f2为分的编码,s1s2为秒的编码。
54.d、根据生态环境的影响因子建立包括自然地理因子和人类活动因子在内的生态因子体系,自然地理因子、人类活动因子分别包括多个生态因子。
55.根据本发明的一个优选实施例,在步骤d中,生态因子体系的生态因子层级如下:自然地理因子包括自然地理条件数据、土壤参数反演数据、水体参数反演数据、植被参数反演数据、大气参数反演数据、生态系统功能参数等,自然地理条件数据包括气温temp、降水rainf、地形landf等,土壤参数反演数据包括含水量soilw、温度soilt等,水体参数反演数据包括悬浮物susp、叶绿素wchlor等,植被参数反演数据包括叶绿素chlor、水分moist等,生态系统功能参数包括蒸发量evap、生态价值量ecol等。人类活动因子包括采矿活动数据、其他活动数据等,采矿活动数据包括采矿量minq、采矿距离mind、采矿面积mina等,其他活动数据包括城镇人口urbanp、城镇gdp、城镇距离urband、放牧活动graz等。
56.f、基于基础地理信息数据、多源遥感大数据、人类活动数据并利用gis空间分析方法对各个生态因子进行定量反演得到长时间序列和精细空间下的生态演化大数据,生态演化大数据包括各个自然地理因子和各个人类活动因子在每个精细格网(即地理格网模型上的网格)上的量化值(即各个自然地理因子、各个人类活动因子对应在网格上的量化值),生态演化大数据为多源生态演化数据的融合且以地理编码和时间编码为信息载体(本实施例可以实现多源生态演化数据融合),并由此构建得到生态演变大数据立方体ee-cube,以便于实现生态演化数据的“纵向”管理,ee-cube[factori]=[temp,rainf,landf,soilw,soilt,susp,wchlor,susp,wchlor,chlor,moist,airo,pm2.5,evap,ecol,minq,mind,mina,urbanp,gdp,urband,graz
……
]。
[0057]
g、生态演变大数据立方体ee-cube在同一网格上以“积木”形式堆叠且以时间编码为标识进行分层,然后以地理编码和时间编码为基准构建数据表结构,将生态演变大数据立方体ee-cube或/和生态演化大数据以格网属性值的形式写入数据表结构并存储数据库;对数据库以地理编码的空间多尺度特性实现生态演化大数据的“分层-分片”多层级高效组织管理;对数据库以地理编码和时间编码两个数据列构建时空复合索引结构(以地理编码的位置唯一性进行数据关联索引并能与网格进行关联)。
[0058]
在步骤g中,时空复合索引结构在地理编码和时间编码两个数据列上构建复合索引结构b
-tree或hash,并与地理格网模型的网格内所有生态演变数据对应关联。
[0059]
h、生态演变大数据多尺度查询:查询区域采用不同空间尺度下对矿区任意时间、任意空间下生态演变数据的快速检索、读取、展示及分析,具体方法如下:
[0060]
h1、查询区域的地理编码表达:提取查询区域(即查询区域的空间数据)所覆盖网格区域并收集所有网格所对应的地理编码。
[0061]
h2、查询区域的时间编码表达:根据所要查询数据的目标时间(即查询区域的时间数据)得到时间编码,并结合查询区域的地理编码得到查询区域的编码集合d
code

[0062]
h3、以查询区域的编码集合d
code
为查询条件通过多层级数据组织结构和时空复合索引结构快速查询对应的生态演变数据,将查询得到的生态演变数据按照编码层级(如查询编码层级)在地理格网模型上进行网格展示或参与上层计算分析,网格展示包括时空分布展示、生态因子体系展示、某一个或几个生态因子展示;上层计算分析包括生态驱动因子
分析、多要素联合对比分析。当观察整个矿区下的生态演变数据空间分布状况,可以选择较大的网格呈现;当关注矿区局部区域的生态演变数据分布时,可以选择中等大小的网格呈现;当聚焦在矿区某一特定小范围区域的局部细节信息,可以采用高分辨率的精细网格进行刻画。
[0063]
在步骤h中,查询区域(一般指选定查询的空间区域及层级、时间区域及层级,其根据查询需求而设定)包括空间数据、时间数据、查询编码层级,查询编码层级包括地理编码层级和时间编码层级。
[0064]
根据本发明的一个实施例:在步骤h3中,编码层级包括地理编码层级和时间编码层级,地理编码层级为网格所属剖分层级,以首次四叉树格网剖分为最高,以最后四叉树格网剖分为最低,时间编码层级按照年月日时分秒从高至低排列。
[0065]
h31、当查询区域的编码集合d
code
的编码层级高于生态演变大数据的编码层级时,通过粗粒度地理编码查询、基于时间编码锁定时间编码层级并将生态演变大数据进行聚合运算,聚合运算表达式如下:fv
factori
=operate(sv0,sv1,sv2,sv3,......,svi),其中fv
factor
是第i个因子在父级网格上的聚合值,sv0、sv1、sv2、sv3……
svi为同一父网格下的i个子网格的因子量化值,operate为聚合计算函数,聚合计算函数包括均值计算average、求和计算sum、最大值计算max、最小值计算min或数量统计计算count。
[0066]
h32、当查询区域的编码集合d
code
的编码层级与生态演变大数据的编码层级相同时,以查询区域的编码集合d
code
为查询条件通过时空复合索引结构快速匹配对应的生态演变数据。
[0067]
根据本发明一个实施例,除在步骤f中存在如下不同之处外其余均相同:在步骤f中,在生态演化大数据中利用目标矿区地理最小外包网格单元的地理编码进行标识得到目标矿区生态演化大数据(这样便于重点关注目标矿区并实现生态演变大数据多尺度查询,生态演化大数据具有长时间序列特征,因此同一矿区的数据会有30年-40年的历史累积数据,基于时间编码进行分片管理,例如同一个矿区相同年份的数据存储在一张表内,以实现大规模数据“分层治理”的组织结构),并由此构建得到矿区生态演变大数据立方体ee-cube并依次进行步骤g~h,由此实现针对矿区的生态演变大数据多尺度查询。
[0068]
实施例二
[0069]
如图1~图7所示,一种基于地理格网模型矿区生态演变大数据多尺度查询方法,其方法如下:
[0070]
a、构建含有经度线和纬度线的地理格网模型:采用四叉树格网剖分结构首次剖分地球(优选地,地球地图或全球平面地图,本实施例采用全球平面地图)得到八个四边形,剖分层级记为level=0;对地理格网模型首次剖分的四边形按照四叉树方式进一步剖分,每个四边形剖分出四个子四边形,剖分层级记为level=1(共计32个四边形);
……
按照上述方式依次递归剖分(如:对剖分层级level=1所剖分的四边形按照四叉树方式进一步剖分,剖分层级记为level=2(此时共计8
×22
×22
个四边形);依次类推,对剖分层级level=m-1所剖分的四边形按照四叉树方式进一步剖分,剖分层级记为level=m(此时共计8
×2m
×2m
个四边形)),得到满足矿区空间分辨率要求(地理格网模型的网格剖分越多,其分辨率越高,根据实际矿区空间分辨率要求进行设置剖分层级)的地理格网模型,剖分层级记为level=n(即按照上述方法由level=n-1剖分得到),地理格网模型的总网格单元数量为8
×2n
×2n
,每个网格带有经纬度区间范围(相邻上下剖分层级的网格带有经纬度区间范围成2的倍数关系,即剖分层级level=n-1中网格经纬度区间范围与剖分层级level=n-2中网格经纬度区间范围成2倍关系)。
[0071]
根据本发明一个优选实施例,在步骤a中,采用四叉树格网剖分结构首次剖分(剖分层级level=0)地球(本实施例采用带经纬度信息的全球平面地图)时,四叉树格网剖分结构在剖分时采用经纬度线进行剖分,本实施例经度线选择主子午线0
°
、90
°
、180
°
、270
°
为分割线,纬度线则选择赤道0
°
,四叉树格网剖分结构首次剖分后参见图2(后续首次剖分的地理编码也如图2所示);递归剖分完成后,每个网格的经度差d
lat
与纬度差d
lon
公式如下:
[0072]
其中level为剖分层级(又称剖分层级level或层级),层级level越大,空间分辨率越高,表示的空间位置越精确。
[0073]
b、基于z-order空间填充曲线对地理格网模型进行地理编码,地理编码优选采用四进制编码(当然也可以采用二进制或十进制编码),其方法如下:
[0074]
b1、地理格网模型首次剖分的八个四边形基于z-order空间填充曲线按照“z”型规则进行编码,八个四边形对应的地理编码为0~7(参见图2)。基于z-order空间填充曲线按照“z”型规则对剖分层级level=1的网格进行编码,“z”型规则为:按照左上、右上、左下、右下的顺序对四个格网单元进行分别编码0、1、2、3。
……
按照上述方式逐级编码,最后得到所有网格的地理编码(如地理编码二进制下的数据结构为g1g2g3q1q2q3q4q5q6…
,g1g2g3为全球首次剖分得到的8个四边形的编码,q1q2q3q4q5q6…
为后续剖分层级所得得到的编码)。参见图2,例如编码为12的网格,其纬度范围为[0
°
,45
°
],经度范围为[90
°
,135
°
],若继续对该格子剖分并编码,则产生4个地理编码(120、121、122、123)。
[0075]
b2、如图3所示,将步骤b1中所有网格按照行号i和列号j的二进制交叉排列表达,i=i1i2i3…
ik,j=j1j2j3…jk
,二进制交叉排列表达为i1j1i2j2i3j3…ikjk
,二进制交叉排列表达公式如下:morton=2
×
i j,并得到morton码(将morton码作为后续步骤的地理编码),其中i,j分别为二进制表达下的网格单元的行号和列号,morton为二进制交叉排列表达;
[0076]
行号i、列号j的表达式如下:
[0077]
其中level为网格所在层级(即剖分层级),lon
min
、lat
min
分别为所在全球初始八个四边形的最小经度和最小纬度,d
lon
为网格单元的经度差,d
lat
为网格单元的纬度差,d
lon
、d
lat
作为网格单元的空间分辨率,lon、lat分别为网格单元内任意位置信息。
[0078]
c、采集具有时间、地理维度信息的生态演变大数据,生态演变大数据包括基础地理信息数据、多源遥感大数据、人类活动数据等,提取生态演变大数据的时间信息并按照“y1y2y3y4m1m2d1d2h1h2f1f2s1s
2”的规则进行时间编码,其中y1y2y3y4为年的编码,m1m2为月的编码,d1d2为日的编码,h1h2为时的编码,f1f2为分的编码,s1s2为秒的编码。
[0079]
d、根据生态环境的影响因子建立包括自然地理因子和人类活动因子在内的生态因子体系,自然地理因子、人类活动因子分别包括多个生态因子。
[0080]
根据本发明的一个优选实施例,在步骤d中,如图4所示,生态因子体系的生态因子层级如下:自然地理因子包括自然地理条件数据、土壤参数反演数据、水体参数反演数据、植被参数反演数据、大气参数反演数据、生态系统功能参数等,自然地理条件数据包括气温temp、降水rainf、地形landf等,土壤参数反演数据包括含水量soilw、温度soilt等,水体参数反演数据包括悬浮物susp、叶绿素wchlor等,植被参数反演数据包括叶绿素chlor、水分moist等,生态系统功能参数包括蒸发量evap、生态价值量ecol等。人类活动因子包括采矿活动数据、其他活动数据等,采矿活动数据包括采矿量minq、采矿距离mind、采矿面积mina等,其他活动数据包括城镇人口urbanp、城镇gdp、城镇距离urband、放牧活动graz等。
[0081]
f、基于基础地理信息数据、多源遥感大数据、人类活动数据并利用gis空间分析方法对各个生态因子进行定量反演得到长时间序列和精细空间下的生态演化大数据,生态演化大数据包括各个自然地理因子和各个人类活动因子在每个精细格网(即地理格网模型上的网格)上的量化值(即各个自然地理因子、各个人类活动因子对应在网格上的量化值),生态演化大数据为多源生态演化数据的融合且以地理编码和时间编码为信息载体(本实施例可以实现多源生态演化数据融合),并由此构建得到生态演变大数据立方体ee-cube,以便于实现生态演化数据的“纵向”管理,ee-cube[factori]=[temp,rainf,landf,soilw,soilt,susp,wchlor,susp,wchlor,chlor,moist,airo,pm2.5,evap,ecol,minq,mind,mina,urbanp,gdp,urband,graz
……
]。
[0082]
根据本发明一个实施例,除在步骤f中存在如下不同之处外其余均相同:在步骤f中,在生态演化大数据中利用目标矿区地理最小外包网格单元的地理编码进行标识得到目标矿区生态演化大数据(这样便于重点关注目标矿区并实现生态演变大数据多尺度查询,例如辽宁蒙东矿区内的网格单元前缀都是12101(经度范围[118.125,123.75],纬度范围[39.375,123.75]),山东鲁西矿区的网格单元都为12102(经度范围[112.5,118.125],纬度范围[33.75,39.375]),因此两个矿区单独存储为一个数据集;另外,生态演化大数据具有长时间序列特征,因此同一矿区的数据会有30年-40年的历史累积数据,基于时间编码进行分片管理,例如同一个矿区相同年份的数据存储在一张表内,以实现大规模数据“分层治理”的组织结构(参见图5)。),并由此构建得到矿区生态演变大数据立方体ee-cube并依次进行步骤g~h,由此实现针对矿区的生态演变大数据多尺度查询。
[0083]
g、生态演变大数据立方体ee-cube在同一网格上以“积木”形式堆叠且以时间编码为标识进行分层,然后以地理编码和时间编码为基准构建数据表结构,将生态演变大数据立方体ee-cube或/和生态演化大数据以格网属性值的形式写入数据表结构并存储数据库(如关系型数据库mysql,其中地理编码、时间编码采用bigint类型,并且设为数据表主键;生态演化数据为float类型;当然还可以为关系型数据库oracle、非关系型数据库mongodb或hbase等);对数据库以地理编码的空间多尺度特性实现生态演化大数据的“分层-分片”多层级高效组织管理;对数据库以地理编码和时间编码两个数据列构建时空复合索引结构(以地理编码的位置唯一性进行数据关联索引并能与网格进行关联)。
[0084]
在步骤g中,时空复合索引结构在地理编码和时间编码两个数据列上构建复合索引结构b
-tree或hash索引结构(将地理编码和时间编码统一融合为数据“键”rowkey:“shard codes code
t”,其中shard为数据分区标识,codes为地理编码,code
t
为时间编码),并与地理格网模型的网格内所有生态演变数据对应关联。
[0085]
h、生态演变大数据多尺度查询:查询区域采用不同空间尺度下对矿区任意时间、任意空间下生态演变数据的快速检索、读取、展示及分析,具体方法如下:
[0086]
h1、查询区域的地理编码表达:提取查询区域(即查询区域的空间数据)所覆盖网格区域并收集所有网格所对应的地理编码。
[0087]
根据本实施例的一个实施例,在步骤h1中,查询区域空间地理编码表达采用边界代数法(边界代数法是一种能通过计算机程序实现基于积分思想的矢量格式向栅格格式转换算法)将矢量面转为网格区域,边界代数法方法如下:以地理格网模型的地理格网阵列为参考坐标轴,由矢量多边形上某点开始顺时针搜索边界线,当边界上行时,位于该边界左侧的具有相同行号的所有网格单元值减去1。当边界下行时,该边界前进方向的右侧所有网格单元值加上1,当边界搜索完毕后,值为1的网格单元则为矢量多边形的覆盖网格,然后收集所有网格所对应的地理编码。如图6所示,初始化地理格网值为0,以地理格网阵列为参考坐标轴,由矢量多边形上某点开始顺时针搜索边界线,当边界上行时(参见图6(a)),位于该边界左侧的具有相同行号的所有网格单元值减去1;当边界下行时(参见图6(b)),该边界前进方向的右侧所有网格单元值加上1,当边界搜索完毕后,值为1的网格单元则为矢量多边形的覆盖网格(参见图6(b)中的黄色网格),这些覆盖网格的编码集合为d
code
。覆盖查询区域的网格大小是根据查询区域范围和用户需求来确定,通常大范围查询则使用低层级、较大网格来覆盖;当关注局部较小区域时,则选择高层级、精细网格来表达,以实现生态演变大数据空间多尺度的查询。
[0088]
h2、查询区域的时间编码表达:根据所要查询数据的目标时间(即查询区域的时间数据)得到时间编码,并结合查询区域的地理编码得到查询区域的编码集合d
code

[0089]
h3、以查询区域的编码集合d
code
为查询条件通过多层级数据组织结构和时空复合索引结构快速查询对应的生态演变数据,将查询得到的生态演变数据按照编码层级(如查询编码层级)在地理格网模型上进行网格展示或参与上层计算分析,网格展示包括时空分布展示、生态因子体系展示、某一个或几个生态因子展示;上层计算分析包括生态驱动因子分析、多要素联合对比分析。当观察整个矿区下的生态演变数据空间分布状况,可以选择较大的网格呈现;当关注矿区局部区域的生态演变数据分布时,可以选择中等大小的网格呈现;当聚焦在矿区某一特定小范围区域的局部细节信息,可以采用高分辨率的精细网格进行刻画。例如:图7中level 17是整个矿区在较大网格(空间分辨率约80米)下的生态价值量空间分布状况;level 18则关注矿区局部区域的生态价值量分布,其网格尺寸约40米;level 19则是聚焦在矿区某一特定小范围区域的局部细节信息,采用高分辨率20米的精细网格进行刻画。
[0090]
在步骤h中,查询区域(一般指选定查询的空间区域及层级、时间区域及层级,其根据查询需求而设定)包括空间数据、时间数据、查询编码层级,查询编码层级包括地理编码层级和时间编码层级。
[0091]
根据本发明的一个实施例:在步骤h3中,编码层级包括地理编码层级和时间编码层级,地理编码层级为网格所属剖分层级,以首次四叉树格网剖分为最高,以最后四叉树格网剖分为最低,时间编码层级按照年月日时分秒从高至低排列。
[0092]
h31、当查询区域的编码集合d
code
的编码层级高于生态演变大数据的编码层级时,通过粗粒度地理编码查询、基于时间编码锁定时间编码层级并将生态演变大数据进行聚合运算,聚合运算表达式如下:fv
factori
=operate(sv0,sv1,sv2,sv3,......,svi),其中fv
factor
是第i个因子在父级网格上的聚合值,sv0、sv1、sv2、sv3……
svi为同一父网格下的i个子网格的因子量化值,operate为聚合计算函数,聚合计算函数包括均值计算average、求和计算sum、最大值计算max、最小值计算min或数量统计计算count。例如图7中查询网格层级为level 17和level 18,而生态演化数据编码层级为19时,需要根据查询网格前缀找到其子网格,例如某一查询网格编码为121012310213012121,则需要查询生态数据表中具有相同前缀“121012310213012121”的所有编码对应的生态价值量,并进行求和计算,得到该查询网格生态价值量的聚合值,从而实现不同空间尺度下的生态价值量的查询。
[0093]
h32、当查询区域的编码集合d
code
的编码层级与生态演变大数据的编码层级相同时,以查询区域的编码集合d
code
为查询条件通过时空复合索引结构快速匹配对应的生态演变数据。
[0094]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献