一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

面向载体精细提取的国外人口空间集成方法和系统与流程

2023-01-17 12:42:19 来源:中国专利 TAG:


1.本技术涉及人口空间化领域,特别涉及面向载体精细提取的国外人口空间集成方法和系统。


背景技术:

2.目前,我国主要集中于中国区域范围内不同尺度人口空间集成或空间化研究,关于国外人口空间集成文献仅有1篇,该篇文章是从综述角度围绕理论体系、研究方法、理论解释等方面对国外人口分布演变机制进行述评。国外人口空间集成方面的研究鲜有报道,更尚无国外人口分布载体提取及人口空间集成技术的文献资料。主要问题如下:一是以行政区划为单元的人口统计与表达可以为政府管理和政策规划提供支撑,但是国外行政区尺度尤其是大范围区域人口分布的均衡表达,掩盖了国外人口分布局部信息和细节特征。二是人口普查区一般难以获取,况且不同国家和地区人口普查区划分情况复杂,划分规则不同,模糊了人口分布的地理差异性,给全球人口分布统一时空基准框架的建立带来影响。三是过粗的格网单元未与人口实际居住地建立相应联系,在动态人口分布实际情况与表达存在一定缺陷。四是由于人员、经费、成本、制度等方面的限制给国外大区域范围尤其是农村地区居住建筑的采集、获取与解译带来一定难度。因此,新发展格局下全球陆表地理信息与人口信息的集成与综合应用受到了极大地限制。近年来,位置导航、互联网、对地观测、测绘地理信息等大数据获取技术的快速发展,高精度、多要素、高维度的全球地理空间大数据扩增,为国外高精度人口空间集成定量研究提供了有效手段。全球30米地表覆盖数据精确测定了全球人工地表的空间分布,可为国外人口分布载体精细化提取及人口空间集成提供可靠的基础数据支撑。本次提出的方法是针对国外人口分布载体不明、国外人口统计数据尺度过粗、国外精细尺度人口获取难度大等问题,开展国外大区域人口空间集成方法研究,以较准确获取人口分布的空间位置、范围和人口相关属性信息。


技术实现要素:

3.(一)申请目的基于此,为了获取国外人口分布的空间位置,以及解决国外人口分布载体不明、国外人口统计数据尺度过粗、国外精细尺度人口获取难度大的问题,为国外人口空间研究及应用提供有效参考,本技术公开了以下技术方案。
4.(二)技术方案本技术公开了面向载体精细提取的国外人口空间集成方法的方法,包括:s1,获取并处理国外多级行政区划人口统计数据、多源地理空间数据,构建标准化数据结构框架;s2,将国外人口统计数据与行政区划界线矢量数据进行空间匹配;s3,基于全球30米地表覆盖数据并融合dem数据和osm数据,精细化提取国外人口分布载体;
s4,基于行政区划和人口分布载体进行空间要素与人口要素空间集成辅助因子提取;s5,基于分区策略的多因子逐步融合建模方法,开展人口空间集成与精度验证。
5.在一种可能的实施方式中,所述构建标准化数据结构框架的方法具体包括:s11:通过网站下载对应国家或地区的最新年份、不同格式的人口统计数据;s12:基于表结构,设计标准化人口数据结构框架;s13:根据标准化表结构,录入对应多级政区人口统计信息;s14:依据国家公开的地名标准以及现有地名库,对不同国家语言转译为中文;s15:对人口数据进行核验,填补缺失人口数据,保证同一级别行政区人口统计数据初始值完整,形成标准化数据表。
6.在一种可能的实施方式中,所述填补缺失人口数据的方法具体包括:s151:采用公开渠道上对应的人口数据进行补充;s152:若通过公开渠道获取不到对应人口数据,分析人口缺失数据特征,对于相关系数大于0.5的人口缺失数据,通过r软件对人口缺失数据变量和已有变量建立回归模型,用缺失变量的预测值插补人口缺失值;s153:采用基于重复模拟的多重插补法插补步骤s152中不能插补的人口缺失值。
7.在一种可能的实施方式中,所述将国外人口统计数据与行政区划界线矢量数据进行空间匹配的方法具体包括:s21:比对国外人口统计数据与行政区划界线矢量数据中的行政区划代码和行政区划名称,提取其数据中不一致的行政区划名称,对于不一致的行政区划名称,通过查询其国家行政区划变更相关资料,下载对应国家或地区的各级行政区划界线数据,确定行政区划矢量数据与人口统计数据的对应关系,进而修正行政区划矢量数据;s22:修正后,通过公共字段“行政区划名称”,利用关联方法将人口统计信息字段追加到行政区划矢量数据图层,完成行政区划界线矢量数据与人口统计数据的空间匹配关联。
8.在一种可能的实施方式中,所述精细化提取国外人口分布载体的主要环节具体包括:s31:人工地表图斑提取、拼接与融合:下载全球30米地表覆盖数据,建立30米地表覆盖国家分幅数据接图表,并按行列号编码,建立国家与30米地表覆盖国家分幅数据的对应关系,根据“08”代码值,提取全球30米地表覆盖数据中人工地表要素,并转为矢量格式,得到人工地表矢量数据,基于图幅存储的数据拼接方式,按照特定一个国家或多个国家边界裁剪,得到特定一个国家或多个国家的人工地表数据,下载土地利用数据,并根据“flcass”属性字段值,提取居住地图斑数据,将人工地表数据与居住地图斑数据进行融合,并对人工地表数据与居住地图斑数据的来源进行分别标识;s32:水域掩膜提取:结合osm数据中现势性一致的水域要素,按位置查找,去除完全位于水域内人工地表;s33:异常图斑识别:通过位置选择方法筛选与国界相交的人工地表图斑,结合目视判别方式,不断调整面积阈值,直至边界处所有细碎图斑均被提取,然后按照属性选择和擦除方法筛选并去除面积小的异常图斑;
s34:去除非居住用地:结合osm数据中土地利用类型,并结合遥感影像数据,筛选并擦除不适合居住的土地利用类型;s35:高海拔无人区识别与去除:下载全球dem高程数据,结合dem高程数据,提取人工地表图斑的高程值,去除海拔高程大于一定阈值的人工地表;s36:狭长人工地表识别与去除:通过人机交互方式,综合考虑人工地表的大小、分布、形态特征,确定人工地表边界密度的拐点,以此设置阈值,并结合纵、横坐标的最大值、最小值、宽度值以及三角网质心核密度分布,去除狭长人工地表。
9.在一种可能的实施方式中,所述集成辅助因子提取的提取方法具体包括:s41:获取每个人口分布载体的面积,下载校正后的npp夜间灯光遥感数据,利用栅格分区统计方法,得到每个人口分布载体单元的灯光亮度值,按照所属行政区,得到每个行政区人口分布载体的总面积、夜间灯光总亮度;s42:下载路网数据,计算对应行政区面积和该行政区范围内道路长度,通过长度与面积比值计算该行政区路网密度,以人口分布载体单元为中心,以距离道路的平均距离为半径构建空间缓冲区,统计该缓冲区范围内道路的长度和缓冲区的面积,计算缓冲区路网密度,将该路网密度值赋给位于该缓冲区中心位置的人口分布载体单元;s43:下载全球30米分辨率dem数据,利用表面分析工具计算与人口统计数据同尺度的行政区和每个人口分布载体的地形因子;s44:下载poi数据,计算与人口统计数据同尺度的行政区面积和该行政区范围内poi数量,通过poi数量与面积比值计算该行政区poi密度,以人口分布载体单元为中心,以人口分布载体单元面积为权重,构建加权voronoi图,统计每个voronoi图内poi数量与该voronoi图面积,通过数量与面积比计算每个voronoi图内poi密度,将poi密度值赋给位于该voronoi图中心位置的人口分布载体单元。
10.在一种可能的实施方式中,所述人口空间集成与精度验证的开展方法具体包括:s51:按照精细提取后的人工地表的面积比例,计算每个精细提取后的人工地表初始人口数,并记为pai,即单一人工地表初始人口数;s52:以初始分配对应的行政区为统计单元,行政区人口统计值应与该行政区各人工地表初始人口数的累加值相等,如果两者不相等,通过两者比值的近似值作为修正系数,对该修正系数迭代纠正,直至行政区人口统计值与该行政区内所有人工地表初始人口数的累加值完全相等时,获取该修正系数,将该修正系数与每个人工地表初始人口数相乘,即可获取每个人工地表人口估算值;s53:行政区单元含有若干子行政区单元,基于子行政区单元,计算人口空间集成相对误差,即子行政区内人工地表人口估算值和该子行政区人口统计值的差值与该子行政区人口统计值的比值的绝对值的平均值,公式如下:其中,mae为人口空间集成相对误差;为第i个子行政区的人口统计值;为第i个子行政区的人口估算值;为子行政区数;
s54:构建人口空间集成相对误差数据集,利用盒须图结合修正的z得分法,识别并提取所述人口空间集成相对误差数据集中高误差的人工地表图斑;具体地,首先,将所述人口空间集成相对误差值进行升序排列,将人口空间集成相对误差数据集分成四等分,并分别计算第一、第二和第三四分位数;然后,计算人口空间集成相对误差的中位数,以及每个数值与中位数的绝对偏差值,再计算该绝对偏差值的中位数;最后计算出修正的z得分值,修正的z得分计算公式为:将修正的z得分值作为阈值,提取大于该阈值或大于第三四分位数的人口空间集成相对误差较高的单一人工地表,进一步在步骤s51中单一人工地表基础上融合osm数据中提取的居住地图斑,融合后即为人口分布载体,按照人口分布载体的面积比例,计算每个人口分布载体的初始人口数,并记为paai,继续执行s52、s53;s55:基于子行政区单元,比较基于单一人工地表、人工地表与居住地图斑融合的人口分布载体这两种方法下的人口空间集成相对误差,并计算作为阈值的修正的z得分值,选择低于该阈值或小于第三四分位数的对应方法建模生成的图斑尺度人口空间集成结果,并记为,标识并提取高于该阈值或大于第三四分位数的行政区内所有人口分布载体图斑;s56:引入灯光亮度,基于人口分布载体面积、灯光亮度计算每个人口分布载体人口数,并记为pli,执行s52、s53;s57:基于子行政区单元,比较基于单一人工地表、人工地表与居住地图斑融合的人口分布载体、引入灯光亮度这三种方法下的人口空间集成相对误差,计算作为阈值的修正的z得分,选择小于该阈值或小于第三四分位数的对应方法建模生成的图斑尺度人口空间集成结果,并记为,标识并提取高于该阈值或大于第三四分位数的行政区内所有人口分布载体图斑;s58:引入路网密度、地形因子,分别基于人口分布载体面积、灯光亮度、路网密度以及地形因子,计算每个人口分布载体人口数,并分别记为pri、pei、ppi,执行s52、s53;s59:基于子行政区单元,比较不同方法下的人口空间集成相对误差,直至所有子行政区内人口空间集成的拟合指数大于0.5,选择对应方法建模生成的图斑尺度人口空间集成结果作为最终结果。拟合指数用于表示人口空间集成的估算值与统计值之间的一致性。计算公式为:其中,为第i个子行政区人口数据实际统计值;为第i个子级行政区人口数据估算值;人口数平均值;为估算的子行政区单元数。
11.作为本技术的第二方面,本技术还公开了面向载体精细提取的国外人口空间集成系统,包括:数据预处理模块,获取并处理国外多级行政区划人口统计数据、多源地理空间数据,构建标准化数据结构框架;数据匹配模块,将国外人口统计数据与行政区划界线矢量数据进行空间匹配;载体单元提取模块,基于全球30米地表覆盖数据并融合dem数据和osm数据,精细化提取国外人口分布载体;辅助因子提取模块,基于行政区划和人口分布载体进行空间要素与人口要素空间集成辅助因子提取;人口空间集成模块,基于分区策略的多因子逐步融合建模方法,开展人口空间集成与精度验证。
12.(三)有益效果1、本技术公开的面向载体精细提取的国外人口空间集成方法及系统,通过将国外人口统计数据与行政区划界线矢量数据进行空间匹配,对行政区划界线矢量数据进行了修正,提高了行政区划界线矢量数据的精准性。
13.2、本技术公开的面向载体精细提取的国外人口空间集成方法及系统,通过对国外人口分布载体进行了深层次的提取,能够得到有效的人口分布空间位置和范围,提高了国外人口空间化研究的可靠性。
14.3、本技术公开的面向载体精细提取的国外人口空间集成方法及系统,通过基于多因子逐步融合建模,并不断精度验证,可筛选出最精准的人口空间集成结果,提高了国外人口统计精细化程度。
附图说明
15.以下参考附图描述的实施例是示例性的,旨在用于解释和说明本技术,而不能理解为对本技术的保护范围的限制。
16.图1是本技术公开的面向载体精细提取的国外人口空间集成方法的流程示意图。
17.图2是本技术公开的哥伦比亚地市级人口统计数据与行政区矢量数据的空间匹配关联的示例图。
18.图3是本技术公开的水域掩膜提取的示例图。
19.图4是本技术公开的国界边缘异常图斑示例图。
20.图5是本技术公开的去除非居住用地示例图。
21.图6是本技术公开的高海拔无人区识别与去除的示例图。
22.图7是本技术公开的人工地表边界密度指数表。
23.图8是本技术公开的水平或竖直形的狭长地表处理参数表。
24.图9是本技术公开的核密度重分类等级阈值表。
25.图10是本技术公开的狭长人工地表识别与提取示例图。
26.图11是本技术公开的哥伦比亚人口空间集成逐步建模精度统计表。
27.图12是本技术公开的哥伦比亚人口空间集成结果空间展布图。
具体实施方式
28.为使本技术实施的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行更加详细的描述。
29.下面参考图1详细描述本技术公开的面向载体精细提取的国外人口空间集成方法实施例。如图1所示,本实施例公开的方法主要包括有以下步骤s1~s5。
30.s1,获取并处理国外多级行政区划人口统计数据、多源地理空间数据,构建标准化数据结构框架;其中,构建标准化数据结构框架的方法包括具体步骤s11~s14。
31.s11:通过我国国家统计局网站内国外统计网站链接下载最新年份、不同格式的人口统计数据;s12:基于表结构,设计标准化人口数据结构框架,其中,标准化人口数据结构的字段不限于行政区划标识码、行政区划英文名称、行政区划中文名称、人口数、年份等;s13:根据标准化表结构,录入对应多级政区人口统计信息;s14:依据国家公开的地名标准以及现有地名库,对不同国家语言,例如阿拉伯语、西班牙语、葡萄牙语等外语转译为中文;s15:对人口数据进行核验,填补缺失人口数据,保证同一级别行政区人口统计数据初始值完整,形成标准化数据表,其中填补缺失人口数据的方法包括具体步骤s151~s153。
32.s151:优先打开我国国家统计局网站内国外统计网站链接,优先采用公开渠道上的对应人口数据进行补充,具体地,该公开渠道有世界银行、世界卫生组织、国家统计局等。
33.s152:若通过国外统计网站等公开渠道获取不到对应人口数据,分析人口缺失数据特征,对于相关系数大于0.5的人口缺失数据,通过r软件对人口缺失数据变量和已有变量建立回归模型,用缺失变量的预测值插补人口缺失值。具体地,首先调用any(is.na())函数判断数据集中是否存在人口缺失值,然后调用lm()函数用缺失数据条件期望值填补人口缺失值。
34.s153:采用基于重复模拟的多重插补法插补步骤s152中不能插补的人口缺失值。具体地,首先调用mice()函数,采用蒙特卡洛方法在原数据基础上产生完整数据集;调用with()函数对上述数据进行统计建模;调用pool()函数对上述统计建模分析结果进行整合;最后,调用lm()、coef()函数比较多重插补估计的标准误大小,选择标准误最小的第n个插补结果填补缺失数据。
35.s2,将国外人口统计数据与行政区划界线矢量数据进行空间匹配,该匹配方法包括具体步骤s21~s22。
36.s21:比对国外人口统计数据与行政区划界线矢量数据中的行政区划代码和行政区划名称,提取其数据中不一致的行政区划名称,对于不一致的行政区划名称,通过查询其国家行政区划变更相关资料,并从osm官网(https://www.openstreetmap.org)下载对应国家或地区的各级行政区划界线数据,确定行政区划矢量数据与人口统计数据的对应关系,进而修正行政区划矢量数据;s22:修正后,通过公共字段“行政区划名称”,利用关联方法将人口统计信息字段追加到行政区划矢量数据图层,完成行政区划界线矢量数据与人口统计数据的空间匹配关
联,如图2所示,为对哥伦比亚进行空间匹配关联后的人口分布图。
37.s3,基于全球30米地表覆盖数据并融合dem数据和osm数据,精细化提取国外人口分布载体,精细化提取国外人口分布载体的主要环节包括具体步骤s31~s36。
38.s31:人工地表图斑提取、拼接与融合:从全国地理信息资源目录服务系统(https://www.webmap.cn)下载全球30米地表覆盖数据,建立30米地表覆盖国家分幅数据接图表,并按行列号编码,建立国家与30米地表覆盖国家分幅数据的对应关系,根据“08”代码值,提取全球30米地表覆盖数据中人工地表要素,并转为矢量格式,得到人工地表矢量数据,基于图幅存储的数据拼接方式,按照特定一个国家或多个国家边界裁剪,得到特定一个国家或多个国家的人工地表数据;从osm官网(https://www.openstreetmap.org/)下载土地利用数据,并根据“flcass”属性字段值,提取居住地图斑数据,将人工地表数据与居住地图斑数据进行融合,并人工地表数据与居住地图斑数据的来源进行分别标识;s32:水域掩膜提取:结合osm数据中现势性一致的水域要素,按位置查找,去除完全位于水域内人工地表,如图3所示,图3中的a为未去除水域的人工地表,图3中的b为去除水域的人工地表;s33:异常图斑识别:通过位置选择方法筛选与国界相交的人工地表图斑,结合目视判别方式,不断调整面积阈值,直至边界处所有细碎图斑均被提取,然后按照属性选择和擦除方法筛选并去除面积较小的异常图斑,如图4所示,为国界边缘异常图斑;s34:去除非居住用地:结合osm数据中土地利用类型,并结合遥感影像数据,筛选并擦除不适合居住的土地利用类型,不适合居住的土地有墓地、采石场、森林、灌木等,如图5所示,图5中的a为未去除非居住用地的人工地表,图5中的b为去除非居住用地的人工地表;s35:高海拔无人区识别与去除:下载全球dem高程数据,结合dem高程数据,提取人工地表图斑的高程值,去除海拔高程大于一定阈值的人工地表。按照国际惯例的海拔划分标准,考虑到高海拔地区一般无人居住,人体机能会严重下降,对人体的肌体和核心器官损伤很大,而且有些损伤是不可逆的,几乎无人在该海拔高度上长期居住。依据dem高程数据,统计每个人工地表图斑范围内的dem均值,得到每个人工地表图斑的高程值,以高程值5000米为阈值点,删除无人居住的人工地表图斑,即高程值大于5000米以上的人工地表图斑,如图6所示,图6中的a为未去除高海拔无人区的人工地表,图6中的b为去除高海拔无人区的人工地表。
39.s36:狭长人工地表识别与去除:通过人机交互方式,综合考虑人工地表的大小、分布、形态特征,确定人工地表边界密度的拐点,以此设置阈值,并结合纵、横坐标的最大值、最小值、宽度值以及三角网质心核密度分布,去除狭长人工地表。
40.其中,去除当狭长人工地表的方法包括具体步骤s361~s363。
41.s361:人工地表形状为狭长条带状时,计算人工地表多边形边界密度,设定阈值参数去除狭长地表。在arcgis环境下,首先,计算区域人工地表图斑的周长与面积,通过周长与面积比计算边界密度指数。然后,绘制所有人工地表的边界密度指数曲线图,根据曲线图判定曲线离群拐点,去除边界密度指数大于该离群拐点的狭长人工地表,人工地表边界密度指数如图7所示。
42.s362:去除边界密度指数大于该离群拐点的狭长人工地表,仍存在一些水平或竖
直形的狭长地表,采用以下方法提取并去除。具体地,用如图8所示的狭长地表处理参数计算剩余人工地表面状要素的横坐标、纵坐标的最大值、最小值及宽度值。令len_y_x=y_wid /x_wid,对len_y_x字段降序排列,绘制len_y_x曲线图,根据拐点位置筛选并使用消除法去除低于该阈值的竖直形狭长地表。
43.s363:当人工地表多边形两头为凸包状、中间为条带状时,一般被认为是道路与建筑物区或其他设施相连的人工地表。具体地,通过对人工地表多边形构建三角网,提取三角网质心点,进行核密度分析,然后根据一定阈值分割并去除条带状多边形,以保留两头的凸包地表。
44.具体地,将人工地表多边形顶点按照顺时针或者逆时针排序,构建三角网。在有序的节点中将每个人工地表多边形图斑分割成n个三角形;任取人工地表多边形上一个节点p,该点即为剖分点,然后再取p的上一个点o,再取这个o的下一个点q,这时opq三个点组成了一个三角形opq。循环以上步骤,直到人工地表多边形节点数为3,完成剖分后停止;提取每个三角形的质心点,以三角形的面积作为权重,对质心点做核密度分析。计算核密度数据集的平均值与标准差,采用标准差分级法将核密度数据集重分类为5个等级。5个等级的对应标准如图9所示,先以核密度数据集的平均值作为第1阈值,然后以平均值加1个、2个、3个标准差值分别作为第2、3、4阈值点,从而分出5个数值区间范围。将核密度数据集平均值设为a,其标准差设为s,计算公式和分级如下:核密度数据集:平均值:标准差:矢量化处理该核密度重分类数据,将矢量化图层与s36-2步生成的人工地表图斑进行相交处理,统计不同等级核密度重分类区域内的人工地表三角形质心点数;基于上述4个阈值点,不断细化核密度重分类数并进行矢量化,如果分类区域范围内质心点数变化趋于平稳时,将该处拐点对应的重分类图斑切割人工地表图斑即可去除中间狭长人工地表,如图10所示,图10中的a为未矢量化处理的人工地表,图10中的b为矢量化处理的人工地表。
45.s4,基于行政区划和人口分布载体进行空间要素与人口要素空间集成辅助因子提取,该集成辅助因子提取的提取方法包括具体步骤s41~s44。
46.s41:获取每个人口分布载体的面积,从美国国家航空航天局(nasa)网站下载校正后的npp夜间灯光遥感数据,利用栅格分区统计方法,得到每个人口分布载体单元的灯光亮度值,按照所属行政区,得到每个行政区人口分布载体的总面积、夜间灯光总亮度,具体地,因存在部分人口分布载体跨域行政区界线的情况,为了保证该载体的完整性,则根据该载体面积比例进行判断,如果该载体在某行政区内的面积比例大于50%,则认为该载体归属于该行政区范围内。
47.s42:从osm官网(https://www.openstreetmap.org/)下载路网数据,计算对应行政区面积和该行政区范围内道路长度,通过长度与面积比值计算该行政区路网密度,以人口分布载体单元为中心,以距离道路的平均距离为半径进行空间缓冲,统计该缓冲区范围
内道路的长度和缓冲区的面积,计算缓冲区路网密度,将该路网密度值赋给位于该缓冲区中心位置的人口分布载体单元。
48.s43:从全国地理信息资源目录服务系统(https://www.webmap.cn)下载全球30米分辨率dem数据,利用表面分析工具计算与人口统计数据同尺度的行政区和每个人口分布载体的地形因子,该地形因子包括高程、坡度以及坡向等其他地形。
49.s44:从osm官网(https://www.openstreetmap.org)下载poi数据,计算与人口统计数据同尺度的行政区面积和该行政区范围内poi数量,通过poi数量与面积比值计算该行政区poi密度,以人口分布载体单元为中心,以人口分布载体单元面积为权重,构建加权voronoi图,统计每个voronoi图内poi数量与该voronoi图面积,通过数量与面积比计算每个voronoi图内poi密度,将poi密度值赋给位于该voronoi图中心位置的人口分布载体单元。
50.s5,基于分区策略的多因子逐步融合建模方法,开展人口空间集成与精度验证,对哥伦比亚人口空间集成逐步建模精度统计如图11所示,该人口空间集成与精度验证的开展方法包括具体步骤s51~s59。
51.s51:按照精细提取后的人工地表的面积比例,计算每个精细提取后的人工地表初始人口数,并记为pai,即单一人工地表初始人口数;具体地,单一人工地表初始人口数的计算方法包括:为每个人工地表添加标识码,计算每个人工地表面积占对应行政区人工地表总面积的比例,按照该比例将对应行政区人口总数分配到每个人工地表,获取人工地表初始人口数。
52.s52:以初始分配对应的行政区为统计单元,行政区人口统计值应与该行政区各人工地表初始人口数的累加值相等,如果两者不相等,通过两者比值的近似值作为修正系数,对该修正系数迭代纠正,直至行政区人口统计值与该行政区内所有人工地表初始人口数的累加值完全相等时,获取该修正系数。将该修正系数与每个人工地表初始人口数相乘,即可获取每个人工地表人口估算值;s53:行政区单元含有若干子行政区单元,基于子行政区单元,计算人口空间集成相对误差,即子行政区内人工地表人口估算值与该子行政区人口统计值差值与该子行政区人口统计值的比值的绝对值的平均值,公式如下:其中,mae为人口空间集成相对误差;为第i个子行政区的人口统计值;为第i个子行政区的人口估算值;为子行政区数。
53.s54:构建人口空间集成相对误差数据集,利用盒须图结合修正的z得分法,识别并提取所述人口空间集成相对误差数据集中高误差的人工地表图斑。具体地,首先,将所述人口空间集成相对误差值进行升序排列,将数据集分成四等分,并分别计算第一、第二和第三四分位数;然后,计算人口空间集成相对误差的中位数,以及每个数值与中位数的绝对偏差值,再计算该绝对偏差值的中
位数;最后计算出修正的z得分值。修正的z得分计算公式为:将修正的z得分值作为阈值,提取大于该阈值或大于第三四分位数的人口空间集成相对误差较高的单一人工地表,进一步在步骤s51中单一人工地表基础上融合osm数据中提取的居住地图斑,融合后即为人口分布载体,按照人口分布载体的面积比例,计算每个人口分布载体的初始人口数,并记为paai,继续执行s52、s53;s55:基于子行政区单元,比较基于单一人工地表、人工地表与居住地图斑融合的人口分布载体这两种方法下的人口空间集成相对误差,并计算作为阈值的修正的z得分值,选择低于该阈值或小于第三四分位数的对应方法建模生成的图斑尺度人口空间集成结果,并记为,标识并提取高于该阈值或大于第三四分位数的行政区内所有人口分布载体图斑;s56:引入灯光亮度,基于人口分布载体面积、灯光亮度计算每个人口分布载体人口数,并记为pli,执行s52、s53;s57:基于子行政区单元,比较基于单一人工地表、人工地表与居住地图斑融合的人口分布载体、引入灯光亮度这三种方法下的人口空间集成相对误差,计算作为阈值的修正的z得分,选择小于该阈值或小于第三四分位数的对应方法建模生成的图斑尺度人口空间集成结果,并记为,标识并提取高于该阈值或大于第三四分位数的行政区内所有人口分布载体图斑;s58:引入路网密度、地形因子,分别基于人口分布载体面积、灯光亮度、路网密度以及地形因子,计算每个人口分布载体人口数,并分别记为pri、pei、ppi,执行s52、s53;s59:基于子行政区单元,比较不同方法下的人口空间集成相对误差,直至所有子行政区内人口空间集成的拟合指数大于0.5,选择对应方法建模生成的图斑尺度人口空间集成结果作为最终结果。拟合指数用于表示人口空间集成的估算值与统计值之间的一致性。计算公式为:式中,为第i个子行政区人口数据实际统计值;为第i个子级行政区人口数据估算值;人口数平均值;为估算的子行政区单元数。
54.具体地,通过上述方法对哥伦比亚进行分区建模的人口空间集成结果如图12所示。
55.下面参考图1详细描述本技术公开的面向载体精细提取的国外人口空间集成系统实施例。本实施例公开的系统包括:数据预处理模块,获取并处理国外多级行政区划人口统计数据、多源地理空间数据,构建标准化数据结构框架;
数据匹配模块,将国外人口统计数据与行政区划界线矢量数据进行空间匹配;载体单元提取模块,基于全球30米地表覆盖数据并融合dem数据和osm数据,精细化提取国外人口分布载体;辅助因子提取模块,基于行政区划和人口分布载体进行空间要素与人口要素空间集成辅助因子提取;人口空间集成模块,基于分区策略的多因子逐步融合建模方法,开展人口空间集成与精度验证。
56.综上,本发明通过将国外人口统计数据与行政区划界线矢量数据进行空间匹配,对行政区划界线矢量数据进行了修正,提高了行政区划界线矢量数据的精准性,通过对国外人口分布载体进行了深层次的提取,能够得到有效的人口分布空间位置和范围,提高了国外人口空间化研究的可靠性,通过基于多因子逐步融合建模,并不断精度验证,可筛选出最精准的人口空间集成结果,提高了国外人口统计精准。
57.本文中的模块、单元或组件的划分仅仅是一种逻辑功能的划分,在实际实现时可以有其他的划分方式,例如多个模块和/或单元可以结合或集成于另一个系统中。作为分离部件说明的模块、单元、组件在物理上可以是分开的,也可以是不分开的。作为单元显示的部件可以是物理单元,也可以不是物理单元,即可以位于一个具体地方,也可以分布到网格单元中。因此可以根据实际需要选择其中的部分或全部的单元来实现实施例的方案。
58.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献