一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于多源数据的村庄发展潜力评价及村庄分类方法及装置与流程

2021-11-05 23:11:00 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,尤其涉及一种基于多源数据的村庄发展潜力评价及村庄分类方法及装置。


背景技术:

2.村镇作为农村的基本单元,是农村居民点聚集的重要空间,也是城乡发展格局中具有更大发展空间的地区。村镇发展是指村镇从落后状态向相对发达状态的转变过程。村镇发展潜力评价是在政策、经济、环境、区位等综合因素影响下,对村镇利用资源的发展能力进行评价,对村庄分类、农村居民点整治、村镇规划布局等工作都具有重要指导作用。村镇发展具有一定弱质性,村镇发展普遍落后于城市,因此受到国内外各个国家和地区的重视和支持。中共十九大提出乡村振兴战略来推动村镇发展,但由于我国农村人口众多且农村经济基础差,村镇发展的总体进展和成效仍不足,且在多元化城镇化的过程中,村镇发展的多样性问题仍存在。快速有效的村镇发展潜力评价和村庄分类是推动新型城镇化的必然选择。因此,构建科学合理、简单易行的村镇发展潜力评价体系,进行合理的村庄分类是目前快速推动村镇发展的重要手段。
3.目前村镇发展潜力评价指标信息获取的数据源包括自然环境数据和经济社会数据两方面。自然环境数据包含村镇的自然地理环境因素,是村镇发展的基础,直接或间接影响村镇发展的方式和条件。社会经济数据包含村镇内部持续变动的因素,能够真实反映出地区经济和社会发展形势,对村镇发展潜力起着决定性作用。
4.村庄分类需要以定量评价为基础,目前的村庄分类多以村庄功能为导向,依据自然、经济、社会等数据展开评价从而进行村庄分类划定。如周杨等基于资源、环境、人文等维度构建评价体系,划分乡村地域类型;文琦等以乡村为基本单位基于乡村振兴类型识别体系对西北干旱贫困地区村落类型进行识别;史秋洁等基于自然禀赋、区位条件等因素划分不同典型村庄类型。
5.目前村镇发展潜力评价中的自然环境数据主要包括坡度、地形差异[11]、资源禀赋等。这类数据主要通过对dem数据或者通过遥感影像处理获得,通过这些手段获取的自然资源数据一般具有准确性;村镇发展潜力评价中的社会经济数据主要包括交通数据、统计年鉴数据、基础数据等。其中交通数据和基础数据通常是由相关部门通过野外试验、实地测量或对现有土地利用规划图等相关图件数字化并结合遥感影像中识别并矢量化得到的,需要花费大量人力物力,且一般只对大型设施进行统计,存在时效性低和精度低的问题。然而村庄之间竞争和产业聚集也影响村庄的分异,而以往的研究对村庄之间空间相互作用和村庄的地理实体空间作用因素考虑较少。


技术实现要素:

[0006]
本发明的目的在于克服现有技术的不足,本发明提供了一种基于多源数据的村庄发展潜力评价及村庄分类方法及装置,可以克服传统评价中数据单一、且更新速度慢的局
限性,从而快速、准确地得到更具时效性的村庄发展潜力评价结果。
[0007]
为了解决上述技术问题,本发明实施例提供了一种基于多源数据的村庄发展潜力评价及村庄分类方法,所述方法包括:
[0008]
确定待潜力评价的村庄区域,并获得所述村庄区域的兴趣点数据、osm数据和夜间灯光数据;
[0009]
将所述村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成所述村庄区域的潜力评价数据库;
[0010]
基于所述潜力评价数据库对所述村庄区域内的村庄进行发展潜力值进行计算评估处理,获得各村庄的发展潜力值;
[0011]
基于所述发展潜力值利用引力模型进行村与村之间的引力值计算处理,获得村与村之间的引力值;
[0012]
基于所述潜力评价数据库利用核密度分析法进行兴趣点数据的核密度分析处理,获得村庄区域的所有兴趣点数据的核密度分布;
[0013]
基于村与村之间的引力值和村庄区域的所有兴趣点数据的核密度分布进行村庄分类处理,获得村庄分类结果,所述村庄分类结果包括搬迁撤并类、规模控制类、相对稳定类和集聚提升类。
[0014]
可选的,所述获得所述村庄区域的兴趣点数据、osm数据和夜间灯光数据,包括:
[0015]
基于百度地图的api接口通过获得相应url并编写python语言对所述村庄区域的百度兴趣点数据的爬取处理,获得所述村庄区域的兴趣点数据,所述兴趣点数据包括类别、名称和经纬度;
[0016]
基于osm官网下载全国的路网数据,对所述路网数据进行地里配准、地图裁剪处理,获得所述村庄区域的osm数据;
[0017]
基于noaa/ngdc网站下载全国夜间灯光数据,对全国夜间灯光数据依次进行消除噪声、去除异常值、影像裁剪处理,获得所述村庄区域的夜间灯光数据。
[0018]
可选的,所述将所述村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成所述村庄区域的潜力评价数据库,包括:
[0019]
基于landsat8遥感影像对所述村庄区域的土地利用数据进行提取处理,获得村庄区域的土地利用数据;
[0020]
以所述土地利用数据将所述村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成所述村庄区域的潜力评价数据库。
[0021]
可选的,所述基于所述潜力评价数据库对所述村庄区域内的村庄进行发展潜力值进行计算评估处理,获得各村庄的发展潜力值,包括:
[0022]
对所述村庄区域的潜力评价数据库的村庄对应潜力评价数据进行指标数据标准化处理,获得标准化指标数据;
[0023]
利用熵值法对所述标准化指标数据进行指标权重确定处理,获得计算指标权重;
[0024]
基于所述计算指标权重对所述村庄区域内的各个村庄的发展潜力值进行计算,获得各村庄的发展潜力值。
[0025]
可选的,所述对所述村庄区域的潜力评价数据库的村庄对应潜力评价数据进行指标数据标准化处理的公式如下:
[0026]
对于正向指标的指标数据标准化处理如下:
[0027][0028]
对于负向指标的指标数据标准化处理如下:
[0029][0030]
其中,y
ij
表示第i个村庄的第j个指标标准化后的值;x
ij
表示第i个村庄的第j个指标的实际值;max(x
ij
)表示第i个村庄的第j个指标的最大值;min(x
ij
)表示第i个村庄的第j个指标的最小值。
[0031]
可选的,所述利用熵值法对所述标准化指标数据进行指标权重确定处理公式如下:
[0032]
计算第j个指标下的第i个村庄的比重p
ij
,如下:
[0033][0034]
计算第j个指标的熵值如下:
[0035][0036]
其中,
[0037]
计算指标权重如下:
[0038][0039]
其中,p
ij
表示第j个指标下的第i个村庄的比重;h
j
表示第j个指标的熵值;y
ij
表示第i个村庄的第j个指标标准化后的值;n表示评价单元的总数;p表示评价指标的总数;w
j
表示第第j个指标的权重。
[0040]
可选的,所述基于所述计算指标权重对所述村庄区域内的各个村庄的发展潜力值进行计算的公式如下:
[0041][0042]
其中,p表示评价指标的总数;w
j
表示第j个指标的权重;a
j
表示第j个指标的标准化后的值。
[0043]
可选的,所述基于所述发展潜力值利用引力模型进行村与村之间的引力值计算处理的公式如下:
[0044][0045]
其中,m表示两个村庄之间的引力值;z
i
、z
j
分别表示在预设范围内的两个村庄的发展潜力值;d
ij
表示两个村庄之间的空间距离;g表示引力常数,取值为1;a表示摩擦系数,取值为2。
[0046]
可选的,所述基于所述潜力评价数据库利用核密度分析法进行兴趣点数据的核密度分析处理的公式如下:
[0047][0048]
其中,f(x)表示核密度函数;h表示带宽;n表示已知点数量;k(.)表示核函数;x

x
i
表示估计点到已知点i之间的距离。
[0049]
另外,本发明实施例还提供了一种基于多源数据的村庄发展潜力评价及村庄分类装置,所述装置包括:
[0050]
数据获得模块:用于确定待潜力评价的村庄区域,并获得所述村庄区域的兴趣点数据、osm数据和夜间灯光数据;
[0051]
数据转化模块:用于将所述村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成所述村庄区域的潜力评价数据库;
[0052]
计算评估模块:用于基于所述潜力评价数据库对所述村庄区域内的村庄进行发展潜力值进行计算评估处理,获得各村庄的发展潜力值;
[0053]
引力值计算模块:用于基于所述发展潜力值利用引力模型进行村与村之间的引力值计算处理,获得村与村之间的引力值;
[0054]
核密度分析模块:用于基于所述潜力评价数据库利用核密度分析法进行兴趣点数据的核密度分析处理,获得村庄区域的所有兴趣点数据的核密度分布;
[0055]
村庄分类模块:用于基于村与村之间的引力值和村庄区域的所有兴趣点数据的核密度分布进行村庄分类处理,获得村庄分类结果,所述村庄分类结果包括搬迁撤并类、规模控制类、相对稳定类和集聚提升类。
[0056]
在本发明实施例中,可以克服传统评价中数据单一、且更新速度慢的局限性,从而快速、准确地得到更具时效性的村镇发展潜力评价结果;和传统村庄分类相比,本技术结合兴趣点数据的核密度分析和重力模型的方法划分村庄类型,能更真实、更科学地模拟村庄类别划分的条件。
附图说明
[0057]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0058]
图1是本发明实施例中的基于多源数据的村庄发展潜力评价及村庄分类方法的流程示意图;
[0059]
图2是本发明实施例中的基于多源数据的村庄发展潜力评价及村庄分类装置的结构组成示意图。
具体实施方式
[0060]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0061]
实施例一
[0062]
请参阅图1,图1是本发明实施例中的基于多源数据的村庄发展潜力评价及村庄分类方法的流程示意图。
[0063]
如图1所示,一种基于多源数据的村庄发展潜力评价及村庄分类方法,所述方法包括:
[0064]
s11:确定待潜力评价的村庄区域,并获得所述村庄区域的兴趣点数据、osm数据和夜间灯光数据;
[0065]
在本发明具体实施过程中,所述获得所述村庄区域的兴趣点数据、osm数据和夜间灯光数据,包括:基于百度地图的api接口通过获得相应url并编写python语言对所述村庄区域的百度兴趣点数据的爬取处理,获得所述村庄区域的兴趣点数据,所述兴趣点数据包括类别、名称和经纬度;基于osm官网下载全国的路网数据,对所述路网数据进行地里配准、地图裁剪处理,获得所述村庄区域的osm数据;基于noaa/ngdc网站下载全国夜间灯光数据,对全国夜间灯光数据依次进行消除噪声、去除异常值、影像裁剪处理,获得所述村庄区域的夜间灯光数据。
[0066]
具体的,关于确定待潜力评价的村庄区域,在本技术中,选定广州市从化区所有范围内的村庄作为待潜力评价的村庄区域,从化区位于广东省中部,广州市东北面,地理坐标113
°
17

—114
°
04

,北纬23
°
22

—23
°
56

,是全省乡村振兴的示范区,也是国家新型城镇化的试点城市。从化区总面积1974.5平方公里,户籍人口63.49万人,城镇化率45.08%,下辖太平、温泉、良口、吕田、鳌头5个镇及街口、城郊、江埔3个街道,共221个行政村和50个社区。从化区充分利用良好的区位优势和丰富的旅游资源,快速推进新型城镇化,打造包括温泉镇在内的六个特色小镇。但是从化区在快速推动城镇化的同时,缺乏合理有效的村镇发展规划,村镇盲目城镇化无序扩张,村镇发展亟需科学的规划。因此,提高村镇发展潜力评价时效性,科学地进行村庄分类,引导村镇有序发展,是解决从化区乃至全国村镇现阶段发展难题的重要措施。
[0067]
兴趣点(point of interest,poi)数据是一种代表真实地理实体的点状数据,包含空间和属性信息,相较于实地调查数据可以更好地反映人类社会经济的状态,具有易获取、数据量丰富、更新快等优点。目前,poi数据作为一种新的点状空间数据已被广泛应用到城市空间结构、城市中心分析、城市功能区识别、商业热点识别、人口空间化等研究中,将poi数据应用到空间分析研究已成为一种新的趋势。本文通过基于百度地图的api接口,通过获取相应url并编写python语言实现对2020年从化区百度poi数据的爬取,获取的poi数据包括类别、名称、经纬度等属性信息。整合处理获取的数据后,得到共12679条数据,并根据百度地图的分类和研究区数据的实际情况将数据分为8类,如表1
[0068]
表1从化区poi数据概况表
[0069]
[0070][0071]
osm数据(openstreetmap,osm)是开源地图数据,包含坐标、道路名称、道路类型、最大行驶速度等空间信息和属性信息,具有较高的拓扑关系和空间精度。在本发明中,是从osm官网下载2020年全国的路网数据,通过地理配准、地图裁剪等手段获得从化区的路网数据。
[0072]
npp/vriis夜间灯光数据是由卫星利用npp/viirs传感器捕捉夜晚地面的灯光状况形成的影像数据,可以有效反映人类活动状况与人口、经济具有较高相关性。在本发明中,是从noaa/ngdc网站下载获得2019年的夜间灯光数据,通过消除噪声、去除异常值、影像裁剪等手段获取从化区的夜间灯光。
[0073]
s12:将所述村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成所述村庄区域的潜力评价数据库;
[0074]
在本发明具体实施过程中,所述将所述村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成所述村庄区域的潜力评价数据库,包括:基于landsat8遥感影像对所述村庄区域的土地利用数据进行提取处理,获得村庄区域的土地利用数据;以所述土地利用数据将所述村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成所述村庄区域的潜力评价数据库。
[0075]
具体的,利用landsat8遥感影像数据是从地理空间数据云下载的云量较少的一景影像,通过掩膜去云、辐射定标、大气校正和图像裁剪等预处理,提取从化区土地利用数据。在本技术中以从化区260个行政村的土地利用数据(除去林场和水库部分)为对象将村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成村庄区域的潜力评价数据库。
[0076]
s13:基于所述潜力评价数据库对所述村庄区域内的村庄进行发展潜力值进行计算评估处理,获得各村庄的发展潜力值;
[0077]
在本发明具体实施过程中,所述基于所述潜力评价数据库对所述村庄区域内的村庄进行发展潜力值进行计算评估处理,获得各村庄的发展潜力值,包括:对所述村庄区域的潜力评价数据库的村庄对应潜力评价数据进行指标数据标准化处理,获得标准化指标数据;利用熵值法对所述标准化指标数据进行指标权重确定处理,获得计算指标权重;基于所述计算指标权重对所述村庄区域内的各个村庄的发展潜力值进行计算,获得各村庄的发展潜力值。
[0078]
进一步的,所述对所述村庄区域的潜力评价数据库的村庄对应潜力评价数据进行指标数据标准化处理的公式如下:
[0079]
对于正向指标的指标数据标准化处理如下:
[0080][0081]
对于负向指标的指标数据标准化处理如下:
[0082][0083]
其中,y
ij
表示第i个村庄的第j个指标标准化后的值;x
ij
表示第i个村庄的第j个指标的实际值;max(x
ij
)表示第i个村庄的第j个指标的最大值;min(x
ij
)表示第i个村庄的第j个指标的最小值。
[0084]
进一步的,所述利用熵值法对所述标准化指标数据进行指标权重确定处理公式如下:
[0085]
计算第j个指标下的第i个村庄的比重p
ij
,如下:
[0086][0087]
计算第j个指标的熵值如下:
[0088][0089]
其中,
[0090]
计算指标权重如下:
[0091][0092]
其中,p
ij
表示第j个指标下的第i个村庄的比重;h
j
表示第j个指标的熵值;y
ij
表示第i个村庄的第j个指标标准化后的值;n表示评价单元的总数;p表示评价指标的总数;w
j
表示第第j个指标的权重。
[0093]
进一步的,所述基于所述计算指标权重对所述村庄区域内的各个村庄的发展潜力值进行计算的公式如下:
[0094][0095]
其中,p表示评价指标的总数;w
j
表示第j个指标的权重;a
j
表示第j个指标的标准化后的值。
[0096]
具体的,村庄发展潜力受到村庄人口经济、资源禀赋、区位条件等综合因素的影响,村庄发展潜力评价指标应尽可能全面反映村庄的发展潜力。根据现有的研究成果,村庄发展潜力受自身资源与利用资源的能力影响,自身资源包括用地适宜性、生态环境、土地资源等,利用资源能力包括人口经济、区位条件等。同时构建指标体系应考虑指标的时效性和科学性,基于poi数据、osm路网数据、夜间灯光等数据具有易获取、更新快、数据量大等特点,形成快速准确获取的指标体系。综上在本技术中,从用地适宜性、人口经济、区位条件、资源禀赋、基础设施、生态环境六个方面构建村镇发展潜力评价指标体系,如表2。
[0097]
表2从化区村庄发展潜力评价指标体系及其权重
[0098][0099][0100]
指标数据标准化;考虑到指标有正向指标和逆向指标,在本技术中,采用数据无量纲化处理将各个指标值都计算为同向且同一数量级的数据,便于进行综合评价分析公式如下:
[0101]
对于正向指标,其公式为:
[0102][0103]
对于负向指标,其公式为:
[0104][0105]
其中,y
ij
表示第i个村庄的第j个指标标准化后的值;x
ij
表示第i个村庄的第j个指标的实际值;max(x
ij
)表示第i个村庄的第j个指标的最大值;min(x
ij
)表示第i个村庄的第j个指标的最小值。
[0106]
指标权重确定,为了消除主观因素对权重设置的影响,采用熵值法确定指标权重。熵值法是根据各项指标观测值所提供的信息大小来确定指标权重,计算步骤如下:
[0107]
计算第j个指标下的第i个村庄的比重p
ij
,如下:
[0108]
[0109]
计算第j个指标的熵值如下:
[0110][0111]
其中,
[0112]
计算指标权重如下:
[0113][0114]
其中,p
ij
表示第j个指标下的第i个村庄的比重;h
j
表示第j个指标的熵值;y
ij
表示第i个村庄的第j个指标标准化后的值;n表示评价单元的总数;p表示评价指标的总数;w
j
表示第第j个指标的权重。
[0115]
最后计算各行政村村镇发展潜力值:
[0116][0117]
其中,p表示评价指标的总数;w
j
表示第j个指标的权重;a
j
表示第j个指标的标准化后的值。
[0118]
基于多源数据构建村庄发展潜力指标体系计算从化区260个行政村的发展潜力值z,并根据自然断点法将结果分为四级,得到从化区村庄发展潜力级别。1级村庄的各类资源缺失或区位条件较差,发展能力欠缺。2、3级村庄各类资源和区位条件一般,发展能力适中。4级村庄有丰富的资源或优越的区位条件,发展能力最优。从化区中1级村41个,2级村64个,3级村92个,4级村63个,分别占比15.77%、24.62%、35.38%、24.23%,3级村数量最多,1级村最少。
[0119]
由此可得,整体上从化区村镇发展潜力较好,但是发展潜力分布不均衡,由于从化区的区政府位于街口街道且西南区域距广州市中心更近,村庄发展潜力较高的多位于从化区的西南部,而东北部的村庄发展潜力都较低。发展潜力最高的区域位于街口街道、城郊街道、江浦街道交界处,良口镇和吕田镇的总体发展潜力较差。在空间分布形态上,从化区村庄的发展潜力由街口街道向外扩散,逐渐减小。
[0120]
s14:基于所述发展潜力值利用引力模型进行村与村之间的引力值计算处理,获得村与村之间的引力值;
[0121]
在本发明具体实施过程中,所述基于所述发展潜力值利用引力模型进行村与村之间的引力值计算处理的公式如下:
[0122][0123]
其中,m表示两个村庄之间的引力值;z
i
、z
j
分别表示在预设范围内的两个村庄的发展潜力值;d
ij
表示两个村庄之间的空间距离;g表示引力常数,取值为1;a表示摩擦系数,取值为2。
[0124]
具体的,空间互相关最早在城市研究中发现,随着村庄社会经济的发展和格局的演变,在村庄发展中空间互相关也具有重要研究意义。引力模型来源于牛顿万有引力模型,用于表达两个区域的引力作用。本文通过引力模型根据村庄的发展潜力和空间距离模拟一定范围内,村庄之间相互作用的结果。引力计算公式为:
[0125][0126]
其中,m表示两个村庄之间的引力值;z
i
、z
j
分别表示在预设范围内的两个村庄的发展潜力值;d
ij
表示两个村庄之间的空间距离;g表示引力常数,取值为1;a表示摩擦系数,取值为2。
[0127]
即,在一定范围内,由于资源、人口等因素,村庄之间存在相互竞争。为模拟村庄之间竞争的结果,采用引力模型计算一定范围内村庄之间的相互作用力,并筛选出引力作用最大的村庄。引力模型的计算半径需根据村庄的实际情况确定,根据对从化区居民可接受出行的实地调研与区域实际情况,将半径确定为10km,计算各个村庄以半径为10km范围内的村庄之间的作用力,确定最大引力指向(根据z值由小指向大),得到各个村庄的引力指向。
[0128]
经统计,从化区的各村庄被指向的次数大多在0到3之间,少数村庄被指向3次以上。村庄被指向的次数越多,则表明村庄的竞争力越强,因此对村庄区域竞争力进行分级:被指向0次为较差,1次为一般,2次为较好,3次及以上为优秀,得到从化区村庄空间引力指向图。从化区村庄区域竞争力优秀村庄24个,较好52个,一般76个,较差108个。
[0129]
为综合考虑从化区村庄自身条件和区域影响进行村庄划分,基于村庄发展潜力和区域竞争力建立村庄分类矩阵,如表3。
[0130]
表3从化区村庄分类矩阵
[0131][0132][0133]
s15:基于所述潜力评价数据库利用核密度分析法进行兴趣点数据的核密度分析处理,获得村庄区域的所有兴趣点数据的核密度分布;
[0134]
在本发明具体实施过程中,所述基于所述潜力评价数据库利用核密度分析法进行兴趣点数据的核密度分析处理的公式如下:
[0135][0136]
其中,f(x)表示核密度函数;h表示带宽;n表示已知点数量;k(.)表示核函数;x

x
i
表示估计点到已知点i之间的距离。
[0137]
具体的,核密度分析法(kernel density estimation,kde)是通过模拟实际概率曲线、使用峰值函数来拟合已知样本点的非参数方法。核密度分析法将每个已知样本点设定为圆心,通过函数计算各样本点在搜索半径内的单位面积密度值,密度值与样本点间距成反比,样本点间距越小则密度越大。核密度计算公式为:
[0138][0139]
其中,f(x)表示核密度函数;h表示带宽;n表示已知点数量;k(.)表示核函数;x

x
i
表示估计点到已知点i之间的距离。
[0140]
考虑地理学第一定律的区位影响,对poi的研究中核密度分析相比于其他密度分析方法更优。因此,在本发明中根据核密度分析法,研究poi数据的空间聚类分布情况,以分析产业设施分布状况。
[0141]
即,为确定从化区产业设施空间分布情况,对从化区各类poi数据进行核密度分析。进行核密度分析时,影响结果的参数主要是样本点权重和搜索半径。权重是对各个点重要性的区分,搜索半径影响核密度分析的效果。本文在进行核密度分析时,将各个点权重设为相同;并经过多实验,确定1.5km的搜索半径最优。将处理范围设定为从化区,分析得到从化区所有poi数据的核密度分布和各类poi数据的核密度分布。
[0142]
从化区产业设施分布主要集中在四个区域,太平镇、温泉镇、良口镇和街口街道、城郊街道、江浦街道交界处。其中,街口街道、城郊街道、江浦街道交界处是从化区政治和经济最集中的区域,产业密度也最集中;太平镇内设有从化区的经济技术开发区,区内发展一大批优秀企业,是从化区第二、三产业聚集区;温泉镇具有从化区特色温泉,全镇依靠丰富的旅游资源,也吸引许多休闲娱乐以及住宿服务产业入驻;良口镇主要是商务住宅点密集。不同聚集区的密度差异较大,县政府区域的密度明显远高于其他区域。因此,从化区呈现一主核心多次核心发展趋势,区域依靠特色发展,但仍存在发展不均衡问题。
[0143]
不同类型poi数据在从化区内聚集程度与特征存在差异,但是在街口街道、城郊街道、江浦街道交界处均有高聚集度。而且在太平镇和温泉镇的聚集程度也较高;产业聚集度高的村庄通常是区域经济的核心,具有更好的发展资源和发展能力。因此,将核密度分析结果与从化区村庄叠加,并综合考虑村庄发展潜力值,得到从化区的经济核心类村庄;根据聚集程度覆盖范围,共叠加得到经济核心类村庄37个,其中街口街道18个,江浦街道8个,城郊街道6个,太平镇3个,温泉镇2个。
[0144]
s16:基于村与村之间的引力值和村庄区域的所有兴趣点数据的核密度分布进行村庄分类处理,获得村庄分类结果,所述村庄分类结果包括搬迁撤并类、规模控制类、相对稳定类和集聚提升类。
[0145]
在本发明具体实施过程中,根据上述的表3将从化区除经济核心类村庄外其余村庄分类,分为搬迁撤并类、规模控制类、相对稳定类、集聚提升类四类,并结合通过poi数据划定的经济核心类村庄,最终得到从化区村庄分类表,如表4。
[0146]
表4从化区村庄分类
[0147][0148]
从化区村庄规模控制类村庄最多,聚集提升类村庄最少,搬迁撤并类、规模控制类、相对稳定类村庄数量相差不大,聚集提升类和经济核心类数量相差不大。在空间上,搬迁撤并类和规模控制类村庄多位于距县政府较远周边地区,从化区的东北区域;相对稳定类村庄多位于从化区的西南区域;聚集提升类村庄多位于县政府周围,从化区中部区域。在行政区划上,搬迁撤并类和规模控制类村庄多位于吕田镇、良口镇、温泉镇;相对稳定类村庄主要位于鳌头镇和太平镇;聚集提升类村庄均匀分布于鳌头镇、城郊街道、街口街道、江浦街道;经济核心类村庄多位于城郊街道、街口街道、江浦街道交界处。
[0149]
在本发明实施例中,可以克服传统评价中数据单一、且更新速度慢的局限性,从而快速、准确地得到更具时效性的村镇发展潜力评价结果;和传统村庄分类相比,本技术结合兴趣点数据的核密度分析和重力模型的方法划分村庄类型,能更真实、更科学地模拟村庄类别划分的条件。
[0150]
实施例二
[0151]
请参阅图2,图2是本发明实施例中的基于多源数据的村庄发展潜力评价及村庄分类装置的结构组成示意图。
[0152]
如图2所示,一种基于多源数据的村庄发展潜力评价及村庄分类装置,所述装置包括:
[0153]
数据获得模块21:用于确定待潜力评价的村庄区域,并获得所述村庄区域的兴趣点数据、osm数据和夜间灯光数据;
[0154]
在本发明具体实施过程中,所述获得所述村庄区域的兴趣点数据、osm数据和夜间灯光数据,包括:基于百度地图的api接口通过获得相应url并编写python语言对所述村庄区域的百度兴趣点数据的爬取处理,获得所述村庄区域的兴趣点数据,所述兴趣点数据包括类别、名称和经纬度;基于osm官网下载全国的路网数据,对所述路网数据进行地里配准、地图裁剪处理,获得所述村庄区域的osm数据;基于noaa/ngdc网站下载全国夜间灯光数据,对全国夜间灯光数据依次进行消除噪声、去除异常值、影像裁剪处理,获得所述村庄区域的夜间灯光数据。
[0155]
具体的,关于确定待潜力评价的村庄区域,在本技术中,选定广州市从化区所有范围内的村庄作为待潜力评价的村庄区域,从化区位于广东省中部,广州市东北面,地理坐标113
°
17

—114
°
04

,北纬23
°
22

—23
°
56

,是全省乡村振兴的示范区,也是国家新型城镇化的试点城市。从化区总面积1974.5平方公里,户籍人口63.49万人,城镇化率45.08%,下辖太平、温泉、良口、吕田、鳌头5个镇及街口、城郊、江埔3个街道,共221个行政村和50个社区。从化区充分利用良好的区位优势和丰富的旅游资源,快速推进新型城镇化,打造包括温泉镇在内的六个特色小镇。但是从化区在快速推动城镇化的同时,缺乏合理有效的村镇发展
规划,村镇盲目城镇化无序扩张,村镇发展亟需科学的规划。因此,提高村镇发展潜力评价时效性,科学地进行村庄分类,引导村镇有序发展,是解决从化区乃至全国村镇现阶段发展难题的重要措施。
[0156]
兴趣点(point of interest,poi)数据是一种代表真实地理实体的点状数据,包含空间和属性信息,相较于实地调查数据可以更好地反映人类社会经济的状态,具有易获取、数据量丰富、更新快等优点。目前,poi数据作为一种新的点状空间数据已被广泛应用到城市空间结构、城市中心分析、城市功能区识别、商业热点识别、人口空间化等研究中,将poi数据应用到空间分析研究已成为一种新的趋势。本文通过基于百度地图的api接口,通过获取相应url并编写python语言实现对2020年从化区百度poi数据的爬取,获取的poi数据包括类别、名称、经纬度等属性信息。整合处理获取的数据后,得到共12679条数据,并根据百度地图的分类和研究区数据的实际情况将数据分为8类,如表1
[0157]
表1从化区poi数据概况表
[0158][0159][0160]
osm数据(openstreetmap,osm)是开源地图数据,包含坐标、道路名称、道路类型、最大行驶速度等空间信息和属性信息,具有较高的拓扑关系和空间精度。在本发明中,是从osm官网下载2020年全国的路网数据,通过地理配准、地图裁剪等手段获得从化区的路网数据。
[0161]
npp/vriis夜间灯光数据是由卫星利用npp/viirs传感器捕捉夜晚地面的灯光状况形成的影像数据,可以有效反映人类活动状况与人口、经济具有较高相关性。在本发明中,是从noaa/ngdc网站下载获得2019年的夜间灯光数据,通过消除噪声、去除异常值、影像裁剪等手段获取从化区的夜间灯光。
[0162]
数据转化模块22:用于将所述村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成所述村庄区域的潜力评价数据库;
[0163]
在本发明具体实施过程中,所述将所述村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成所述村庄区域的潜力评价数据库,包括:基于landsat8遥感影像对所述村庄区域的土地利用数据进行提取处理,获得村庄区域的土地利用数据;以所述土地利用数据将所述村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成所述村庄区域的潜力评价数据库。
[0164]
具体的,利用landsat8遥感影像数据是从地理空间数据云下载的云量较少的一景
影像,通过掩膜去云、辐射定标、大气校正和图像裁剪等预处理,提取从化区土地利用数据。在本技术中以从化区260个行政村的土地利用数据(除去林场和水库部分)为对象将村庄区域的兴趣点数据、osm数据和夜间灯光数据统一转化为西安80投影坐标系,形成村庄区域的潜力评价数据库。
[0165]
计算评估模块23:用于基于所述潜力评价数据库对所述村庄区域内的村庄进行发展潜力值进行计算评估处理,获得各村庄的发展潜力值;
[0166]
在本发明具体实施过程中,所述基于所述潜力评价数据库对所述村庄区域内的村庄进行发展潜力值进行计算评估处理,获得各村庄的发展潜力值,包括:对所述村庄区域的潜力评价数据库的村庄对应潜力评价数据进行指标数据标准化处理,获得标准化指标数据;利用熵值法对所述标准化指标数据进行指标权重确定处理,获得计算指标权重;基于所述计算指标权重对所述村庄区域内的各个村庄的发展潜力值进行计算,获得各村庄的发展潜力值。
[0167]
进一步的,所述对所述村庄区域的潜力评价数据库的村庄对应潜力评价数据进行指标数据标准化处理的公式如下:
[0168]
对于正向指标的指标数据标准化处理如下:
[0169][0170]
对于负向指标的指标数据标准化处理如下:
[0171][0172]
其中,y
ij
表示第i个村庄的第j个指标标准化后的值;x
ij
表示第i个村庄的第j个指标的实际值;max(x
ij
)表示第i个村庄的第j个指标的最大值;min(x
ij
)表示第i个村庄的第j个指标的最小值。
[0173]
进一步的,所述利用熵值法对所述标准化指标数据进行指标权重确定处理公式如下:
[0174]
计算第j个指标下的第i个村庄的比重p
i
j,如下:
[0175][0176]
计算第j个指标的熵值如下:
[0177][0178]
其中,
[0179]
计算指标权重如下:
[0180][0181]
其中,p
ij
表示第j个指标下的第i个村庄的比重;h
j
表示第j个指标的熵值;y
ij
表示第i个村庄的第j个指标标准化后的值;n表示评价单元的总数;p表示评价指标的总数;w
j
表示第第j个指标的权重。
[0182]
进一步的,所述基于所述计算指标权重对所述村庄区域内的各个村庄的发展潜力
值进行计算的公式如下:
[0183][0184]
其中,p表示评价指标的总数;w
j
表示第j个指标的权重;a
j
表示第j个指标的标准化后的值。
[0185]
具体的,村庄发展潜力受到村庄人口经济、资源禀赋、区位条件等综合因素的影响,村庄发展潜力评价指标应尽可能全面反映村庄的发展潜力。根据现有的研究成果,村庄发展潜力受自身资源与利用资源的能力影响,自身资源包括用地适宜性、生态环境、土地资源等,利用资源能力包括人口经济、区位条件等。同时构建指标体系应考虑指标的时效性和科学性,基于poi数据、osm路网数据、夜间灯光等数据具有易获取、更新快、数据量大等特点,形成快速准确获取的指标体系。综上在本技术中,从用地适宜性、人口经济、区位条件、资源禀赋、基础设施、生态环境六个方面构建村镇发展潜力评价指标体系,如表2。
[0186]
表2从化区村庄发展潜力评价指标体系及其权重
[0187][0188][0189]
指标数据标准化;考虑到指标有正向指标和逆向指标,在本技术中,采用数据无量纲化处理将各个指标值都计算为同向且同一数量级的数据,便于进行综合评价分析公式如下:
[0190]
对于正向指标,其公式为:
[0191][0192]
对于负向指标,其公式为:
[0193][0194]
其中,y
ij
表示第i个村庄的第j个指标标准化后的值;x
ij
表示第i个村庄的第j个指标的实际值;max(x
ij
)表示第i个村庄的第j个指标的最大值;min(x
ij
)表示第i个村庄的第j个指标的最小值。
[0195]
指标权重确定,为了消除主观因素对权重设置的影响,采用熵值法确定指标权重。熵值法是根据各项指标观测值所提供的信息大小来确定指标权重,计算步骤如下:
[0196]
计算第j个指标下的第i个村庄的比重p
ij
,如下:
[0197][0198]
计算第j个指标的熵值如下:
[0199][0200]
其中,
[0201]
计算指标权重如下:
[0202][0203]
其中,p
ij
表示第j个指标下的第i个村庄的比重;h
j
表示第j个指标的熵值;y
ij
表示第i个村庄的第j个指标标准化后的值;n表示评价单元的总数;p表示评价指标的总数;w
j
表示第第j个指标的权重。
[0204]
最后计算各行政村村镇发展潜力值:
[0205][0206]
其中,p表示评价指标的总数;w
j
表示第j个指标的权重;a
j
表示第j个指标的标准化后的值。
[0207]
基于多源数据构建村庄发展潜力指标体系计算从化区260个行政村的发展潜力值z,并根据自然断点法将结果分为四级,得到从化区村庄发展潜力级别。1级村庄的各类资源缺失或区位条件较差,发展能力欠缺。2、3级村庄各类资源和区位条件一般,发展能力适中。4级村庄有丰富的资源或优越的区位条件,发展能力最优。从化区中1级村41个,2级村64个,3级村92个,4级村63个,分别占比15.77%、24.62%、35.38%、24.23%,3级村数量最多,1级村最少。
[0208]
由此可得,整体上从化区村镇发展潜力较好,但是发展潜力分布不均衡,由于从化区的区政府位于街口街道且西南区域距广州市中心更近,村庄发展潜力较高的多位于从化区的西南部,而东北部的村庄发展潜力都较低。发展潜力最高的区域位于街口街道、城郊街道、江浦街道交界处,良口镇和吕田镇的总体发展潜力较差。在空间分布形态上,从化区村庄的发展潜力由街口街道向外扩散,逐渐减小。
[0209]
引力值计算模块24:用于基于所述发展潜力值利用引力模型进行村与村之间的引
力值计算处理,获得村与村之间的引力值;
[0210]
在本发明具体实施过程中,所述基于所述发展潜力值利用引力模型进行村与村之间的引力值计算处理的公式如下:
[0211][0212]
其中,m表示两个村庄之间的引力值;z
i
、z
j
分别表示在预设范围内的两个村庄的发展潜力值;d
ij
表示两个村庄之间的空间距离;g表示引力常数,取值为1;a表示摩擦系数,取值为2。
[0213]
具体的,空间互相关最早在城市研究中发现,随着村庄社会经济的发展和格局的演变,在村庄发展中空间互相关也具有重要研究意义。引力模型来源于牛顿万有引力模型,用于表达两个区域的引力作用。本文通过引力模型根据村庄的发展潜力和空间距离模拟一定范围内,村庄之间相互作用的结果。引力计算公式为:
[0214][0215]
其中,m表示两个村庄之间的引力值;z
i
、z
j
分别表示在预设范围内的两个村庄的发展潜力值;d
ij
表示两个村庄之间的空间距离;g表示引力常数,取值为1;a表示摩擦系数,取值为2。
[0216]
即,在一定范围内,由于资源、人口等因素,村庄之间存在相互竞争。为模拟村庄之间竞争的结果,采用引力模型计算一定范围内村庄之间的相互作用力,并筛选出引力作用最大的村庄。引力模型的计算半径需根据村庄的实际情况确定,根据对从化区居民可接受出行的实地调研与区域实际情况,将半径确定为10km,计算各个村庄以半径为10km范围内的村庄之间的作用力,确定最大引力指向(根据z值由小指向大),得到各个村庄的引力指向。
[0217]
经统计,从化区的各村庄被指向的次数大多在0到3之间,少数村庄被指向3次以上。村庄被指向的次数越多,则表明村庄的竞争力越强,因此对村庄区域竞争力进行分级:被指向0次为较差,1次为一般,2次为较好,3次及以上为优秀,得到从化区村庄空间引力指向图。从化区村庄区域竞争力优秀村庄24个,较好52个,一般76个,较差108个。
[0218]
为综合考虑从化区村庄自身条件和区域影响进行村庄划分,基于村庄发展潜力和区域竞争力建立村庄分类矩阵,如表3。
[0219]
表3从化区村庄分类矩阵
[0220][0221]
核密度分析模块25:用于基于所述潜力评价数据库利用核密度分析法进行兴趣点数据的核密度分析处理,获得村庄区域的所有兴趣点数据的核密度分布;
[0222]
在本发明具体实施过程中,所述基于所述潜力评价数据库利用核密度分析法进行兴趣点数据的核密度分析处理的公式如下:
[0223][0224]
其中,f(x)表示核密度函数;h表示带宽;n表示已知点数量;k(.)表示核函数;x

x
i
表示估计点到已知点i之间的距离。
[0225]
具体的,核密度分析法(kernel density estimation,kde)是通过模拟实际概率曲线、使用峰值函数来拟合已知样本点的非参数方法。核密度分析法将每个已知样本点设定为圆心,通过函数计算各样本点在搜索半径内的单位面积密度值,密度值与样本点间距成反比,样本点间距越小则密度越大。核密度计算公式为:
[0226][0227]
其中,f(x)表示核密度函数;h表示带宽;n表示已知点数量;k(.)表示核函数;x

x
i
表示估计点到已知点i之间的距离。
[0228]
考虑地理学第一定律的区位影响,对poi的研究中核密度分析相比于其他密度分析方法更优。因此,在本发明中根据核密度分析法,研究poi数据的空间聚类分布情况,以分析产业设施分布状况。
[0229]
即,为确定从化区产业设施空间分布情况,对从化区各类poi数据进行核密度分析。进行核密度分析时,影响结果的参数主要是样本点权重和搜索半径。权重是对各个点重要性的区分,搜索半径影响核密度分析的效果。本文在进行核密度分析时,将各个点权重设为相同;并经过多实验,确定1.5km的搜索半径最优。将处理范围设定为从化区,分析得到从化区所有poi数据的核密度分布和各类poi数据的核密度分布。
[0230]
从化区产业设施分布主要集中在四个区域,太平镇、温泉镇、良口镇和街口街道、城郊街道、江浦街道交界处。其中,街口街道、城郊街道、江浦街道交界处是从化区政治和经济最集中的区域,产业密度也最集中;太平镇内设有从化区的经济技术开发区,区内发展一大批优秀企业,是从化区第二、三产业聚集区;温泉镇具有从化区特色温泉,全镇依靠丰富的旅游资源,也吸引许多休闲娱乐以及住宿服务产业入驻;良口镇主要是商务住宅点密集。不同聚集区的密度差异较大,县政府区域的密度明显远高于其他区域。因此,从化区呈现一主核心多次核心发展趋势,区域依靠特色发展,但仍存在发展不均衡问题。
[0231]
不同类型poi数据在从化区内聚集程度与特征存在差异,但是在街口街道、城郊街道、江浦街道交界处均有高聚集度。而且在太平镇和温泉镇的聚集程度也较高;产业聚集度高的村庄通常是区域经济的核心,具有更好的发展资源和发展能力。因此,将核密度分析结果与从化区村庄叠加,并综合考虑村庄发展潜力值,得到从化区的经济核心类村庄;根据聚集程度覆盖范围,共叠加得到经济核心类村庄37个,其中街口街道18个,江浦街道8个,城郊街道6个,太平镇3个,温泉镇2个。
[0232]
村庄分类模块26:用于基于村与村之间的引力值和村庄区域的所有兴趣点数据的核密度分布进行村庄分类处理,获得村庄分类结果,所述村庄分类结果包括搬迁撤并类、规模控制类、相对稳定类和集聚提升类。
[0233]
在本发明具体实施过程中,根据上述的表3将从化区除经济核心类村庄外其余村庄分类,分为搬迁撤并类、规模控制类、相对稳定类、集聚提升类四类,并结合通过poi数据划定的经济核心类村庄,最终得到从化区村庄分类表,如表4。
[0234]
表4从化区村庄分类
[0235][0236]
从化区村庄规模控制类村庄最多,聚集提升类村庄最少,搬迁撤并类、规模控制类、相对稳定类村庄数量相差不大,聚集提升类和经济核心类数量相差不大。在空间上,搬迁撤并类和规模控制类村庄多位于距县政府较远周边地区,从化区的东北区域;相对稳定类村庄多位于从化区的西南区域;聚集提升类村庄多位于县政府周围,从化区中部区域。在行政区划上,搬迁撤并类和规模控制类村庄多位于吕田镇、良口镇、温泉镇;相对稳定类村庄主要位于鳌头镇和太平镇;聚集提升类村庄均匀分布于鳌头镇、城郊街道、街口街道、江浦街道;经济核心类村庄多位于城郊街道、街口街道、江浦街道交界处。
[0237]
在本发明实施例中,可以克服传统评价中数据单一、且更新速度慢的局限性,从而快速、准确地得到更具时效性的村镇发展潜力评价结果;和传统村庄分类相比,本技术结合兴趣点数据的核密度分析和重力模型的方法划分村庄类型,能更真实、更科学地模拟村庄类别划分的条件。
[0238]
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可
以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(rom,readonly memory)、随机存取存储器(ram,random access memory)、磁盘或光盘等。
[0239]
另外,以上对本发明实施例所提供的一种基于多源数据的村庄发展潜力评价及村庄分类方法及装置进行了详细介绍,本文中应采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献