一种使用区位熵识别跨地区产业集聚的方法

2022-11-19 12:39:24 来源：中国专利 TAG：

1.本发明涉及数据处理技术领域，涉及一种使用区位熵识别跨地区产业集聚的方法。

背景技术：

2.产业集聚是指同一产业在某个特定地理区域内高度集中，产业资本要素在空间范围内不断汇聚的一个过程。产业集聚能够形成外部规模经济和内部规模经济，促进集聚区域的经济发展。同时，外部规模经济有可能产生正向的空间溢出效应，带动周边地区产业的发展。此外产业集聚还可以促进创新。
3.关于产业集聚的识别的方法，多见于经济学管理学领域，并且种类较多，涉及的对象和范围也不尽相同。如以企业为研究对象的、基于ripley的k函数的d函数和m函数，但该类方法多用于城市内部；以城市或区域整体为研究对象的区域基尼系数、以因子分析法为核心的多元统计方法等，但无空间纬度，只能表征产业的总体集聚程度；也有以企业为对象，但受限于数据获取不得已从产业整体角度出发以反映区域内产业集中程度的赫芬达尔指数、产业集中度、产业绝对集中地理指数等。现有方法多反映研究范围内部产业的总体集聚程度，并且需提前预设所分析的产业，对于不同地区之间产业是否有可能存在集聚现象无法进行准确识别。
4.产业集聚的识别可应用于区域领域的研究分析，包括区域产业集群发展、跨城市群都市区产业合作、区域产业一体化等。通过识别跨地区产业集聚，能够为区域产业规划提供决策支持和数据支撑。但目前还没有使用区位熵构识别跨地区产业集聚的方法。

技术实现要素：

5.本发明要克服现有技术的上述缺点，提供一种使用区位熵识别跨地区产业集聚的方法。
6.为了识别跨地区产业集聚，本发明的一种使用区位熵识别跨地区产业集聚的方法，包括如下步骤：
7.步骤1：通过企业注册数据计算各地区各产业的区位熵，并根据区位熵确定各地区的主导产业。
8.步骤11：筛选正常营业的企业数据。爬取到的原始企业注册数据包括公司名称、经营状态、注册资本、行业、地级市和区县等字段(地级市和区县在后文统称为地区)，从中筛选出经营状态为存续、正常、在业的企业，即为研究所需的企业数据集。
9.步骤12：汇总各地区各产业的注册资本规模。按照地区和行业对各企业的注册资本进行加和汇总，得到各地区内各个产业的注册资本规模数据集，主要包括地区以及各行业注册资本规模等字段。
10.步骤13：计算区位熵。使用excel，按照区位熵公式对各地区各产业注册资本规模表进行计算，得到各地区各产业的区位熵，区位熵公式如下所示。
[0011][0012]
式中：lq
ij
代表j地区i产业的区位熵，q
ij
为j地区的i产业的注册资本规模，qj为j地区所有产业的注册资本规模；qi指在研究范围内i产业的注册资本规模；q为研究范围内所有产业的注册资本规模。
[0013]
步骤14：识别地区主导产业。将各地区内，由步骤13计算得到的不同产业的区位熵从大到小进行降序排列，并选取各地区内区位熵值前x1的产业，将其识别为该地区的主导产业，从而得到各地区主导产业数据集，其字段包括地区、第一大主导产业、第二大主导产业和第三大主导产业4个字段。
[0014]
步骤2：构建地区间的产业关联矩阵，并确定不同地区之间的产业关联强度。
[0015]
步骤21：构建od联系。因为某地区与除其自身外的其他地区都有可能存在产业关联，同时减少重复联系，所以可根据区域内地区的数量n，构建n*(n-1)/2的od联系数据集，其字段包括origin和destination两个字段。
[0016]
步骤22：构建产业关联联系对。将地区主导产业和od联系两个产业分别根据“origin＝地区”和“destination＝地区”进行2次表连接得到带有origin和destination地区各自主导产业的关联数据集，其字段包括origin、o主导产业1、o主导产业2、o主导产业3、destination、d主导产业1、d主导产业2、d主导产业3共8个字段。
[0017]
步骤22：赋值产业关联强度。若两地区间无相同的主导产业则赋值为0，若有一个主导产业相同则赋值为1，有两个相同则赋值为2，以此类推.并去除值为0的产业联系，得赋值后地区产业关联数据集，其字段包括origin、destination和产业关联度3个字段。
[0018]
步骤3：识别不同地区之间产业集聚以及集聚地区的主导产业。
[0019]
步骤31：识别集聚区域。通过凝聚子群算法对产业关联表进行分析(该操作可借助gephi中的模块度分析实现)，被分为同一个子群的地区将会被赋值同样的数字，不同子群数字不同，根据分析结果确定哪些地区之间联系紧密、实现了跨地区产业集聚。
[0020]
步骤32：识别集聚区域的主导产业。将集聚区域内部的产业关联进行汇总，统计不同产业的关联对数，并根据数量从多到少进行降序排列，取前x2的产业作为该集聚区域的主导产业。
[0021]
本发明的优点是：
[0022]
(1)根据区位熵构建不同地区间的产业关联，且操作简单。弥补现有研究中，操作简单的方法只能表征单一空间尺度下的产业集聚情况、不同空间尺度下的方法操作复杂可行性低的不足。
[0023]
(2)通过各地区的主导产业所构建出的产业关联表，能够识别出跨地区产业集聚可能，以及产业集聚区的主导产业，且无需对所分析产业进行预设。
附图说明
[0024]
图1是本发明方法的流程图。
具体实施方式
[0025]
下面结合附图进一步说明本发明的技术方案。以2020年底某区域内各地区的产业集群识别为例，对本发明技术方案做进一步介绍。
[0026]
一种用区位熵构建不同地区之间产业关联网络的方法,包括如下步骤：
[0027]
(一)识别地区主导产业。
[0028]
(1)筛选正常营业的企业数据集。从企业注册数据中筛选出经营状态为存续、正常或者在业的企业，即为研究所需的企业数据集，包括公司名称、经营状态、注册资本、行业和地区共5个字段。样例数据见下表。
[0029]
公司名称经营状态注册资本行业地区gsmc1存续zczb1hy1dq1gsmc2正常zczb2hy2dq2gsmc3在业zczb3hy3dq3
……ꢀ………………
[0030]
(2)汇总各地区各产业的注册资本规模。按照地区和行业对各企业的注册资本进行加和汇总，得到各地区内各个产业的注册资本规模数据集，主要包括地区以及各行业注册资本规模等字段。样例数据处理结果见下表。
[0031]
地区行业1注册资本行业2注册资本
……
dq1dq1_hy1zczbdq1_hy2zczb
……
dq2dq2_hy1zczbdq2_hy2zczb
……
dq3dq3_hy1zczbdq3_hy2zczb
…………………………
[0032]
(3)计算区位熵。计算区位熵。使用excel，按照区位熵公式对各地区各产业注册资本规模表进行计算，得到各地区各产业的区位熵。样例数据处理结果见下表。
[0033]
地区行业1区位熵行业2区位熵
……
dq1hy1_qws1hy2_qws1
……
dq2hy1_qws2hy2_qws2
……
dq3hy1_qws3hy3_qws3
…………………………
[0034]
(4)识别地区主导产业。将各地区内，由步骤13计算得到的不同产业的区位熵从大到小进行降序排列，并选取各地区内区位熵值前x1(本次说明x1取3)的产业，将其识别为该地区的主导产业，从而得到各地区主导产业数据集，其字段包括地区、第一大主导产业、第二大主导产业和第三大主导产业4个字段。样例数据处理结果见下表。
[0035]
[0036][0037]
(二)构建产业关联。
[0038]
(1)构建od联系。因为某地区与除其自身外的其他地区都有可能存在产业关联，同时减少重复联系，所以可根据区域内地区的数量n，构建n*(n-1)/2的od联系数据集，其字段包括origin和destination两个字段。样例数据处理结果见下表。
[0039]
origindestinationdq1dq2dq1dq3dq2dq3
…………
[0040]
(2)构建产业关联联系对。将od联系数据集和主导产业数据集根据“origin＝地区”进行连接，得到含o地区主导产业的联系表，样例数据处理结果见下表。
[0041]
origino主导产业1o主导产业2o主导产业3destinationdq1zdcy1zdcy2zdcy3dq2dq1zdcy1zdcy2zdcy3dq3dq2zdcy1zdcy4zdcy5dq3
…………………………
[0042]
再将含o地区主导产业的联系数据集同主导产业数据集根据“destination＝地区”进行连接，得到含o、d地区各自主导产业的联系表。样例数据处理结果见下表。
[0043][0044][0045]
(2)赋值产业关联强度。若两地区间无相同的主导产业则赋值为0，若有一个主导产业相同则赋值为1，以此类推，最大值为3.并去除值为0的产业联系，得地区产业关联数据集，其字段包括origin、destination和产业关联度3个字段。样例数据处理结果见下表。
[0046]
origindestination产业关联度dq1dq21
dq1dq32dq2dq32
………………
[0047]
(三)识别不同地区之间产业集聚。
[0048]
(1)识别集聚区域。通过凝聚子群算法分析产业关联表(该操作可借助gephi中的模块度分析实现)，被分为同一个子群的地区将会被赋值同样的数字，不同子群数字不同，根据分析结果确定哪些地区之间联系紧密、实现了跨地区产业集聚。样例数据处理结果见下表。
[0049]
地区集聚区域dq1jjqy1dq2jjqy2dq3jjqy2
…………
[0050]
(2)识别集聚区域的主导产业。集聚区域内部的产业关联进行汇总，统计不同产业的关联对数，并根据不同集聚区域对其内部产业关联对数数量从多到少进行降序排列，样例数据处理结果见下表。
[0051]
集聚区域产业关联对数总和jjqy1zdcy110jjqy1zdcy28jjqy1zdcy37
………………
[0052]
取前x2(本次说明x2取3)产业作为各集聚区域的主导产业。样例数据处理结果见下表。
[0053]
集聚区域第一大主导产业第二大主导产业第三大主导产业jjqy1zdcy1zdcy2zdcy3jjqy2zdcy2zdcy4zdcy1
……………………
[0054]
本发明的关键技术在于使用区位熵对地区的优势主导产业进行识别(步骤13、14)，通过构建产业关联联系对(步骤21、22)，不同地区间的主导产业产生了联系并赋有联系强度(步骤23)，最后对产业关联进行凝聚子群分析(步骤31)，从而识别产业集聚区域，并对集聚区域内的主导产业进行识别(步骤32)。
[0055]
本说明书实施所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围不应当被视为仅限于所陈述的具体形式，本发明的保护范围也包括本领域技术人员根据本发明构思所能够想到的等同技术手段。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：基于时间序列的相关性分析方法、装置、设备及介质与流程

一种使用区位熵识别跨地区产业集聚的方法

相关文献

最热文献