一种基于多源交通出行数据和主题模型的城市功能区识别方法

2022-07-10 01:42:05 来源：中国专利 TAG：

1.本发明涉及一种基于多源交通出行数据和主题模型的城市功能区识别方法，属于交通大数据技术领域。

背景技术：

2.城市的发展促进了城市不同区域的功能化以满足人们的某些特定需求。功能区的存在使得社会经济资源得到合理、高效的部署以及给人们的生产生活带来很多便利。城市功能区是指通过自然资源与社会服务的空间聚集使得特定的城市功能能够得到最大程度发挥的区域。随着城市建设和社会经济的快速发展，城市功能区所呈现出的自然景观特征和社会经济特征也日益显著。而城市化进程的加快使得城市规模飞速地膨胀，过去的城市规划逐渐无法满足城市化扩张的需要，产生了许多诸如交通拥堵、住房紧张、环境恶化等问题。城市功能区分类是科学合理规划建设的前提，研究城市功能区的识别与划分的方法对于测算土地利用程度、规划各类经济社会职能、合理高效利用各类资源、提升区域综合竞争力等具有重要意义。传统的城市功能区划分主要基于土地利用调查数据，通过建立评价指标来量化城市景观与社会经济特征，以实现城市功能的划分。该方法数据获取成本高、效率低，构建评价指标的主观因素强，难以准确地刻画不同城市功能的自然与社会特征，迫切需要一种新的方法和途径来进行城市功能区的划分。在大数据技术蓬勃发展的现在，因大数据的获取来源较为广泛、时空分辨率高、涵盖信息多等优势，基于大数据的城市功能区分析方法已成为功能区划分技术的热点手段之一。至今已有许多研究结合用户活动出行数据与兴趣点数据识别不同的城市功能区，比如使用兴趣点数据与公交刷卡数据、地铁刷卡数据、网约车轨迹数据以及手机移动数据等识别城市功能区。
3.1)兴趣点数据是一种具有类别属性的数据，具有样本量大，覆盖信息量广等特点，其类别条目具有住宿服务设施、购物服务、科技文化、风景名胜、交通设施等关键字，可以为聚类后的区域地块提供语义分析支持。
4.2)居民出行数据包含公交刷卡数据、地铁刷卡数据、网约车订单数据以及手机移动数据等，具有丰富的居民出行信息，一条居民出行记录一般包含居民的上下车时间、上下车位置以及出行时长等。居民的出行与城市空间结构之间有着密切的关系，一般而言，居民通常在工作日的早上离开住宅区，晚上下班之后返回原居住地，而访问娱乐区的主要时间是工作日的晚上或非工作日的全天；其次，区域的不同功能同样与人群到达模式相关，比如访问娱乐区的居民在工作日很可能来自工作区，非工作日来自住宅区；此外，种种研究表明，出行时长、出行方式选择都会对居民的出行活动产生影响。因此，居民出行数据中包含的居民出行特征和区域的功能联系紧密。
5.利用多源出行数据结合兴趣点数据进行功能区识别的方法可以弥补单一数据源带来的识别偏差的问题，充分利用多种出行方式数据包含的更加全面丰富的居民出行信息和兴趣点数据包含的空间语义信息，使得功能区的识别更加准确。

技术实现要素：

6.技术问题：本技术的目的在于提供一种基于多源交通出行数据和主题模型的城市功能区识别方法技术，以路网为基础划分交通分析小区，并且结合兴趣点和居民出行特征，克服单一因素的影响，充分利用不同出行方式的数据所表达的功能区特征，得到更加符合实际的结果。
7.技术方案：为实现上述目的，本技术所采取的技术方案为：
8.本技术提供一种基于多源交通出行数据和主题模型的城市功能区识别方法，所述的基于多源交通出行数据和主题模型的城市功能区识别方法用于对城市空间进行功能区的划分，包括以下步骤：
9.步骤一：获取路网数据、兴趣点数据以及多源交通(网约车、地铁)出行数据；
10.步骤二：根据所述路网数据，利用形态学处理腐蚀与膨胀的方法，将城市空间划分为若干个交通分析小区；
11.步骤三：根据所述兴趣点数据和网约车、地铁出行数据在交通分析小区中的分布，挖掘区域出行-活动特征以构造词汇；
12.步骤四：采用潜在狄利克雷分配主题模型算法得到各所述交通分析小区的功能概率分布；
13.步骤五：根据每个交通分析小区的功能概率分布，采用k-means算法对所有交通分析小区进行功能聚类，得到针对于所述城市空间的c个簇，并根据各所述交通分析小区中的区域出行-活动特征分布对每一个簇进行功能标注。
14.作为优选，所述兴趣点数据为经过数据清洗、重分类之后，包含名称、地址、坐标，分为p个类别的地理空间点数据。所述的多源交通出行数据为经过数据清洗和筛选得到的城市网约车、地铁的出行数据。所述的路网数据为经过筛选的包括高速公路、城市快速路和城市主干路的路网数据，对这些道路进行形态学的膨胀和腐蚀处理，根据处理过后的道路的延伸自然地将城市空间划分为不同的基本单元，得到交通分析小区。
15.作为优选，根据所述兴趣点数据和网约车、地铁出行数据，构造区域出行-活动特征和土地利用属性特征，包括：
16.提取兴趣点地理信息特征。将根据各类别兴趣点平均占地面积进行加权的兴趣点类别频次和用地混合度作为主题模型的词汇，将所有区域经过加权的兴趣点的类别频次和区域混合度作为主题模型的词汇库以得到由兴趣点类别构成的交通分析小区-出行特征概率分布以及各交通分析小区的兴趣点主题概率分布。用地混合度的计算方法采用基于熵指数的计算方法：
[0017][0018]
其中，pi表示第i种兴趣点占所有种类兴趣点的比例，p表示兴趣点总类别数。
[0019]
提取出行-活动特征。所述的出行-活动特征为工作日和休息日的基本流量特征，每条出行数据包含上车(进站)和下车(出站)两个出行特征，其具体形式为feature＝(direction,tj)，其中，direction表示地铁客流进出站或网约车上下车方向，对于网约车订单上车点和地铁客流进站点，取direction＝s，对于网约车订单下车点和地铁客流出站点，取direction＝e，对于网约车订单，tj表示网约车订单中乘客上车时刻以及下车时刻，
对于地铁数据，tj表示地铁乘客进站时刻以及出站时刻。
[0020]
基于不同数据集构造各功能区相应的词汇，由主题模型分别求解得到不同数据集构造的交通分析小区-功能特征分布和功能特征-出行特征分布。
[0021]
作为优选，所述的构建潜在狄利克雷分配概率主题模型，利用潜在狄利克雷分配概率主题模型挖掘交通分析小区的功能特征向量，潜在狄利克雷分配概率主题模型通过提取各功能特征向量所包含的高维语义向量来分配各功能特征向量的概率，包括：
[0022]
利用潜在狄利克雷分配概率主题模型将数据集中的每个交通分析小区的功能分布按照概率分布向量的形式给出，潜在狄利克雷分配是一种无监督的贝叶斯模型,该模型被广泛应用于主题建模和文档主题分类中：
[0023]
p(w|d)＝p(w|k)
×
p(k|d)
[0024]
其中
[0025]
d为文档，在具体应用场景中表示为交通分析小区；
[0026]
w为词汇，表示为交通分析小区所具有的区域出行-活动特征；
[0027]
k为主题，表示为交通分析小区所具有的城市功能特征；
[0028]
该模型以k为中间层，p(k|d)表示交通分析小区总集d中的每个交通分析小区d对应到不同城市功能k的概率，其分布表示为向量θd，p(w|k)表示城市功能总集中的每个城市功能k生成不同区域出行-活动特征w的概率，其分布表示为向量βk；利用主题模型算法求解每个交通分析小区的城市功能特征概率分布，以及城市功能特征分布中的区域出行-活动特征分布；潜在狄利克雷分配概率主题模型的城市功能区特征识别模型学习过程如下：
[0029]
令城市交通分析小区中的区域出行-活动特征通过以下步骤生成：
[0030]
1)由超参数α确定的狄利克雷分布生成交通分析小区d的多项式功能特征概率分布θd。，即其中，为分布的超参数，是一个k维的向量，k表示给定的交通分析小区的城市功能总数量。狄利克雷分布的概率密度函数如下：
[0031][0032]
其中pk表示第k种城市功能的出现概率，αk为第k种城市功能对应的超参数。
[0033]
2)由超参数δ确定的狄利克雷分布生成对应的交通分析小区-出行特征条件分布βk，即其中，η为出行特征分布的超参数，维度为出行特征集合的元素个数v。
[0034]
3)交通分析小区d的第n个出行特征的功能特征通过计算交通分析小区d的功能特征分布θd对第n个出行特征的多项式概率分布zd得到，即zd＝multi(θd)，该多项式分布的概率密度函数为：
[0035][0036]
其中，pi表示第i种功能特征的出现概率，θ
d,i
为交通分析小区d的第i种功能特征的出现频次。
[0037]
基于困惑度确定主题数量k。在运用潜在狄利克雷分配主题模型建模时，利用训练后的模型在测试集中的困惑度确定最佳主题数，若模型在测试集上的困惑度小于预设值，
则当前功能特征数量k的取值符合要求，困惑度计算公式如下：
[0038][0039]
其中，d表示由所有出行特征构成的总集；m为交通分析小区总数量；wd为交通分析小区d中的出行特征集；nd为交通分析小区d中的出行特征数；p(wd)为交通分析小区d中所有出行特征的似然值。
[0040]
将区域兴趣点特征数据集、预处理之后的网约车、地铁工作日和休息日数据集分别进行主题模型建模，得到对应的交通分析小区功能特征概率分布，形成各个交通分析小区功能特征向量。由此构造的城市区域功能特征向量同时考虑了交通分析小区兴趣点重分类数据、区域混合度、网约车工作日数据、网约车休息日数据、地铁工作日数据和地铁休息日数据，既考虑了区域的地理信息，又结合了不同的出行方式所体现的居民出行特征，丰富了区域的居民出行特征表示，从而得到更为广泛而良好的结果。
[0041]
作为优选，根据每个交通分析小区的功能特征，采用k-means算法对所有交通分析小区进行功能聚类。聚类得到针对于所述城市空间的c个簇，并根据各所述簇中的功能概率分布对每一个簇进行功能标注。包括：
[0042]
令交通分析小区d的功能特征分布是由地铁、网约车、兴趣点三者结合分别得到的交通分析小区-功能特征概率分布向量的堆栈，即featured＝(vec
taxiweek，d
，vec
taxiweekend，d
，vec
metroweek，d
，vec
metroweekend，d
，vec
poi，d
)，其中vec
taxiweek,d
表示在工作日网约车主题模型中，交通分析小区d属于工作日网约车各个功能特征的概率分布向量，vec
taxiweekend,d
表示在休息日网约车主题模型中，交通分析小区d属于休息日网约车各个功能特征的概率分布向量，vec
metroweek,d
表示在工作日地铁模型中，交通分析小区d属于工作日地铁各个功能特征的概率分布向量，vec
metroweekend,d
表示在休息日地铁模型中，交通分析小区d属于休息日地铁各个功能特征的概率分布向量，vec
poi,d
表示在兴趣点模型中，交通分析小区d属于兴趣点各个功能特征的概率分布向量。
[0043]
最终交通分析小区的功能区聚类数量由聚类评价指标轮廓系数确定：
[0044][0045]
其中，将每个簇的功能分布特征组成的向量作为样本，a表示样本与同一簇内其余所有元素距离的平均值；遍历不包含样本点的所有簇，计算样本点到这些簇中所有点的平均距离，其中的最小值为b。；
[0046]
计算不同聚类数量c值下相应的轮廓系数指标，取使得轮廓系数指标值最大的c值，即为针对城市空间交通分析小区的c个簇。
[0047]
对于聚类得到的各簇，根据其区域特征和出行活动特征指标确定该区域的具体城市功能用地类别。其中，区域特征包括各交通分析小区的兴趣点频率密度和类别比例，区域中频率密度和类别比例分别由下式计算：
[0048][0049]
[0050]
其中，i表示兴趣点类型，p表示兴趣点总类别数，ni表示某个区域内第i类兴趣点的数量，ni表示研究区域中第i类兴趣点的总数量；fdi表示第i种类型兴趣点占该类型兴趣点总数的频率密度；cri表示第i种类型兴趣点的频数密度占某个区域内所有类型兴趣点频率密度的比例；
[0051]
区域出行活动特征指标包括该区域多源出行数据的工作日和休息日归一化小时流量，由下式计算：
[0052][0053]
其中，x
norm
表示区域归一化后的小时流量，x为区域原始小时流量，x
max
和x
min
分别表示区域小时流量的最大值和最小值。
[0054]
通过分析区域多源出行数据的工作日和休息日归一化小时流量中反映的居民出行特征，并与典型城市功能用地的居民出行特征相对比，完成区域具体城市功能标定。
[0055]
有益效果：与现有技术相比，本发明的技术方案具有以下有益效果：
[0056]
本发明的基于多源交通出行数据和主题模型的城市功能区识别方法，以易获取、体量大的多源交通出行数据为数据源，弥补了传统城市功能区调查采用的问卷调查方法的抽样率低、成本高昂的缺陷；结合兴趣点数据扩展了出行数据的语义信息，使动态的出行数据更多地作用于城市功能区识别；本发明方法模型简洁，避免了大量的参数标定，识别结果准确、可靠，是交通出行数据在城市土地利用中的重要应用。
附图说明
[0057]
图1为本技术的基于多源交通出行数据和主题模型的城市功能区识别方法的技术流程图；
[0058]
图2为利用路网数据进行交通分析小区划分的一种实施例示意图；
[0059]
图3为潜在狄利克雷分配主题模型示意图；
[0060]
图4为k-means方法不同聚类数量对应的轮廓系数图；
[0061]
图5为利用本专利提出的技术方法得到的功能区网约车工作日的归一化流量折线图；
[0062]
图6为利用本专利提出的技术方法得到的功能区识别的一种实施例示意图。
具体实施方式：
[0063]
下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
[0064]
除非另有定义，本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的，不是在于限制本技术。
[0065]
其中一实施例中，提供了一种基于多源交通出行数据和主题模型的城市功能区识别方法，所述的基于多源交通出行数据和主题模型的城市功能区识别方法用于对城市空间
进行功能区识别。
[0066]
如图1所示，基于多源交通出行数据和主题模型的城市功能区识别方法包括以下步骤：
[0067]
步骤一：获取路网数据、兴趣点数据以及多源交通(网约车、地铁)出行数据；
[0068]
获取路网数据、兴趣点数据以及多源交通(网约车、地铁)出行数据时，可通过与相关部门或单位之间建立数据接口，直接获取上述数据；也可以通过第三方平台收集并整合得到上述数据。
[0069]
在得到上述数据之后，还可以选择性的对上述原始数据进行去重、筛选或纠错等数据清洗处理，以提高基础数据的可靠性。对于得到的包含名称、地址、坐标的地理空间兴趣点数据，可以重分类为p个类别以便于之后的数据处理。
[0070]
步骤二：根据所述路网数据，通过形态学的腐蚀与膨胀处理将所述城市空间划分为若干个交通分析小区；
[0071]
城市道路一般分为快速路、主干路、次干路和支路等。为了得到合理大小的基本单元，本实施例中采用的路网数据包括：高速公路、城市快速路和城市主干路，对这些道路进行形态学的膨胀和腐蚀处理，根据处理过后的道路的延伸自然地将城市空间划分为不同的基本单元，得到交通分析小区。
[0072]
如图2所示，图中区域内的黑线代表的是城市区域内的高速公路、城市快速路和城市主干路的分布，将各道路进行形态学处理的膨胀和腐蚀之后，道路交叉、延伸所围成的闭合区域作为不同的基本单元。
[0073]
需要说明的是本实施例进行形态学处理时使用的膨胀和腐蚀运算本身为现有技术，对其原理本身不再进行过多的赘述。
[0074]
步骤三：根据所述兴趣点数据和网约车、地铁的居民出行数据，构造区域出行-活动特征和土地利用属性特征；
[0075]
提取兴趣点地理信息特征。将根据各类别兴趣点平均占地面积进行加权的兴趣点类别频次和用地混合度作为主题模型的词汇，将所有区域经过加权的兴趣点的类别频次和区域混合度作为主题模型的词汇库以获得由兴趣点类别构成的交通分析小区-出行特征概率分布以及各交通分析小区的兴趣点主题概率分布。用地混合度的计算方法采用基于熵指数的计算方法，如下所示：
[0076][0077]
其中，pi表示第i种兴趣点占所有种类兴趣点的比例，p表示兴趣点类别数量。
[0078]
提取出行-活动特征。所述的出行-活动特征为工作日和休息日的基本流量特征，每条出行数据包含上车(进站)和下车(出站)两个出行特征，其具体形式为：feature＝(direction，tj)，其中direction表示地铁客流进出站或上下车方向，对于网约车订单上车点和地铁客流进站点，取direction＝s，对于网约车订单下车点和地铁客流出站点，取direction＝e，对于网约车订单，tj表示网约车订单中乘客上车时刻以及下车时刻，对于地铁数据，tj表示地铁乘客进站时刻以及出站时刻。
[0079]
将一个交通分析小区视为一个文档，交通分析小区中的一个功能视为一个主题，因此具有多个功能的区域就类似于包含各种主题的文档。将由不同数据集构造的各功能区
相应的词汇分别代入主题模型，由主题模型分别求解得到不同数据集构造的主题模型的文档-功能概率分布和交通分析小区-出行特征分布。交通分析小区功能到文档主题的映射关系如表1所示。
[0080]
表1从区域功能到文档主题的类比
[0081][0082]
步骤四：采用潜在狄利克雷分配主题模型算法得到各所述交通分析小区的功能特征；
[0083]
基于不同数据集构造的各功能区相应的词汇，分别对其求解得到不同数据集构造的交通分析小区-功能特征分布和功能特征-出行特征分布，并使用潜在狄利克雷分配主题模型进行求解，利用潜在狄利克雷分配概率主题模型挖掘交通分析小区的功能特征向量，潜在狄利克雷分配概率主题模型通过提取各功能特征向量所包含的高维语义向量来分配各功能特征向量的概率，包括：
[0084]
利用潜在狄利克雷分配概率主题模型将数据集中的每个交通分析小区的功能特征分布按照概率分布的形式给出，潜在狄利克雷分配是一种无监督的贝叶斯模型,该模型被广泛应用于主题建模和文档主题分类中，其中：
[0085]
p(w|d)＝p(w|k)
×
p(k|d)
[0086]
其中
[0087]
d为文档，在具体应用场景中表示为交通分析小区；
[0088]
w为词汇，表示为交通分析小区所具有的区域出行-活动特征；
[0089]
k为主题，表示为交通分析小区所具有的城市功能特征；
[0090]
该模型以k为中间层，p(k|d)表示交通分析小区总集d中的每个交通分析小区d对应到不同城市功能k的概率，其分布表示为向量θd，p(w|k)表示城市功能总集中的每个城市功能k生成不同区域出行-活动特征w的概率，其分布表示为向量βk；利用主题模型算法求解每个交通分析小区的城市功能特征概率分布，以及城市功能特征分布中的区域出行-活动特征分布。
[0091]
如图3所示，基于潜在狄利克雷分配概率主题模型识别功能区的生成过程如下：
[0092]
1)由超参数α确定狄利克雷分布生成交通分析小区d的功能特征概率分布θd，即其中，为分布的超参数，是一个k维的向量，对于每一个功能特征k,分布超参数α依据相关经验取为α＝50/k，k表示给定的交通分析小区的城市功能总数量，狄利克雷分布的概率密度函数如下：
[0093][0094]
其中，pk表示第k种城市功能的出现概率，αk为第k种城市功能对应的超参数；
[0095]
2)由超参数η确定狄利克雷分布生成功能特征k的出行特征条件分布βk，即
其中，η为出行特征分布的超参数，维度为出行特征集合的元素个数v；
[0096]
3)交通分析小区d的第n个出行特征的功能特征通过计算交通分析小区d的功能特征分布θd对第n个出行特征的多项式概率分布zd得到，即zd＝multi(θd)，该多项式分布的概率密度函数为：
[0097][0098]
其中，pi表示第i种功能特征的出现概率，θ
d，i
为交通分析小区d的第i种功能特征的出现频次；
[0099]
每个功能特征k所对应的功能特征-出行特征条件概率分布为βk，按照其共轭多项式分布φk随机选取得到出行特征，即φk＝multi(βk)，多项式分布的概率密度函数为：
[0100][0101]
其中，pi表示第i种出行特征的出现概率，β
k，i
为第i种出行特征的出现频次；
[0102]
在运用潜在狄利克雷分配主题模型建模时，利用训练后的模型在测试集中的困惑度确定最佳主题数，若模型在测试集上的困惑度小于预设值，则当前主题数量k的取值符合要求，困惑度计算公式如下：
[0103][0104]
其中，d表示由所有出行特征构成的总集；m为交通分析小区总数量；wd为交通分析小区d中的出行特征集；nd为交通分析小区d中的出行特征数；p(wd)为交通分析小区d中所有出行特征的似然值。
[0105]
将区域兴趣点特征数据集、预处理之后的网约车、地铁工作日和休息日数据集分别进行主题模型建模，得到对应的交通分析小区功能特征概率分布，形成各个交通分析小区功能特征向量。由此构造的城市区域功能特征向量同时考虑了区域兴趣点重分类数据、区域混合度、网约车、地铁工作日和休息日数据，既考虑了区域的地理信息，又结合了不同的出行方式所体现的居民出行特征，丰富了区域的居民出行特征表示，从而得到更为广泛而良好的结果。
[0106]
步骤五：根据每个交通分析小区的功能概率分布特征，采用k-means聚类算法对所有交通分析小区进行功能聚类，聚类得到针对于所述城市交通分析小区的c个簇，并根据各所述簇中的功能特征对每一簇进行功能标注。包括：
[0107]
令交通分析小区d的功能特征是由地铁、网约车、兴趣点三者分别得到的区域-主题概率分布向量的堆栈，即：
[0108]
featured＝(vec
taxiweek，d
，vec
taxiweekend，d
，vec
metroweek，d
，vec
metroweekend，d
，vec
poi，d
)，
[0109]
其中vec
taxiweek，d
表示在工作日网约车主题模型中，交通分析小区d属于工作日网约车各个功能特征的概率分布向量，vec
taxiweekend,d
表示在休息日网约车主题模型中，交通分析小区d属于休息日网约车各个功能特征的概率分布向量，vec
metroweek,d
表示在工作日地铁模型中，交通分析小区d属于工作日地铁各个功能特征的概率分布向量，vec
metroweekend,d
表示在休息日地铁模型中，交通分析小区d属于休息日地铁各个功能特征的概率分布向量，
vec
poi,d
表示在兴趣点模型中，交通分析小区d属于兴趣点各个功能特征的概率分布向量。最终小区的功能区聚类数量由聚类评价指标轮廓系数(轮廓系数)确定：
[0110][0111]
其中，将每个簇的功能分布特征组成的向量作为样本，a表示样本与同一簇内其余所有元素距离的平均值，遍历不包含样本点的所有簇，计算样本点到这些簇中所有点的平均距离，其中的最小值为b。
[0112]
计算不同聚类数量c值下相应的轮廓系数指标，取使得轮廓系数指标值最大的c值，即为针对城市空间交通分析小区的c个簇。
[0113]
在聚类评价指标计算时，遍历一定范围内所有可能的聚类数量c值，计算不同c值相应的轮廓系数，取使得轮廓系数值最大的聚类数目，从而得到针对城市交通分析小区的c类功能区。其中轮廓系数的值位于-1到1之间，值越大意味着划分到同一类区域的各交通小区的功能特性相近，而不同区域之间的功能特性差别明显，同时意味着相应的划分方法更优秀。如图4所示，本实施例中最终选取聚类数量大于2的最大轮廓系数值对应的簇数，即c＝5，研究区域的城市空间被划分为五类功能区。
[0114]
对于聚类得到的各簇，根据其区域特征和出行活动特征指标确定该区域具体城市功能用地类别。其中，区域特征包括各交通分析小区的兴趣点频率密度和类别比例，区域中频率密度和类别比例分别由下式计算：
[0115][0116][0117]
其中，i表示兴趣点类型，p表示兴趣点总类别数，ni表示某个区域内第i类兴趣点的数量，ni表示研究区域中第i类兴趣点的总数量；fdi表示第i种类型兴趣点占该类型兴趣点总数的频率密度；cri表示第i种类型兴趣点的频数密度占某个区域内所有类型兴趣点频率密度的比例；
[0118]
区域出行活动特征指标包括该区域多源出行数据的工作日和休息日归一化小时流量，由下式计算：
[0119][0120]
其中x
norm
表示区域归一化后的小时流量，x为区域原始小时流量，x
max
和x
min
分别表示区域小时流量的最大值和最小值，图5展示了本实施例中各簇网约车工作日的归一化流量折线图。
[0121]
通过分析区域多源出行数据的工作日和休息日归一化小时流量中反映的居民出行特征，并与典型城市功能用地的居民出行特征相对比，依据区域特征和出行活动特征进行区域功能标注，最终确定的区域功能属性包括办公区、居住区或休闲区等。图6展示了本实施例所标注的一种功能区分布情况。
[0122]
需要说明的是，本实施例进行功能特征聚类时采用的k-means算法本身为现有技术，对k-means算法本身不再进行过多的赘述。
[0123]
以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。
[0124]
以上所述实施例仅表达了本技术的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本技术构思的前提下，还可以做出若干变形和改进，这些都属于本技术的保护范围。因此，本技术专利的保护范围应以所附权利要求为准。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

一种基于多源交通出行数据和主题模型的城市功能区识别方法

相关文献

最热文献