基于手机信令数据的职住地识别方法、装置及存储介质与流程

2021-11-05 19:40:00 来源：中国专利 TAG：

1.本发明涉及涉及手机信令数据挖掘技术领域，尤其是一种基于手机信令数据的职住地识别方法、装置及存储介质。

背景技术：

2.随着移动通信技术的发展，智能手机用户数量的增长，手机终端成为了用户出行调查、用户分布调查等研究中一种有效的数据获取方式。为了对用户的网络使用进行计费、分析用户活跃度等，移动运营商在用户接打电话、收发信息、网络连接时，会对用户连接基站的位置和时间进行记录，由此得到手机信令数据。
3.归因于其产生机理，手机信令数据具有实时动态性强、覆盖范围广、采集成本低、数据更新频率快等优势，可以有效、大规模地提取城市中个体连续时空出行信息。相比之下，传统研究采用问卷调查等方式统计居民职住数据，其数据收集工作成本较高、调查时段短，而包括浮动车、视频监控在内的各种新数据源在提取居民出行特征的研究中更偏向于获取交通流参数而非人的出行模式，因此手机信令数据在研究居民的停留、出行特征有很大优势。
4.居民职住地分布是城市规划和交通规划的重要组成部分。掌握居民工作地和居住地的位置分布有助于从职住平衡、职住分离和通勤行为等角度了解城市空间特征，优化城市土地利用、合理引导公共交通建设，也可通过分析通勤强度分布、城市中心城区空间结构布局与运行特征等，优化大城市空间运行绩效。使用大量手机信令数据分析居民职住地分布，可以获取大规模广覆盖的样本信息，增加研究对象的多样性和区域的完整性，同时，手机信令数据持续调查时段较长，可以减少居民出行的偶然性和规律时效性带来的误差，因此需要一套有效的使用手机信令数据识别用户职住地的方法，准确地获取用户的职住地信息。

技术实现要素：

5.本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明提出一种基于手机信令数据的职住地识别方法、装置及存储介质。
6.本发明所采取的技术方案是：
7.一方面，本发明实施例包括一种基于手机信令数据的职住地识别方法，包括：
8.获取手机信令数据；
9.根据所述手机信令数据，获取基站集合，所述基站集合包括含有手机信令数据记录的所有基站；
10.根据所述基站集合中每个基站及其周边基站的分布，结合蜂窝网络模型，识别基站覆盖区域；
11.将城市区域划分为网格，并将与所述基站覆盖区域有交集的网格识别为基站覆盖网格；
12.计算用户在所述基站覆盖网格中每个网格的累积停留时长；
13.基于网格空间位置和用户在所述基站覆盖网格中各网格的累积停留时长，使用hartigan leader聚类算法，对网格进行聚类，得到类簇集合；
14.计算用户在所述类簇集合中每个类簇的累积停留时长；
15.根据用户在所述类簇集合中每个类簇的累积停留时长，提取备选职住簇；
16.通过划分时间窗，识别所述备选职住簇为工作地或居住地。
17.进一步地，所述根据所述基站集合中每个基站及其周边基站的分布，结合蜂窝网络模型，识别基站覆盖区域这一步骤，包括：
18.在所述基站集合中搜索距离目标基站最近的多个邻接基站，得到邻接基站集合，所述目标基站为所述基站集合中的任意一个基站；
19.计算第一间距，所述第一间距为所述邻接基站集合中每个邻接基站与所述目标基站的间距的平均值；
20.基于蜂窝网络模型，根据所述第一间距，计算得到基站覆盖半径；
21.以所述目标基站为中心，通过所述基站覆盖半径划分得到基站覆盖区域。
22.进一步地，所述基站覆盖半径通过以下公式计算得到：
[0023][0024]
式中，r
bs
为基站覆盖半径，d
bs
为第一间距。
[0025]
进一步地，所述计算用户在所述基站覆盖网格中每个网格的累积停留时长这一步骤，包括：
[0026]
获取职住兴趣点集合，所述职住兴趣点包括工作地相关属性兴趣点和居住地相关属性兴趣点；
[0027]
根据所述职住兴趣点集合，获取所述基站覆盖网格中每个网格内的职住兴趣点数量；
[0028]
根据每个网格内的职住兴趣点数量，将用户在基站的累积停留时间分配到网格上，得到用户在每个网格的累积停留时长。
[0029]
进一步地，所述根据每个网格内的职住兴趣点数量，将用户在基站的累积停留时间分配到网格上，得到用户在每个网格的累积停留时长通过下一公式执行：
[0030][0031]
式中，t
j
为用户在网格j的累积停留时间，t
bs
为用户在基站bs的累积停留时间，bs
j
为覆盖网格j的基站集合，n
j
是网格j中的兴趣点数量，∑
j∈bs n
j
为基站bs覆盖区域内的兴趣点数量。
[0032]
进一步地，所述计算用户在所述类簇集合中每个类簇的累积停留时长这一步骤，包括：
[0033]
获取所述类簇集合中每个类簇中包含的网格；
[0034]
计算用户在每个所述网格的累积停留时长；
[0035]
将用户在每个所述网格的累积停留时长相加，得到用户在每个类簇的累积停留时长。
[0036]
进一步地，所述根据用户在所述类簇集合中每个类簇的累积停留时长，提取备选职住簇这一步骤，包括：
[0037]
根据用户在每个类簇的累积停留时长，对所述类簇集合中的各个类簇进行排序，得到排序列表；
[0038]
从所述排序列表中提取备选职住簇，所述备选职住簇为为所述排序列表中前预设数量个的类簇或者后预设数量个的类簇。
[0039]
进一步地，所述通过划分时间窗，识别所述备选职住簇为工作地或居住地这一步骤，包括：
[0040]
将一天平均划分为24个时间窗；
[0041]
计算在每个所述时间窗下用户在所述备选职住簇的累积停留时长；
[0042]
根据在每个所述时间窗下用户在所述备选职住簇的累积停留时长，获取备选职住簇代表时窗；
[0043]
获取备选职住簇代表时窗的所属时段；
[0044]
根据备选职住簇代表时窗的所属时段，识别所述备选职住簇为工作地或居住地。
[0045]
另一方面，本发明实施例还包括一种基于手机信令数据的职住地识别装置，包括：
[0046]
至少一个处理器；
[0047]
至少一个存储器，用于存储至少一个程序；
[0048]
当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现所述的基于手机信令数据的职住地识别方法。
[0049]
另一方面，本发明实施例还包括计算机可读存储介质，其上存储有处理器可执行的程序，所述处理器可执行的程序在被处理器执行时用于实现所述的基于手机信令数据的职住地识别方法。
[0050]
本发明的有益效果是：
[0051]
本发明提出一种基于手机信令数据的职住地识别方法，包括获取手机信令数据；根据手机信令数据，获取基站集合，基站集合包括含有手机信令数据记录的所有基站；根据基站集合中每个基站及其周边基站的分布，结合蜂窝网络模型，识别基站覆盖区域；将城市区域划分为网格，并将与基站覆盖区域有交集的网格识别为基站覆盖网格；计算用户在基站覆盖网格中每个网格的累积停留时长；基于网格空间位置和用户在基站覆盖网格中各网格的累积停留时长，使用hartigan leader聚类算法，对网格进行聚类，得到类簇集合；计算用户在类簇集合中每个类簇的累积停留时长；根据用户在类簇集合中每个类簇的累积停留时长，提取备选职住簇；通过划分时间窗，识别备选职住簇为工作地或居住地；本发明能够准确、有效、快速地识别用户的职住地位置，为城市发展规划、交通设施规划等相关应用提供方法和数据支撑。
[0052]
本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。
附图说明
[0053]
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：
[0054]
图1为本发明实施例所述基于手机信令数据的职住地识别方法的步骤流程图；
[0055]
图2为本发明实施例所述蜂窝网络覆盖模型示意图；
[0056]
图3为本发明实施例所述某用户某时段内停留位置示意图；
[0057]
图4为本发明实施例所述某用户一日网格停留时间的3d插值图；
[0058]
图5为本发明实施例所述聚类范围与平均时间占比的关系示意图；
[0059]
图6为本发明实施例所述用户在其备选职住地簇内，各时窗的停留时间的示意图；
[0060]
图7为本发明实施例所述基于手机信令数据的职住地识别装置的结构示意图。
具体实施方式
[0061]
下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。
[0062]
在本发明的描述中，需要理解的是，涉及到方位描述，例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。
[0063]
在本发明的描述中，若干的含义是一个或者多个，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
[0064]
本发明的描述中，除非另有明确的限定，设置、安装、连接等词语应做广义理解，所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
[0065]
下面结合附图，对本技术实施例作进一步阐述。
[0066]
参照图1，本发明实施例提供一种基于手机信令数据的职住地识别方法，包括但不限于以下步骤：
[0067]
s100.获取手机信令数据；
[0068]
s200.根据手机信令数据，获取基站集合，基站集合包括含有手机信令数据记录的所有基站；
[0069]
s300.根据基站集合中每个基站及其周边基站的分布，结合蜂窝网络模型，识别基站覆盖区域；
[0070]
s400.将城市区域划分为网格，并将与基站覆盖区域有交集的网格识别为基站覆盖网格；
[0071]
s500.计算用户在基站覆盖网格中每个网格的累积停留时长；
[0072]
s600.基于网格空间位置和用户在基站覆盖网格中各网格的累积停留时长，使用hartigan leader聚类算法，对网格进行聚类，得到类簇集合；
[0073]
s700.计算用户在类簇集合中每个类簇的累积停留时长；
[0074]
s800.根据用户在类簇集合中每个类簇的累积停留时长，提取备选职住簇；
[0075]
s900.通过划分时间窗，识别备选职住簇为工作地或居住地。
[0076]
本实施例中，手机信令数据是指用户使用手机时，与基站进行通信中产生的数据，信令数据可能会在用户产生通话、发信息、连接网络、基站切换等行为时候留下的记录，一般会记录用户编号、用户年龄、用户性别、连接基站编号和记录时间等信息。参照表1，手机信令数据中的数据字段包括：用户编码isdn、用户性别gender、用户年龄age、连接基站编号cid和记录时间戳time，其中，时间戳格式为yyyymmddhhmmss。然后，将手机信令数据与基站数据融合，具体地，参考基站信息表，基于基站编号cid，匹配基站位置，可获取用户连接基站经度lng、基站纬度lat数据。
[0077]
表1原始手机信令数据示意表
[0078]
isdngenderagetimecid4117***m3020180715071145237405701***m6320180723053558258155717***m202018062014202019086
[0079]
本实施例中，为了提升数据质量，在步骤s100之后，也就是在获取手机信令数据之后，还将进一步对手机信令数据进行预处理。预处理包括以下处理过程：
[0080]
(1)异常数据处理：异常数据指含缺失值的记录、数据格式不正确的记录及同时间戳不同位置的记录，删除这类异常数据；
[0081]
(2)重复数据处理：重复数据指由于通信或传输误差，产生同用户同时间同位置产生完全相同的记录数据，重复数据保留一条，其余删除；
[0082]
(3)同位置数据处理：同位置数据指用户在同一区域活动时，频繁连接同一基站留下的大量短时间内同位置数据。提取这一类数据，记录连接基站编号及经纬度信息，计算用户在下一个连接基站的第一个记录时间戳与用户在当前基站的第一个记录时间戳之差(time
location2
‑
time
location1
)计算用户在当前基站的停留时间staying time，记录当前位置第一条记录的时间戳为停留起始时间start time，合并同位置数据。
[0083]
(4)漂移数据处理：漂移数据指用户在建筑物密集区域或信号不稳定区域活动时，记录位置产生远距离漂移的误差数据。计算每条信令数据的记录时间戳与后一条数据的记录时间戳之差(time2‑
time1)，根据记录基站经纬度，计算每条信令数据与后一条数据的记录位置距离distance1‑2，计算用户移动速展若用户移动速度大于移动速度上限阈值(可取120km/h，考虑城市最大行车速度)，则认为后一条数据为漂移数据并删除；
[0084]
(5)乒乓数据处理：乒乓数据指用户在基站边界活动时，不断在多个基站间切换连接留下的记录。识别短时间内用户连接基站来回切换的数据为一组乒乓数据，计算这组数据中最频繁连接的基站编号cid
frequent
，保留这组数据中记录基站为cid
frequent
的数据，删除其余数据；
[0085]
本实施例中，经过预处理后的手机信令数据格式如表2所示。
[0086]
表2预处理后手机信令数据示意表
[0087][0088]
本实施例中，参照表2可知，由于手机信令数据中包含了基站信息，因此，可以根据手机信令数据，获取基站集合，基站集合包括含有手机信令数据记录的所有基站。
[0089]
本实施例中，关于步骤s300，也就是根据基站集合中每个基站及其周边基站的分布，结合蜂窝网络模型，识别基站覆盖区域这一步骤，包括：
[0090]
s301.在基站集合中搜索距离目标基站最近的多个邻接基站，得到邻接基站集合，目标基站为基站集合中的任意一个基站；
[0091]
s302.计算第一间距，第一间距为邻接基站集合中每个邻接基站与目标基站的间距的平均值；
[0092]
s303.基于蜂窝网络模型，根据第一间距，计算得到基站覆盖半径；
[0093]
s304.以目标基站为中心，通过基站覆盖半径划分得到基站覆盖区域。
[0094]
本实施例中，对于有信令记录的基站集合bs中的每个基站bs，搜索与基站bs距离最近的四个邻接基站，记录为基站bs的邻接基站集合bs
adjacent
；然后基于邻接基站集合bs
adjacent
中每个邻接基站与基站bs的站间距，计算基站理想站间距(即第一间距)和基站覆盖半径。其中，基站理想站间距的计算公式为：基站覆盖半径的计算公式为：基站理想站间距d
bs
为邻接基站集合bs
adjacent
中每个邻接基站与基站bs的站间距的平均值，其中d
i
表示第i个邻接基站与基站bs的间距，基站覆盖半径r
bs
基于蜂窝网络模型，通过基站理想站间距计算。然后以基站为中心，通过基站覆盖半径划分基站覆盖区域。
[0095]
具体地，国内基站多为3扇区定向站，基站设置基于为蜂窝网络覆盖模型(如图2所示)，理想情况下，若某基站覆盖半径为r，则其理想站间距d为1.5r。针对现实的基站分布模式和位置数据修正该模型，搜索每个基站bs距离最近的四个基站，记录为基站bs的邻接基站集合bs
adjacent
，基于四个邻接基站与基站bs的距离计算基站理想站间距d
bs
，然后推算基站的覆盖半径以确定基站覆盖区域。
[0096]
本实施例中，关于步骤s400，得到基站覆盖区域后，进一步将基站覆盖区域进行网格化处理。具体地，将城市划分为100米
×
100米网格，然后将与基站覆盖区域有交集的网格识别为基站覆盖网格。考虑到基站的空间分布，将区域划分为大小约100米
×
100米的网格面域。通过网格表示基站覆盖区域：若基站覆盖区域与网格有所重叠，则认为该网格被基站覆盖。
[0097]
本实施例中，关于步骤s500，也就是计算用户在基站覆盖网格中每个网格的累积停留时长这一步骤，包括：
[0098]
s501.获取职住兴趣点集合，职住兴趣点包括工作地相关属性兴趣点和居住地相关属性兴趣点；
[0099]
s502.根据职住兴趣点集合，获取基站覆盖网格中每个网格内的职住兴趣点数量；
[0100]
s503.根据每个网格内的职住兴趣点数量，将用户在基站的累积停留时间分配到网格上，得到用户在每个网格的累积停留时长。
[0101]
本实施例中，筛选工作地相关属性兴趣点和居住点相关属性兴趣点，形成职住兴趣点集合，筛选各网格内的职住兴趣点，根据网格内兴趣点数量，将用户在基站的累积停留时间分配到网格上，若该网格被多个基站覆盖，则累加各个基站分配的停留时间，即计算用户的网格累积停留时间：
[0102][0103]
式中，t
j
为用户在网格j的累积停留时间，t
bs
为用户在基站bs的累积停留时间，bs
j
为覆盖网格j的基站集合，n
j
是网格j中的兴趣点数量，∑
j∈bs n
j
为基站bs覆盖区域内的兴趣点数量。
[0104]
其中，提取职住兴趣点时，工作地相关属性包括：汽车服务、餐饮服务、购物服务、生活服务、运动休闲服务、住宿服务、医疗保健服务、政府机构、科教文化服务、金融机构和企业，居住地相关属性包括：商业住宅和居民区。
[0105]
具体地，通过网络地图，爬取区域内兴趣点信息，记录与工作地、居住地相关的兴趣点数据。兴趣点指地图上代表一个特征地点的数据，与居民活动密切相关，包括建筑物、车站、信号标志等，兴趣点数据字段包括兴趣点编号poi_id、兴趣点经度poi_lng、兴趣点纬度poi_lat和兴趣点类型poi_type，部分兴趣点数据如表3所示。
[0106]
表3兴趣点数据示意表
[0107]
poi_idpoi_lngpoi_latpoi_typeb02f5077vf113.21071622.875081文化服务boffl1ft5p112.88029323.180195公司企业boffkujwao113.00288923.240415公司企业
[0108]
然后，根据兴趣点位置数据，计算每个网格内兴趣点数量。针对每条信令记录，提取其停留时长及连接基站覆盖的网格集合，计算每个网格的兴趣点数量占比，按比例将停留时长分配到网格上；分别对每个网格累加其分配到的停留时长，得到网格的停留时间。参照图3，图3为某用户某时段内停留位置示意图，该用户在时段内连接过基站a和基站b，其覆盖范围为黑框所示，网格内的圆点表示兴趣点的分布位置。如图3所示，网格j1同时被基站a和基站b覆盖，基站a、b覆盖范围内分别有7个、3个兴趣点，假设用户在基站a、b的停留时长分别为420s和135s，则用户在网格j1的停留时间为105s；其计算过程为的停留时间为105s；其计算过程为
[0109]
本实施例中，关于步骤s600，主要关注累积停留时间更长的网格，不预设类簇数量，将网格聚类为主要活动簇，具体步骤如下：
[0110]
(1)分别针对每个用户，对其停留网格集合i中的每个网格j，根据网格累积停留时间，按照递减顺序对网格排序，选择排序第一的网格为初始类簇中心c，标记为已访问网格，记录其所属类簇编号；
[0111]
(2)以类簇中心c为圆心，150米为半径划分类簇覆盖区域area；
[0112]
(3)按顺序访问下一个网格，若该网格中心位于area范围内，将网格标记为已访问网格，记录其所属类簇编号，修正类簇中心c为该类簇内以累积停留时间为权重的网格中心，以新的类簇中心c为圆心，150米为半径重新划分类簇覆盖区域area；
[0113]
(4)重复步骤(3)直到所有网格被遍历一次；
[0114]
(5)提取所有未被标记为已访问的网格，选择排序第一的网格为新的类簇中心c，标记为已访问网格，记录其所属类簇编号；
[0115]
(6)重复步骤(2)
‑
(5)，直到所有网格都被标记为已访问并记录所属类簇。
[0116]
具体地，由于有固定职住地的用户将大部分时间花费在其职住地附近范围内活动，因此在职住地附近的网格显示出聚集性的高停留时间，如图4所示为某用户一日网格停留时间的3d插值图，在其工作地和居住地附近范围内，有停留时间的双高峰。
[0117]
对所有用户的数据进行处理，将聚类范围参数设置为不同取值时，提取每个用户在停留时间最长的簇内的停留时间，计算该簇停留时间占总时间比例，计算所有用户停留时间占比均值。如图5所示，随着聚类范围参数增大，平均时间占比增大，当聚类范围参数达到150米时，平均时间占比大幅度增大，而后趋于平稳，表示150米为一般用户在某停留区域的活动范围，得到聚类范围参数为150米。
[0118]
然后根据聚类范围参数，使用hartigan leader算法，对每个用户多日的数据进行聚类，得到用户的活动区域聚类结果。
[0119]
本实施例中，关于步骤s700，也就是计算用户在类簇集合中每个类簇的累积停留时长这一步骤，包括：
[0120]
s701.获取类簇集合中每个类簇中包含的网格；
[0121]
s702.计算用户在每个网格的累积停留时长；
[0122]
s703.将用户在每个网格的累积停留时长相加，得到用户在每个类簇的累积停留时长。
[0123]
本实施例中，在计算得到用户在每个类簇的累积停留时长之后，执行步骤s800，也就是根据用户在类簇集合中每个类簇的累积停留时长，提取备选职住簇这一步骤，包括：
[0124]
s801.根据用户在每个类簇的累积停留时长，对类簇集合中的各个类簇进行排序，得到排序列表；
[0125]
s802.从排序列表中提取备选职住簇，备选职住簇为为排序列表中前预设数量个的类簇或者后预设数量个的类簇。
[0126]
本实施例中，分别计算每个类簇内网格累积停留时长总和，记为类簇累积停留时长，根据类簇累积停留时长，按递减排序类簇，选取排序前二位的类簇，标记为备选职住簇，其他类簇标记为一般活动簇。
[0127]
本实施例中，关于步骤s900，也就是通过划分时间窗，识别备选职住簇为工作地或居住地这一步骤，包括：
[0128]
s901.将一天平均划分为24个时间窗；
[0129]
s902.计算在每个时间窗下用户在备选职住簇的累积停留时长；
[0130]
s903.根据在每个时间窗下用户在备选职住簇的累积停留时长，获取备选职住簇代表时窗；
[0131]
s904.获取备选职住簇代表时窗的所属时段；
[0132]
s905.根据备选职住簇代表时窗的所属时段，识别备选职住簇为工作地或居住地。
[0133]
本实施例中，通过划分时窗，标记备选职住簇的职住属性，具体步骤如下：
[0134]
(1)将一天平均划分为24个时间窗，分别针对用户的两个备选职住簇，计算用户在备选职住簇内24个时间窗的停留时长，选择停留时长最长的时间窗为该备选职住簇的代表时窗；
[0135]
(2)若用户的一个备选职住簇代表时窗所属时段在9:00
‑
18:00时间范围内，同时另一个备选职住簇的代表时窗所属时段在18:00
‑
9:00时间范围内，则将前一个备选职住簇标记为工作簇，后一个备选职住簇标记为居住簇，反之，前一个备选职住簇标记为居住簇，后一个备选职住簇标记为工作簇，若上述两种情况都未出现，则将用户标记为无固定职住地用户。
[0136]
具体地，将一天评平均分割为24个时间窗，分别筛选用户连接两个备选职住簇内基站的数据，计算用户在两个备选职住簇内，各时窗的停留时间，按停留时间对时间窗排序。图6为一个用户在其备选职住地簇内，各时窗的停留时间的示意图。若用户的一个备选职住簇代表时窗所属时段在9:00
‑
18:00时间范围内，同时另一个备选职住簇的代表时窗所属时段在18:00
‑
9:00时间范围内，则将前一个备选职住簇标记为工作簇，后一个备选职住簇标记为居住簇，反之，前一个备选职住簇标记为居住簇，后一个备选职住簇标记为工作簇，若上述两种情况都未出现，则将用户标记为无固定职住地用户。
[0137]
本发明实施例所述一种基于手机信令数据的职住地识别方法具有以下技术效果：
[0138]
本发明实施例提出一种基于手机信令数据的职住地识别方法，包括获取手机信令数据；根据手机信令数据，获取基站集合，基站集合包括含有手机信令数据记录的所有基站；根据基站集合中每个基站及其周边基站的分布，结合蜂窝网络模型，识别基站覆盖区域；将城市区域划分为网格，并将与基站覆盖区域有交集的网格识别为基站覆盖网格；计算用户在基站覆盖网格中每个网格的累积停留时长；基于网格空间位置和用户在基站覆盖网格中各网格的累积停留时长，使用hartigan leader聚类算法，对网格进行聚类，得到类簇集合；计算用户在类簇集合中每个类簇的累积停留时长；根据用户在类簇集合中每个类簇的累积停留时长，提取备选职住簇；通过划分时间窗，识别备选职住簇为工作地或居住地；本发明能够准确、有效、快速地识别用户的职住地位置，为城市发展规划、交通设施规划等相关应用提供方法和数据支撑。
[0139]
参照图7，本发明实施例还提供了一种基于手机信令数据的职住地识别装置200，具体包括：
[0140]
至少一个处理器210；
[0141]
至少一个存储器220，用于存储至少一个程序；
[0142]
当所述至少一个程序被所述至少一个处理器210执行，使得所述至少一个处理器210实现如图1所示的方法。
[0143]
其中，存储器220作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。存储器220可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器220可选包括相对于处理器210远程设置的远程存储器，这些远程存储器可以通过网络连接至处理器210。上述网络的实例包括但不限于互联网、企业内部网、
局域网、移动通信网及其组合。
[0144]
可以理解到，图7中示出的装置结构并不构成对装置200的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。
[0145]
如图7所示的装置200中，处理器210可以调取存储器220中储存的程序，并执行但不限于图1所示实施例的步骤。
[0146]
以上所描述的装置200实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现实施例的目的。
[0147]
本发明实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有处理器可执行的程序，所述处理器可执行的程序在被处理器执行时用于实现如图1所示的方法。
[0148]
本技术实施例还公开了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行图1所示的方法。
[0149]
可以理解的是，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd
‑
rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。
[0150]
上面结合附图对本发明实施例作了详细说明，但是本发明不限于上述实施例，在技术领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：标定数据的管理方法、系统、介质及设备与流程

基于手机信令数据的职住地识别方法、装置及存储介质与流程

相关文献

最热文献