基于信令大数据的区域人口统计方法、系统及存储介质与流程

2022-11-30 15:40:15 来源：中国专利 TAG：

1.本技术涉及大数据及信令数据技术领域，具体而言，涉及基于信令大数据的区域人口统计方法、系统及存储介质。

背景技术：

2.信令数据的采集是一个连续的过程，相应地，信令数据的存储也是连续的过程，各家运营商根据信令获取的时间和业务发生的地点记录信令数据，信令数据中用于标识业务发生地点的数据是信令发生时所连接的基站扇区，基站扇区在网络优化和业务调整过程中会有一定的变化，导致不同时间段的扇区对应的位置信息不一致，另外，使用信令数据进行人口统计或相关分析，需要根据一定的空间纬度进行处理，比如社区、村庄、街镇、重点区域等等，为了避免统计模型的重复开发，方便模型部署，需要在底层将数据在空间纬度上处理成标准栅格化式。
3.现有城市区域针对流动人口分布情况的识别和统计通常采取信息登记进行获取的方式，但易产生采集遗漏或统计偏差的技术漏洞，统计结果缺乏精准性和快捷性，而通过对用户终端信息进行识别统计缺乏精确度和快捷性，且难以精准掌握流动人口个体的常驻信息，无法对区域人口分布情况进行有效识别统计，缺少对人口分布情况进行动态化统计的技术。
4.针对上述问题，目前亟待有效的技术解决方案。

技术实现要素：

5.本技术实施例的目的在于提供基于信令大数据的区域人口统计方法、系统及存储介质，可以根据终端用户的信令数据信息进行区域人口常驻分布情况的获取技术，提高对人口分布情况统计的精准度。
6.本技术实施例还提供了基于信令大数据的区域人口统计方法，包括以下步骤：获取预设时间段内区域内终端用户的信令数据信息集；根据所述信令数据信息集进行数据提取获取信令响应时间数据和信令响应地址数据并进行数据清洗获得第一标识用户；获取所述第一标识用户在所述预设时间段内信令响应地址对应的基站扇区动态信息并生成所述第一标识用户的基站扇区动态轨迹画像；根据所述基站扇区动态轨迹画像提取基站扇区覆盖标识数据并结合标识数据的对应信令响应时间数据处理获得扇区交集密度数据；根据所述扇区交集密度数据与预设常驻交密度阈值进行阈值对比筛选符合阈值对比要求的对应标识用户，标记为第二标识用户；根据所述第二标识用户的扇区交集密度数据输入至预设的扇区栅格密布模型中进行处理获取栅格密度分布数据；根据所述栅格密度分布数据进行聚合获得区域内栅格密度分布图，根据所述区域
内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况。
7.可选地，在本技术实施例所述的基于信令大数据的区域人口统计方法中，所述获取预设时间段内区域内终端用户的信令数据信息集，根据所述信令数据信息集进行数据提取获取信令响应时间数据和信令响应地址数据并进行数据清洗获得第一标识用户，包括：获取预设时间段内区域内的终端用户的信令数据信息集，包括信令时间信息、信令定位信息、信令交互信息以及信令服务标识信息；根据所述信令数据信息集进行数据提取获取信令响应的信令响应时间数据和信令响应地址数据；根据所述信令响应时间数据和信令响应地址数据进行时间点、时间点定位以及时长的数据清洗筛除不符合要求的信令数据信息；将清洗留存的第二信令数据信息集对应的终端用户标记为第一标识用户。
8.可选地，在本技术实施例所述的基于信令大数据的区域人口统计方法中，所述获取所述第一标识用户在所述预设时间段内信令响应地址对应的基站扇区动态信息并生成所述第一标识用户的基站扇区动态轨迹画像，包括：根据所述第一标识用户在所述预设时间段内信令响应地址数据提取基站响应标识数据；根据所述基站响应标识数据在基站标识数据库中进行查询获得区域内对应标识的基站扇区并提取基站扇区动态信息；所述基站扇区动态信息包括基站扇区响应数据、基站扇区覆盖数据、基站动态交互数据；根据所述基站扇区响应度数据、基站扇区覆盖数据、基站动态交互数据生成所述第一标识用户的基站扇区动态轨迹画像。
9.可选地，在本技术实施例所述的基于信令大数据的区域人口统计方法中，所述根据所述基站扇区动态轨迹画像提取基站扇区覆盖标识数据并结合标识数据的对应信令响应时间数据处理获得扇区交集密度数据，包括：根据所述基站扇区动态轨迹画像提取基站扇区覆盖标识数据，包括基站排布标识数据、扇区交集度数据、扇区轨迹标识数据以及扇区驻留数据；根据所述基站排布标识数据、扇区交集度数据、扇区轨迹标识数据以及扇区驻留数据结合预设时间段内的信令响应时间段节点计算获得预设时间段内的扇区交集密度数据；所述扇区交集密度数据计算公式为：；其中p为扇区交集密度数据，为第i个信令响应时间段节点的扇区驻留数据，为第i个信令响应时间段节点的扇区交集度数据，为第i个信令响应时间段节点的扇区轨迹标识数据，为基站排布标识数据，n为预设时间段内的信令响应时间段节点个数，i为n个时间段节点中的第i个信令响应时间段节点，为轨迹密度系数。
10.可选地，在本技术实施例所述的基于信令大数据的区域人口统计方法中，所述根据所述扇区交集密度数据与预设常驻交密度阈值进行阈值对比筛选符合阈值对比要求的对应标识用户，标记为第二标识用户，包括：根据所述第一标识用户的扇区交集密度数据与预设常驻交密度阈值进行阈值对比；将符合阈值对比结果的第一标识用户进行标识，标记为第二标识用户。
11.可选地，在本技术实施例所述的基于信令大数据的区域人口统计方法中，所述根据所述第二标识用户的扇区交集密度数据输入至预设的扇区栅格密布模型中进行处理获取栅格密度分布数据，包括：获取训练好的扇区栅格密布模型；根据所述第二标识用户的扇区交集密度数据结合所述扇区交集度数据和扇区轨迹标识数据输入至训练好的扇区栅格密布模型中处理获得栅格密度分布数据。
12.可选地，在本技术实施例所述的基于信令大数据的区域人口统计方法中，所述根据所述栅格密度分布数据进行聚合获得区域内栅格密度分布图，根据所述区域内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况，包括：根据所述栅格密度分布数据进行聚合获得区域内栅格密度分布数据；根据所述栅格密度分布数据构建栅格密度分布图；将所述栅格密度分布图根据预设栅格密度对照值进行人口密度值转换获得区域常驻人口密度布局数据；根据所述区域常驻人口密度布局数据作为所述预设时间段内统计的区域常驻人口密度分布情况。
13.第二方面，本技术实施例提供了基于信令大数据的区域人口统计系统，该系统包括：存储器及处理器，所述存储器中包括基于信令大数据的区域人口统计方法的程序，所述基于信令大数据的区域人口统计方法的程序被所述处理器执行时实现以下步骤：获取预设时间段内区域内终端用户的信令数据信息集；根据所述信令数据信息集进行数据提取获取信令响应时间数据和信令响应地址数据并进行数据清洗获得第一标识用户；获取所述第一标识用户在所述预设时间段内信令响应地址对应的基站扇区动态信息并生成所述第一标识用户的基站扇区动态轨迹画像；根据所述基站扇区动态轨迹画像提取基站扇区覆盖标识数据并结合标识数据的对应信令响应时间数据处理获得扇区交集密度数据；根据所述扇区交集密度数据与预设常驻交密度阈值进行阈值对比筛选符合阈值对比要求的对应标识用户，标记为第二标识用户；根据所述第二标识用户的扇区交集密度数据输入至预设的扇区栅格密布模型中进行处理获取栅格密度分布数据；根据所述栅格密度分布数据进行聚合获得区域内栅格密度分布图，根据所述区域内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况。
14.可选地，在本技术实施例所述的基于信令大数据的区域人口统计系统中，所述获取预设时间段内区域内终端用户的信令数据信息集，根据所述信令数据信息集进行数据提
取获取信令响应时间数据和信令响应地址数据并进行数据清洗获得第一标识用户，包括：获取预设时间段内区域内的终端用户的信令数据信息集，包括信令时间信息、信令定位信息、信令交互信息以及信令服务标识信息；根据所述信令数据信息集进行数据提取获取信令响应的信令响应时间数据和信令响应地址数据；根据所述信令响应时间数据和信令响应地址数据进行时间点、时间点定位以及时长的数据清洗筛除不符合要求的信令数据信息；将清洗留存的第二信令数据信息集对应的终端用户标记为第一标识用户。
15.第三方面，本技术实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中包括基于信令大数据的区域人口统计方法程序，所述基于信令大数据的区域人口统计方法程序被处理器执行时，实现如上述任一项所述的基于信令大数据的区域人口统计方法的步骤。
16.由上可知，本技术实施例提供的基于信令大数据的区域人口统计方法、系统及存储介质通过获取预设时间段内区域内终端用户的信令数据信息集提取并清洗获得基站扇区动态轨迹画像并提取基站扇区覆盖标识数据结合信令响应时间数据处理获得扇区交集密度数据，再根据第二标识用户的扇区交集密度数据进行模型处理并聚合获得区域内栅格密度分布图转换获得人口密度分布情况；从而基于信令大数据对终端用户信令数据清洗处理获得扇区交集密度数据筛选用户并进行模型处理获得栅格密度分布数据进行聚合转换获得人口密度分布数据，实现根据信令数据进行用户扇区栅格轨迹驻停密度识别获得人口密度分布情况，实现对区域内人口常驻密度分布的精准统计。
17.本技术的其他特征和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本技术实施例了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
18.为了更清楚地说明本技术实施例的技术方案，下面将对本技术实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本技术的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
19.图1为本技术实施例提供的基于信令大数据的区域人口统计方法的流程图；图2为本技术实施例提供的基于信令大数据的区域人口统计方法的筛选出第一标识用户的流程图；图3为本技术实施例提供的基于信令大数据的区域人口统计方法的生成基站扇区动态轨迹画像的流程图；图4为本技术实施例提供的基于信令大数据的区域人口统计系统的结构示意图。
具体实施方式
20.下面将结合本技术实施例中附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。通常在
此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围，而是仅仅表示本技术的选定实施例。基于本技术的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本技术保护的范围。
21.应注意到，相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本技术的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。
22.请参照图1，图1是本技术一些实施例中的基于信令大数据的区域人口统计方法的一种流程图。该基于信令大数据的区域人口统计方法用于终端设备中，例如电脑、手机终端等。该基于信令大数据的区域人口统计方法，包括以下步骤：s101、获取预设时间段内区域内终端用户的信令数据信息集；s102、根据所述信令数据信息集进行数据提取获取信令响应时间数据和信令响应地址数据并进行数据清洗获得第一标识用户；s103、获取所述第一标识用户在所述预设时间段内信令响应地址对应的基站扇区动态信息并生成所述第一标识用户的基站扇区动态轨迹画像；s104、根据所述基站扇区动态轨迹画像提取基站扇区覆盖标识数据并结合标识数据的对应信令响应时间数据处理获得扇区交集密度数据；s105、根据所述扇区交集密度数据与预设常驻交密度阈值进行阈值对比筛选符合阈值对比要求的对应标识用户，标记为第二标识用户；s106、根据所述第二标识用户的扇区交集密度数据输入至预设的扇区栅格密布模型中进行处理获取栅格密度分布数据；s107、根据所述栅格密度分布数据进行聚合获得区域内栅格密度分布图，根据所述区域内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况。
23.需要说明的是，为获取区域内在一定预设的时间段内终端用户的常驻分布情况和分布密度，通过获取预设时间段内区域内终端用户的信令数据信息集进行数据提取获取信令响应时间数据和信令响应地址数据并进行数据清洗获得第一标识用户，将不满足区域内信令响应时间以及对应信令响应地址分布的信令数据对应用户进行筛除获得第一标识用户，根据在预设时间段内信令响应地址对应的基站扇区动态信息生成的基站扇区动态轨迹画像，描绘用户信令响应途径的标记基站扇区获得路径上基站扇区的轨迹信息，并提取基站扇区覆盖标识数据结合其对应的信令响应时间数据处理获得扇区交集密度数据，该扇区交集密度数据反应用户在区域内扇区重叠区域内的驻留时长、驻留时间节点数以及时间段内各停驻点的停驻频次，再根据扇区交集密度数据进行阈值对比筛选符合阈值对比要求的标记为第二标识用户，即将在扇区交集区域停驻时长、频次不足的用户和驻留时间节点数不足的频繁移动或某时间段不动的用户如快递配送、区域服务、工作访问、临停等人员进行排除获得区域的常驻用户，再根据第二标识用户的扇区交集密度数据输入至预设的扇区栅格密布模型中进行处理获取栅格密度分布数据，即对扇区交集信息进行栅格化处理，即根据扇区或交集区的有效面积进行适配栅格化处理获得适配大小的栅格，便于通过栅格密度对扇区驻停情况进行数据化映射和可视化描述，再将区域内第二标识用户的栅格密度分布数据进行聚合获得区域内栅格密度分布图，该分布图是一张数据化的栅格密度分布图，反
映出区域内第二标识用户的驻停驻留情况，再根据区域内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况，即通过预设密度值的数据转化呈现出区域内第二标识用户的驻留驻停分布情况，如某子区域a驻留驻停用户多且频次高，则a的密度显示为大如色度深，且对应密度值大，如某子区域b驻留驻停用户少则其密度显示为小如色度浅，对应密度值小，即实现了通过信令用户的基站扇区交集密度数据经过栅格化处理获得栅格密度分布数据聚合和转换获得区域常驻人口密度分布情况的智慧化筛分统计技术。
24.请参照图2，图2是本技术一些实施例中的基于信令大数据的区域人口统计方法的筛选出第一标识用户的流程图。根据本发明实施例，所述获取预设时间段内区域内终端用户的信令数据信息集，根据所述信令数据信息集进行数据提取获取信令响应时间数据和信令响应地址数据并进行数据清洗获得第一标识用户，具体为：s201、获取预设时间段内区域内的终端用户的信令数据信息集，包括信令时间信息、信令定位信息、信令交互信息以及信令服务标识信息；s202、根据所述信令数据信息集进行数据提取获取信令响应的信令响应时间数据和信令响应地址数据；s203、根据所述信令响应时间数据和信令响应地址数据进行时间点、时间点定位以及时长的数据清洗筛除不符合要求的信令数据信息；s204、将清洗留存的第二信令数据信息集对应的终端用户标记为第一标识用户。
25.需要说明的是，根据预设时间段内区域内终端用户的信令数据信息集进行数据提取获得信令响应时间数据和信令响应地址数据，即对信令响应时间、时长，信令响应时间对应的地址定位以及信令交互信息和信令服务标识如通讯商、注册地等信令信息进行提取获得信令响应时间和对应响应地址的数据，再对数据根据信令响应时间节点、响应时间点定位和信令时长进行数据清洗筛选，将不符合预设要求的信令数据信息进行筛除，如信令响应时长不满足要求，信令响应时间节点次数不足以及信令响应定位散布、定位点、关联定位地址等不符合要求的信令数据信息进行清洗，将留下的信令数据信息集对应的用户标记为第一标识用户，实现对区域内有效常驻用户按照信令数据信息的预设条件进行初步筛选。
26.请参照图3，图3是本技术一些实施例中的基于大数据信令处理的生成基站扇区动态轨迹画像的流程图。根据本发明实施例，所述获取所述第一标识用户在所述预设时间段内信令响应地址对应的基站扇区动态信息并生成所述第一标识用户的基站扇区动态轨迹画像，具体为：s301、根据所述第一标识用户在所述预设时间段内信令响应地址数据提取基站响应标识数据；s302、根据所述基站响应标识数据在基站标识数据库中进行查询获得区域内对应标识的基站扇区并提取基站扇区动态信息；s303、所述基站扇区动态信息包括基站扇区响应数据、基站扇区覆盖数据、基站动态交互数据；s304、根据所述基站扇区响应度数据、基站扇区覆盖数据、基站动态交互数据生成所述第一标识用户的基站扇区动态轨迹画像。
27.需要说明的是，为获取第一标识用户在预设时间段内的动态轨迹情况，通过第一标识用户在预设时间段内信令响应地址数据提取基站响应标识数据，即信令对应响应基站
的标识数据，根据基站响应标识数据在基站标识数据库中进行查询获得区域内对应标识的基站扇区并提取基站扇区动态信息，即通过基站的定位标识在基站标识数据库中定位到基站扇区并获得信令与标识基站扇区之间的动态交互数据，基站扇区动态信息包括基站扇区响应数据、基站扇区覆盖数据、基站动态交互数据，各数据反映出信令响应基站扇区的交互情况，各基站扇区或基站扇区交集覆盖区域的交互频次、响应强度以及交互时长、交互频数所对应的参数值，根据信令与基站响应的交互时长、频次、覆盖区域、重复性、经过的基站路径描绘出可反映第一标识用户信令对应基站扇区交互情况和活动情况的基站扇区动态轨迹画像，该轨迹画像可反映出信令在各基站扇区之间的连续切换情况，反映出信令路径以及用户的活动轨迹和活动情况。
28.根据本发明实施例，所述根据所述基站扇区动态轨迹画像提取基站扇区覆盖标识数据并结合标识数据的对应信令响应时间数据处理获得扇区交集密度数据，具体为：根据所述基站扇区动态轨迹画像提取基站扇区覆盖标识数据，包括基站排布标识数据、扇区交集度数据、扇区轨迹标识数据以及扇区驻留数据；根据所述基站排布标识数据、扇区交集度数据、扇区轨迹标识数据以及扇区驻留数据结合预设时间段内的信令响应时间段节点计算获得预设时间段内的扇区交集密度数据；所述扇区交集密度数据计算公式为：；其中p为扇区交集密度数据，为第i个信令响应时间段节点的扇区驻留数据，为第i个信令响应时间段节点的扇区交集度数据，为第i个信令响应时间段节点的扇区轨迹标识数据，为基站排布标识数据，n为预设时间段内的信令响应时间段节点个数，i为n个时间段节点中的第i个信令响应时间段节点，为轨迹密度系数（根据扇区轨迹标识数据在基站标识数据库中查询获得）。
29.需要说明的是，根据基站扇区动态轨迹画像提取基站扇区覆盖标识数据包括基站排布标识数据、扇区交集度数据、扇区轨迹标识数据以及扇区驻留数据，数据反映经过基站路径标识排布、扇区之间交集区域、经过扇区轨迹标识以及扇区和扇区交集区域响应停留时长和驻留频次，再根据上述数结合预设时间段内的信令响应时间段节点计算获得预设时间段内的扇区交集密度数据，即通过对预设时间段内内各信令响应时间段节点对应的基站扇区交集区域分布、扇区轨迹路径、扇区响应时长、扇区停驻频次进行时间节点数据累计的程序化计算获得用户的扇区交集密度数据，该密度数据反映出用户在预设时间段内在扇区或扇区交集区域活动强度以及信令响应的扇区或扇区交集区域的分布密度，可通过扇区密度衡量出用户在区域内各点驻停情况和驻停点情况。
30.根据本发明实施例，所述根据所述扇区交集密度数据与预设常驻交密度阈值进行阈值对比筛选符合阈值对比要求的对应标识用户，标记为第二标识用户，具体为：根据所述第一标识用户的扇区交集密度数据与预设常驻交密度阈值进行阈值对比；
将符合阈值对比结果的第一标识用户进行标识，标记为第二标识用户。
31.需要说明的是，根据获得的扇区交集密度数据与预设常驻交密度阈值进行阈值对比，将不满足在预设时间段内在扇区或扇区交集区域活动强度大小以及信令响应的扇区或扇区交集区域的分布密度高低的用户进行剔除，将不符合在区域内驻停、途径要求的用户进行去除，其中该常驻交密度阈值可根据区域属性信息进行设置，如将阈值设置为85%。
32.根据本发明实施例，所述根据所述第二标识用户的扇区交集密度数据输入至预设的扇区栅格密布模型中进行处理获取栅格密度分布数据，具体为：获取训练好的扇区栅格密布模型；根据所述第二标识用户的扇区交集密度数据结合所述扇区交集度数据和扇区轨迹标识数据输入至训练好的扇区栅格密布模型中处理获得栅格密度分布数据。
33.需要说明的是，将第二标识用户的扇区交集密度数据结合扇区交集度数据和扇区轨迹标识数据输入至训练好的扇区栅格密布模型中处理获得栅格密度分布数据，即根据预设时间段内在扇区或扇区交集区域活动强度以及信令响应的扇区或扇区交集区域的分布密度进行模型栅格化处理获得相适配的反映活动强度和活动分布密度的密度栅格，实现根据信令在扇区的活动强度和密度情况进行栅格化处理获得适配的密度化栅格并获得栅格密度分布数据，即对基站扇区和扇区交集区域活动强度和活动分布情况进行栅格密度分布处理，其中，扇区栅格密布模型是根据大量已有历史的扇区交集密度数据、扇区交集度数据、扇区轨迹标识数据和栅格密度分布数据的数据样本进行训练处理获得的扇区栅格密布模型，数据样本越丰富则模型训练得出的处理结果越准确，根据历史样本的扇区交集密度数据、扇区交集度数据、扇区轨迹标识数据和栅格密度分布数据输入至初始模型中进行自学习得到输出值，若输出值大于预设阈值则学习停止，获得扇区栅格密布模型。
34.根据本发明实施例，所述根据所述栅格密度分布数据进行聚合获得区域内栅格密度分布图，根据所述区域内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况，具体为：根据所述栅格密度分布数据进行聚合获得区域内栅格密度分布数据；根据所述栅格密度分布数据构建栅格密度分布图；将所述栅格密度分布图根据预设栅格密度对照值进行人口密度值转换获得区域常驻人口密度布局数据；根据所述区域常驻人口密度布局数据作为所述预设时间段内统计的区域常驻人口密度分布情况。
35.需要说明的是，将获得的区域内第二标识用户的栅格密度分布数据进行聚合获得区域内栅格密度分布数据，可集中反映出区域内用户在各点、各子域的活动强度和活动密度，根据数据构建出区域内栅格密度分布图，该分布图是一张数据化的栅格密度分布图，反映出区域内第二标识用户的驻停驻留、活动强度以及活动密度情况，再根据区域内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况，即通过预设密度值的数据转化呈现出区域内第二标识用户的活动分布和驻留驻停分布情况，即反映区域常驻人口密度分布情况的区域常驻人口密度布局数据。
36.如图4所示，本发明还公开了基于信令大数据的区域人口统计系统，包括存储器41和处理器42，所述存储器中包括基于信令大数据的区域人口统计方法程序，所述基于信令
大数据的区域人口统计方法程序被所述处理器执行时实现如下步骤：获取预设时间段内区域内终端用户的信令数据信息集；根据所述信令数据信息集进行数据提取获取信令响应时间数据和信令响应地址数据并进行数据清洗获得第一标识用户；获取所述第一标识用户在所述预设时间段内信令响应地址对应的基站扇区动态信息并生成所述第一标识用户的基站扇区动态轨迹画像；根据所述基站扇区动态轨迹画像提取基站扇区覆盖标识数据并结合标识数据的对应信令响应时间数据处理获得扇区交集密度数据；根据所述扇区交集密度数据与预设常驻交密度阈值进行阈值对比筛选符合阈值对比要求的对应标识用户，标记为第二标识用户；根据所述第二标识用户的扇区交集密度数据输入至预设的扇区栅格密布模型中进行处理获取栅格密度分布数据；根据所述栅格密度分布数据进行聚合获得区域内栅格密度分布图，根据所述区域内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况。
37.需要说明的是，为获取区域内在一定预设的时间段内终端用户的常驻分布情况和分布密度，通过获取预设时间段内区域内终端用户的信令数据信息集进行数据提取获取信令响应时间数据和信令响应地址数据并进行数据清洗获得第一标识用户，将不满足区域内信令响应时间以及对应信令响应地址分布的信令数据对应用户进行筛除获得第一标识用户，根据在预设时间段内信令响应地址对应的基站扇区动态信息生成的基站扇区动态轨迹画像，描绘用户信令响应途径的标记基站扇区获得路径上基站扇区的轨迹信息，并提取基站扇区覆盖标识数据结合其对应的信令响应时间数据处理获得扇区交集密度数据，该扇区交集密度数据反应用户在区域内扇区重叠区域内的驻留时长、驻留时间节点数以及时间段内各停驻点的停驻频次，再根据扇区交集密度数据进行阈值对比筛选符合阈值对比要求的标记为第二标识用户，即将在扇区交集区域停驻时长、频次不足的用户和驻留时间节点数不足的频繁移动或某时间段不动的用户如快递配送、区域服务、工作访问、临停等人员进行排除获得区域的常驻用户，再根据第二标识用户的扇区交集密度数据输入至预设的扇区栅格密布模型中进行处理获取栅格密度分布数据，即对扇区交集信息进行栅格化处理，即根据扇区或交集区的有效面积进行适配栅格化处理获得适配大小的栅格，便于通过栅格密度对扇区驻停情况进行数据化映射和可视化描述，再将区域内第二标识用户的栅格密度分布数据进行聚合获得区域内栅格密度分布图，该分布图是一张数据化的栅格密度分布图，反映出区域内第二标识用户的驻停驻留情况，再根据区域内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况，即通过预设密度值的数据转化呈现出区域内第二标识用户的驻留驻停分布情况，如某子区域a驻留驻停用户多且频次高，则a的密度显示为大如色度深，且对应密度值大，如某子区域b驻留驻停用户少则其密度显示为小如色度浅，对应密度值小，即实现了通过信令用户的基站扇区交集密度数据经过栅格化处理获得栅格密度分布数据聚合和转换获得区域常驻人口密度分布情况的智慧化筛分统计技术。
38.根据本发明实施例，所述获取预设时间段内区域内终端用户的信令数据信息集，根据所述信令数据信息集进行数据提取获取信令响应时间数据和信令响应地址数据并进行数据清洗获得第一标识用户，具体为：
获取预设时间段内区域内的终端用户的信令数据信息集，包括信令时间信息、信令定位信息、信令交互信息以及信令服务标识信息；根据所述信令数据信息集进行数据提取获取信令响应的信令响应时间数据和信令响应地址数据；根据所述信令响应时间数据和信令响应地址数据进行时间点、时间点定位以及时长的数据清洗筛除不符合要求的信令数据信息；将清洗留存的第二信令数据信息集对应的终端用户标记为第一标识用户。
39.需要说明的是，根据预设时间段内区域内终端用户的信令数据信息集进行数据提取获得信令响应时间数据和信令响应地址数据，即对信令响应时间、时长，信令响应时间对应的地址定位以及信令交互信息和信令服务标识如通讯商、注册地等信令信息进行提取获得信令响应时间和对应响应地址的数据，再对数据根据信令响应时间节点、响应时间点定位和信令时长进行数据清洗筛选，将不符合预设要求的信令数据信息进行筛除，如信令响应时长不满足要求，信令响应时间节点次数不足以及信令响应定位散布、定位点、关联定位地址等不符合要求的信令数据信息进行清洗，将留下的信令数据信息集对应的用户标记为第一标识用户，实现对区域内有效常驻用户按照信令数据信息的预设条件进行初步筛选。
40.根据本发明实施例，所述获取所述第一标识用户在所述预设时间段内信令响应地址对应的基站扇区动态信息并生成所述第一标识用户的基站扇区动态轨迹画像，具体为：根据所述第一标识用户在所述预设时间段内信令响应地址数据提取基站响应标识数据；根据所述基站响应标识数据在基站标识数据库中进行查询获得区域内对应标识的基站扇区并提取基站扇区动态信息；所述基站扇区动态信息包括基站扇区响应数据、基站扇区覆盖数据、基站动态交互数据；根据所述基站扇区响应度数据、基站扇区覆盖数据、基站动态交互数据生成所述第一标识用户的基站扇区动态轨迹画像。
41.需要说明的是，为获取第一标识用户在预设时间段内的动态轨迹情况，通过第一标识用户在预设时间段内信令响应地址数据提取基站响应标识数据，即信令对应响应基站的标识数据，根据基站响应标识数据在基站标识数据库中进行查询获得区域内对应标识的基站扇区并提取基站扇区动态信息，即通过基站的定位标识在基站标识数据库中定位到基站扇区并获得信令与标识基站扇区之间的动态交互数据，基站扇区动态信息包括基站扇区响应数据、基站扇区覆盖数据、基站动态交互数据，各数据反映出信令响应基站扇区的交互情况，各基站扇区或基站扇区交集覆盖区域的交互频次、响应强度以及交互时长、交互频数所对应的参数值，根据信令与基站响应的交互时长、频次、覆盖区域、重复性、经过的基站路径描绘出可反映第一标识用户信令对应基站扇区交互情况和活动情况的基站扇区动态轨迹画像，该轨迹画像可反映出信令在各基站扇区之间的连续切换情况，反映出信令路径以及用户的活动轨迹和活动情况。
42.根据本发明实施例，所述根据所述基站扇区动态轨迹画像提取基站扇区覆盖标识数据并结合标识数据的对应信令响应时间数据处理获得扇区交集密度数据，具体为：根据所述基站扇区动态轨迹画像提取基站扇区覆盖标识数据，包括基站排布标识
数据、扇区交集度数据、扇区轨迹标识数据以及扇区驻留数据；根据所述基站排布标识数据、扇区交集度数据、扇区轨迹标识数据以及扇区驻留数据结合预设时间段内的信令响应时间段节点计算获得预设时间段内的扇区交集密度数据；所述扇区交集密度数据计算公式为：；其中p为扇区交集密度数据，为第i个信令响应时间段节点的扇区驻留数据，为第i个信令响应时间段节点的扇区交集度数据，为第i个信令响应时间段节点的扇区轨迹标识数据，为基站排布标识数据，n为预设时间段内的信令响应时间段节点个数，i为n个时间段节点中的第i个信令响应时间段节点，为轨迹密度系数（根据扇区轨迹标识数据在基站标识数据库中查询获得）。
43.需要说明的是，根据基站扇区动态轨迹画像提取基站扇区覆盖标识数据包括基站排布标识数据、扇区交集度数据、扇区轨迹标识数据以及扇区驻留数据，数据反映经过基站路径标识排布、扇区之间交集区域、经过扇区轨迹标识以及扇区和扇区交集区域响应停留时长和驻留频次，再根据上述数结合预设时间段内的信令响应时间段节点计算获得预设时间段内的扇区交集密度数据，即通过对预设时间段内内各信令响应时间段节点对应的基站扇区交集区域分布、扇区轨迹路径、扇区响应时长、扇区停驻频次进行时间节点数据累计的程序化计算获得用户的扇区交集密度数据，该密度数据反映出用户在预设时间段内在扇区或扇区交集区域活动强度以及信令响应的扇区或扇区交集区域的分布密度，可通过扇区密度衡量出用户在区域内各点驻停情况和驻停点情况。
44.根据本发明实施例，所述根据所述扇区交集密度数据与预设常驻交密度阈值进行阈值对比筛选符合阈值对比要求的对应标识用户，标记为第二标识用户，具体为：根据所述第一标识用户的扇区交集密度数据与预设常驻交密度阈值进行阈值对比；将符合阈值对比结果的第一标识用户进行标识，标记为第二标识用户。
45.需要说明的是，根据获得的扇区交集密度数据与预设常驻交密度阈值进行阈值对比，将不满足在预设时间段内在扇区或扇区交集区域活动强度大小以及信令响应的扇区或扇区交集区域的分布密度高低的用户进行剔除，将不符合在区域内驻停、途径要求的用户进行去除，其中该常驻交密度阈值可根据区域属性信息进行设置，如将阈值设置为85%。
46.根据本发明实施例，所述根据所述第二标识用户的扇区交集密度数据输入至预设的扇区栅格密布模型中进行处理获取栅格密度分布数据，具体为：获取训练好的扇区栅格密布模型；根据所述第二标识用户的扇区交集密度数据结合所述扇区交集度数据和扇区轨迹标识数据输入至训练好的扇区栅格密布模型中处理获得栅格密度分布数据。
47.需要说明的是，将第二标识用户的扇区交集密度数据结合扇区交集度数据和扇区轨迹标识数据输入至训练好的扇区栅格密布模型中处理获得栅格密度分布数据，即根据预
设时间段内在扇区或扇区交集区域活动强度以及信令响应的扇区或扇区交集区域的分布密度进行模型栅格化处理获得相适配的反映活动强度和活动分布密度的密度栅格，实现根据信令在扇区的活动强度和密度情况进行栅格化处理获得适配的密度化栅格并获得栅格密度分布数据，即对基站扇区和扇区交集区域活动强度和活动分布情况进行栅格密度分布处理，其中，扇区栅格密布模型是根据大量已有历史的扇区交集密度数据、扇区交集度数据、扇区轨迹标识数据和栅格密度分布数据的数据样本进行训练处理获得的扇区栅格密布模型，数据样本越丰富则模型训练得出的处理结果越准确，根据历史样本的扇区交集密度数据、扇区交集度数据、扇区轨迹标识数据和栅格密度分布数据输入至初始模型中进行自学习得到输出值，若输出值大于预设阈值则学习停止，获得扇区栅格密布模型。
48.根据本发明实施例，所述根据所述栅格密度分布数据进行聚合获得区域内栅格密度分布图，根据所述区域内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况，具体为：根据所述栅格密度分布数据进行聚合获得区域内栅格密度分布数据；根据所述栅格密度分布数据构建栅格密度分布图；将所述栅格密度分布图根据预设栅格密度对照值进行人口密度值转换获得区域常驻人口密度布局数据；根据所述区域常驻人口密度布局数据作为所述预设时间段内统计的区域常驻人口密度分布情况。
49.需要说明的是，将获得的区域内第二标识用户的栅格密度分布数据进行聚合获得区域内栅格密度分布数据，可集中反映出区域内用户在各点、各子域的活动强度和活动密度，根据数据构建出区域内栅格密度分布图，该分布图是一张数据化的栅格密度分布图，反映出区域内第二标识用户的驻停驻留、活动强度以及活动密度情况，再根据区域内栅格密度分布图进行密度值转换获得区域常驻人口密度分布情况，即通过预设密度值的数据转化呈现出区域内第二标识用户的活动分布和驻留驻停分布情况，即反映区域常驻人口密度分布情况的区域常驻人口密度布局数据。
50.本发明第三方面提供了一种可读存储介质，所述可读存储介质中包括基于信令大数据的区域人口统计方法程序，所述基于信令大数据的区域人口统计方法程序被处理器执行时，实现如上述任一项所述的基于信令大数据的区域人口统计方法的步骤。
51.本发明公开的基于信令大数据的区域人口统计方法、系统及存储介质，通过获取预设时间段内区域内终端用户的信令数据信息集提取并清洗获得基站扇区动态轨迹画像并提取基站扇区覆盖标识数据结合信令响应时间数据处理获得扇区交集密度数据，再根据第二标识用户的扇区交集密度数据进行模型处理并聚合获得区域内栅格密度分布图转换获得人口密度分布情况；从而基于信令大数据对终端用户信令数据清洗处理获得扇区交集密度数据筛选用户并进行模型处理获得栅格密度分布数据进行聚合转换获得人口密度分布数据，实现根据信令数据进行用户扇区栅格轨迹驻停密度识别获得人口密度分布情况，实现对区域内人口常驻密度分布的精准统计。
52.在本技术所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或
可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。
53.上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
54.另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。
55.本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器（rom，read-only memory）、随机存取存储器（ram，random access memory）、磁碟或者光盘等各种可以存储程序代码的介质。
56.或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机、服务器、或者网络设备等）执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种混动变速器轴承润滑冷却仿真分析方法与流程

基于信令大数据的区域人口统计方法、系统及存储介质与流程

相关文献

最热文献