真实人群数量预测方法及装置与流程

2022-03-26 10:15:37 来源：中国专利 TAG：

1.本发明涉及数据预测技术领域，尤其涉及一种真实人群数量预测方法及装置。

背景技术：

2.在分析特定区域的区域特征，如区域的人流量、商业吸引度或人群画像等特征时，会需要获取特定区域的真实人群数量来作为数据分析的基础，但由于人群数量的数据收集难度较高，成本巨大，现有技术一般不会直接统计真实的人群数量，而是通过人工统计特定时间段的人群数量进行估算，或通过一些相关的参数如通信数据来代替真实人群数量。但现有的技术思路始终无法保证最终估算出的或替代得到的人群数量足够真实，进而后续的区域的特征分析工作也无法在准确的数据基础上进行。可见现有技术存在缺陷，亟待解决。

技术实现要素：

3.本发明所要解决的技术问题在于，提供一种真实人群数量预测方法及装置，能够实现高效率且低成本地对区域的真实人群数量进行预估，后续可以便于利用区域的人群数量进行进一步的数据分析操作。
4.为了解决上述技术问题，本发明第一方面公开了一种真实人群数量预测方法，所述方法包括：
5.确定待预测区域在目标时间段的通信终端数量；
6.将所述通信终端数量输入至训练好的回归网络预测模型中，以预测得到所述待预测区域在所述目标时间段的真实人群数量；所述回归网络预测模型为通过包括有多个已知在训练时间段的区域人群数量和通信终端数量的训练区域的训练数据集训练得到。
7.作为一个可选的实施方式，在本发明第一方面中，所述通信终端数量包括基于软件维度感知的终端数量、基于操作系统维度感知的终端数量、基于运营商维度感知的终端数量和基于品牌维度感知的终端数量中的至少一种；和/或，所述区域人群数量为根据所述训练区域在所述训练时间段的至少一个运营商的呼叫详细记录确定得到；和/或，所述区域人群数量为根据所述训练区域在所述训练时间段的多个运营商的呼叫详细记录的总和确定得到；和/或，所述区域人群数量为根据所述训练区域在所述训练时间段的目标运营商的呼叫详细记录以及所述目标运营商对应的占比参数确定得到；所述占比参数用于指示所述目标运营商的呼叫详细记录占所有运营商的呼叫详细记录总和的比例。
8.作为一个可选的实施方式，在本发明第一方面中，所述确定待预测区域在目标时间段的通信终端数量，包括：
9.获取感知设备在目标时间段内在所述待预测区域感知到的设备通信信息；
10.根据所述设备通信信息，确定所述待预测区域在所述目标时间段的通信终端数量。
11.作为一个可选的实施方式，在本发明第一方面中，确定待预测区域的通信终端数量后，所述方法还包括：
12.确定所述待预测区域的区域特征参数；
13.所述将所述通信终端数量输入至训练好的回归网络预测模型中，以预测得到出所述待预测区域在目标时间段的真实人群数量，包括：
14.将所述通信终端数量和所述区域特征参数输入至训练好的回归网络预测模型中，以预测得到出所述待预测区域在目标时间段的真实人群数量；
15.所述回归网络预测模型为通过包括有多个已知在训练时间段的区域人群数量、区域特征参数和通信终端数量的训练区域的训练数据集训练得到。
16.作为一个可选的实施方式，在本发明第一方面中，所述区域特征参数包括区域物理特征、区域行政级别特征、区域周边设施特征和区域周边竞品特征中的至少一种。
17.作为一个可选的实施方式，在本发明第一方面中，所述确定所述待预测区域的区域特征参数，包括：
18.确定所述待预测区域的所在位置周围的多个目标设施；
19.确定所述待预测区域的所在位置与任一所述目标设施的距离参数；
20.将所述所有所述目标设施对应的所述距离参数确定为所述待预测区域的所述区域周边设施特征；
21.和/或，
22.确定所述待预测区域的所在位置周围的多个竞品店铺；
23.确定所述待预测区域的所在位置距离任一所述竞品店铺的距离参数；
24.将所述所有所述竞品店铺对应的所述距离参数确定为所述待预测区域的所述区域周边竞品特征。
25.作为一个可选的实施方式，在本发明第一方面中，所述回归网络预测模型根据以下步骤被训练得到：
26.确定训练数据集；所述训练数据集包括有多个已知在训练时间段的区域人群数量和通信终端数量的训练区域；
27.将所述训练数据集输入至人群预测训练模型进行训练直至收敛，以得到所述训练好的回归网络预测模型；所述人群预测训练模型包括所述回归网络预测模型以及相应的参数优化层。
28.作为一个可选的实施方式，在本发明第一方面中，所述回归网络预测模型包括线性回归网络模型、多项式回归网络模型、岭回归算法模型、lightgbm回归模型、多层感知器网络模型和卷积神经网络模型中的至少一种。
29.本发明实施例第二方面公开了一种真实人群数量预测装置，所述装置包括：
30.确定模块，用于确定待预测区域在目标时间段的通信终端数量；
31.预测模块，用于将所述通信终端数量输入至训练好的回归网络预测模型中，以预测得到所述待预测区域在所述目标时间段的真实人群数量；所述回归网络预测模型为通过包括有多个已知在训练时间段的区域人群数量和通信终端数量的训练区域的训练数据集训练得到。
32.作为一个可选的实施方式，在本发明第二方面中，所述通信终端数量包括基于软件维度感知的终端数量、基于操作系统维度感知的终端数量、基于运营商维度感知的终端数量和基于品牌维度感知的终端数量中的至少一种；和/或，所述区域人群数量为根据所述
训练区域在所述训练时间段的至少一个运营商的呼叫详细记录确定得到；和/或，所述区域人群数量为根据所述训练区域在所述训练时间段的多个运营商的呼叫详细记录的总和确定得到；和/或，所述区域人群数量为根据所述训练区域在所述训练时间段的目标运营商的呼叫详细记录以及所述目标运营商对应的占比参数确定得到；所述占比参数用于指示所述目标运营商的呼叫详细记录占所有运营商的呼叫详细记录总和的比例。
33.作为一个可选的实施方式，在本发明第二方面中，所述确定模块确定待预测区域在目标时间段的通信终端数量的具体方式，包括：
34.获取感知设备在目标时间段内在所述待预测区域感知到的设备通信信息；
35.根据所述设备通信信息，确定所述待预测区域在所述目标时间段的通信终端数量。
36.作为一个可选的实施方式，在本发明第二方面中，所述确定模块还用于确定所述待预测区域的区域特征参数；
37.所述预测模块将所述通信终端数量输入至训练好的回归网络预测模型中，以预测得到出所述待预测区域在目标时间段的真实人群数量的具体方式，包括：
38.将所述通信终端数量和所述区域特征参数输入至训练好的回归网络预测模型中，以预测得到出所述待预测区域在目标时间段的真实人群数量；
39.所述回归网络预测模型为通过包括有多个已知在训练时间段的区域人群数量、区域特征参数和通信终端数量的训练区域的训练数据集训练得到。
40.作为一个可选的实施方式，在本发明第二方面中，所述区域特征参数包括区域物理特征、区域行政级别特征、区域周边设施特征和区域周边竞品特征中的至少一种。
41.作为一个可选的实施方式，在本发明第二方面中，所述确定模块确定所述待预测区域的区域特征参数的具体方式，包括：
42.确定所述待预测区域的所在位置周围的多个目标设施；
43.确定所述待预测区域的所在位置与任一所述目标设施的距离参数；
44.将所述所有所述目标设施对应的所述距离参数确定为所述待预测区域的所述区域周边设施特征；
45.和/或，
46.确定所述待预测区域的所在位置周围的多个竞品店铺；
47.确定所述待预测区域的所在位置距离任一所述竞品店铺的距离参数；
48.将所述所有所述竞品店铺对应的所述距离参数确定为所述待预测区域的所述区域周边竞品特征。
49.作为一个可选的实施方式，在本发明第二方面中，所述装置还包括训练模块，所述训练模块用于执行以下步骤训练得到所述回归网络预测模型：
50.确定训练数据集；所述训练数据集包括有多个已知在训练时间段的区域人群数量和通信终端数量的训练区域；
51.将所述训练数据集输入至人群预测训练模型进行训练直至收敛，以得到所述训练好的回归网络预测模型；所述人群预测训练模型包括所述回归网络预测模型以及相应的参数优化层。
52.作为一个可选的实施方式，在本发明第二方面中，所述回归网络预测模型包括线
性回归网络模型、多项式回归网络模型、岭回归算法模型、lightgbm回归模型、多层感知器网络模型和卷积神经网络模型中的至少一种。
53.本发明第三方面公开了另一种真实人群数量预测装置，所述装置包括：
54.存储有可执行程序代码的存储器；
55.与所述存储器耦合的处理器；
56.所述处理器调用所述存储器中存储的所述可执行程序代码，执行本发明第一方面公开的真实人群数量预测方法中的部分或全部步骤。
57.与现有技术相比，本发明实施例具有以下有益效果：
58.本发明实施例中，公开了一种真实人群数量预测方法及装置，该方法包括：确定待预测区域在目标时间段的通信终端数量；将所述通信终端数量输入至训练好的回归网络预测模型中，以预测得到所述待预测区域在所述目标时间段的真实人群数量；所述回归网络预测模型为通过包括有多个已知在训练时间段的区域人群数量和通信终端数量的训练区域的训练数据集训练得到。可见，本发明实施例能够根据区域的通信终端数量，结合回归网络模型对区域的真实人群数量进行预测，从而能够实现高效率且低成本地对区域的真实人群数量进行预估，后续可以便于利用区域的人群数量进行进一步的数据分析操作。
附图说明
59.为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
60.图1是本发明实施例公开的一种真实人群数量预测方法的流程示意图。
61.图2是本发明实施例公开的一种真实人群数量预测装置的结构示意图。
62.图3是本发明实施例公开的另一种真实人群数量预测装置的结构示意图。
具体实施方式
63.为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
64.本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
65.在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。
66.本发明公开了一种真实人群数量预测方法及装置，能够根据区域的通信终端数量，结合回归网络模型对区域的真实人群数量进行预测，从而能够实现高效率且低成本地对区域的真实人群数量进行预估，后续可以便于利用区域的人群数量进行进一步的数据分析操作。以下分别进行详细说明。
67.实施例一
68.请参阅图1，图1是本发明实施例公开的一种真实人群数量预测方法的流程示意图。其中，图1所描述的真实人群数量预测方法应用于人群数量预测系统的预测芯片、预测终端或预测服务器(其中，该预测服务器可以为本地服务器或云服务器)中。如图1所示，该真实人群数量预测方法可以包括以下操作：
69.101、确定待预测区域在目标时间段的通信终端数量。
70.可选的，通信终端可以为移动终端如手机或平板或笔记本电脑，或是固定终端如台式电脑或服务器。可选的，通信终端数量可以包括基于软件维度感知的终端数量、基于操作系统维度感知的终端数量、基于运营商维度感知的终端数量和基于品牌维度感知的终端数量中的至少一种。
71.可选的，基于软件维度感知的终端数量可以为使用不同手机软件应用的固定终端数量或移动终端数量，这些手机软件应用包括但不限于：百度视频、网易音乐、腾讯视频、微信等软件应用。可选的，基于操作系统维度感知的终端数量可以包括使用不同操作系统的固定终端数量或移动终端数量，这些操作系统包括但不限于：ios，android，鸿蒙系统等操作系统。可选的，基于运营商维度感知的终端数量可以包括使用不同通信运营商的固定终端数量或移动终端数量，这些运营商包括但不限于：中国移动、中国联通、中国电信等运营商。可选的，基于品牌维度感知的终端数量可以包括使用不同品牌的固定终端数量或移动终端数量，这些品牌包括但不限于：苹果，华为，荣耀，魅族，三星，小米，oppo，vivo，一加，锤子等品牌。
72.102、将通信终端数量输入至训练好的回归网络预测模型中，以预测得到待预测区域在目标时间段的真实人群数量。
73.可选的，回归网络预测模型为通过包括有多个已知在训练时间段的区域人群数量和通信终端数量的训练区域的训练数据集训练得到。可选的，训练数据集中的训练区域可以选择具有代表性的区域，这些区域包括但并不限于：典型的居民区、典型的商业区、典型的工业区、典型的教育区、典型的交通枢纽区等区域。
74.可选的，训练数据集中训练区域的区域人群数量可以为运营商或者大数据机构针对训练时间段训练区域的人群统计数据的数据信息。
75.可选的，训练数据集中训练区域的区域人群数量可以为根据训练区域在训练时间段的至少一个运营商的呼叫详细记录确定得到。具体的，呼叫详细记录(call detail records，cdrs)，又称手机通话位置数据，是通信运营商计算营收的一种基本数据。该类数据记录了手机使用事件(如接打电话，收发短信，或者使用网络)发生时所连接的基站编码与时间。具体的，特定区域内多个运营商的呼叫详细记录，一般可以认为是比较接近真实的人群数量。
76.可选的，区域人群数量为根据训练区域在训练时间段的多个运营商的呼叫详细记录的总和确定得到，例如可以通过购买多个运营商在训练区域在训练时间段的呼叫详细记
录并进行相加计算，以得到区域人群数量。
77.可选的，区域人群数量可以为根据训练区域在训练时间段的目标运营商的呼叫详细记录以及目标运营商对应的占比参数确定得到，具体的，占比参数用于指示目标运营商的呼叫详细记录占所有运营商的呼叫详细记录总和的比例。可选的，区域人群数量可以等于训练区域在训练时间段的目标运营商的呼叫详细记录与占比参数的乘积。可选的，占比参数可以通过统计目标运营商在历史时间段内在多个区域的呼叫详细记录占所有运营商的呼叫详细记录总和的比例来得到。
78.可选的，目标运营商可以包括有多个目标运营商，此时，可以根据训练区域在训练时间段的多个目标运营商的呼叫详细记录乘以每一目标运营商对应的占比参数，以得到多个参考区域人群数量。可选的，区域人群数量可以根据多个参考区域人群数量计算得到，例如计算多个参考区域人群数量的加权平均数。可选的，可以将多个参考区域人群数量中偏移较大的值去掉后再计算加权平均数，以得到区域人群数量，其中偏移较大的值可以根据每一参考区域人群数量与多个参考区域人群数量的平均数之间的差值来确定。
79.可见，上述发明实施例能够根据区域的通信终端数量，结合回归网络模型对区域的真实人群数量进行预测，从而能够实现高效率且低成本地对区域的真实人群数量进行预估，后续可以便于利用区域的人群数量进行进一步的数据分析操作。
80.作为一个可选的实施方式，在上述步骤101中的，确定待预测区域在目标时间段的通信终端数量，包括：
81.获取感知设备在目标时间段内在待预测区域感知到的设备通信信息；
82.根据设备通信信息，确定待预测区域在目标时间段的通信终端数量。
83.可选的，感知设备可以包括无线ap，蓝牙设备，无线探针设备以及其他具有设备感知功能的物联网设备中的至少一种。可选的，设备通信信息中可以包括设备的软件信息、操作系统信息、通信运营商信息和设备品牌信息中的至少一种，以便于后续用于统计出不同感知维度的通信终端数量。
84.可见，通过实施该可选的实施方式，可以根据感知设备在目标时间段内在待预测区域感知到的设备通信信息，确定待预测区域在目标时间段的通信终端数量，从而能够准确确定出待预测区域在目标时间段的通信终端数量，后续能够基于此实现高效率且低成本地对区域的真实人群数量进行预估。
85.作为一个可选的实施方式，在上述步骤101之后，该方法还包括：
86.确定待预测区域的区域特征参数。
87.可选的，区域特征参数可以包括区域物理特征、区域行政级别特征、区域周边设施特征和区域周边竞品特征中的至少一种。可选的，区域物理特征可以包括区域的面积和/或区域的形状。可选的，区域行政级别特征可以为区域的行政级别特征，例如区域所在城市的行政级别，这可以用于表征区域的城市级别，并进一步可以用于表征区域的人口特点。
88.可选的，区域周边设施特征可以包括区域周边设施的数量和/或区域周边设施与区域位置之间的距离参数。可选的，区域周边设施可以为poi(point of interest，兴趣点)或aoi(area of interest，兴趣面)，其类型包括但不限于：运动休闲、餐饮、生活服务、科教文化、购物、交通出行、国家政府、住宿、企业商务、健康医疗/保健、公共设施等。
89.可选的，区域周边竞品特征可以包括区域周边竞品店铺的数量和/或区域周边竞
品店铺与区域位置之间的距离参数。可选的，距离参数可以包括直接距离、平均距离、最大距离和最小距离中的至少一种。
90.具体的，上述步骤102中的，将通信终端数量输入至训练好的回归网络预测模型中，以预测得到出待预测区域在目标时间段的真实人群数量，包括：
91.将通信终端数量和区域特征参数输入至训练好的回归网络预测模型中，以预测得到出待预测区域在目标时间段的真实人群数量。
92.可选的，回归网络预测模型为通过包括有多个已知在训练时间段的区域人群数量、区域特征参数和通信终端数量的训练区域的训练数据集训练得到。
93.可见，通过实施该可选的实施方式，可以确定待预测区域的区域特征参数，并结合区域特征参数以更精确地预测待预测区域在目标时间段的真实人群数量，后续能够基于此实现高效率且低成本地对区域的真实人群数量进行预估。
94.作为一个可选的实施方式，在上述步骤中的，确定待预测区域的区域特征参数，包括：
95.确定待预测区域的所在位置周围的多个目标设施；
96.确定待预测区域的所在位置与任一目标设施的距离参数；
97.将所有目标设施对应的距离参数确定为待预测区域的区域周边设施特征。
98.在一个具体的实施方式中，待预测区域可以为店铺或设施。可选的，待预测区域对应的目标设施，可以为待预测区域所在位置的第一距离范围内的商业设施，例如商场或写字楼，如服装、百货、建材、装饰材料大市场或者综合性大商场，或其他大型的餐饮、娱乐、休闲设施，商业广场以及商业街等标志性的与民众生活密切相关的商业设施。
99.可选的，待预测区域的所在位置与任一目标设施的距离参数，可以包括直线距离或可步行距离中的一种或两种。可选的，待预测区域的所在位置与任一目标设施的直线距离可以通过计算待预测区域的所在位置与任一目标设施的所在位置之间的连线的距离来确定。可选的，待预测区域的所在位置与任一目标设施的可步行距离，可以通过以下方式确定：
100.根据预设的区域地图模型，确定出待预测区域的所在位置与任一目标设施的所在位置在区域地图模型之间的步行路径；
101.确定该步行路径的长度，以确定待预测区域的所在位置与任一目标设施的可步行距离。
102.可选的，可以将所有目标设施对应的距离参数的平均值、全部值、最大值和最小值中的至少一种确定为待预测区域的区域周边设施特征。
103.可见，通过该可选的实施方式，可以将所有目标设施对应的距离参数确定为待预测区域的区域周边设施特征，从而合理地确定出区域周边设施特征，有利于后续能够基于此实现高效率且低成本地对区域的真实人群数量进行预估。
104.作为一个可选的实施方式，在上述步骤中的，确定待预测区域的区域特征参数，包括：
105.确定待预测区域的所在位置周围的多个竞品店铺；
106.确定待预测区域的所在位置距离任一竞品店铺的距离参数；
107.将所有竞品店铺对应的距离参数确定为待预测区域的区域周边竞品特征。
108.在一个具体的实施方式中，待预测区域可以为店铺或设施。可选的，待预测区域对应的竞品店铺，可以为待预测区域所在位置周围的竞品店铺，其中，竞品店铺可以为服务领域与待预测区域对应的服务领域有交集的周边店铺，或是上架商品的商品参数与待预测区域对应的预设上架商品的商品参数有交集的周边店铺。可选的，竞品店铺的确定方式可以包括：
109.获取待预测区域所在位置的第二距离范围内的所有店铺；
110.确定任一店铺对应的店铺参数；
111.确定待预测区域对应的店铺参数；店铺参数包括服务领域集合和/或上架商品的商品参数；
112.计算待预测区域对应的店铺参数与任一店铺对应的店铺参数之间的相似度；
113.将与待预测区域对应的店铺参数之间的相似度高于预设的相似度阈值的店铺确定为竞品店铺。
114.可选的，待预测区域的所在位置与任一竞品店铺的距离参数，可以包括直线距离或可步行距离中的一种或两种。可选的，待预测区域的所在位置与任一竞品店铺的直线距离可以通过计算待预测区域的所在位置与任一竞品店铺的所在位置之间的连线的距离来确定。可选的，待预测区域的所在位置与任一竞品店铺的可步行距离，可以通过以下方式确定：
115.根据预设的区域地图模型，确定出待预测区域的所在位置与任一竞品店铺的所在位置在区域地图模型之间的步行路径；
116.确定该步行路径的长度，以确定待预测区域的所在位置与任一竞品店铺的可步行距离。
117.可选的，可以将所有竞品店铺对应的距离参数的平均值、全部值、最大值和最小值中的至少一种确定为待预测区域的区域周边竞品特征。
118.可见，通过该可选的实施方式，可以将所有竞品店铺对应的距离参数确定为待预测区域的区域周边竞品特征，从而合理地确定出区域周边竞品特征，有利于后续能够基于此实现高效率且低成本地对区域的真实人群数量进行预估。
119.作为一个可选的实施方式，回归网络预测模型根据以下步骤被训练得到：
120.确定训练数据集；
121.将训练数据集输入至人群预测训练模型进行训练直至收敛，以得到训练好的回归网络预测模型。
122.可选的，训练数据集包括有多个已知在训练时间段的区域人群数量和通信终端数量的训练区域。优选的，训练数据集包括有多个已知在训练时间段的区域人群数量、区域特征参数和通信终端数量的训练区域，以训练出可以根据区域特征参数和通信终端数量预测出真实人群数量的网络模型。
123.可选的，人群预测训练模型包括回归网络预测模型以及相应的参数优化层。可选的，参数优化层可以包括损失函数计算层和梯度下降优化层，其中损失函数计算层用于计算回归网络预测模型的预测人群数量结果和训练数据的区域人群数量标注之间的差异，而梯度下降优化层用于采用梯度下降方法优化回归网络预测模型的模型参数，以使得损失函数计算层的损失函数值计算结果达到最小，以得到训练好的回归网络预测模型。
124.可选的，回归网络预测模型可以包括线性回归网络模型、多项式回归网络模型、岭回归算法模型、lightgbm回归模型、多层感知器网络模型和卷积神经网络模型中的至少一种。其中，线性回归网络模型或多项式回归网络模型可以用于将上述区域特征参数和通信终端数量进行线性运算/多项式运算得到回归网络模型。其中，可以在数据量较大时采用卷积神经网络模型(cnn)，可以采用一维卷积神经网络。
125.可见，通过实施该可选的实施方式，可以通过将训练数据集输入至人群预测训练模型进行训练直至收敛，以得到训练好的回归网络预测模型，从而能够训练得到可以用于预测出真实人群数量的网络模型，有利于后续能够基于此实现高效率且低成本地对区域的真实人群数量进行预估。
126.实施例二
127.请参阅图2，图2是本发明实施例公开的一种真实人群数量预测装置的结构示意图。其中，图2所描述的真实人群数量预测装置应用于人群数量预测系统的预测芯片、预测终端或预测服务器(其中，该预测服务器可以为本地服务器或云服务器)中。如图2所示，该真实人群数量预测装置可以包括：
128.确定模块201，用于确定待预测区域在目标时间段的通信终端数量。
129.可选的，通信终端可以为移动终端如手机或平板或笔记本电脑，或是固定终端如台式电脑或服务器。可选的，通信终端数量可以包括基于软件维度感知的终端数量、基于操作系统维度感知的终端数量、基于运营商维度感知的终端数量和基于品牌维度感知的终端数量中的至少一种。
130.可选的，基于软件维度感知的终端数量可以为使用不同手机软件应用的固定终端数量或移动终端数量，这些手机软件应用包括但不限于：百度视频、网易音乐、腾讯视频、微信等软件应用。可选的，基于操作系统维度感知的终端数量可以包括使用不同操作系统的固定终端数量或移动终端数量，这些操作系统包括但不限于：ios，android，鸿蒙系统等操作系统。可选的，基于运营商维度感知的终端数量可以包括使用不同通信运营商的固定终端数量或移动终端数量，这些运营商包括但不限于：中国移动、中国联通、中国电信等运营商。可选的，基于品牌维度感知的终端数量可以包括使用不同品牌的固定终端数量或移动终端数量，这些品牌包括但不限于：苹果，华为，荣耀，魅族，三星，小米，oppo，vivo，一加，锤子等品牌。
131.预测模块202，用于将通信终端数量输入至训练好的回归网络预测模型中，以预测得到待预测区域在目标时间段的真实人群数量。
132.可选的，回归网络预测模型为通过包括有多个已知在训练时间段的区域人群数量和通信终端数量的训练区域的训练数据集训练得到。可选的，训练数据集中的训练区域可以选择具有代表性的区域，这些区域包括但并不限于：典型的居民区、典型的商业区、典型的工业区、典型的教育区、典型的交通枢纽区等区域。
133.可选的，训练数据集中训练区域的区域人群数量可以为运营商或者大数据机构针对训练时间段训练区域的人群统计数据的数据信息。
134.可选的，训练数据集中训练区域的区域人群数量可以为根据训练区域在训练时间段的至少一个运营商的呼叫详细记录确定得到。具体的，呼叫详细记录(call detail records，cdrs)，又称手机通话位置数据，是通信运营商计算营收的一种基本数据。该类数
据记录了手机使用事件(如接打电话，收发短信，或者使用网络)发生时所连接的基站编码与时间。具体的，特定区域内多个运营商的呼叫详细记录，一般可以认为是比较接近真实的人群数量。
135.可选的，区域人群数量为根据训练区域在训练时间段的多个运营商的呼叫详细记录的总和确定得到，例如可以通过购买多个运营商在训练区域在训练时间段的呼叫详细记录并进行相加计算，以得到区域人群数量。
136.可选的，区域人群数量可以为根据训练区域在训练时间段的目标运营商的呼叫详细记录以及目标运营商对应的占比参数确定得到，具体的，占比参数用于指示目标运营商的呼叫详细记录占所有运营商的呼叫详细记录总和的比例。可选的，区域人群数量可以等于训练区域在训练时间段的目标运营商的呼叫详细记录与占比参数的乘积。可选的，占比参数可以通过统计目标运营商在历史时间段内在多个区域的呼叫详细记录占所有运营商的呼叫详细记录总和的比例来得到。
137.可选的，目标运营商可以包括有多个目标运营商，此时，可以根据训练区域在训练时间段的多个目标运营商的呼叫详细记录乘以每一目标运营商对应的占比参数，以得到多个参考区域人群数量。可选的，区域人群数量可以根据多个参考区域人群数量计算得到，例如计算多个参考区域人群数量的加权平均数。可选的，可以将多个参考区域人群数量中偏移较大的值去掉后再计算加权平均数，以得到区域人群数量，其中偏移较大的值可以根据每一参考区域人群数量与多个参考区域人群数量的平均数之间的差值来确定。
138.可见，上述发明实施例能够根据区域的通信终端数量，结合回归网络模型对区域的真实人群数量进行预测，从而能够实现高效率且低成本地对区域的真实人群数量进行预估，后续可以便于利用区域的人群数量进行进一步的数据分析操作。
139.作为一个可选的实施方式，确定模块201确定待预测区域在目标时间段的通信终端数量，包括：
140.获取感知设备在目标时间段内在待预测区域感知到的设备通信信息；
141.根据设备通信信息，确定待预测区域在目标时间段的通信终端数量。
142.可选的，感知设备可以包括无线ap，蓝牙设备，无线探针设备以及其他具有设备感知功能的物联网设备中的至少一种。可选的，设备通信信息中可以包括设备的软件信息、操作系统信息、通信运营商信息和设备品牌信息中的至少一种，以便于后续用于统计出不同感知维度的通信终端数量。
143.可见，通过实施该可选的实施方式，可以根据感知设备在目标时间段内在待预测区域感知到的设备通信信息，确定待预测区域在目标时间段的通信终端数量，从而能够准确确定出待预测区域在目标时间段的通信终端数量，后续能够基于此实现高效率且低成本地对区域的真实人群数量进行预估。
144.作为一个可选的实施方式，确定模块201还用于确定待预测区域的区域特征参数。
145.可选的，区域特征参数可以包括区域物理特征、区域行政级别特征、区域周边设施特征和区域周边竞品特征中的至少一种。可选的，区域物理特征可以包括区域的面积和/或区域的形状。可选的，区域行政级别特征可以为区域的行政级别特征，例如区域所在城市的行政级别，这可以用于表征区域的城市级别，并进一步可以用于表征区域的人口特点。
146.可选的，区域周边设施特征可以包括区域周边设施的数量和/或区域周边设施与
区域位置之间的距离参数。可选的，区域周边设施可以为poi(point of interest，兴趣点)或aoi(area of interest，兴趣面)，其类型包括但不限于：运动休闲、餐饮、生活服务、科教文化、购物、交通出行、国家政府、住宿、企业商务、健康医疗/保健、公共设施等。
147.可选的，区域周边竞品特征可以包括区域周边竞品店铺的数量和/或区域周边竞品店铺与区域位置之间的距离参数。可选的，距离参数可以包括直接距离、平均距离、最大距离和最小距离中的至少一种。
148.预测模块202将通信终端数量输入至训练好的回归网络预测模型中，以预测得到出待预测区域在目标时间段的真实人群数量的具体方式，包括：
149.将通信终端数量和区域特征参数输入至训练好的回归网络预测模型中，以预测得到出待预测区域在目标时间段的真实人群数量。
150.可选的，回归网络预测模型为通过包括有多个已知在训练时间段的区域人群数量、区域特征参数和通信终端数量的训练区域的训练数据集训练得到。
151.可见，通过实施该可选的实施方式，可以确定待预测区域的区域特征参数，并结合区域特征参数以更精确地预测待预测区域在目标时间段的真实人群数量，后续能够基于此实现高效率且低成本地对区域的真实人群数量进行预估。
152.作为一个可选的实施方式，确定模块201确定待预测区域的区域特征参数的具体方式，包括：
153.确定待预测区域的所在位置周围的多个目标设施；
154.确定待预测区域的所在位置与任一目标设施的距离参数；
155.将所有目标设施对应的距离参数确定为待预测区域的区域周边设施特征。
156.在一个具体的实施方式中，待预测区域可以为店铺或设施。可选的，待预测区域对应的目标设施，可以为待预测区域所在位置的第一距离范围内的商业设施，例如商场或写字楼，如服装、百货、建材、装饰材料大市场或者综合性大商场，或其他大型的餐饮、娱乐、休闲设施，商业广场以及商业街等标志性的与民众生活密切相关的商业设施。
157.可选的，待预测区域的所在位置与任一目标设施的距离参数，可以包括直线距离或可步行距离中的一种或两种。可选的，待预测区域的所在位置与任一目标设施的直线距离可以通过计算待预测区域的所在位置与任一目标设施的所在位置之间的连线的距离来确定。可选的，待预测区域的所在位置与任一目标设施的可步行距离，可以通过以下方式确定：
158.根据预设的区域地图模型，确定出待预测区域的所在位置与任一目标设施的所在位置在区域地图模型之间的步行路径；
159.确定该步行路径的长度，以确定待预测区域的所在位置与任一目标设施的可步行距离。
160.可选的，可以将所有目标设施对应的距离参数的平均值、全部值、最大值和最小值中的至少一种确定为待预测区域的区域周边设施特征。
161.可见，通过该可选的实施方式，可以将所有目标设施对应的距离参数确定为待预测区域的区域周边设施特征，从而合理地确定出区域周边设施特征，有利于后续能够基于此实现高效率且低成本地对区域的真实人群数量进行预估。
162.作为一个可选的实施方式，确定模块201确定待预测区域的区域特征参数的具体
方式，包括：
163.确定待预测区域的所在位置周围的多个竞品店铺；
164.确定待预测区域的所在位置距离任一竞品店铺的距离参数；
165.将所有竞品店铺对应的距离参数确定为待预测区域的区域周边竞品特征。
166.在一个具体的实施方式中，待预测区域可以为店铺或设施。可选的，待预测区域对应的竞品店铺，可以为待预测区域所在位置周围的竞品店铺，其中，竞品店铺可以为服务领域与待预测区域对应的服务领域有交集的周边店铺，或是上架商品的商品参数与待预测区域对应的预设上架商品的商品参数有交集的周边店铺。可选的，竞品店铺的确定方式可以包括：
167.获取待预测区域所在位置的第二距离范围内的所有店铺；
168.确定任一店铺对应的店铺参数；
169.确定待预测区域对应的店铺参数；店铺参数包括服务领域集合和/或上架商品的商品参数；
170.计算待预测区域对应的店铺参数与任一店铺对应的店铺参数之间的相似度；
171.将与待预测区域对应的店铺参数之间的相似度高于预设的相似度阈值的店铺确定为竞品店铺。
172.可选的，待预测区域的所在位置与任一竞品店铺的距离参数，可以包括直线距离或可步行距离中的一种或两种。可选的，待预测区域的所在位置与任一竞品店铺的直线距离可以通过计算待预测区域的所在位置与任一竞品店铺的所在位置之间的连线的距离来确定。可选的，待预测区域的所在位置与任一竞品店铺的可步行距离，可以通过以下方式确定：
173.根据预设的区域地图模型，确定出待预测区域的所在位置与任一竞品店铺的所在位置在区域地图模型之间的步行路径；
174.确定该步行路径的长度，以确定待预测区域的所在位置与任一竞品店铺的可步行距离。
175.可选的，可以将所有竞品店铺对应的距离参数的平均值、全部值、最大值和最小值中的至少一种确定为待预测区域的区域周边竞品特征。
176.可见，通过该可选的实施方式，可以将所有竞品店铺对应的距离参数确定为待预测区域的区域周边竞品特征，从而合理地确定出区域周边竞品特征，有利于后续能够基于此实现高效率且低成本地对区域的真实人群数量进行预估。
177.作为一个可选的实施方式，该装置还包括训练模块，训练模块用于执行以下步骤训练得到回归网络预测模型：
178.确定训练数据集；
179.将训练数据集输入至人群预测训练模型进行训练直至收敛，以得到训练好的回归网络预测模型。
180.可选的，训练数据集包括有多个已知在训练时间段的区域人群数量和通信终端数量的训练区域。优选的，训练数据集包括有多个已知在训练时间段的区域人群数量、区域特征参数和通信终端数量的训练区域，以训练出可以根据区域特征参数和通信终端数量预测出真实人群数量的网络模型。
181.可选的，人群预测训练模型包括回归网络预测模型以及相应的参数优化层。可选的，参数优化层可以包括损失函数计算层和梯度下降优化层，其中损失函数计算层用于计算回归网络预测模型的预测人群数量结果和训练数据的区域人群数量标注之间的差异，而梯度下降优化层用于采用梯度下降方法优化回归网络预测模型的模型参数，以使得损失函数计算层的损失函数值计算结果达到最小，以得到训练好的回归网络预测模型。
182.可选的，回归网络预测模型可以包括线性回归网络模型、多项式回归网络模型、岭回归算法模型、lightgbm回归模型、多层感知器网络模型和卷积神经网络模型中的至少一种。其中，线性回归网络模型或多项式回归网络模型可以用于将上述区域特征参数和通信终端数量进行线性运算/多项式运算得到回归网络模型。其中，可以在数据量较大时采用卷积神经网络模型(cnn)，可以采用一维卷积神经网络。
183.可见，通过实施该可选的实施方式，可以通过将训练数据集输入至人群预测训练模型进行训练直至收敛，以得到训练好的回归网络预测模型，从而能够训练得到可以用于预测出真实人群数量的网络模型，有利于后续能够基于此实现高效率且低成本地对区域的真实人群数量进行预估。
184.实施例三
185.请参阅图3，图3是本发明实施例公开的又一种真实人群数量预测装置。图3所描述的真实人群数量预测装置应用于人群数量预测系统的预测芯片、预测终端或预测服务器(其中，该预测服务器可以为本地服务器或云服务器)中。如图3所示，该真实人群数量预测装置可以包括：
186.存储有可执行程序代码的存储器301；
187.与存储器301耦合的处理器302；
188.其中，处理器302调用存储器301中存储的可执行程序代码，用于执行实施例一或实施例二所描述的真实人群数量预测方法的步骤。
189.实施例四
190.本发明实施例公开了一种计算机读存储介质，其存储用于电子数据交换的计算机程序，其中，该计算机程序使得计算机执行实施例一或实施例二所描述的真实人群数量预测方法的步骤。
191.实施例五
192.本发明实施例公开了一种计算机程序产品，该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，且该计算机程序可操作来使计算机执行实施例一或实施例二所描述的真实人群数量预测方法的步骤。
193.上述对本说明书特定实施例进行了描述，其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，附图中描绘的过程不一定必须按照示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
194.本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备、非易失性计算机可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述
的比较简单，相关之处参见方法实施例的部分说明即可。
195.本说明书实施例提供的装置、设备、非易失性计算机可读存储介质与方法是对应的，因此，装置、设备、非易失性计算机存储介质也具有与对应方法类似的有益技术效果，由于上面已经对方法的有益技术效果进行了详细说明，因此，这里不再赘述对应装置、设备、非易失性计算机存储介质的有益技术效果。
196.在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(programmable logic device,pld)(例如现场可编程门阵列(field programmable gatearray，fpga))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(hardware description language，hdl)，而hdl也并非仅有一种，而是有许多种，如abel(advanced boolean expression language)、ahdl(altera hardware descriptionlanguage)、confluence、cupl(cornell university programming language)、hdcal、jhdl(java hardware description language)、lava、lola、myhdl、palasm、rhdl(rubyhardware description language)等，目前最普遍使用的是vhdl(very-high-speedintegrated circuit hardware description language)与verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。
197.控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit，asic)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：arc 625d、atmel at91sam、microchip pic18f26k20以及silicone labs c8051f320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
198.上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何
设备的组合。
199.为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
200.本领域内的技术人员应明白，本说明书实施例可提供为方法、系统、或计算机程序产品。因此，本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
201.本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
202.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
203.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
204.在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
205.内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
206.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。
207.还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要
素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
208.本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
209.本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
210.最后应说明的是：本发明实施例公开的一种真实人群数量预测方法及装置所揭露的仅为本发明较佳实施例而已，仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各项实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于人工智能的精算临分方法、装置、设备及存储介质与流程

真实人群数量预测方法及装置与流程

相关文献

最热文献