基于神经网络的移动通信用户时空分布预测方法及装置与流程

2022-07-10 12:44:42 来源：中国专利 TAG：

1.本发明涉及移动通信领域，特别是涉及一种基于神经网络的移动通信用户时空分布预测方法及装置。

背景技术：

2.随着5g移动通信的发展和无线网络智能化的演进，衍生出各种各样的新型业务需求，准确预测移动用户随时间变化的分布情况在5g项目应用中起到十分重要的作用，比如在大规模天线技术的波束自优化中，需要根据移动用户迁移的预测聚合进行天线权值自适应调整。
3.然而预测随着时间变化的移动用户分布，受到各方面的影响，预测难度很大。传统的基于时间序列的移动用户分布预测算法，不能和外部特征结合，只使用移动用户分布本身特征，使得算法预测准确率较低，且复用性不高。

技术实现要素：

4.本发明实施例的目的在于提供一种基于神经网络的移动通信用户时空分布预测方法及装置，以实现提高移动通信用户的时空分布预测准确度。
5.具体技术方案如下：
6.为实现上述目的，本发明实施例提供了一种基于神经网络的移动通信用户时空分布预测方法，所述方法包括：
7.获取在第一时段内各个子时段采集的目标栅格和该目标栅格的外围栅格的栅格数据、以及与所述目标栅格相关的外部指标数据，其中，所述栅格数据包括栅格内地理指标数据和移动用户通信数据；
8.将所述栅格数据和所述外部指标数据输入预先训练的预测模型，得到所述目标栅格在所述第一时段之后的预测时段内各个子时段的预测用户数目；其中，所述预测模型是根据预先采集的历史时段内各个子时段的样本栅格的栅格数据、外部指标数据训练的。
9.可选的，所述栅格内地理指标数据包括室内栅格占比和/或道路栅格占比；
10.所述移动用户通信数据包括以下一种或多种：用户总数、运动态用户数、静止态用户数、通信流量总和、服务小区切换次数、参考信号接收功率和/或信号与干扰加噪声比；
11.所述外部指标数据包括以下一种或多种：时间点因子、节假日因子、突发事件因子和区域发展因子。
12.可选的，所述预测模型包含预设数目个子模型，所述预设数目等同于所述第一时段内子时段数目，每个子模型对应一个子时段；每个子模型包含卷积神经网络cnn、循环神经网络rnn和支持向量回归模型svr；各个子时段对应的子模型的rnn网络的输出和svr模型的输出均连接下一子时段对应的子模型的rnn网络的输入，且最终子时段对应的子模型中svr模型的输出层大小等同于所述预测时段内子时段数目。
13.可选的，所述将所述栅格数据和所述外部指标数据输入预先训练的预测模型，得
到所述目标栅格在所述第一时段之后的预测时段内各个子时段的预测用户数目，包括：
14.将各个子时段的栅格数据输入该子时段对应的子模型中的cnn网络，得到栅格特征数据，将所述栅格特征数据、该子时段的外部指标数据、上一子时段对应的子模型中rnn网络的输出以及上一子时段对应的子模型中svr模型的输出拼接，并依次输入该子时段对应的子模型中的rnn网络、全连接层和svr模型，直到得到最终子时段对应的子模型的svr模型的输出层结果，其中，所述输出层的输出结果为所述预测时段内各个子时段的预测用户数目。
15.可选的，基于如下损失函数训练所述预测模型：
[0016][0017]
其中，l(x,θ)表示损失函数，x表示输入的样本特征数据，包括栅格数据和外部指标数据，θ表示模型参数，c表示模型惩罚系数，表示真实用户数量，f(θ.xi)表示模型输出，δ表示松弛因子，i表示样本标号，n表示模型输入的样本总数，表示模型参数数目，θi表示第i个模型参数。
[0018]
可选的，所述预测模型还包括域分类器；所述方法还包括：
[0019]
获取第一样本数据和第二样本数据，其中所述第一样本数据为已学习的栅格数据和外部指标数据，所述第二样本数据为未学习的栅格数据和外部指标数据；
[0020]
分别将所述第一样本数据和所述第二样本数据输入所述预测模型，得到所述预测模型中域分类器的分类结果；
[0021]
根据所述分类结果，以及预先设置的损失函数，确定分类损失值；
[0022]
根据所述分类损失值，按照梯度上升方向调整所述预测模型中的参数，直到分类损失值大于预设阈值。
[0023]
为实现上述目的，本发明实施例还提供了一种基于神经网络的移动通信用户时空分布预测装置，所述装置包括：
[0024]
获取模块，用于获取在第一时段内各个子时段采集的目标栅格和该目标栅格的外围栅格的栅格数据、以及与所述目标栅格相关的外部指标数据，其中，所述栅格数据包括栅格内地理指标数据和移动用户通信数据；
[0025]
预测模块，用于将所述栅格数据和所述外部指标数据输入预先训练的预测模型，得到所述目标栅格在所述第一时段之后的预测时段内各个子时段的预测用户数目；其中，所述预测模型是根据预先采集的历史时段内各个子时段的样本栅格的栅格数据、外部指标数据训练的。
[0026]
可选的，所述栅格内地理指标数据包括室内栅格占比和/或道路栅格占比；
[0027]
所述移动用户通信数据包括以下一种或多种：用户总数、运动态用户数、静止态用户数、通信流量总和、服务小区切换次数、参考信号接收功率和/或信号与干扰加噪声比；
[0028]
所述外部指标数据包括以下一种或多种：时间点因子、节假日因子、突发事件因子和区域发展因子。
[0029]
可选的，所述预测模型包含预设数目个子模型，所述预设数目等同于所述第一时
段内子时段数目，每个子模型对应一个子时段；每个子模型包含卷积神经网络cnn、循环神经网络rnn和支持向量回归模型svr；各个子时段对应的子模型的rnn网络的输出和svr模型的输出均连接下一子时段对应的子模型的rnn网络的输入，且最终子时段对应的子模型中svr模型的输出层大小等同于所述预测时段内子时段数目。
[0030]
可选的，所述预测装置，具体用于：将各个子时段的栅格数据输入该子时段对应的子模型中的cnn网络，得到栅格特征数据，将所述栅格特征数据、该子时段的外部指标数据、上一子时段对应的子模型中rnn网络的输出以及上一子时段对应的子模型中svr模型的输出拼接，并依次输入该子时段对应的子模型中的rnn网络、全连接层和svr模型，直到得到最终子时段对应的子模型的svr模型的输出层结果，其中，所述输出层的输出结果为所述预测时段内各个子时段的预测用户数目。
[0031]
可选的，所述装置还包括第一训练模块，所述第一训练模块用于：
[0032]
基于如下损失函数训练所述预测模型：
[0033][0034]
其中，l(x,θ)表示损失函数，x表示输入的样本特征数据，包括栅格数据和外部指标数据，θ表示模型参数，c表示模型惩罚系数，表示真实用户数量，f(θ.xi)表示模型输出，δ表示松弛因子，i表示样本标号，n表示模型输入的样本总数，m表示模型参数数目，θi表示第i个模型参数。
[0035]
可选的，所述预测模型还包括域分类器；所述装置还包括第二训练模块，所述第二训练模块用于：
[0036]
获取第一样本数据和第二样本数据，其中所述第一样本数据为已学习的栅格数据和外部指标数据，所述第二样本数据为未学习的栅格数据和外部指标数据；
[0037]
分别将所述第一样本数据和所述第二样本数据输入所述预测模型，得到所述预测模型中域分类器的分类结果；
[0038]
根据所述分类结果，以及预先设置的损失函数，确定分类损失值；
[0039]
根据所述分类损失值，按照梯度上升方向调整所述预测模型中的参数，直到分类损失值大于预设阈值。
[0040]
为实现上述目的，本发明实施例还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；
[0041]
存储器，用于存放计算机程序；
[0042]
处理器，用于执行存储器上所存放的程序时，实现上述任一方法步骤。
[0043]
为实现上述目的，本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一方法步骤。
[0044]
本发明实施例有益效果：
[0045]
采用本发明实施例提供的基于神经网络的移动通信用户时空分布预测方法及装置，以目标栅格为中心，定义了外围环绕形式的邻近栅格，并采集针对目标栅格的第一时段
内栅格内地理指标数据和移动用户通信数据，并结合外部指标数据输入预先训练的预测模型，得到第一时段之后预测时段的预测用户数目。可见，能够有效结合多种特征数据，可以涵盖各种复杂场景，提高移动通信用户分布预测的准确度，并且能够实现较高的模型复用性。
[0046]
当然，实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
[0047]
为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的实施例。
[0048]
图1为本发明实施例提供的基于神经网络的移动通信用户时空分布预测方法的一种流程示意图；
[0049]
图2为本发明实施例提供的栅格区域的一种示意图；
[0050]
图3为本发明实施例提供的预测模型的一种示意图；
[0051]
图4为本发明实施例提供的预测模型优化方法的一种流程示意图；
[0052]
图5为本发明实施例提供的基于神经网络的移动通信用户时空分布预测装置的一种结构示意图；
[0053]
图6为本发明实施例提供的电子设备的一种结构示意图。
具体实施方式
[0054]
本发明实施例中术语“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
[0055]
本技术实施例中术语“多个”是指两个或两个以上，其它量词与之类似。
[0056]
下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，并不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
[0057]
本技术实施例提供的技术方案可以适用于多种系统，尤其是5g系统。例如适用的系统可以是全球移动通讯(global system of mobile communication，gsm)系统、码分多址(code division multiple access，cdma)系统、宽带码分多址(wideband code division multiple access，wcdma)通用分组无线业务(general packet radio service，gprs)系统、长期演进(long term evolution，lte)系统、lte频分双工(frequency division duplex，fdd)系统、lte时分双工(time division duplex，tdd)系统、高级长期演进(long term evolution advanced，lte-a)系统、通用移动系统(universal mobile telecommunication system，umts)、全球互联微波接入(worldwide interoperability for microwave access，wimax)系统、5g新空口(new radio,nr)系统等。这多种系统中均包
括终端设备和网络设备。系统中还可以包括核心网部分，例如演进的分组系统(evloved packet system,eps)、5g系统(5gs)等。
[0058]
具体的，和4g通信时代相比，5g基站规划具有在空间分布上更加密集、基站电力功耗更大、波束覆盖范围更小等特点。5g通信应用的这些特点衍生出了各种各样的新需求，如果能够准确预测出移动通信用户的时空分布，在5g massivemimo大规模天线波束权值规划中，就能实现5g波束随着移动通信用户的时空变化而变化这将大大提高5g基站的服务效率。且在基站节能领域，紧密结合移动通信用户的时空分布，就能够实现5g基站的能动协调，从而达到降低不必要电力能源消耗的目的。所以本发明实施例在新的5g通信时代应用场景广大。
[0059]
而传统的基于时间序列的移动用户分布预测算法，不能和外部特征结合，只使用移动用户分布本身特征，使得算法预测准确率较低，且复用性不高。
[0060]
为了解决传统的基于时间序列的移动用户分布预测算法误差较大，预测准确度较低的技术问题，本发明实施例提供了一种基于神经网络的移动通信用户时空分布预测方法及装置。
[0061]
参见图1，图1为本发明实施例提供的基于神经网络的移动通信用户时空分布预测方法的一种流程示意图，该方法可以应用于基站，方法包括以下步骤：
[0062]
s101：获取在第一时段内各个子时段采集的目标栅格和该目标栅格的外围栅格的栅格数据、以及与目标栅格相关的外部指标数据，其中，栅格数据包括栅格内地理指标数据和移动用户通信数据。
[0063]
本发明实施例中，为了便于预测移动通信用户时空分布，可以将地理区域划分为栅格区域，栅格区域可以是正方形或长方形的地理区域。栅格区域的大小可以根据不同应用场景及业务需求进行设置。
[0064]
作为一个示例，参见图2，可以以50米为边长设置栅格区域。其中，正中间的栅格记为目标栅格，即图2所示中颜色最深的栅格。目标栅格的第一圈外围栅格包含8个栅格，目标栅格的第二圈外围栅格包含16个栅格，以此类推。外围栅格的圈数也可以根据需求进行设定，例如设置5圈外围栅格。
[0065]
本发明实施例中，可以采集目标栅格和该目标栅格的外围栅格的栅格数据，这些栅格数据可以包括栅格内地理指标数据和移动用户通信数据。其中，每一圈外围栅格包含的各个栅格的数据可以取均值，作为该圈外围栅格的栅格数据。
[0066]
在本发明的一种实施例中，栅格内地理指标数据包括室内栅格占比和/或道路栅格占比；移动用户通信数据包括以下一种或多种：用户总数、运动态用户数、静止态用户数、通信流量总和、服务小区切换次数、参考信号接收功率和/或信号与干扰加噪声比。
[0067]
其中，室内栅格占比表示栅格区域内建筑物的面积占比，道路栅格占比表示栅格区域内道路的面积占比，用户总数表示栅格区域内移动通信用户的总数目，运动态用户数表示栅格区域内处于相对运动状态的用户数目，静止态用户数表示栅格区域内处于相对静止状态的用户数目，通信流量总和表示栅格区域内用户采用终端进行通信产生的流量总和，服务小区切换次数表示栅格区域内用户采用终端进行服务小区切换的总次数，参考信号接收功率即rsrp，英文全称为reference signal receiving power，是网络中可以代表无线信号强度的关键参数，通常指在某个符号内承载参考信号的所有资源粒子上接收到的
信号功率的平均值。信号与干扰加噪声比即sinr，英文全称为signal to interference plus noise ratio，通常指接收到的有用信号的强度与接收到的干扰信号的强度的比值。
[0068]
容易理解的，用户数目也可以理解为用户所使用的移动终端的数目。
[0069]
具体的，可以根据建筑物地图等信息确定栅格区域内的室内占比和道路占比，通过基站收集移动通信用户的服务小区切换次数、参考信号接收功率等。
[0070]
本发明实施例中，可以获取上述目标栅格和该目标栅格的外围栅格的上述每种栅格数据及方差，则上例中，可以获取(1 5)
×
(9
×
2)的栅格数据，进而可以用6
×
18的矩阵来表示。
[0071]
此外，由于移动通信用户的分布也与时间点、节假日、突发事件等相关，还可以采集与目标栅格相关的外部指标数据。外部指标数据可以包括时间点因子、节假日因子、突发事件因子和区域发展因子。
[0072]
其中，突发事件因子可以表示突发事件对移动通信用户带来的影响，影响可以包括聚集效应和分散效应。可以定义突发事件因子在-1到1之间，负数表示分散效应，正数表示聚集效应，影响因子的绝对值越大表示影响程度越大。
[0073]
区域发展因子可以表示目标栅格所处区域的发展指标，可以以政府统计的指标为标准进行计算，取值可以根据需求设置，例如在0.6到1.4之间。
[0074]
节假日因子可以表示节假日对移动通信用户带来的影响，可以根据节假日的影响程度设置不同取值，例如春节的影响程度较高，对应的节假日因子可以较大。
[0075]
时间点因子用来表征在日、星期、月、年等周期上的规律，对时间刻度数据在不同周期上进行0-1标准化。作为一个示例，时间点因子可以包括日周期因子、星期周期因子、月周期因子、年周期因子。日周期因子用于表示一天内的时刻，例如越靠近24时，则日周期因子越大；相应的，星期周期因子用于表示一周内的星期，例如越靠近周日，则星期周期因子越大；月周期因子用于表示一月内的日期大小，例如越靠近月末，则月周期因子越大；年周期因子用于表示一年内的月份大小，例如越靠近年末，则年周期因子越大。
[0076]
本发明实施例中，可以根据实际需求设置子时段的时长，例如每个子时段为一个小时。则上述栅格数据均是针对每个子时段的，也就是说，在第一时段内的每个子时段，都采集得到6
×
18矩阵形式的栅格数据。具体的，可以在子时段内多次采集并取均值，作为该子时段的栅格数据。
[0077]
上述第一时段表示预测时段之前的时段。举例来讲，如果需要预测12月8号每个小时的用户数目，则预测时段为12月8号，第一时段可以是预测时段的前一周，即12月1号到12月7号。由于子时段为一个小时，因此获取的第一时段内采集的栅格数据和外部指标数据均可以为24
×
7＝168份。
[0078]
上述仅作为示例，子时段时长、预测时段时长和第一时段时长均可以根据实际需求进行设定，不做限定。此外，为了便于说明，下文中均沿用上述示例。
[0079]
s102：将栅格数据和外部指标数据输入预先训练的预测模型，得到目标栅格在第一时段之后的预测时段内各个子时段的预测用户数目；其中，预测模型是根据预先采集的历史时段内各个子时段的样本栅格的栅格数据、外部指标数据训练的。
[0080]
在本发明的一种实施例中，预测模型可以包含预设数目个子模型，预设数目等同于第一时段内子时段数目，每个子模型对应一个子时段，每个子模型包含卷积神经网络
(convolutional neural networks，cnn)、循环神经网络(recurrent neural network，rnn)和支持向量回归模型(support vector regression，svr)。
[0081]
并且，除最终子时段之外的其他各个子时段对应的子模型的rnn网络的输出和svr模型的输出均连接下一子时段对应的子模型的rnn网络的输入，最终子时段对应的子模型的svr模型的输出层大小等同于预测时段内子时段数目。
[0082]
为了便于理解，参见图3，图3为本发明实施例提供的预测模型的一种示意图，如图3所示，每个子时段对应一个子模型，也就是说，各个子时段的栅格数据以及外部指标数据均输入该子时段对应的子模型中。
[0083]
承接上例，第一时段为12月1号到12月7号，每个子时段为一个小时，则共有24
×
7＝168个子时段，每个子时段对应一个子模型。
[0084]
并且，第一子时段对应的子模型的rnn网络的输出和svr模型的输出均连接第二子时段对应的子模型，作为第二子时段对应的子模型的rnn网络的输入，第二子时段对应的子模型的rnn网络的输入还包括第二子时段的栅格数据经过cnn网络进行特征提取后得到的栅格特征数据以及第二子时段的外部指标数据；相应的，第二子时段对应的子模型的rnn网络的输出和svr模型的输出均连接第三子时段对应的子模型，作为第三子时段对应的子模型的rnn网络的输入，第三子时段对应的子模型的rnn网络的输入还包括第三子时段的栅格数据经过cnn网络进行特征提取后得到的栅格特征数据以及第三子时段的外部指标数据；以此类推。
[0085]
最终子时段对应的子模型中svr模型的输出层输出预测结果，输出层大小等同于预测时段内子时段数目，输出结果为预测时段内各个子时段的预测用户数目。
[0086]
承接上例，预测时段为12月8号，共包含24个子时段，因此输出层大小预先设置为24，输出结果为12月8号每个小时的用户数目的预测值。
[0087]
本发明实施例中，可以根据实际需求设置rnn网络、全连接层以及svr模型的大小，例如，rnn网络可以设置为包含存储单元内部结构为门控循环单元(gated recurrent unit，gru)的中间隐藏层memory网络，隐藏层分为3层，大小依次可以设置为100,64和32。全连接层大小为128，
[0088]
svr层大小为64，可以采用径向基核函数，并在svr层加入dropout。
[0089]
其中添加dropout是为了提高模型的泛化能力，具体为：在前向传播过程，让某个神经元的激活值以预设的概率停止工作，使得模型训练不过于依赖局部特征。
[0090]
上述仅作为示例，在实际应用中，可以根据需求设置网络中各层大小，对此不做限定。
[0091]
在本发明的一种实施例中，上述步骤s102中：将栅格数据和外部指标数据输入预先训练的预测模型，得到目标栅格在第一时段之后的预测时段内各个子时段的预测用户数目，具体可以包括：
[0092]
将各个子时段的栅格数据输入该子时段对应的子模型中的cnn网络，得到栅格特征数据，将栅格特征数据、该子时段的外部指标数据、上一子时段对应的子模型中rnn网络的输出以及上一子时段对应的子模型中svr模型的输出拼接，并依次输入该子时段对应的子模型中的rnn网络、全连接层和svr模型，直到得到最终子时段对应的子模型的svr模型的输出层结果，其中，输出层的输出结果为预测时段内各个子时段的预测用户数目。
[0093]
具体的，可以参见图3，每个子时段的栅格数据、外部指标数据输入该子时段对应的子模型中，并且，将该子时段的栅格特征数据、外部指标数据、上一子时段对应的子模型中rnn网络的输出以及上一子时段对应的子模型中svr模型的输出进行拼接，并输入该子时段对应子模型的rnn网络中，rnn网络的输出作为全连接层的输入，全连接层的输出作为svr网络的输入。同样的，该子时段对应子模型中rnn网络的输出和svr网络的输出均作为下一子时段对应子模型中rnn网络的部分输入，以此类推，直到最终子时段对应的子模型中svr模型的输出层输出预测结果，预测结果是预测时段内各个子时段的预测用户数目。
[0094]
采用本发明实施例提供的基于神经网络的移动通信用户时空分布预测方法及装置，以目标栅格为中心，定义了外围环绕形式的邻近栅格，并采集针对目标栅格的第一时段内栅格内地理指标数据和移动用户通信数据，并结合外部指标数据输入预先训练的预测模型，得到第一时段之后预测时段的预测用户数目。可见，能够有效结合多种特征数据，可以涵盖各种复杂场景，提高移动通信用户分布预测的准确度，并且能够实现较高的模型复用性。
[0095]
下面对预测模型的训练过程进行介绍。
[0096]
本发明实施例中，可以预先采集历史时段内各个子时段的样本栅格的栅格数据、外部指标数据，用于训练预测模型。
[0097]
其中，历史时段可以是预测时段之前较长的一个时段，例如10月1号至11月30号。此外，样本栅格及其外围栅格的设置方式可以与上文中目标栅格及其外围栅格的设置方式相同。
[0098]
本发明实施例中，可以采用与上文中相同的方法采集历史时段内各个子时段的样本栅格的栅格数据、外部指标数据，作为训练样本。
[0099]
本发明实施例中，可以根据实际需求搭建图3所示的神经网络模型，并初始化神经网络模型中的参数。
[0100]
例如，承接上例，预测模型的实际需求是：根据前一周的数据预测未来一天的用户数目，即第一时段为一周，包含的子时段为24
×
7，则搭建的神经网络模型中可以设置24
×
7个子模型，每个子模型包含cnn网络、rnn网络和svr模型。所要预测的预测时段为一天，包含子时段24个，则设置最终子时段的输出层大小为24。
[0101]
进而，在训练阶段，每次输入连续的一周内采集的数据，对应的真实值为这一周的后一天中各子时段的真实用户数目。
[0102]
举例来讲，10月1日至10月7日对应的栅格数据和外部指标数据作为训练阶段的一份样本数据，对应的真实值为10月8号采集的各个子时段的用户真实数目。
[0103]
进而，对历史时段按24
×
7个子时段为周期进行切分，即可得到大量的样本数据。
[0104]
本发明实施例中，在搭建网络模型之后，可以利用easy encoder算法对各隐藏层参数进行设置，以提高训练速度并降低训练难度。
[0105]
本发明实施例中，可以设置损失函数，计算损失值，进而根据损失值调整神经网络模型中参数，直到神经网络模型收敛。其中，各个子模型可以共享参数，即根据损失值调整参数时，每个子模型的参数都是相同的。
[0106]
在本发明的一种实施例中，损失函数可以是：
[0107][0108]
其中，l(x,θ)表示损失函数，第一部分表示误差项，第二部分表示正则项，x表示输入的样本特征数据，包括栅格数据和外部指标数据，θ表示模型参数，c表示模型惩罚系数，表示真实用户数量，f(θ.xi)表示模型输出，δ表示松弛因子，可以设置在0.01-0.1之间。i表示样本标号，n表示模型输入的样本总数，m表示模型参数数目，θi表示第i个模型参数。
[0109]
本发明实施例中，可以通过调整模型惩罚系数c来权衡误差项和正则项的权重。此外，还可以设置迭代次数，学习率，下降方法，dropout比例等参数。
[0110]
本发明实施例中，当迭代次数达到预设次数，或损失值下降到预设范围内，可以认为预测模型训练完成。
[0111]
在本发明的一种实施例中，为了进一步提高模型泛化能力，还可以设置一个域分类器，该域分类器用于预测输入的样本数据是已学习的，或是未学习的。
[0112]
本发明实施例中，已学习的样本数据表示之前已经输入过模型，并用于训练模型的栅格数据和外部指标数据，记为第一样本数据；未学习的样本数据表示之前未输入过模型的栅格数据和外部指标数据，记为第二样本数据。
[0113]
如果深度神经网络模型能够准确的区分输入的数据是已学习的数据，或未学习的数据，表示深度神经网络模型提取到的中间特征在已知样本和未知样本中分布不一样，这会导致模型的泛化能力不强。
[0114]
为了提高预测模型的泛化能力，可以根据大量的第一样本数据和第二样本数据对预测模型进行进一步训练、优化，具体的，参见图4，对预测模型进行进一步训练、优化的步骤可以包括：
[0115]
s401：获取第一样本数据和第二样本数据，其中第一样本数据为已学习的栅格数据和外部指标数据，第二样本数据为未学习的栅格数据和外部指标数据。
[0116]
如上文，第一样本数据是已经输入过模型，并用于训练模型的栅格数据和外部指标数据；第二样本数据是之前未输入过模型的栅格数据和外部指标数据。
[0117]
本发明实施例中，可以根据实际需求划分第一样本数据和第二样本数据。
[0118]
承接上例，可以将历史时段内10月1日-11月15日采集的栅格数据和外部指标数据均划分为第一样本数据；将历史时段内11月16日-11月30日采集的栅格数据和外部指标数据均划分为第二样本数据。
[0119]
s402：分别将第一样本数据和第二样本数据输入预测模型，得到预测模型中域分类器的分类结果。
[0120]
其中，域分类器的分类结果表示输入的样本数据的类型，即第一样本数据或第二样本数据。具体的，可以采用标签来标注第一样本数据和第二样本数据，例如，第一样本数据的标签为1，第二样本数据的标签为2。
[0121]
本步骤中，可以将第一样本数据和第二样本数据输入预测模型，即可得到预测模
型中域分类器的分类结果。
[0122]
s403：根据分类结果，以及预先设置的损失函数，确定分类损失值。
[0123]
本发明实施例中，可以根据需求设置损失函数，例如采用二分类问题常用的交叉熵损失函数。根据分类结果和损失函数，即可确定分类损失值。
[0124]
s404：根据分类损失值，按照梯度上升方向调整预测模型中的参数，直到损失值大于预设阈值。
[0125]
本发明实施例中，对预测模型进一步训练、优化的目的是使得预测模型中的域分类器不能预测出输入的样本数据的类型，也就是说，无法分辨输入数据属于第一样本数据或第二样本数据。
[0126]
因此，训练的目标是使得损失值大于一定的阈值。
[0127]
本领域技术人员容易理解，通常根据损失值调整模型参数都是基于梯度下降方向，使得损失值降到特定阈值以下，而本发明实施例中，以梯度上升方向调整预测模型中的参数，直到损失值大于预设阈值，完成预测模型的优化。
[0128]
此外，也可以设置最大迭代次数，当达到最大迭代次数时，认为预测模型完成优化。
[0129]
优化后的预测模型不能区分第一样本数据和第二样本数据，表示预测模型提取到的中间特征在已知样本和未知样本上的分布已足够接近，因此即使输入未学习过的数据，也可以实现准确的预测，可见，提高了预测模型的泛化能力。
[0130]
相应于本发明实施例提供的基于神经网络的移动通信用户时空分布预测方法实施例，本发明实施例还提供了一种基于神经网络的移动通信用户时空分布预测装置，参见图5，装置可以包括以下模块：
[0131]
获取模块501，用于获取在第一时段内各个子时段采集的目标栅格和该目标栅格的外围栅格的栅格数据、以及与所述目标栅格相关的外部指标数据，其中，所述栅格数据包括栅格内地理指标数据和移动用户通信数据；
[0132]
预测模块502，用于将栅格数据和外部指标数据输入预先训练的预测模型，得到目标栅格在第一时段之后的预测时段内各个子时段的预测用户数目；其中，预测模型是根据预先采集的历史时段内各个子时段的样本栅格的栅格数据、外部指标数据训练的。
[0133]
在本发明的一种实施例中，栅格内地理指标数据包括室内栅格占比和/或道路栅格占比；
[0134]
移动用户通信数据包括以下一种或多种：用户总数、运动态用户数、静止态用户数、通信流量总和、服务小区切换次数、参考信号接收功率和/或信号与干扰加噪声比；
[0135]
外部指标数据包括以下一种或多种：时间点因子、节假日因子、突发事件因子和区域发展因子。
[0136]
在本发明的一种实施例中，预测模型包含预设数目个子模型，预设数目等同于第一时段内子时段数目，每个子模型对应一个子时段；每个子模型包含卷积神经网络cnn、循环神经网络rnn和支持向量回归模型svr；各个子时段对应的子模型的rnn网络的输出和svr模型的输出均连接下一子时段对应的子模型的rnn网络的输入，且最终子时段对应的子模型中svr模型的输出层大小等同于预测时段内子时段数目；
[0137]
在本发明的一种实施例中，预测装置502，具体用于：将各个子时段的栅格数据输
入该子时段对应的子模型中的cnn网络，得到栅格特征数据，将栅格特征数据、该子时段的外部指标数据、上一子时段对应的子模型中rnn网络的输出以及上一子时段对应的子模型中svr模型的输出拼接，并依次输入该子时段对应的子模型中的rnn网络、全连接层和svr模型，直到得到最终子时段对应的子模型的svr模型的输出层结果，其中，输出层的输出结果为预测时段内各个子时段的预测用户数目。
[0138]
在本发明的一种实施例中，在图5所示装置基础上，还可以包括第一训练模块，第一训练模块用于：
[0139]
基于如下损失函数训练预测模型：
[0140][0141]
其中，l(x,θ)表示损失函数，x表示输入的样本特征数据，包括栅格数据和外部指标数据，θ表示模型参数，c表示模型惩罚系数，表示真实用户数量，f(θ.xi)表示模型输出，δ表示松弛因子，i表示样本标号，n表示模型输入的样本总数，m表示模型参数数目，θi表示第i个模型参数。
[0142]
在本发明的一种实施例中，预测模型还包括域分类器；在图5所示装置基础上，装置还包括第二训练模块，第二训练模块用于：
[0143]
获取第一样本数据和第二样本数据，其中第一样本数据为已学习的栅格数据和外部指标数据，第二样本数据为未学习的栅格数据和外部指标数据；
[0144]
分别将第一样本数据和第二样本数据输入预测模型，得到预测模型中域分类器的分类结果；
[0145]
根据分类结果，以及预先设置的损失函数，确定分类损失值；
[0146]
根据分类损失值，按照梯度上升方向调整预测模型中的参数，直到分类损失值大于预设阈值。
[0147]
采用本发明实施例提供的基于神经网络的移动通信用户时空分布预测方法及装置，以目标栅格为中心，定义了外围环绕形式的邻近栅格，并采集针对目标栅格的第一时段内栅格内地理指标数据和移动用户通信数据，并结合外部指标数据输入预先训练的预测模型，得到第一时段之后预测时段的预测用户数目。可见，能够有效结合多种特征数据，可以涵盖各种复杂场景，提高移动通信用户分布预测的准确度，并且能够实现较高的模型复用性。
[0148]
其中，方法和装置是基于同一申请构思的，由于方法和装置解决问题的原理相似，因此装置和方法的实施可以相互参见，重复之处不再赘述。
[0149]
本发明实施例还提供了一种电子设备，如图6所示，包括处理器601、通信接口602、存储器603和通信总线604，其中，处理器601，通信接口602，存储器603通过通信总线604完成相互间的通信，
[0150]
存储器603，用于存放计算机程序；
[0151]
处理器601，用于执行存储器603上所存放的程序时，实现如下步骤：
[0152]
获取在第一时段内各个子时段采集的目标栅格和该目标栅格的外围栅格的栅格
数据、以及与目标栅格相关的外部指标数据，其中，栅格数据包括栅格内地理指标数据和移动用户通信数据；
[0153]
将栅格数据和外部指标数据输入预先训练的预测模型，得到目标栅格在第一时段之后的预测时段内各个子时段的预测用户数目；其中，预测模型是根据预先采集的历史时段内各个子时段的样本栅格的栅格数据、外部指标数据训练的。
[0154]
上述电子设备提到的通信总线可以是外设部件互连标准(peripheral component interconnect，pci)总线或扩展工业标准结构(extended industry standard architecture，eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
[0155]
通信接口用于上述电子设备与其他设备之间的通信。
[0156]
存储器可以包括随机存取存储器(random access memory，ram)，也可以包括非易失性存储器(non-volatile memory，nvm)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。
[0157]
上述的处理器可以是通用处理器，包括中央处理器(central processing unit，cpu)、网络处理器(network processor，np)等；还可以是数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现场可编程门阵列(field-programmable gate array，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0158]
采用本发明实施例提供的电子设备，以目标栅格为中心，定义了外围环绕形式的邻近栅格，并采集针对目标栅格的第一时段内栅格内地理指标数据和移动用户通信数据，并结合外部指标数据输入预先训练的预测模型，得到第一时段之后预测时段的预测用户数目。可见，能够有效结合多种特征数据，可以涵盖各种复杂场景，提高移动通信用户分布预测的准确度，并且能够实现较高的模型复用性。
[0159]
在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，计算机程序被处理器执行时实现上述任一基于神经网络的移动通信用户时空分布预测方法的步骤。
[0160]
在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一基于神经网络的移动通信用户时空分布预测方法的步骤。
[0161]
在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以
是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质(例如固态硬盘solid state disk(ssd))等。
[0162]
需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0163]
本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于基于神经网络的移动通信用户时空分布预测装置、电子设备、计算机可读存储介质及计算机程序产品实施例而言，由于其基本相似于基于神经网络的移动通信用户时空分布预测方法实施例，所以描述的比较简单，相关之处参见基于神经网络的移动通信用户时空分布预测方法实施例的部分说明即可。
[0164]
以上所述仅为本发明的较佳实施例，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：图像获取方法及装置、电子设备、存储介质与流程

基于神经网络的移动通信用户时空分布预测方法及装置与流程

相关文献

最热文献