一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于矩阵补全的路径损耗数据增强方法及系统

2022-11-09 22:48:42 来源:中国专利 TAG:


1.本发明涉及信息与通信工程技术领域,具体涉及一种基于矩阵补全的路径损耗数据增强方法及系统。


背景技术:

2.随着无线通信技术的快速发展,移动数据流量呈爆发式增长,这对无线通信网络的高质量传输提出了更高要求;为无线通信系统的设计和优化提供指导、确保无线通信服务质量达到可接受的水平,信号传播路径损耗建模预测工作是必不可少的一个环节;无线电波在城市环境的无线信道传播,会产生反射、绕射和散射或媒介中的折射等现象,各种传播机制对路径损耗的预测带来了很大的困难。
3.电波传播预测模型主要有传统预测模型和机器学习预测模型两大类;传统预测模型主要有经验模型、确定模型和半确定模型;近十几年来,许多研究人员已经将研究方向从传统的电波传播路径损耗预测模型转向了基于数据驱动的机器学习方法(机器学习预测模型);而机器学习是一种基于大量数据和灵活模型架构提高特定任务性能的方法,可以分为分类和回归两类问题;电波传播路径损耗预测就是典型的回归任务,利用大量的数据通过多次迭代计算模型参数,找到电波传播路径损耗与其影响参数之间的拟合关系函数,这样,便可以在新的输入参数条件下得到要预测的路径损耗值,达到显著优越的泛化性能。
4.机器学习预测模型包括ann-based和non_ann-based,用于机器学习预测模型实验的巨量数据是摆在很多研究人员面前的首要问题;常用的两种获取训练数据的方法包括测量数据和仿真数据;而测量数据是基于大量路径损耗的实测数据,其获取工作常常是很难实现的;因此,很多研究将训练数据的获取诉诸于已有的计算预测模型来获得数据。
5.目前通过电磁求解器生成合成数据是一个计算效率较高的方法,常用的求解器是射线跟踪(rt)求解器;但使用基于确定性模型求解器生成的数据集,其中的环境输入特征均是理论层面上的,诸如反射面的数量、传播介质的电磁参数、最大障碍物高度;这些理论层面上的数据集只能针对特定环境条件下,而且这个计算需要很大的硬件支撑;同时有研究者提出两种扩充训练数据集的机制,第一种是原始数据在新场景或不同频段重复使用,第二种是基于先验信息通过传统模型生成训练样本数据,但其存在先验信息需要通过已经测量的数据获取的缺陷;有的研究者将考察的地理区域的电波传播路径损耗分布热力图直接表示为一个元素数据缺失的矩阵,本质就是图像修复,其存在不能很好地体现电波传播影响因素的缺陷。


技术实现要素:

6.针对上述问题,本发明的一个目的是提供一种基于矩阵补全的路径损耗数据增强方法,该方法中仅使用了少量监测站点的路径损耗测量值,避免了获取大量测量数据,有效地扩充了数据集,有利于模型训练准确率的提升。
7.本发明的第二个目的是提供一种基于矩阵补全的路径损耗数据增强系统。
8.本发明所采用的第一个技术方案是:一种基于矩阵补全的路径损耗数据增强方法,包括以下步骤:s100:基于发射基站和监测站点的特征属性数据构建特征属性数据集,并获取少量监测站点的路径损耗实测值;s200:将所述特征属性数据集中的数据输入经验预测模型中进行计算,从而获得该监测站点的经验模型路径损耗预测值;s300:基于所述经验模型路径损耗预测值和少量监测站点的路径损耗实测值,构建路径损耗稀疏低秩矩阵;s400:将路径损耗稀疏低秩矩阵进行补全,以获得补全的路径损耗矩阵;将补全的路径损耗矩阵与特征属性数据集中的数据进行结合,从而形成增强数据训练集;s500:基于所述增强数据训练集对机器学习预测模型进行训练。
9.优选地,所述步骤s100中发射基站的特征属性数据包括发射功率以及发射天线经度、纬度、高度、主瓣方向;监测站点的特征属性数据包括纬度、经度、高度、植被种类和楼宇高度、密度。
10.优选地,所述步骤s100还包括对所述特征属性数据集进行降维预处理。
11.优选地,所述降维预处理包括以下子步骤:(1)对所述特征属性数据集中各个维度的特征属性进行标准化预处理;(2)计算协方差矩阵以分析各特征属性数据之间的相关性;(3)基于各特征属性数据之间的相关性筛选出特征属性数据集中的主特征,从而实现特征属性数据集的降维。
12.优选地,所述步骤s200中的经验预测模型包括自由空间传播模型、ecc-33经验模型、okumura-hata经验模型和cost-231 hata经验模型中的任一个。
13.优选地,所述步骤s300中的路径损耗稀疏低秩矩阵通过以下方法构建:基于经验模型路径损耗预测值和少量监测站点的路径损耗实测值构建矩阵,该矩阵中其中一行的数据为路径损耗实测值,将该行的数据按照数据不完整比例进行随机置零,以形成路径损耗稀疏低秩矩阵。
14.优选地,所述步骤s400中将路径损耗稀疏低秩矩阵进行补全包括以下子步骤:s410:将路径损耗稀疏低秩矩阵按设定截断长度进行分段,以获得若干截断矩阵;s420:基于损失函数求得所述若干截断矩阵的近似矩阵;s430:将所述若干截断矩阵的近似矩阵进行拼接,以获得补全的路径损耗矩阵。
15.优选地,将补全的路径损耗矩阵与特征属性数据集中的数据进行结合包括:提取所述补全的路径损耗矩阵第一行的所有数据,与发射基站和监测站点的特征属性数据进行结合,从而获得增强数据训练集。
16.优选地,步骤s500中的机器学习预测模型包括bp神经网络模型、svm回归预测模型和决策树回归预测模型中的一种或多种。
17.本发明所采用的第二个技术方案是:一种基于矩阵补全的路径损耗数据增强系统,包括获取模块、计算模块、路径损耗稀疏低秩矩阵构建模块、补全模块和训练模块;所述获取模块用于基于发射基站和监测站点的特征属性数据构建特征属性数据集,并获取少量监测站点的路径损耗实测值;
所述计算模块用于将所述特征属性数据集中的数据输入经验预测模型中进行计算,从而获得该监测站点的经验模型路径损耗预测值;所述路径损耗稀疏低秩矩阵构建模块用于基于所述经验模型路径损耗预测值和少量监测站点的路径损耗实测值,构建路径损耗稀疏低秩矩阵;所述补全模块用于将路径损耗稀疏低秩矩阵进行补全,以获得补全的路径损耗矩阵;将补全的路径损耗矩阵与特征属性数据集中的数据进行结合,从而形成增强数据训练集;所述训练模块用于基于所述增强数据训练集对机器学习预测模型进行训练。
18.上述技术方案的有益效果:(1)针对路径损耗实测数据难获取的问题,本发明公开的一种基于矩阵补全的路径损耗数据增强方法中首先通过地图数据中记录的地形地貌信息确定要获取路径损耗的监测站点及该点的相关特征属性,同时获取发射基站参数;根据常用的多种城市环境的路径损耗预测经验模型计算获得多套路径损耗数据;结合以上监测站点中少量已获得的实测路径损耗值,建立稀疏低秩矩阵;最后通过矩阵分解补全方法,完成以上无实测数据监测站点数值补全,实现机器学习模型训练数据的有效扩充。
19.(2)本发明公开的一种基于矩阵补全的路径损耗数据增强方法中仅使用了少量监测站点的路径损耗测量值,避免了获取大量测量数据存在困难的同时,有效地扩充了数据集,有利于模型训练准确率的提升。
20.(3)本发明通过已有的城市环境路径损耗经验模型,结合少量实测路径损耗值,构建稀疏低秩矩阵,通过分段矩阵补全完成数据增强的目的。
附图说明
21.图1为本发明的一个实施例提供的一种基于矩阵补全的路径损耗数据增强方法的流程示意图;图2为本发明的一个实施例提供的不同预测模型数据和实测数据对比的示意图;图3为本发明一个实施例提供的路径损耗值缺失矩阵构建及分段补全示意图,其中,图3(a)为路径损耗稀疏低秩矩阵的示意图,图3(b)为将路径损耗稀疏低秩矩阵进行分段截断后的稀疏矩阵的示意图;图4为本发明一个实施例提供的实测城市场景的示意图;图5为本发明一个实施例提供的发射基站1路径损耗实测值分布的示意图;图6为本发明一个实施例提供的发射基站2路径损耗实测值分布的示意图;图7为本发明一个实施例提供的发射基站3路径损耗实测值分布的示意图;图8为本发明一个实施例提供的发射基站4路径损耗实测值分布的示意图;图9为本发明一个实施例提供的发射基站1的少量监测站点路径损耗实测值分布图;图10为本发明一个实施例提供的发射基站2的少量监测站点路径损耗实测值分布图;图11为本发明一个实施例提供的发射基站3的少量监测站点路径损耗实测值分布图;
图12为本发明一个实施例提供的发射基站4的少量监测站点路径损耗实测值分布图;图13为本发明的一个实施例提供的一种基于矩阵补全的路径损耗数据增强系统的结构示意图。
具体实施方式
22.下面结合附图和实施例对本发明的实施方式作进一步详细描述。以下实施例的详细描述和附图用于示例性地说明本发明的原理,但不能用来限制本发明的范围,即本发明不限于所描述的优选实施例,本发明的范围由权利要求书限定。
23.在本发明的描述中,需要说明的是,除非另有说明,“多个”的含义是两个或两个以上;术语“第一”“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性;对于本领域的普通技术人员而言,可视具体情况理解上述术语在本发明中的具体含义。
24.实施例一如图1所示,本发明提供的一种基于矩阵补全的路径损耗数据增强方法,主要包括以下步骤:s100:基于发射基站和监测站点(接收站点)的特征属性数据构建特征属性数据集,获取少量监测站点的路径损耗实测值;已知的发射基站的特征属性数据(参数)包括发射功率以及发射天线经度、纬度、高度、主瓣方向等;通过含有高程、土地覆盖、建筑物和植被要素的地图数据获取监测站点公开的特征属性数据,监测站点的特征属性数据包括纬度、经度、高度、植被种类、楼宇高度、密度等;通过固定频谱监测站或移动车载监测设备,获取少量监测站点的路径损耗实测值。
25.进一步的,在一个实施例中,还包括对上述特征属性数据集进行降维预处理,以便于后期结合补全路径损耗矩阵形成的增强数据集具有低维度,从而提高路径损耗机器学习预测模型的训练计算效率。
26.特征属性数据的相关性(多重共线性)导致的特征空间不稳定,同时,大维度的数据集会产生计算效率低下、存储压力大以及泛化能力弱等一系列问题;而采用特征抽取来降维可解决以上问题;pca、lda和kernelpca这三种方法都可以将特征属性数据集变换为一个维度更低的新的特征子集;pca,lda是常用的特征降维方法,二者分别对应无监督数据和监督数据;而kernelpca对应的是非线性可分的数据;由于数据增强仅需要保留最佳描述特征(主成分)而非分类特征,因此,我们使用pca对特征属性数据进行特征降维。
27.pca(principal component analysis)是一种用于连续属性特征的数据降维方法,它构造了原始数据的一个正交变换,新空间的基底去除了原始空间数据的相关性,只需要使用少数的新特征变量,即所谓的主成分,就能够解释原始数据中的大部分信息,进而达到了高维数据的降维,减少数据冗余信息,增强模型训练算法的高效性。
28.对特征属性数据集进行降维预处理包括以下子步骤:(1)对特征属性数据集中各个维度的特征属性进行标准化预处理;假设对某监测区域的n个监测站点进行路径损耗数据采集,该每个监测站点有m个特征属性数据,则n个监测站点的m个特征属性数据可构造矩阵x,记作:
式中,xi为第i个监测站点的m个特征属性值的向量,记作:其中,为第i个监测站点的第j个特征属性的值,i=1,2,

,n,j=1,2,

,m,t为矩阵转置符。
29.基于矩阵x计算各个特征属性数据的估计样本均值和标准差。
30.①
对n个监测站点的第个特征属性进行均值计算得到:

对n个监测站点的第个特征属性进行标准差计算得到:标准化后特征矩阵记作:式中,为标准化后特征矩阵;m为特征属性数据的数量;n为监测站点的数量;为第i个监测站点的m个特征属性值标准化后的向量,其中,式中,为第i个监测站点的第j个特征属性标准化后的值,,式中,为第i个监测站点的第j个特征属性的值,i=1,2,

,n,j=1,2,

,m,为n个监测站点的第j个特征属性的均值;为n个监测站点的第j个特征属性的标准差。
31.(2)计算协方差矩阵以分析各特征属性数据之间的相关性;协方差矩阵通过以下公式表示:式中,sm×m为协方差矩阵;为第p个特征属性与第q个特征属性之间的协方差,p,q=1,2,

,m,m为特征属性数据的数量;由以下公式计算得到:
式中,为第p个特征属性与第q个特征属性之间的协方差;n为监测站点的数量;、分别为第k个监测站点的第p个特征属性和第q个特征属性标准化后的值;、分别为n个监测站点的第p个特征属性和第q个特征属性的均值。
32.协方差越大,表征第p个特征属性与第q个特征属性之间的离散度越大,它们彼此所包含的信息越丰富;从线性坐标投影角度讲,主成分是将多个相关特征的数据集投影到相关特征较少的坐标系上,而协方差矩阵的特征向量实际上是相关性最小、方差最大的坐标方向。
33.(3)基于各特征属性数据之间的相关性筛选出特征属性数据集中的主特征,以形成主特征集,从而实现特征属性数据集的降维;假设协方差矩阵sm×m的特征值经计算为λ1,λ2,

,λi,

,λm,且满足λ1》λ2》

λi》

》λm,设定门限值th,计算各个特征(成分)的累积贡献率,若计算到第k个特征(成分)的累积贡献率大于或等于门限值th,则丢弃第k个特征之后的不重要特征(成分);即将m维的特征属性数据集降到维的主特征集,以实现维数降低。
34.每个特征属性所占的信息百分比,即代表特征属性数据集中各特征属性的贡献率;初始特征属性数据集中第k个特征属性的贡献率通过以下公式计算得到:式中,为特征属性数据集中第k个特征属性的贡献率;为第k个特征向量对应的特征值;m为特征属性数据的数量;为第个特征向量对应的特征值。
35.前k个特征的累积贡献率通过以下公式计算得到:式中,为前k个特征属性的累积贡献率;m为特征属性数据的数量;为第个特征向量对应的特征值。
36.s200:将特征属性数据集中的数据输入经验预测模型中进行计算,从而获得该监测站点的经验模型路径损耗预测值;根据城市环境下的电波传播路径损耗的经验预测模型进行计算,从而获得多套路径损耗经验预测数据;我们采用了四种经验预测模型,包括自由空间传播模型、ecc-33经验模型、okumura-hata经验模型和cost-231 hata经验模型。
37.自由空间传播模型通过以下公式表示:式中,pl1(db)为经自由空间传播模型计算得到的路径损耗预测值(单位:db),d为接收点(监测站点)距离发射基站的距离(单位:km);f为发射基站载波频率(单位:mhz)。
38.ecc-33经验模型通过以下公式表示:
式中,pl2(db)为经ecc-33经验模型计算得到的路径损耗预测值(单位:db);a
fs
为自由空间衰减;a
bm
为基本路径损耗中值;gb为天线高度修正因子;gr为接收机增益因子;d为接收点距离发射基站的距离(单位:km);f为发射基站载波频率(单位:mhz);hb为发射基站天线高度(单位:m);h
ue
为接收天线有效高度(单位:m)。
39.okumura-hata经验模型(gsm 900mhz)通过以下公式表示:900mhz)通过以下公式表示:式中,为经okumura-hata经验模型计算得到的路径损耗预测值(单位为db);d为接收点距离发射基站的距离(单位:km);f为发射基站载波频率(单位:mhz);hb为发射基站天线高度(单位:m);h
ue
为接收天线有效高度(单位:m);ahm为接收天线纠正参数;cm为杂波纠正参数,其值为3db。
40.cost-231 hata经验模型通过以下公式表示:式中,为经cost-231 hata经验模型计算得到的路径损耗预测值(单位:db);d为接收点距离发射基站的距离(单位:km);f为发射基站载波频率(单位:mhz);hb为发射基站天线高度(单位:m);h
ue
为接收天线有效高度(单位:m);ahm为接收天线纠正参数;cm为杂波纠正参数,其值为3db。
41.okumura-hata经验模型和cost-231 hata经验模型是同一种模型不同频段的计算公式。
42.s300:基于经验模型路径损耗预测值和少量监测站点的路径损耗实测值,构建路径损耗稀疏低秩矩阵;针对基于机器学习模型的路径损耗预测任务,本发明首先构建含缺失路径损耗值的稀疏低秩矩阵;在构建路径损耗稀疏低秩矩阵时,本发明借鉴预测评分/推荐系统的“协同过滤”思想,假设类似的监测接收点在它们特征属性类似的情况下,同样的一个预测模型得到的路径损耗值大概率是近似的;图2为通过四种方法(实测,自由传播模型,ecc-33经验模型,cost231-hata经验模型)在1000多个监测站点(监测点)获得的路径损耗值;从图2可以看出,这个假设是符合我们对自然界的观测结果的。
43.基于少量监测站点的路径损耗实测值和经验模型路径损耗预测值构建路径损耗
稀疏低秩矩阵包括以下步骤:根据上述假设和数据分析,通过z种方法(包括实际测量结果和经验模型计算结果)得到的n个监测站点的路径损耗值(即经验模型路径损耗预测值和少量监测站点的路径损耗实测值),基于以上方法得到的路径损耗值构建矩阵,该矩阵中其中一行的数据为路径损耗实测值,将该行的数据按照自定义的数据不完整比例进行随机置零,以形成路径损耗稀疏低秩矩阵;数据不完整比例为:选取的用于获取路径损耗实测值的少量监测站点数量与总的监测站点数量的比值,例如总的监测站点为1000个,本发明只选取的其中的50个监测站点作为获取路径损耗实测值的少量监测站点,则数据不完整比例为50:1000;按照图3(a)所示,本发明将特征属性数据集中的路径损耗值构建为矩阵,矩阵的第一行为路径损耗实测值,将第一行无实测数据的元素置为空,形成路径损耗稀疏低秩矩阵,a∈;z的值例如为4,即矩阵的第2,3,4行路径损耗预测值均由三个经验模型自由空间传播模型、ecc-33、hata对应计算获得;即矩阵每列表示考察区域的监测站点,每行表示该监测站点的四种路径损耗值,分别是:第一行表示路径损耗实测值(空白位置表示该监测站点无路径损耗实测值),第二行表示ecc-33经验模型计算得到的路径损耗预测值,第三行表示hata经验模型计算得到的路径损耗预测值,第四行表示自由空间传播模型计算得到的路径损耗预测值。
44.s400:对路径损耗稀疏低秩矩阵进行补全,以形成补全的路径损耗矩阵;将补全的路径损耗矩阵与特征属性数据集中的数据进行结合,从而形成增强数据训练集;(1)将路径损耗稀疏低秩矩阵进行补全包括以下子步骤:s410:将路径损耗稀疏低秩矩阵按设定截断长度进行分段,以获得若干截断矩阵;利用矩阵分解来填充没有路径损耗实测值的考察地点,为了能够扩充高质量的数据,本发明将图3(a)中的路径损耗稀疏低秩矩阵按照每d个监测站点为一组(即按照设定截断长度)进行分段补全操作,如图3(b)所示。
45.如果一个z行n列的非零矩阵a,a∈不含缺失值,那么该矩阵可以表示为两个矩阵的乘积运算形式,即进行矩阵的满秩分解:式中,非零矩阵a的秩为rank(a)=h,h《min{z,n};u、v为秩为h的两个实数矩阵,即,;t为矩阵转置符;r为实数集。
46.如果矩阵a中的元素项存在缺失值,矩阵a无法直接按照上式进行分解,这时,可以用一种近似的解法——梯度下降法,完成u,v的求解,进而得到补全矩阵作为含缺失元素矩阵a的近似矩阵。
47.为了能够利用矩阵分解尽可能准确地拟合真实的路径损耗值,我们将构建的稀疏低秩矩阵按照截断窗口宽度为d个监测站点进行截断操作,共产生w个截断(truncate)的路径损耗稀疏矩阵,=1,2,

,w,k=d或k=,其中,为n个监测站点经过d取整后的剩余监测站点的个数;如果所有监测站点的数量n是d的整数倍,即n%d=0,则n=w

d;如果n%d≠0,则n=w

d ,其中,《d,符号“%”表示取余数。
48.具体地:式中,为路径损耗稀疏矩阵,表示拼接操作。
49.s420:基于损失函数求得所述若干截断矩阵的近似矩阵;定义损失函数::求解上式的目标,就是找到能使最小的u、v矩阵;式中,表示2范数;为截断后的第个路径损耗稀疏矩阵;u、v为该损失函数要求解的秩为h的两个实数矩阵,下标、分别表示矩阵的行和列,为矩阵中第列的第个元素值,为矩阵中第行的第个元素值;t为矩阵转置符;β为损失函数的惩罚项系数;为监测站点的偏置;为路径损耗计算方法的偏置;为矩阵的非空元素;为向量的第个元素值;为向量的第个元素值;为矩阵的整体偏置,其中,式中,p为矩阵中的非空的元素个数。
50.令,根据梯度下降公式,则,更新公式有:式中,、为矩阵u中第行的第和个元素的值,、为矩阵v中列的第和个元素的值;为更新系数;β为损失函数的惩罚项系数;。
51.s430:将若干截断矩阵的近似矩阵进行拼接,以获得补全的路径损耗矩阵;
我们的总体目标是找到稀疏低秩矩阵的近似矩阵,经过上述截断操作,我们将问题转化为求解每个截断矩阵的近似矩阵,之后拼接得到路径损耗稀疏低秩矩阵的近似矩阵。
52.即为路径损耗补全矩阵;分别为第1,2,

,

w个截断矩阵的补全矩阵。
53.(2)将补全的路径损耗矩阵与特征属性数据集中的数据结合,包括:提取补全的路径损耗矩阵第一行的所有数据,将提取的数据与发射基站和监测站点(接收站点)的特征属性数据进行结合,从而获得增强数据训练集。
54.根据我们设计的稀疏低秩矩阵及矩阵补全过程中的拆分操作,先将算法伪代码描述如下:机器学习对数据的需求是极大的,但通过实地测量技术获取路径损耗数据的过程
仍然很昂贵;特别是在一些敏感地区,从无线电数据收集使用申请的批准到原始数据测定所需的时间过多;因此,本发明通过矩阵分解补全的方法,完成以上稀疏低秩矩阵中监测站点实测数据值的补全,实现机器学习模型训练数据的有效扩充,有效解决数据需求量大和数据难获取之间的矛盾,对于提升机器学习算法的准确率具有重要意义。
55.s500:基于增强数据训练集对机器学习预测模型进行训练;机器学习预测模型包括bp神经网络模型、svm回归预测模型和决策树回归预测模型中的一种或多种。
56.本发明针对路径损耗实测数据难获取的问题,公开了一种基于矩阵补全的路径损耗数据增强方法,该方法中首先通过地图数据中记录的地形地貌信息确定要获取路径损耗的监测站点及该点的相关特征属性数据(包括:纬度、经度、高度、植被种类、楼宇高度密度等),同时获取发射基站参数;根据常用的多种城市环境的路径损耗预测经验模型计算获得多套路径损耗预测值;路径损耗预测值结合监测站点中少量已获得的路径损耗实测值,建立稀疏低秩矩阵;最后通过矩阵分解补全方法,完成以上无实测数据监测站点数值补全,实现机器学习模型训练数据的有效扩充增强。
57.下面结合仿真实验说明本发明技术方案的有益效果:为了验证本发明的有效性,实测监测站点及发射基站采用如表1所示的特征维度;表1特征属性数据路径损耗值采集地点是巴西fortaleza-ce城,我们利用经纬坐标获得了如图4所示的测试场景,利用安捷伦e6474a对这个城市区域的2327个街道点的信号强度进行了接收测量,这些测量值是由不同的四个发射基站分别工作产生的;图5-图8分别显示了该区域在四个不同基站工作时实测获得的路径损耗值分布情况,图5-图8中显示了不同基站位置路径损耗的衰减分布情况,箭头方向表示小区发射基站天线的最大辐射方向;深色代表路径损耗值较大,浅色代表路径损耗值较小;发射基站的发射频率为:853.71mhz。
58.如图9-图12所示,我们将原监测站点数据随机去除95%,来模拟实测得到的少量监测站点数据;例如将1000个监测站点随机去除95%,只实测少量监测站点数据。
59.由于经验模型反应了监测站点(接收点)与发射基站之间的特征属性,结合经验模型计算的路径损耗值构建稀疏低秩矩阵,能够很好地补充缺失接收点的路径损耗值特征属性;构建的稀疏低秩矩阵是合理且有效可靠的;有限实测数据经过矩阵补全产生更多的数据,即形成增强数据训练集,增加了训练样本的数量及多样性,提升了机器学习模型的鲁棒性,避免过拟合问题的发生;其中,有限实测数据训练集为:在实测数据训练集的基础上,按比例随机丢弃部分实测数据,剩余数据用于模拟由于各种限制因素而只能采集到的有限实测数据,就称有限实测
数据训练集;实测数据训练集为:实测数据集按照比例分成训练集和测试集两部分,其中的训练集称为实测数据训练集;增强数据训练集为:按照矩阵分解补全方法扩充的数据训练集。
60.实施例二图13为本发明的一个实施例提供的一种基于矩阵补全的路径损耗数据增强系统,包括获取模块、计算模块、路径损耗稀疏低秩矩阵构建模块、补全模块和训练模块;所述获取模块用于基于发射基站和监测站点的特征属性数据构建特征属性数据集,并获取少量监测站点的路径损耗实测值;所述计算模块用于将所述特征属性数据集中的数据输入经验预测模型中进行计算,从而获得该监测站点的经验模型路径损耗预测值;所述路径损耗稀疏低秩矩阵构建模块用于基于所述经验模型路径损耗预测值和少量监测站点的路径损耗实测值,构建路径损耗稀疏低秩矩阵;所述补全模块用于将路径损耗稀疏低秩矩阵进行补全,以获得补全的路径损耗矩阵;将补全的路径损耗矩阵与特征属性数据集中的数据进行结合,从而形成增强数据训练集;所述训练模块用于基于所述增强数据训练集对机器学习预测模型进行训练。
61.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
62.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
63.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
64.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
65.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献