一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于改进KNN融合随机森林算法的WIFI定位方法

2022-06-29 22:09:57 来源:中国专利 TAG:

一种基于改进knn融合随机森林算法的wifi定位方法
技术领域:
1.本发明涉及通信,信号与信息处理和基于位置的服务技术领域,具体涉及一种基于改进knn融合随机森林算法的wifi定位方法。


背景技术:

2.在我们日常生活中,大多数常用的定位应用都是基于全球定位系统(gps)获取的位置信息,但是由于室内环境的复杂性以及位置信号差等原因,gps的定位服务在室内表现的并不是很理想。
3.目前主流的室内定位技术方案有:超宽带(uwb)定位技术,射频识别(rfid)定位技术,蓝牙定位技术,超声波定位技术等等。这些都可以实现室内定位。然而,移动电话信号并不是在所有的室内场景下都可以稳定的传播,使用射频识别需要花费额外的硬件安装费用,超声波的商用设备在市场上少之又少,因此这些定位技术在实际应用中并不常见。而wifi覆盖区域广泛,因此wifi定位技术通常作为室内定位技术的首选。通常,一个wifi系统由一些固定的接入点(ap)组成,他们可以部署在室内一些便于安装的位置,能连接wifi的设备相互之间可以直接或间接的通过ap通信,因此可以考虑在通信功能外实现定位功能。
4.当前,绝大多数基于wifi的定位系统都利用信号强度(rss),其方法主要分为两类:三角形算法和位置指纹识别算法。其中三角形算法利用待测目标到至少三个已知参考点之间的距离信息估计目标位置,而位置指纹识别算法则通过比较定位所需的信号特征指纹信息获取目标位置。
5.基于三角型算法的wifi定位很大程度上依赖于确知的ap位置信息及准确的信号传输损耗模型,由于影响信号传输的因素很多,不同环境下的信号传输损耗模型大不相同,建立一个准确的,适合实际应用的损耗模型存在着很大的困难。
6.本发明从应对强干扰的前提出发,设计了融合改进knn和随机森林算法得到的模型,二者分别从高维和低维两个角度分析利用数据,增加了模型的抗干扰能力。


技术实现要素:

7.本发明在满足实际需求的前提下,有效的提高了该模型在实现wifi定位的准确度,具有推广应用价值。
8.本发明实现上述要求采取的技术方案是:
9.一种基于改进knn融合随机森林算法的wifi定位方法,该方法包括以下步骤:
10.步骤1:采集wifi信号组合,构建数据集。
11.步骤2:对数据进行预处理,使用主成分分析法进行特征提取。特征提取是机器学习中常用的数据处理方式,一般出现在实际搭建模型之前,以达到特征空间维度的变化。
12.步骤3:搭建并训练模型,设置权重。
13.步骤4:改进knn模型,传统的knn模型是将所有维度用于计算距离,然而当某一维度有较大差异时会影响整体的判断,为了解决这一问题构造了基于降维的knn,以三维样本
数据(x1,x2,x3)为例:
14.使用改进knn计算公式为:
[0015][0016][0017][0018][0019]
式中:x
′1,x
′2,x
′3为测试数据,d为样本数据与测试数据之间的距离。
[0020]
对于n维特征向量而言,同时对n-1维特征向量进行隶属度计算,由于单个误差数据会影响n-1个计算指标,因此该示例模型要求有两个相似权重即视为一类。
[0021]
步骤5:融合随机森林算法。改进knn算法增加了计算成本,其输入样本量应该尽可能的小,为了防止样本量较小导致的模型欠拟合问题,采用改进knn与随机森林融合的模型。随机森林是一种通过多棵决策树进行优化决策的算法。对于特征选取,使用基尼指数增益值δgini(a)作为决策树选择特征的依据,其公式为:
[0022]
δgini(a)=gini(d)-ginia(d)
[0023][0024][0025]
式中:选取属性为a,k表示数据集d被分为k个dj数据集。
[0026]
步骤6:实际数据输入混合分类算法模型得到整合后结果。
[0027]
本发明的有益效果是:本发明提供了一种基于混合分类算法模型的wifi定位方法,本发明在传统knn模型上做了改进,解决了当某一维度有较大差异时会影响整体的判断这一问题,同时导致计算成本的增加,以及小样本数据会导致欠拟合的问题,因此在此基础上联合了随机森林算法。从实验结果表明:本发明提出的融合模型比传统的knn和随机森林算法的模型在准确度上分别提高了15.7%和9.6%,其准确率达到了98.3%。
附图说明:
[0028]
图1为混合分类算法模型的构建及工作过程;
[0029]
图2为改进knn在四个维度下的相似度;
[0030]
图3为随机森林的树状结构;
[0031]
图4为实验场地区域划分示意图;
具体实施方式:
[0032]
具体实施方式一:本实施方式所述的基于混合分类算法的wifi定位方法,该方法具体包括以下步骤:
[0033]
步骤1:采集wifi信号组合,构建数据集。
[0034]
步骤2:对数据进行预处理,使用主成分分析法进行特征提取。特征提取是机器学习中常用的数据处理方式,一般出现在实际搭建模型之前,以达到特征空间维度的变化。
[0035]
步骤3:搭建并训练模型,设置权重。
[0036]
步骤4:改进knn模型,传统的knn模型是将所有维度用于计算距离,然而当某一维度有较大差异时会影响整体的判断,为了解决这一问题构造了基于降维的knn,以三维样本数据(x1,x2,x3)为例:
[0037]
使用改进knn计算公式为:
[0038][0039][0040][0041][0042]
式中:x
′1,x
′2,x
′3为测试数据,d为样本数据与测试数据之间的距离。
[0043]
对于n维特征向量而言,同时对n-1维特征向量进行隶属度计算,由于单个误差数据会影响n-1个计算指标,因此该示例模型要求有两个相似权重即视为一类。
[0044]
步骤5:融合随机森林算法。改进knn算法增加了计算成本,其输入样本量应该尽可能的小,为了防止样本量较小导致的模型欠拟合问题,采用改进knn与随机森林联合的模型。随机森林是一种通过多棵决策树进行优化决策的算法。对于特征选取,使用基尼指数增益值δgini(a)作为决策树选择特征的依据,其公式为:
[0045]
δgini(a)=gini(d)-ginia(d)
[0046][0047][0048]
式中:选取属性为a,k表示数据集d被分为k个dj数据集。
[0049]
步骤6:实际数据输入混合分类算法模型得到整合后结果。
[0050]
具体实施二:本实施方式与具体实施方式一不同的是:所述步骤1的具体过程为:
[0051]
所述改进knn算法中使用四维样本数据(x1,x2,x3,x4):
[0052][0053][0054][0055][0056][0057]
具体实施方式三:本实施方式与具体实施方式二不同的是:在室内划分若干个网格,每个网格单元的面积是1m*1m,室内部署6个ap,方位尚不明确;在每一个网格单元中密
集采样,保证数据充足,这样做的优点是:提高混合分类算法模型的预测精度。
[0058]
本发明与传统的knn算法和随机森林算法在准确率上对比如图4所示,准确率相比传统cnn算法提高了15.7%,相比随机森林算法提高了9.6%。在定位精度上提升显著,定位误差可以保持在1m以内。表明本发明在室内环境中进行wifi定位的有效性以及可实现性。
[0059]
本发明的实施方式并不受上述实施实例的限制,其他的任何未违背本发明精神实质与原理下所作的改变,修饰,替代,组合,简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献