一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于MR数据定位的异常指纹识别方法与流程

2022-10-22 10:07:57 来源:中国专利 TAG:

基于mr数据定位的异常指纹识别方法
技术领域
1.本发明涉及移动通信技术领域,特别涉及一种基于mr数据定位的异常指纹识别方法。


背景技术:

2.移动终端以一定时间间隔,以测量报告的方式向基站周期性上报所在小区的下行信号强度、质量等测量信息。基站将终端上报的下行信息和自身收集的上行物理信息上传给基站控制器,并由其收集与统计。mr(通信大数据平台)是这类测量数据合成后的总称。mr数据可以为网络质量评估、话务热点分布分析、载频隐性故障分析、越区覆盖分析、网络干扰分析、邻区优化、覆盖优化等提供支撑,为无线优化和网络规划建设提供较准确的依据。
3.随着移动通信技术的不断发展,把mr数据用于位置定位也得到越来越多的重视和应用。把mr数据用于定位,相关的核心算法有多种,其中定位精度较高、适用场景最广、成熟可推广的方案主要是指纹定位算法。
4.指纹定位算法通过在已建立的特征库(指纹库)中匹配与当前mr数据特征最接近的位置点来估算mr的位置。基于指纹库的定位方法即特征匹配方法,源于数据库定位。它需要预先创建指纹数据库,指纹数据库里存放的是离散的信号强度和位置坐标。无线信号的传播对环境具有依赖性,因此无线信号在同一位置具有唯一性。位置指纹定位技术就是将每个位置的无线信号特征与位置信息结合起来,构成一条指纹,存储在数据库中,形成位置指纹库。进行位置定位时,待定位终端实测的信号强度与指纹数据库记录的信号强度向量进行匹配来得到待定位终端的位置估计。
5.位置指纹的计算精度依赖于指纹库数据记录的质量,指纹数据的优劣直接影响到定位效果。由于实际的通信环境较复杂,当移动终端在移动中或者位于遮挡的区域时,移动终端上报的mr数据中的位置信息和场强信息存在数据异常现象。因此,在积累位置指纹库时需要对数据进行清洗、过滤、位置纠偏等工作,以保证指纹库的数据质量。业界把错误或低质量的指纹称为脏指纹。如果没有脏指纹识别技术,指纹库中就无法避免存入错误的指纹,直接导致定位结果出现错误。业内通过mr数据实现大范围定位功能的方案,基本都采用的指纹算法。但是在公开的资料这些指纹定位算法对指纹数据的正确性没有明确的识别方式,所以脏指纹识别装置目前公开资料还没有发现有类似的方案。
6.指纹正确与否或者指纹质量将直接影响mr指纹算法的定位精确度。现有mr定位系统基本没有指纹质量的识别装置,错误的指纹无法被丢弃而是直接进入指纹库,将直接导致定位结果的错误。如果脏指纹不受控制,积累到一定的数量,则整个mr指纹识别精度就会大幅下降,直接影响定位精度。


技术实现要素:

7.本发明的目的旨在至少解决所述技术缺陷之一。
8.为此,本发明的目的在于提出一种基于mr数据定位的异常指纹识别方法,以解决
背景技术中所提到的问题,克服现有技术中存在的不足。
9.为了实现上述目的,本发明的实施例提供一种基于mr数据定位的异常指纹识别方法,包括如下步骤:
10.步骤s1,剔除指纹离群点,其中,采用dbscan聚类算法对采集到的指纹数据进行离群点发现,过滤掉异常数据,完成指纹离群点剔除再进行指纹入库;
11.步骤s2,控制指纹密度,包括如下步骤:
12.步骤s21,根据步骤s1保留的指纹作为后续环节的输入指纹;
13.步骤s22,根据指纹中带的经纬度信息,转换出对应cell的值;
14.步骤s23,该cell内的现有指纹数是否达到了预设阈值;
15.步骤s24,如果没有达到所述预设阈值,则直接将该指纹存入指纹库;
16.步骤s25,如果cell内的现有指纹已经达到预设阈值,则检查现有指纹是否达到老化条件;
17.步骤s26,如果有旧指纹达到老化条件则删除最早老化的指纹,采用本指纹入库;
18.步骤s27,如果没有旧指纹达到老化条件,则丢弃该指纹。
19.步骤s3,纠偏基站位置,包括:识别错误的mr信息、识别错误的基站基础信息。
20.由上述任一方案优选的是,在所述步骤s1中,在指纹库中的数据是以服务小区id为索引进行存储的,将每条指纹组成n维指纹向量,对相同服务小区下积累的指纹向量进行dbscan聚类,聚类完成后输出的离群点即为异常指纹数据,将上述异常指纹数据从指纹库中进行删除。
21.由上述任一方案优选的是,在所述步骤s1中,
22.核心对象:以该对象为圆心,以dbscan聚类半径做覆盖的圆内如果指纹对象数目大于最小对象数则该指纹为核心对象;
23.边缘对象:以该对象为圆心,以dbscan聚类半径做覆盖的圆内如果指纹对象数目小于最小对象数,但是至少包含一个核心对象则该指纹为边缘对象;
24.异常指纹对象:属于指纹对象但是既不是核心对象也不是边缘对象的指纹则为异常指纹。
25.由上述任一方案优选的是,在所述步骤s2中,
26.采用google s2算法库将地理位置进行栅格化,按照栅格级别对地图进行分块,每个块中按照服务小区与邻小区的特征进行密度控制;待处理指纹数据经过数据清洗后,如果同一栅格内相同服务小区与邻小区的指纹数据密度未达到设定阈值,则数据可以进入指纹库,否则数据抛弃。
27.由上述任一方案优选的是,在所述步骤s3中,所述识别错误的mr信息,包括如下步骤:
28.步骤s31a,mr系统持续接收现网mr数据,对其中包含有采样时刻ue经纬度的mr数据进行分析;
29.步骤s32a,分析本条mr数据,检查是否存在ta项内容,如果存在按照s31、s32、s33进行处理,如果不存在则按照步骤s31、s32、s34进行处理;
30.步骤s33a:ta1是本条mr数据中自带的经纬度与该mr所属基站经纬度之间距离/速度系数阈值,计算所得,计算ta1与本条mr自带的ta的差值;
31.步骤s34a:本条mr数据中自带的经纬度与该mr所属基站经纬度之间距离;
32.步骤s35a:如果计算值大于ta差阈值;
33.步骤s36a:如果计算值大于距离阈值;
34.步骤s37a:满足这两类情况的数据代表本条mr数据为异常数据。
35.由上述任一方案优选的是,所述识别错误的基站基础信息,包括如下步骤:
36.步骤s31b,mr系统持续接收现网mr数据,对其中包含有采样时刻ue经纬度的mr数据进行分析;
37.步骤s32b,当收集时间达到预设时长,将这部分数据作为分析数据;
38.步骤s33b,对分析数据以各基站为单位,分别计算异常mr数据的占比,
39.步骤s34b,如果异常mr数据的占比值大于异常阈值,则判断该基站为基础信息错误的基站;
40.步骤s35b,将识别为基础信息错误的基站信息反馈至mr系统。
41.由上述任一方案优选的是,在所述步骤s33b中,设某基站下的分析数据为m条,其中n条是异常mr数据,则异常mr数据的占比=n/m。
42.本发明提出了一种基于mr数据定位的异常指纹识别方法,目的是最大限度防止脏指纹进入指纹库,影响mr指纹定位算法的精度。如果说指纹识别算法是mr定位功能的核心,那异常指纹(即脏指纹)识别就是指纹算法的核心技术之一。
43.本发明的目的就是开展指纹正确性和指纹质量的识别,提升指纹库中的指纹质量,及时、准确把错误和质量不高的指纹筛选出来,完成异常指纹的识别。异常指纹识别技术可以提升指纹库的质量,最终可以提升mr定位精度。
44.本发明的关键点是整个脏指纹识别装置,包括三个处理环节以及每个环节选取的实现算法及算法参数,包括:(1)利用mr数据实现指纹定位的原理;(2)dbscan聚类算法;(3)google s2算法。
45.异常指纹识别装置是对mr定位技术有益的完善和提升。异常指纹实现异常mr指纹的去除,指纹规模的控制,异常基站信息识别三个功能。这三类功能在提升mr定位精度、提升定位性能等方面都有明显的优化效果。异常mr指纹的去除和异常基站信息识别两个功能可以防止错误指纹和基站信息影响定位,直接提升定位精度。指纹规模的控制功能可以防止不必要的过渡计算和存储,明显节约定位时间,提升定位性能。
46.本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
47.本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
48.图1为根据本发明实施例的基于mr数据定位的异常指纹识别方法的流程图;
49.图2为根据本发明实施例的dbscan聚类算法示意图;
50.图3为根据本发明实施例的指纹密度控制流程图;
51.图4为根据本发明实施例的错误的mr信息识别流程图;
52.图5为根据本发明实施例的错误的基站基础信息识别流程图。
具体实施方式
53.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
54.下面首先对本发明涉及的几个术语进行说明:
55.mr:运营商测量报告;ta:服务小区时间提前量;ue:手机终端;mr:最小化路测数据。
56.本发明的基于mr数据定位的异常指纹识别方法用于完成异常mr指纹的去除、指纹规模的控制、异常基站信息识别的三个功能。为了实现这些功能,本发明设计了三个环节,第一环节是指纹离群点剔除,第二各环节是指纹密度控制,第三个环节是基站位置纠偏。这三个环节的实现步骤是串行实现。
57.如图1所示,本发明实施例的基于mr数据定位的异常指纹识别方法,包括如下步骤:
58.步骤s1,剔除指纹离群点,其中,采用dbscan聚类算法对采集到的指纹数据进行离群点发现,过滤掉异常数据,完成指纹离群点剔除再进行指纹入库。
59.具体的,当ue在地下、移动过程中、有遮挡或其它不可知的情况下,mr上报的指纹信息与实际位置存在误差较大的情况,因此需要识别ue上报的mr数据是否正确。本专利采用dbscan聚类算法对采集到的指纹数据进行离群点发现,过滤掉异常数据,完成指纹离群点剔除再进行指纹入库。
60.dbscan聚类算法是由密度可达关系导出最大密度相连的样本集合,这样的一个集合中有一个或多个核心对象,如果只有一个核心对象,则簇中其他非核心对象都在这个核心对象的领域内;如果是多个核心对象,那么任意一个核心对象的领域内一定包含另一个核心对象,这些核心对象以及包含在他邻域内的所有样本构成一个类。dbscan算法最大的优势就是无需给定聚类个数,并且能够发现任意形状的聚类,且在聚类过程中能自动识别出离群点。
61.dbscan聚类算法非常适合以基站为单位的指纹数据的聚合分析,指纹库中的数据是以服务小区id为索引进行存储的,将每条指纹组成n维指纹向量,对相同服务小区下积累的指纹向量进行dbscan聚类,聚类完成后输出的离群点即为异常指纹数据,然后从指纹库中进行删除。
62.如图2所示,dbscan聚类算法先定义如下:
63.核心对象:以该对象为圆心,以dbscan聚类半径做覆盖的圆内如果指纹对象数目大于最小对象数则该指纹为核心对象。图2中用a点标示。
64.边缘对象:以该对象为圆心,以dbscan聚类半径做覆盖的圆内如果指纹对象数目小于最小对象数,但是至少包含一个核心对象则该指纹为边缘对象。图2中用b点标示。
65.异常指纹对象:属于指纹对象但是既不是核心对象也不是边缘对象的指纹则为异常指纹,也可以称为脏指纹。图2中用c点标示。
66.本dbscan聚类算法的覆盖半径为0.01,最小指纹数量为2。
67.步骤s2,控制指纹密度。
68.指纹库中的数据量与计算复杂度有关,实时定位模块需要通过指纹库快速计算出
终端位置,一个区域内并非位置指纹数据越多越好,因此要对指纹数据进行密度控制。指纹密度控制环节是控制指纹的数量,实现指纹均衡的目的。
69.本专利采用google s2算法库将地理位置进行栅格化,按照栅格级别对地图进行分块,每个块中按照服务小区与邻小区的特征进行密度控制。待处理指纹数据经过数据清洗后,如果同一栅格内相同服务小区与邻小区的指纹数据密度未达到设定阈值,则数据可以进入指纹库,否则数据抛弃。
70.表1google s2算法各级面积对应表
71.s2算法的级别最小面积最大面积平均面积1112.18km225.51km220.27km21547520m299638m279172m22046.41m297.30m277.32m22111.60m224.33m219.33m2300.44cm20.93cm20.74cm272.根据mr的定位精度范围在百米量级,结合google s2的cell面积,考虑存储计算等效率,google s2的cell选取21级,每个cell的指纹阀值数选取为3。
73.具体的,如图3所示,控制指纹密度,包括如下步骤:
74.步骤s21,根据步骤s1保留的指纹作为后续环节的输入指纹;
75.步骤s22,根据指纹中带的经纬度信息,根据google s2算法转换出对应cell的值;
76.步骤s23,该cell内的现有指纹数是否达到了预设阈值,其中,预设阈值可以为3;
77.步骤s24,如果没有达到预设阈值,则直接将该指纹存入指纹库;
78.步骤s25,如果cell内的现有指纹已经达到预设阈值,则检查现有指纹是否达到老化条件;
79.步骤s26,如果有旧指纹达到老化条件则删除最早老化的指纹,采用本指纹入库,其中老化设计为1周;
80.步骤s27,如果没有旧指纹达到老化条件,则丢弃该指纹。
81.步骤s3,纠偏基站位置,包括:识别错误的mr信息、识别错误的基站基础信息。
82.具体的,基站位置纠偏是主动发现基站基础数据的异常,使得尽快同步正确的基站基础信息,维护指纹库的正确性。基站位置纠偏主要包含两个识别方向,一个是识别错误的mr信息,另一个是识别错误的基站基础信息。
83.下面分别对基站位置纠偏的两个识别方向进行说明。
84.(1)识别错误的mr信息
85.错误的mr信息就是脏指纹。在这类mr信息中指纹的各项采集值与经纬度不匹配,即指纹信息对应的位置是错误的。如果这类数据进入了指纹库,作为指纹分析的基础将导致以错传错,直接导致定位出现大的错误,所以识别脏指纹对正确定位非常重要。
86.具体的,如图4所示,识别错误的mr信息,包括如下步骤:
87.步骤s31a,mr系统持续接收现网mr数据,其中有1%左右的数据是包含有采样时刻ue经纬度的mr数据,对这类数据进行分析;
88.步骤s32a,分析本条mr数据,检查是否存在ta项内容,如果存在按照s31、s32、s33进行处理,如果不存在则按照步骤s31、s32、s34进行处理;
89.步骤s33a:ta1是本条mr数据中自带的经纬度与该mr所属基站经纬度之间距离/速度系数阈值,计算所得,计算ta1与本条mr自带的ta的差值;其中,速度系数阈值为单位时间的通信信号传播速度系数,主要由传输时间颗粒度和传输距离区分度决定,可以根据基站的传输能力在50-200等范围取值。优选的,速度系数阈值选取78。
90.需要说明的是,速度系数阈值的选取仅出于示例的目的,而不是为了限制本发明的保护范围。根据实际情况,速度系数阈值可以选取其他数值。
91.步骤s34a:本条mr数据中自带的经纬度与该mr所属基站经纬度之间距离;
92.步骤s35a:如果计算值大于ta差阈值;其中,ta差阈值为ta1-ta的差值,如果该阈值比较大就表明存在错误的可能,可以根据不同基站比如2/3/4/5g取值范围在50-150之间。优选的,ta差阈值选取100。
93.需要说明的是,ta差阈值的选取仅出于示例的目的,而不是为了限制本发明的保护范围。根据实际情况,ta差阈值可以选取其他数值。
94.步骤s36a:如果计算值大于距离阈值;其中,距离阈值可以为计算mr位置与基站位置的差,经验值取100,也可以根据不同基站比如2/3/4/5g取值范围在500-10000之间。优选的,距离阈值选取7000米。
95.需要说明的是,距离阈值的选取仅出于示例的目的,而不是为了限制本发明的保护范围。根据实际情况,距离阈值可以选取其他数值。
96.步骤s37a:满足这两类情况的数据代表本条mr数据为异常数据。
97.(2)识别错误的基站基础信息是是为了发现提供的基础信息可能是错误的需要去核实纠正。
98.如图5所示,识别错误的基站基础信息,包括如下步骤:
99.步骤s31b,mr系统持续接收现网mr数据,其中有1%左右的数据是包含有采样时刻ue经纬度的mr数据,对这类数据进行收集;
100.步骤s32b,当收集时间达到预设时长,将这部分数据作为分析数据,其中,预设时长可以为15分钟,该收集时间段支持调节;
101.步骤s33b,对分析数据以各基站为单位,分别计算异常mr数据的占比。
102.在本步骤中,设某基站下的分析数据为m条,其中n条是异常mr数据,则异常mr数据的占比=n/m。
103.步骤s34b,如果异常mr数据的占比值大于异常阈值,则判断该基站为基础信息错误的基站;其中,异常阈值为在该基站范围产生的异常mr数据占比,可以在60%-99%范围取值。优选的,异常阈值选取80%是经验值。
104.需要说明的是,异常阈值的选取仅出于示例的目的,而不是为了限制本发明的保护范围。根据实际情况,异常阈值可以选取其他数值。
105.步骤s35b,将识别为基础信息错误的基站信息反馈至mr系统。
106.与现有技术相比,本发明相对于现有技术具有以下有益效果:本发明的目的就是开展指纹正确性和指纹质量的识别,提升指纹库中的指纹质量,及时、准确把错误和质量不高的指纹筛选出来,完成脏指纹的识别。脏指纹识别技术可以提升指纹库的质量,最终可以提升mr定位精度。
107.本发明的关键点是整个脏指纹识别装置,包括三个处理环节以及每个环节选取的
实现算法及算法参数,包括:(1)利用mr数据实现指纹定位的原理;(2)dbscan聚类算法;(3)google s2算法。
108.异常指纹识别装置是对mr定位技术有益的完善和提升。异常指纹实现异常mr指纹的去除,指纹规模的控制,异常基站信息识别三个功能。这三类功能在提升mr定位精度、提升定位性能等方面都有明显的优化效果。异常mr指纹的去除和异常基站信息识别两个功能可以防止错误指纹和基站信息影响定位,直接提升定位精度。指纹规模的控制功能可以防止不必要的过渡计算和存储,明显节约定位时间,提升定位性能。
109.在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
110.本领域技术人员不难理解,本发明包括上述说明书的发明内容和具体实施方式部分以及附图所示出的各部分的任意组合,限于篇幅并为使说明书简明而没有将这些组合构成的各方案一一描述。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
111.尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求及其等同限定。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献