一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

样本集构建、室内定位模型构建、室内定位方法和装置与流程

2021-10-27 14:07:00 来源:中国专利 TAG:方法 构建 定位 室内 样本


1.本发明涉及计算机技术领域,尤其涉及一种样本集构建方法、室内定位模型构建方法、室内定位方法和装置。


背景技术:

2.目前,一般基于样本集中的样本数据,采用机器学习方法构建出室内定位模型,并依据该构建出的室内定位模型,进行室内定位。如,依据构建出的室内定位模型,对室内运行的机器人进行定位或者规划行驶路线等。
3.在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
4.由于室内环境复杂度越来越大,样本集中脏数据的量越来越大,如何有效地去除样本集中的脏数据是需要解决的问题。


技术实现要素:

5.有鉴于此,本发明实施例提供一种样本集构建、室内定位模型构建、室内定位方法和装置,能够有效地去除样本集中的脏数据。
6.为实现上述目的,根据本发明实施例的一个方面,提供了一种样本集构建方法,包括:
7.获取已知参考点的多个信号强度;
8.根据所述多个信号强度,确定高概率发生区间;
9.从所述多个信号强度中,选取属于所述高概率发生区间的信号强度;
10.利用属于所述高概率发生区间的信号强度,为所述已知参考点生成对应的样本数据;
11.利用多个所述已知参考点对应的样本数据,构建样本集。
12.优选地,
13.当所述多个信号强度来源于至少两个信号源,且每一个所述信号源对应多个信号强度时,
14.针对每一个所述信号源对应的多个信号强度,执行确定高概率发生区间的步骤。
15.优选地,为所述已知参考点生成对应的样本数据,包括:
16.针对来源于同一信号源且的属于所述高概率发生区间的多个信号强度,执行:计算所述多个信号强度的平均值,将所述平均值作为所述已知参考点对应的样本数据;
17.或者,
18.针对属于所述高概率发生区间的信号强度,执行:计算每两个所述信号源之间的信号强度差,将所述信号强度差作为所述已知参考点的样本数据。
19.优选地,所述样本集构建方法,进一步包括:
20.从多个所述已知参考点中,为未知参考点选定满足预设间距阈值的多个目标已知参考点;
21.为每一个所述目标已知参考点分配对应的权重;
22.利用所述权重以及所述目标已知参考点对应的样本数据,为所述未知参考点计算对应的样本数据;
23.将所述未知参考点对应的样本数据添加到所述样本集中。
24.第二方面,本发明实施例提供一种室内定位模型构建方法,包括:
25.获取样本集,其中,所述样本集由多个样本数据构建,所述样本数据由属于高概率发生区间的信号强度生成;
26.利用所述样本集,迭代训练支持向量机,构建出室内定位模型。
27.优选地,所述室内定位模型构建方法,
28.进一步包括:为支持向量机中的参数设置有对应的第一取值范围;
29.在所述第一取值范围内,随机为支持向量机分配初始参数;
30.基于所述初始参数,执行所述迭代训练支持向量机的步骤。
31.优选地,所述室内定位模型构建方法,
32.进一步包括:为支持向量机的参数设置有迭代步长;
33.所述迭代训练支持向量机的步骤包括:
34.从第二次迭代开始,将每一次迭代作为当前迭代,执行:
35.确定所述当前迭代对应的上一迭代对应的参数;
36.为所述上一迭代对应的参数增加或减少所述迭代步长,作为所述当前迭代的参数;
37.基于所述当前迭代的参数,训练所述支持向量机;
38.当训练的结果满足预设的第一终止条件时,则终止迭代。
39.优选地,所述室内定位模型构建方法,
40.进一步包括:为支持向量机中的参数设置有对应的第二取值范围;
41.在所述第二取值范围内初始化烟花种群;
42.所述迭代训练支持向量机的步骤包括:
43.针对每一次迭代,执行:
44.确定烟花种群,确定所述烟花种群中的烟花的爆炸火花和变异火花;
45.计算所述爆炸火花和所述变异火花的适应度;
46.判断当前迭代的结果是否满足第二终止条件,
47.如果是,则将适应度最小的爆炸火花或适应度最小的变异火花作为训练结果,并结束当前流程;
48.否则,从所述爆炸火花和所述变异火花中,选取出多个目标火花组成烟花种群,其中,所述目标火花作为所述烟花种群中的烟花。
49.第三方面,本发明实施例提供一种基于上述任一方法构建出的室内定位模型实现的室内定位方法,包括:
50.获取待定位点的信号指纹信息;
51.将所述信号指纹信息输入所述室内定位模型,获得所述待定位点的位置信息。
52.优选地,所述获取待定位点的信号指纹信息,包括:
53.将采集到的待定位点的信号强度作为所述信号指纹信息;
54.或者,
55.针对采集到的至少两个信号源在待定位点的信号强度,计算每两个所述信号源对应的信号强度差,将所述信号强度差作为所述信号指纹信息。
56.第四方面,本发明实施例提供一种样本集构建装置,包括:
57.信号获取单元,用于获取已知参考点的多个信号强度;
58.信号处理单元,用于根据所述信号获取单元获取到的多个信号强度,确定高概率发生区间;从所述多个信号强度中,选取出属于所述高概率发生区间的信号强度;
59.样本集构建单元,用于利用所述信号处理单元选出的属于所述高概率发生区间的信号强度,为所述已知参考点生成对应的样本数据;利用多个所述已知参考点对应的样本数据,构建样本集。
60.优选地,
61.所述信号处理单元,用于当所述多个信号强度来源于至少两个信号源,且每一个所述信号源对应多个信号强度时,针对每一个所述信号源对应的多个信号强度,执行根据所述多个信号强度,确定高概率发生区间的步骤。
62.优选地,
63.所述信号处理单元,进一步用于从多个所述已知参考点中,为未知参考点选定满足预设间距阈值的多个目标已知参考点;为每一个所述目标已知参考点分配对应的权重;
64.所述样本集构建单元,进一步用于利用所述权重以及所述目标已知参考点对应的样本数据,为所述未知参考点计算对应的样本数据;将所述未知参考点对应的样本数据添加到所述样本集中。
65.第五方面,本发明实施例提供一种室内定位模型构建装置,包括:
66.样本集获取单元,用于获取样本集,其中,所述样本集由多个样本数据构建,所述样本数据由属于高概率发生区间的信号强度生成;
67.模型构建单元,用于利用所述样本集获取单元获取到的所述样本集,迭代训练支持向量机,构建出室内定位模型。
68.第六方面,本发明实施例提供一种室内定位装置,包括:
69.信息获取单元,用于获取待定位点的信号指纹信息;
70.位置确定单元,用于将所述信息获取单元获取到的信号指纹信息输入所述室内定位模型,获得所述待定位点的位置信息。
71.上述发明中的一个实施例具有如下优点或有益效果:对于获取到的数据如信号强度来说,大部分为正常数据,而且正常数据分布一般比较集中,一般情况下,能够限定出正常数据所在的范围或区间,而小部分的异常数据即脏数据,则往往在正常数据所在的范围或区间之外,基于此,本发明实施例提供的方案根据多个信号强度,确定高概率发生区间;利用属于高概率发生区间的信号强度,为已知参考点生成对应的样本数据;利用多个已知参考点对应的样本数据,构建样本集,采用高概率发生区间实现了去除脏数据,即构建样本集的样本数据由去除脏数据后的数据得到,能够有效地去除样本集中的脏数据。
72.上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
73.附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
74.图1是根据本发明实施例的一种应用场景的示意图;
75.图2是根据本发明实施例的样本集构建方法的主要流程的示意图;
76.图3是根据本发明另一实施例的样本集构建方法的主要流程的示意图;
77.图4是根据本发明实施例的样本数据采集场地的示意图;
78.图5是根据本发明实施例的室内定位模型构建方法的主要流程的示意图;
79.图6是根据本发明实施例的迭代训练支持向量机的主要流程的示意图;
80.图7是根据本发明另一实施例的迭代训练支持向量机的主要流程的示意图;
81.图8是根据本发明实施例的室内定位方法的主要流程的示意图;
82.图9是根据本发明实施例的样本集构建装置的主要单元的示意图;
83.图10是根据本发明实施例的室内定位模型构建装置的主要单元的示意图;
84.图11是根据本发明实施例的室内定位装置的主要单元的示意图;
85.图12是本发明实施例可以应用于其中的示例性系统架构图;
86.图13是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
87.以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
88.本发明实施例提供的方案的一种应用场景可如图1所示。在图1中,由于在不同位置能够接收信号发生设备如无线路由器、通信塔等产生的信号强度有所差异,因此,可基于该信号强度,构建信号强度与位置关系的模型。那么,在获取到一个未知位置的信号强度之后,即可定位出该未知位置。通过信号采集设备如手机、电脑、平板等,在已知参考点采集信号发生设备(图1示出的ap1、ap2、

、apn)发出的信号强度,将已知参考点的位置信息和采集到的信号强度可存储到对应的数据库中。该位置信息与采集到的信号强度的存储可以如下表1所示。
89.表1
90.参考点位置信息信号强度i1(x1,y1)(rssi
11ap1
,rssi
12ap1
,...,rssi
1ab
)i2(x2,y2)(rssi
21ap1
,rssi
22ap1
,...,rssi
2ab
)
………………
i
j
(x
j
,y
j
)(rssi
j1ap1
,rssi
j2ap1
,...,rssi
jab
)
91.其中,i
j
表征第j个已知参考点;rssi
jab
表征在第j个已知参考点第a次采集到的信号发生源b的信号强度;j的取值为不小于1的正整数;a的取值为不小于1的正整数;b的取值范围为ap1、ap2、...、apn;(x
j
,y
j
)表征第j个已知参考点所对应的位置信息(位置坐标)。
92.其中,已知参考点的位置坐标是基于同一坐标系确定出的,比如,该坐标系为在室
内任意构建出的坐标系。
93.基于采集到的上述已知参考点的信号强度,构建出样本集,并基于样本集,训练数据模型。可基于训练后的数据模型,根据未知点的信号强度得到该未知点的位置。其应用于室内位置确定、管理以及路径规划,比如,确定室内扫地机器人、送餐机器人、仓库搬运设备等在室内的位置、为室内扫地机器人、送餐机器人、仓库搬运设备等规划行驶路径等。
94.已知参考点是指位置信息已经被确定,且对应的信号强度也已被采集到。
95.相应地,未知参考点是指位置信息已经被确定,但是对应的信号强度未被采集。
96.其中,位置信息可以为坐标位置,对于分布区域比较小或者分布在室内的已知参考点和/或未知参考点来说,该坐标位置可以为预先构建出的坐标系(比如用户根据建筑结构特点构建出的坐标系等)中的坐标位置;对于分布区域比较大的已知参考点和/或未知参考点来说,该坐标位置还可以为经、纬度。
97.图2是根据本发明实施例的样本集构建方法。如图1所示,该样本集构建方法可包括如下步骤:
98.201:获取已知参考点的多个信号强度;
99.202:根据多个信号强度,确定高概率发生区间;
100.203:从多个信号强度中,选取出属于高概率发生区间的信号强度;
101.204:利用属于高概率发生区间的信号强度,为已知参考点生成对应的样本数据;
102.205:利用多个已知参考点对应的样本数据,构建样本集。
103.对于获取到的数据如信号强度来说,大部分为正常数据,而且正常数据分布一般比较集中,一般情况下,能够限定出正常数据所在的范围或区间,而小部分的异常数据即脏数据,则往往在正常数据所在的范围或区间之外,基于此,本发明实施例提供的方案根据多个信号强度,确定高概率发生区间;利用属于高概率发生区间的信号强度,为已知参考点生成对应的样本数据;利用多个已知参考点对应的样本数据,构建样本集,采用高概率发生区间实现了去除脏数据,即构建样本集的样本数据是由去除脏数据后的数据得到的,能够有效地去除样本集中的脏数据。
104.其中,步骤201的具体实施方式可包括:接收信号采集设备在已知参考点采集到的信号强度。该信号采集设备在已知参考点采集信号强度,比如,对于wifi信号来说,通过笔记本电脑上安装wifi信号采集软件wifiscan进行采集,实现上述步骤201。
105.其中,步骤202的具体实施方式可包括:确定高概率发生区间为下述计算公式(1)得到的区间范围。
106.计算公式(1)
107.108.其中,n
j
表征第j个已知参考点对应的信号强度个数;rssi
ji
表征第j个已知参考点对应的第i个信号强度;j和i均为不小于1的正整数。
109.相应地,在多个信号强度中,大于等于
110.且小于等于
111.的信号强度,即为属于高概率发生区间的信号强度。
112.在本发明一个实施例中,当多个信号强度来源于至少两个信号源,且每一个信号源对应多个信号强度时,针对每一个信号源对应的多个信号强度,执行根据多个信号强度,确定高概率发生区间的步骤。
113.比如,在已知参考点a获取到的信号强度来源于信号源ap1、ap2以及ap3。其中,
114.信号源ap1对应的信号强度为rssi1、rssi2、rssi3、

、rssi
n
;相应地,后续选取属于高概率发生区间的信号强度,生成样本数据则具体为:通过rssi1、rssi2、rssi3、

、rssi
n
确定信号源ap1的高概率发生区间,并从rssi1、rssi2、rssi3、

、rssi
n
中选取属于信号源ap1的高概率发生区间的信号强度,从而为已知参考点a生成该信号源ap1对应的样本数据;
115.信号源ap2对应的信号强度为rssi
n 1
、rssi
n 2
、rssi
n 3


、rssi
2n
;后续选取属于高概率发生区间的信号强度,生成样本数据则具体为:通过rssi
n 1
、rssi
n 2
、rssi
n 3


、rssi
2n
确定信号源ap2的高概率发生区间,并从rssi
n 1
、rssi
n 2
、rssi
n 3


、rssi
2n
中选取属于信号源ap2的高概率发生区间的信号强度,从而为已知参考点a生成该信号源ap2对应的样本数据;
116.信号源ap3对应的信号强度为:
117.rssi
2n 1
、rssi
2n 2
、rssi
2n 3


、rssi
3n
;则通过
118.rssi
2n 1
、rssi
2n 2
、rssi
2n 3


、rssi
3n
确定信号源ap3的高概率发生区间,并从rssi
2n 1
、rssi
2n 2
、rssi
2n 3


、rssi
3n
中选取属于信号源ap3的高概率发生区间的信号强度,从而为已知参考点a生成该信号源ap3对应的样本数据。
119.通过上述实施例,实现了按照已知参考点和信号源统计信号强度,避免了由于不同信号源到已知参考点的距离差异以及不同信号源产生的信号强度差异而导致的误差。
120.在本发明一个实施例中,上述步骤204生成样本数据的具体实现方式可以有两种。
121.第一种样本数据的具体实现方式:
122.针对来源于同一信号源且属于高概率发生区间的多个信号强度,执行:计算多个信号强度的平均值,将平均值作为已知参考点对应的样本数据。
123.其中,可采用下述计算公式(2),计算多个信号强度的平均值;
124.计算公式(2):
[0125][0126]
其中,表征信号源apn所对应的平均值;m
apn
表征源于信号源apn且属于高
概率发生区间的信号强度的个数;rssi
tapn
表征来源于信号源apn且属于高概率发生区间的第t个信号强度,t为不大于m的正整数,m为不小于2的正整数。
[0127]
第二种样本数据的具体实现方式:
[0128]
针对属于高概率发生区间的信号强度,执行:计算每两个信号源之间的信号强度差,将信号强度差作为已知参考点的样本数据。
[0129]
其中,计算每两个信号源之间的信号强度差可采用下述计算公式(3)计算得到:
[0130]
计算公式(3):
[0131][0132]
其中,rssu
api-apj
表征信号源api与信号源apj之间的信号强度差;表征由源于信号源api且属于高概率发生区间的多个信号强度计算得到的平均值;表征由源于信号源apj且属于高概率发生区间的多个信号强度计算得到的平均值。
[0133]
在本发明一个实施例中,如图3所示,上述样本集构建方法可进一步包括如下步骤:
[0134]
301:从多个已知参考点中,为未知参考点选定满足预设间距阈值的多个目标已知参考点;
[0135]
302:为每一个目标已知参考点分配对应的权重;
[0136]
303:利用权重以及目标已知参考点对应的样本数据,为未知参考点计算对应的样本数据;
[0137]
304:将未知参考点对应的样本数据添加到样本集中。
[0138]
通过上述过程实现了为样本集增加样本数据,使样本集更加丰富性。由于未知参考点的样本数据是由已知参考点的样本数据得到的,避免了获取未知参考点的多个信号强度以及确定高概率发生区间的步骤,其中,获取已知参考点的多个信号强度的过程一般需要花费比较长的时间,而基于已知参考点的样本数据,能够有效的缩短得到未知参考点的样本数据所需时间,因此,本实施例提供的方案能够有效地提高构建样本集的效率。
[0139]
一般已知参考点与未知参考点相间存在。如图4给出的样本数据采集场地,包括4间房间和走廊部分的矩形区域。为该矩形区域划分出1米
×
1米的网格,每一个网格中的点(如网格的中心点或非中心点)即为已知参考点或未知参考点,其中,图4示出的c1、c2、c3、c4、c5、c6、c7、c8、c9、c10为部分已知参考点,相对应的c1、c2、c3、c4、c5、c6、c7、c8、c9、c10、c11为部分未知参考点。其中,图4给出的部分已知参考点和部分未知参考点的分布仅是一个示例,还可以有其他分布方式(只需要保证以未知参考点为中心设定阈值为半径的范围内存在已知参考点即可)。
[0140]
满足预设间距阈值一般是指与未知参考点间距不大于2倍的网格边长的已知参考点(比如网格边长为1米,则满足预设间距阈值为与未知参考点间距不大于2米的已知参考点),以保证选出的目标已知参考点基本与未知参考点相邻。
[0141]
其中,步骤302和步骤303可采用克里金插值法计算得到。克里金插值法是通过参考已知点的特征进而对未知点进行最优无偏估计,首先构建与定位区域内参考点信息相对应的变差函数模型,然后在此结构分析的基础之上求解克里金方程确定,得出未知估计点的坐标位置,并通过交叉验证得到待估计点的特征属性值。
[0142]
其中,为每一个目标已知参考点分配对应的权重具体可由下述计算公式组计算得到:
[0143]
计算公式组:
[0144][0145]
其中,λ
i
表征步骤301中选定的第i个目标已知参数点所对应的权重;h表征步骤301中选定的目标已知参数点总个数;cov(x
i
,x
j
)表征选定的第i个目标已知参数点对应的信号强度与选定的第j个目标已知参数点对应的信号强度之间的协方差(第j个目标已知参数点指示为除第i个目标已知参数点之外的随机选出的任意一个目标已知参数据点);cov(x0,x
i
)表征未知参考点对应的信号强度与第i个目标已知参数点对应的信号强度之间的协方差;μ表征拉格朗日系数。
[0146]
上述计算公式组获得的具体过程:
[0147]
假设区域化变量z(x)(信号强度在区域的变量)在整个研究区域内满足二阶平稳,
[0148]
即,假设z(x)的数学期望存在且等于常数:e[z(x)]=m(常数),z(x)的协方差cov(x
i
,x
j
)存在且只与两点之间的相对位置有关。
[0149]
或假设区域化变量z(x)满足本征假设:e[z(x
i
)-z(x
j
)]=0,增量的方差存在且平稳:var[z(x
i
)-z(x
j
)]=e[z(x
i
)-z(x
j
)]2。
[0150]
依据无偏性要求:e[z
*
(x0)]=e[z(x0)],经上所述可推导出:
[0151][0152]
在无偏条件下使估计方差达到最小,即:
[0153][0154]
其中μ为拉格朗日系数,于是可得出上述计算公式组,从而求得各个目标已知参考点的权重λ
i(i=1,2,...,h
)
°
[0155]
基于上述计算出的权重,采用下述计算公式(4),计算未知参考点对应的样本数据。
[0156]
计算公式(4):
[0157][0158]
其中,z
*
(x0)表征未知参考点x0的信号强度;z(x
i
)表征第i个目标已知参数点的信号强度;λ
i
表征步骤s301中选定的第i个目标已知参数点所对应的权重;h表征步骤s301中选定的目标已知参数点总个数。
[0159]
即求出诸权重λ
i(i=1,2,...,h)
后,就可求出未知参考点x0的信号强度z
*
(x0)。
[0160]
另外,在上述样本集构建过程中,可选用两种型号的采集设备在已知参考点采集多次信号强度,这样可将一种型号的采集设备采集到的多次信号强度作为训练样本集,将另一种型号的采集设备采集到的多次信号强度作为测试样本集。其中每一种型号的采集设备在每一个已知参考点采集信号强度的次数一般不小于12次。
[0161]
比如,针对图4给出的样本数据采集场地,使用一种型号的pc端的wifi信号采集软件wifiscan对每个已知参考点采集12次数据,每秒采集一次,最后得出训练样本集。测试定位精度的样本集(应用于模型测试阶段的样本集)则采用另一种型号的笔记本的wifi信号采集软件随机在图4中的各个区域(房间1、房间2、房间3、房间4及走廊)各采集多条信号强度,以构建出测试样本集。
[0162]
如图5所示,本发明实施例提供一种室内定位模型构建方法,该室内定位模型构建方法可包括如下步骤:
[0163]
501:获取样本集,其中,样本集由多个样本数据构建,样本数据由属于高概率发生区间的信号强度生成;
[0164]
502:利用样本集,迭代训练支持向量机,构建出室内定位模型。
[0165]
由于样本集中的样本数据由属于高概率发生区间的信号强度生成,其使整个样本集中的样本数据的有效性和准确度大大提高,在样本集中的样本数据的有效性和准确度大大提高的前提下,基于该样本集构建出的室内定位模型的准确性也得到了有效地提高。
[0166]
在本发明一个实施例中,上述室内定位模型构建方法可进一步包括:为支持向量机中的参数设置对应的第一取值范围;在第一取值范围内,随机为支持向量机分配初始参数;基于初始参数,执行迭代训练支持向量机的步骤。其中,第一取值范围为0.1~10。
[0167]
通过上述为支持向量机中的参数设置对应的第一取值范围;在第一取值范围内,随机为支持向量机分配初始参数,有效地缩小了参数范围,在保证训练结果的准确性的同时,能够有效地减少迭代次数。
[0168]
在本发明一个实施例中,上述室内定位模型构建方法可进一步包括:为支持向量机的参数设置迭代步长;相应地,如图6所示,从第二次迭代开始,将每一次迭代作为当前迭代,可执行步骤601至步骤604:
[0169]
601:确定当前迭代对应的上一迭代对应的参数;
[0170]
602:为上一迭代对应的参数增加或减少迭代步长,作为当前迭代的参数;
[0171]
603:基于当前迭代的参数,训练支持向量机;
[0172]
604:当训练的结果满足预设的第一终止条件时,则终止迭代。
[0173]
上述为支持向量机的参数设置迭代步长的具体实施方式为,每次迭代的上一迭代参数乘以0.1或者10作为一个步长,从而得到当前迭代参数。比如,上一迭代的一个参数为0.1,当前迭代的一个步长为0.1
×
0.1=0.01,该参数为0.1 0.01=0.11;又比如,上一迭代的一个参数为10,当前迭代的一个步长为10
×
0.1=1,该参数为10-1=9。
[0174]
上述第一终止条件可以为:迭代次数达到预设的第一迭代次数阈值;或者,上述第一终止条件可以为:当前迭代的结果与上一迭代的结果之间的差值不大于预设的差值阈值;或者,上述第一终止条件可以为:当前迭代产生的模型进行室内定位产生的定位结果与实际位置之间的差异不大于预设的差异阈值。
[0175]
值得说明的是,当图6给出的实施例中确定出参数值后,可对该参数值再细化搜索更准确的值。该对参数值再细化搜索更准确的值可以有两种具体实施方式,方式一:缩小步长取值,进一步为该确定出的参数值确定一个区间,在该区间内采用缩小后的步长进一步执行上述图6示出的迭代过程。方式二为:采用图7示出的迭代过程实现。
[0176]
值得说明的是,下述图7给出的具体过程可作为图6示出的实施例的并列实施例,也可作为图6示出的实施例的进一步限定。
[0177]
在本发明一个实施例中,针对迭代训练支持向量机,如图7所示,上述室内定位模型构建方法可包括:
[0178]
701:为支持向量机中的参数设置对应的第二取值范围;
[0179]
当图7给出的具体过程作为图6示出的实施例的并列实施例时,该第二取值范围可以与第一取值范围一致,也可与第一取值范围不同,该第二取值范围可为人为设定的。当图7给出的具体过程作为图6示出的实施例的进一步限定,该第二取值范围是基于图6示出的实施例得到的最后一次迭代产生的参数,确定出的一个取值区间。
[0180]
702:在第二取值范围内初始化烟花种群;
[0181]
针对每一次迭代,执行步骤703至步骤707:
[0182]
703:确定烟花种群,确定烟花种群中的烟花的爆炸火花和变异火花;
[0183]
704:计算爆炸火花和变异火花的适应度;
[0184]
705:判断当前迭代的结果是否满足第二终止条件,如果是,则执行步骤706;否则,执行步骤707;
[0185]
706:将适应度最小的爆炸火花或适应度最小的变异火花作为训练结果,并结束当前流程;
[0186]
707:从爆炸火花和变异火花中,选取出多个目标火花组成烟花种群,其中,目标火花作为烟花种群中的烟花。
[0187]
其中,在上述步骤702中,可通过计算爆炸算子计算烟花种群中的烟花g
i
每一次爆炸产生的火花个数s
i
和爆炸幅度半径a
i

[0188]
其中,火花个数s
i
可通过下述的计算公式(5)计算得到,爆炸幅度半径a
i
可通过下述计算公式(6)计算得到。
[0189]
计算公式(5):
[0190][0191]
计算公式(6):
[0192][0193]
其中w表征常数,用以控制火花总数,y
max
=max(f(g
i
))表征当前烟花种群中适应度最大值,y
min
=min(f(g
i
))表征当前种群中适应度最小值,表征最大的爆炸幅度,ε表征一极小常数以免出现除零操作;g
i
表征当前烟花种群中第i个爆炸烟花;p表征当前烟花种群中包括的爆炸烟花总数。
[0194]
另外,f(g
i
)=1-d(g
i
),其中,f(g
i
)表征当前种群中烟花g
i
对应的适应度;d(g
i
)表
征当前种群中烟花g
i
对应的定位精度的准确率。
[0195]
另外,确定变异火花,可通过变异算子计算得出高斯变异火花。具体:随机选取一个火花g
iu
并且对其在第u维上进行高斯变异操作,其中v是服从v~n(1,1)的高斯分布随机值。
[0196]
变异算子:
[0197]
g
iu
=g
iu
×
v
[0198]
采用模运算映射规则将越界的火花映射到可行域内。
[0199]
模型运算映射规则:
[0200]
g
iu
=g
minu
|g
iu
|%(g
maxu-g
minu
)
[0201]
其中,g
iu
表征越界的第i个火花在第u维上的位置;g
maxu
和g
minu
分别表示第u维上的上下边界。
[0202]
上述步骤704的具体实施方式为,通过1减爆炸烟花或变异火花的对应的定位精度的准确率,即可得到爆炸火花或变异火花的适应度。
[0203]
第二终止条件可以为迭代次数达到预设的第二迭代次数阈值。
[0204]
上述步骤707的具体实施方式可为:
[0205]
采用精英策略选取本次迭代过程中适应度函数值最小的火花(即最优火花)作为下一次迭代的爆炸烟花,下一次迭代的其余n个烟花则采用轮盘赌博的方式进行选取。火花g
i
被选取的概率公式p(g
i
)如下所示。
[0206][0207]
其中,r(g
i
)为两个个体之间的欧式距离。
[0208]
r(g
i
)=∑
j∈k
||g
i-g
j
||
[0209]
其中,g
i
表征当前迭代产生的爆炸火花和变异火花中第i个火花;g
j
表征当前迭代产生的爆炸火花和变异火花中的任意一个火花;k表征g
i
和g
j
所属于的爆炸烟花所产生的火花集合;
[0210]
根据概率从大到小的顺序,选取n个火花组成下一迭代的烟花种群。
[0211]
如图8所示,本发明实施例提供一种基于上述实施例构建出的室内定位模型实现的室内定位方法,该室内定位方法可包括如下步骤:
[0212]
801:获取待定位点的信号指纹信息;
[0213]
802:将信号指纹信息输入室内定位模型,获得待定位点的位置信息。
[0214]
上述步骤801可以为:采集待定位点的信号强度,将采集到的信号强度作为信号指纹信息;
[0215]
上述步骤801还可以为:采集至少两个信号源在待定位点的信号强度,计算每两个信号源对应的信号强度差,将信号强度差作为信号指纹信息。
[0216]
利用信号强度差作为信号指纹信息能够去除采集信号强度的设备的硬件带来的误差,从而有效地提高定位准确性。
[0217]
如图9所示,本发明实施例提供一种样本集构建装置900,该样本集构建装置900可包括:
[0218]
信号获取单元901,用于获取已知参考点的多个信号强度;
[0219]
信号处理单元902,用于根据信号获取单元901获取到的多个信号强度,确定高概率发生区间;从多个信号强度中,选取出属于高概率发生区间的信号强度;
[0220]
样本集构建单元903,用于利用信号处理单元902选出的属于高概率发生区间的信号强度,为已知参考点生成对应的样本数据;利用多个已知参考点对应的样本数据,构建样本集。
[0221]
在本发明一个实施例中,信号处理单元902,用于当多个信号强度来源于至少两个信号源,且每一个信号源对应多个信号强度时,针对每一个信号源对应的多个信号强度,执行确定高概率发生区间的步骤。
[0222]
在本发明一个实施例中,样本集构建单元903,用于针对来源于同一信号源且的属于高概率发生区间的多个信号强度,执行:计算多个信号强度的平均值,将平均值作为已知参考点对应的样本数据。
[0223]
在本发明一个实施例中,样本集构建单元903,用于针对属于高概率发生区间的信号强度,执行:计算每两个信号源之间的信号强度差,将信号强度差作为已知参考点的样本数据。
[0224]
在本发明一个实施例中,信号处理单元902,进一步用于从多个已知参考点中,为未知参考点选定满足预设间距阈值的多个目标已知参考点;为每一个目标已知参考点分配对应的权重;
[0225]
样本集构建单元903,进一步用于利用信号处理单元902分配的权重以及目标已知参考点对应的样本数据,为未知参考点计算对应的样本数据;将未知参考点对应的样本数据添加到样本集中。
[0226]
如图10所示,本发明实施例提供一种室内定位模型构建装置1000,该室内定位模型构建装置1000可包括:
[0227]
样本集获取单元1001,用于获取样本集,其中,样本集由多个样本数据构建,样本数据由属于高概率发生区间的信号强度生成;
[0228]
模型构建单元1002,用于利用样本集获取单元获取到的样本集,迭代训练支持向量机,构建出室内定位模型。
[0229]
其中,样本集获取单元1001可以为获取上述图9所示的实施例的样本集构建装置900构建出的样本集。
[0230]
在本发明一个实施例中,模型构建单元1002,进一步用于为支持向量机中的参数设置有对应的第一取值范围;在第一取值范围内,随机为支持向量机分配初始参数;基于初始参数,执行迭代训练支持向量机的步骤。
[0231]
在本发明一个实施例中,模型构建单元1002,进一步用于为支持向量机的参数设置有迭代步长;从第二次迭代开始,将每一次迭代作为当前迭代,执行:确定当前迭代对应的上一迭代对应的参数;为上一迭代对应的参数增加或减少迭代步长,作为当前迭代的参数;基于当前迭代的参数,训练支持向量机;当训练的结果满足预设的第一终止条件时,则终止迭代。
[0232]
在本发明一个实施例中,模型构建单元1002,进一步用于为支持向量机中的参数设置有对应的第二取值范围;在所述第二取值范围内初始化烟花种群;针对每一次迭代,执行:确定烟花种群,确定烟花种群中的烟花的爆炸火花和变异火花;计算爆炸火花和变异火
花的适应度;判断当前迭代的结果是否满足第二终止条件,如果是,则将适应度最小的爆炸火花或适应度最小的变异火花作为训练结果,并结束当前流程;否则,从爆炸火花和变异火花中,选取出多个目标火花组成烟花种群,其中,目标火花作为烟花种群中的烟花。
[0233]
如图11所示,本发明实施例提供一种室内定位装置1100,该室内定位装置1100可包括:
[0234]
信息获取单元1101,用于获取待定位点的信号指纹信息;
[0235]
位置确定单元1102,用于将信息获取单元获取到的信号指纹信息输入室内定位模型,获得待定位点的位置信息。
[0236]
在本发明一个实施例中,信息获取单元1101,用于将采集到的待定位点的信号强度作为所述信号指纹信息。
[0237]
在本发明一个实施例中,信息获取单元1101,进一步用于针对采集到的至少两个信号源在待定位点的信号强度,计算每两个信号源对应的信号强度差,将信号强度差作为信号指纹信息。
[0238]
值得说明的是,位置确定单元1102所采用的室内定位模型可来源于上述实施例提供的室内定位模型构建装置1000构建出的室内定位模型。
[0239]
另外,上述样本集构建装置900、室内定位模型构建装置1000以及室内定位装置1100可以插件的形式集成到同一设备或系统中。
[0240]
另外,上述样本集构建装置900、室内定位模型构建装置1000以及室内定位装置1100可集成一个集样本构建、室内定位模型构建以及室内定位为一体的装置或设备。
[0241]
另外,上述样本集构建装置900和室内定位模型构建装置1000可集成到同一设备,室内定位装置1100在另一设备;样本集构建装置900单独在一个设备,室内定位模型构建装置1000和室内定位装置1100可集成到同一设备。
[0242]
图12示出了可以应用本发明实施例的样本集构建方法或样本集构建装置或室内定位模型构建方法或室内定位模型构建装置或室内定位方法或室内定位装置的示例性系统架构1200。
[0243]
如图12所示,系统架构1200可以包括终端设备1201、1202、1203,网络1204、服务器1205、数据库1206和自动移动设备1207。网络1204用以在终端设备1201、1202、1203和服务器1205之间、终端设备1201、1202、1203和数据库1206之间、服务器1205和数据库1206之间、数据库1206和自动移动设备1207之间、服务器1205和自动移动设备1207提供通信链路的介质。网络1204可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0244]
用户可以使用终端设备1201、1202、1203通过网络1204与服务器1205交互,以发送或接收信息等。终端设备1201、1202、1203通过网络1204与数据库1206交互,以发送或接收信号强度相关的信息等。数据库1206与服务器1205交互,以发送样本集或接收构建出得室内定位模型等。自动移动设备1207与服务器1205交互,以发送信号指纹信息或者接收定位结果。终端设备1201、1202、1203以及自动移动设备1207上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
[0245]
终端设备1201、1202、1203可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
[0246]
自动移动设备1207可以是仓库自动搬运设备、搬运机器人、送餐机器人、扫地机器人等。
[0247]
服务器1205可以是提供各种服务的服务器,例如对用户利用终端设备1201、1202、1203所采集到的信号强度提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的信号强度等数据进行分析等处理,并将处理结果(例如样本集、训练出的定位模型、定位结果
--
仅为示例)反馈给数据库、自动移动设备等。
[0248]
需要说明的是,本发明实施例所提供的样本集构建方法、室内定位模型构建方法以及室内定位方法一般由服务器1205执行,相应地,样本集构建装置、室内定位模型构建装置以及室内定位装置一般设置于服务器1205中。
[0249]
应该理解,图12中的终端设备、网络、服务器、数据库和自动移动设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络、服务器、数据库和自动移动设备。
[0250]
下面参考图13,其示出了适于用来实现本发明实施例的终端设备或服务器的计算机系统1300的结构示意图。图13示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0251]
如图13所示,计算机系统1300包括中央处理单元(cpu)1301,其可以根据存储在只读存储器(rom)1302中的程序或者从存储部分1308加载到随机访问存储器(ram)1303中的程序而执行各种适当的动作和处理。在ram 1303中,还存储有系统1300操作所需的各种程序和数据。cpu 1301、rom 1302以及ram 1303通过总线1304彼此相连。输入/输出(i/o)接口1305也连接至总线1304。
[0252]
以下部件连接至i/o接口1305:包括键盘、鼠标等的输入部分1306;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分1307;包括硬盘等的存储部分1308;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分1309。通信部分1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至i/o接口1305。可拆卸介质1311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1310上,以便于从其上读出的计算机程序根据需要被安装入存储部分1308。
[0253]
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1309从网络上被下载和安装,和/或从可拆卸介质1311被安装。在该计算机程序被中央处理单元(cpu)1301执行时,执行本发明的系统中限定的上述功能。
[0254]
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程
序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0255]
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0256]
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括信号获取单元、信号处理单元和样本集构建单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,信号获取单元还可以被描述为“获取已知参考点的多个信号强度的单元”。
[0257]
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取已知参考点的多个信号强度;根据多个信号强度,确定高概率发生区间;从多个信号强度中,选取属于高概率发生区间的信号强度;利用属于高概率发生区间的信号强度,为已知参考点生成对应的样本数据;利用多个已知参考点对应的样本数据,构建样本集。
[0258]
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取样本集,其中,样本集由多个样本数据构建,样本数据由属于高概率发生区间的信号强度生成;利用样本集,迭代训练支持向量机,构建出室内定位模型。
[0259]
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取待定位点的信号指纹信息;将信号指纹信息输入室内定位模型,获得待定位点的位置信息。
[0260]
根据本发明实施例的技术方案,对于获取到的数据如信号强度来说,大部分为正常数据,而且正常数据分布一般比较集中,一般情况下,能够限定出正常数据所在的范围或区间,而小部分的异常数据即脏数据,则往往在正常数据所在的范围或区间之外,基于此,本发明实施例提供的方案根据多个信号强度,确定高概率发生区间;利用属于高概率发生区间的信号强度,为已知参考点生成对应的样本数据;利用多个已知参考点对应的样本数据,构建样本集,采用高概率发生区间实现了去除脏数据,即构建样本集的样本数据由去除脏数据后的数据得到,能够有效地去除样本集中的脏数据。
[0261]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜