一种区域数据的在线采集方法与流程

2022-03-14 01:04:04 来源：中国专利 TAG：

1.本发明涉及一种区域数据的在线采集方法，属于数据采集技术领域。

背景技术：

2.随着科学技术的发展，传感器技术，通信技术和无线传输技术也得到了迅速的发展。近年来，由于无线智能终端设备的爆炸性普及，无线智能终端设备已被广泛地用于执行感测任务，这使得移动人群感知技术引起了极大的关注。
3.传统意义上的数据采集往往是用特定的大型传感器在目标区域进行数据的收集，这无疑是费力且不长久的，而且消耗人力和财力，伴随着移动人群感知技术的兴起，这为特定的地理区域数据的采集带来了新的方法，并为区域数据采集定义了新范式。移动人员可以通过自身的轨迹路线刻意或者无意到达某个地点，再通过移动设备中的传感器采集并上传该区域的某些数据，任务发布者可以在一定的时空范围内获得该目标区域的整体感知图，这相比于传统的区域采集更高效且采集的范围更广。
4.现有的利用人群轨迹的数据采集方法基本都是建立在已知数据提供者在一段时间内的历史轨迹的情况下进行数据采集，而在某些紧急的数据采集任务中，在没有任何历史轨迹的情况下，我们希望获取到目标区域中的数据，同时更注重目标区域中较为重点区域的数据，频繁的采集这些区域的数据可以提高这些区域数据的可靠性，同时我们也希望选择的数据提供者在提供目标区域中重点区域数据的同时兼顾目标区域的覆盖率，如何在没有数据提供者历史轨迹的情况下进行上述在目标区域数据的快速采集，有待于我们解决。
5.公开于该背景技术部分的信息仅仅旨在增加对本发明的总体背景的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域普通技术人员所公知的现有技术。

技术实现要素：

6.本发明的目的在于克服现有技术中的不足，提供一种区域数据的在线采集方法，以解决现有技术中利用数据提供者历史轨迹进行数据采集，难以在没有数据提供者的历史轨迹的紧急任务中实现数据快速采集的技术问题。
7.为解决上述技术问题，本发明是采用下述技术方案实现的：
8.一种区域数据的在线采集方法，包括：
9.预先建立关于数据提供者的价值表，网格化目标区域，将目标区域划分重点区域和一般区域；
10.根据目标区域的大小随机选择指定数量的数据提供者对目标区域进行数据采集，获取目标区域的采集数据；
11.获取并根据数据提供者在目标区域内的运动轨迹，计算获取每位数据提供者的重点区域覆盖率和一般区域覆盖率；
12.根据所选数据提供者的重点区域覆盖率和一般区域覆盖率，计算每位数据提供者
的当前收益以及未来期望的最大收益；
13.根据每位数据提供者的当前收益和未来期望的最大收益，计算每位数据提供者的价值，完成对预建立的价值表的更新；
14.随机选择或查找价值表，选择下一轮对目标区域进行数据采集的数据提供者；
15.重复多轮选择数据提供者对目标区域进行数据采集，整合多轮数据提供者所采集的数据，完成对目标区域的数据采集。
16.作为本发明的一种优选技术方案，对所述数据提供者的区域覆盖率计算方法包括：
17.获取每轮数据提供者的数据采集时间，对数据采集时间划分多个等长时隙；
18.获取数据提供者在每个时隙内的位置信息，得到数据提供者在每轮数据采集时经过重点区域和一般区域的次数，建立轨迹统计矩阵；
19.根据轨迹统计矩阵完成对数据提供者的一般区域覆盖率和重点区域覆盖率的计算。
20.作为本发明的一种优选技术方案，所述数据提供者的重点区域覆盖率计算公式为：
[0021][0022]
其中，cd为数据提供者的移动轨迹在重点区域的覆盖率；x为计算覆盖率所依据的轨迹统计矩阵，|x|为所依据的轨迹统计矩阵中行的数量；i为数据提供者；m为一般区域网格的数量，n为重点区域网格的数量；j表示轨迹统计矩阵中的列，j从m 1至m n表示轨迹统计矩阵中的后n列代表的重点区域网格；v
ij
为第i位数据提供者经过第j个网格的次数；
[0023]
所述数据提供者的一般区域覆盖率的计算公式为：
[0024][0025]
其中，cp为数据提供者的移动轨迹在一般区域的覆盖率；j表示轨迹统计矩阵中的列，j从1至m表示轨迹统计矩阵中的前m列代表的一般区域网格，j从m 1至m n表示轨迹统计矩阵中的重点区域网格。
[0026]
作为本发明的一种优选技术方案，对数据提供者当前收益进行计算的公式为：
[0027]
δf(pk)＝f(s
′
)-f(s)
[0028]
其中，pk为集合p中的第k位数据提供者；p为选中的数据提供者的集合；δf(pk)为所选择数据提供者pk的当前收益；s
′
为已计算当前收益的数据提供者与下一位待计算当前收益的数据提供者pk的集合；f(s
′
)为集合s
′
中的数据提供者的当前收益；f(s)为在计算下一位数据提供者当前收益之前，s集合中数据提供者的当前收益；
[0029]
f(s)＝α
×
cp β
×
log
10
(cd)
[0030]
其中，s为本轮中已计算过当前收益的数据提供者的集合；cp为以集合s中数据提供者的轨迹统计矩阵为计算依据的一般区域覆盖率；cd为以集合s中数据提供者的轨迹统计矩阵为计算依据的重点区域覆盖率；
[0031]
f(s
′
)＝α
×
cp β
×
log
10
(cd)
[0032]
其中，s
′
为本轮中已计算过当前收益的数据提供者的集合；cp为以集合s
′
中数据提供者的轨迹统计矩阵为计算依据的一般区域覆盖率；cd为以集合s
′
中数据提供者的轨迹统计矩阵为计算依据的重点区域覆盖率。
[0033]
作为本发明的一种优选技术方案，所述数据提供者的未来期望的最大收益为剩余未选择的数据提供者中所拥有的最高价值。
[0034]
作为本发明的一种优选技术方案，数据提供者价值的计算公式为：
[0035]
q(s,pk)
′
＝q(s,pk) lr*(δf(pk) γmaxq(s
′
,p
′
)-q(s,pk))
[0036]
其中，lr为学习率；q(s,pk)为在选择s的情况洗选择pk的原有价值；q(s,pk)
′
为在选择s的情况下选择pk的现有价值；p
′
为剩下的拥有最高价值的数据提供者；maxq(s
′
,p
′
)为在选择s
′
的情况下，剩下的数据提供者所能提供的最高价值。
[0037]
作为本发明的一种优选技术方案，在一轮价值表的更新中，所述数据提供者的价值计算顺序与在本轮中数据提供者的收益计算顺序一致。
[0038]
作为本发明的一种优选技术方案，在一轮数据提供者的选择中对所述数据采集者的选择方式包括：
[0039]
随机生成一个位于0到1之间的固定数值作为探索概率；
[0040]
随机生成与数据采集者对应数量，且在0到1之间的随机数；
[0041]
对比随机数与探索概率的大小，根据对比结果从价值表或所有数据提供者中选择；
[0042]
其中，当所述随机数小于探索概率，从所有数据提供者中选择；
[0043]
当随机数大于或等于探索概率，通过查找价值表选择数据提供者。
[0044]
作为本发明的一种优选技术方案，从参与过所述数据采集的数据提供者中随机选择的概率为30％，从未参与所述数据采集的数据提供者中随机选择的概率为70％。
[0045]
作为本发明的一种优选技术方案，通过查找价值表选择数据提供者的方法包括：
[0046]
根据已选择的数据提供者的情况找到价值表的对应行；
[0047]
根据价值表的对应行判断剩余可选的数据提供者；
[0048]
比较剩余可选数据提供者的价值，选择最高价值的数据提供者，完成对数据提供者的选择。
[0049]
与现有技术相比，本发明所达到的有益效果：
[0050]
通过划分区域的重要程度，并利用人群在其上的轨迹进行特定的区域数据采集，在没有任何数据提供者历史移动轨迹的情况下选择数据提供者完成任务，可以解决数据采集中的冷启动问题，能够实现特殊紧急的数据采集任务。
附图说明
[0051]
图1是本发明的流程图；
[0052]
图2是本发明中通过价值表选择数据提供者的流程图。
具体实施方式
[0053]
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。
[0054]
如图1和图2所示，一种区域数据的在线采集方法，包括：
[0055]
预先建立关于数据提供者的价值表，网格化目标区域，将目标区域划分重点区域和一般区域。
[0056]
在将目标区域网格化并划分为一般区域和重点区域时，用r表示所有区域网格化后的集合，r＝{a1,a2,a3…am
}∪{b1,b2,b3…bn
}，其中，am表示一般区域的网格，m表示表示一般区域的网格数量，bn表示重点区域的网格，n表示重点区域的网格数量，预先建立的初始价值表为零，该表每一行表示每位数据提供者是否被选构成的组合，列表示每一位数据提供者，即执行数据采集之前每一位数据提供者的价值为零。
[0057]
根据目标区域的大小随机选择指定数量的数据提供者对目标区域进行数据采集，获取目标区域的采集数据。
[0058]
数据提供者的数量选择根据实际情况而定，用p表示选中的数据提供者的集合，p＝{p1,p2…
pz}，pk表示p中第k位数据提供者，z表示所选择的数据提供者数量。
[0059]
这里的每一轮数据提供者均会进行对目标区域的数据采集，下一轮与上一轮相比可以获得更好的在目标区域和重点区域上的覆盖率，在多轮的数据采集后，用户能够得到在此目标区域中可靠的重点区域的数据和所能得到的一般区域的数据。
[0060]
获取并根据数据提供者在目标区域内的运动轨迹，计算获取每位数据提供者的重点区域覆盖率和一般区域覆盖率。
[0061]
对数据提供者的区域覆盖率计算方法包括：
[0062]
获取每轮数据提供者的数据采集时间，对数据采集时间划分多个等长时隙；
[0063]
获取数据提供者在每个时隙内的位置信息，得到数据提供者在每轮数据采集时经过重点区域和一般区域的次数，建立轨迹统计矩阵；
[0064]
根据轨迹统计矩阵完成对数据提供者的一般区域覆盖率和重点区域覆盖率的计算。
[0065]
根据所选数据提供者的重点区域覆盖率和一般区域覆盖率，计算每位数据提供者的当前收益以及未来期望的最大收益。
[0066]
该收益是由一轮中的数据提供者以随机顺序逐个进行计算，且每一位数据提供者的当前收益是在其之前的数据提供者当前收益的基础上进行计算。
[0067]
用s表示在本轮中已计算过当前收益的数据提供者的集合，s中数据提供者的轨迹用轨迹矩阵l(s)表示，由于轨迹与附加时间相关联，将轨迹的时间范围表示为等长时隙t＝{t1,t2…
td}，tk表示第k个时隙；
[0068][0069]
其中，|s|表示s中数据提供者的数量，l
ij
∈r，l
ij
表示第i位数据提供者在第j个时隙所处的位置，其中i代表s中第i位数据提供者，j表示在第j个时隙。轨迹矩阵l(s)中的每一行表示s中每位数据提供者的轨迹，每一列表示在某个时隙内s中的数据提供者所处的位置。
[0070]
根据轨迹矩阵可得统计矩阵v(s)：
[0071][0072]
其中，|s|表示s中数据提供者的数量，v
ij
表示第i位数据提供者经过第j个网格的次数(重复不计)，其中i代表s中第i位数据提供者，j表示在第j个网格。统计矩阵前m列表示数据提供者经历的一般区域网格的次数，后n列表示经历的重点区域网格的次数。统计矩阵v(s)的每一行表示s中每位数据提供者的轨迹经过不同网格的次数，每一列表示某个网格被s中哪些数据提供者经历过。
[0073]
据提供者的重点区域覆盖率计算公式为：
[0074][0075]
其中，cd为数据提供者的移动轨迹在重点区域的覆盖率；x为计算覆盖率所依据的轨迹统计矩阵，|x|为所依据的轨迹统计矩阵中行的数量；i为数据提供者；m为一般区域网格的数量，n为重点区域网格的数量；j表示轨迹统计矩阵中的列，j从m 1至m n表示轨迹统计矩阵中的后n列代表的重点区域网格；v
ij
为第i位数据提供者经过第j个网格的次数；
[0076]
数据提供者的一般区域覆盖率的计算公式为：
[0077][0078]
其中，cp为数据提供者的移动轨迹在一般区域的覆盖率；x为计算覆盖率所依据的轨迹统计矩阵，|x|为所依据的轨迹统计矩阵中行的数量；i为数据提供者，代表轨迹统计中的行；m为一般区域网格的数量，n为重点区域网格的数量；j表示轨迹统计矩阵中的列，j从1至m表示轨迹统计矩阵中的前m列代表的一般区域网格，j从m 1至m n表示轨迹统计矩阵中的重点区域网格；v
ij
为第i位数据提供者经过第j个网格的次数。
[0079]
根据每位数据提供者的当前收益和未来期望的最大收益，计算每位数据提供者的价值，完成对预建立的价值表的更新；
[0080]
数据提供者pk的轨迹由轨迹向量l(pk)表示，l(pk)＝[l
1 l
2 l3…
ld]，得到统计向量v(pk)＝[v
1 v2…vm v
m 1
…vm n
]，将数据提供者pk的轨迹向量和统计向量合并到已计算收益的数据提供者的轨迹矩阵和统计矩阵中，得到l(s
′
)和v(s
′
)，并计算其当前收益，计算当前数据提供者的收益的公式为：
[0081]
δf(pk)＝f(s
′
)-f(s)
[0082]
其中，p为选中的数据提供者的集合；pk为集合p中的第k位数据提供者；δf(pk)为所选择数据提供者pk的当前收益；s
′
为已计算当前收益的数据提供者与下一位待计算当前收益的数据提供者pk的集合；f(s
′
)为集合s
′
中的数据提供者的当前收益；；f(s)为在计算下一位数据提供者当前收益之前，s集合中数据提供者的当前收益；
[0083]
f(s)＝α
×
cp β
×
log
10
(cd)
[0084]
其中，s为本轮中已计算过当前收益的数据提供者的集合；f(s)为在计算下一位数据提供者当前收益之前，s集合中数据提供者的当前收益；cp为以集合s中数据提供者的轨迹统计矩阵为计算依据的一般区域覆盖率；cd为以集合s中数据提供者的轨迹统计矩阵为
计算依据的重点区域覆盖率；α＝1；β＝0.3；
[0085]
f(s
′
)＝α
×
cp β
×
log
10
(cd)
[0086]
其中，s
′
为本轮中已计算过当前收益的数据提供者的集合；f(s
′
)为集合s
′
中的数据提供者的当前收益；cp为以集合s
′
中数据提供者的轨迹统计矩阵为计算依据的一般区域覆盖率；cd为以集合s
′
中数据提供者的轨迹统计矩阵为计算依据的重点区域覆盖率；α＝1；β＝0.3。
[0087]
需要注意的是，在技术f(s)和f(s
′
)时，其中的cp和cd在计算时所依据的轨迹统计矩阵不同，其中
[0088]
迭代上述的计算过程则可完成对本轮所有的数据提供者当前收益的计算。
[0089]
数据提供者的价值主要是由数据提供者的当前收益和对未来收益的预期构成，对未来收益的预期指预测所选的数据提供者在未来对数据采集整体覆盖率和覆盖度造成的影响。
[0090]
数据提供者的未来期望的最大收益为剩余未选择的数据提供者中所拥有的最高价值。
[0091]
数据提供者价值的计算公式为：
[0092]
q(s,pk)
′
＝q(s,pk) lr*(δf(pk) γmaxq(s
′
,p
′
)-q(s,pk))
[0093]
其中，s为已计算过当前收益的数据提供者的集合；p为选中的数据提供者的集合；pk为集合p中的第k位数据提供者；lr为学习率；s
′
为已计算当前收益的数据提供者与下一位待计算当前收益的数据提供者pk的集合；δf(pk)为数据提供者pk的当前收益；q(s,pk)为在选择s的情况洗选择pk的原有价值；q(s,pk)
′
为在选择s的情况下选择pk的现有价值；p
′
为剩下的拥有最高价值的数据提供者；maxq(s
′
,p
′
)为在选择s
′
的情况下，剩下的数据提供者所能提供的最高价值。
[0094]
maxq(s
′
,p
′
)体现了对未来收益的预期，具体表示为在选择了pk的情况下，s转变为s
′
，此时根据价值表选择剩余数据提供者中拥有最高价值的数据提供p
′
，该位数据提供者的价值即为maxq(s
′
,p
′
)。
[0095]
在一轮价值表的更新中，数据提供者的价值计算顺序与在本轮中数据提供者的收益计算顺序一致。
[0096]
对价值表的更新包括将更新后的价值放入价值表中，价值表每一行表示每位数据提供者是否被选构成的组合，在价值表中找到与集合s所对应的行，并将价值放入第pk列的格中，迭代上述过程，并依据数据提供者的价值的计算顺序更新数据提供者的价值，完成对价值表的更新。
[0097]
需要注意的是，每一轮更新的价值表将作为下一轮选择数据提供者的依据。
[0098]
随机选择或查找价值表，选择下一轮对目标区域进行数据采集的数据提供者；
[0099]
在一轮数据提供者的选择中对数据采集者的选择方式包括：
[0100]
随机生成一个位于0到1之间的固定数值作为探索概率；
[0101]
随机生成与数据采集者对应数量，且在0到1之间的随机数；
[0102]
对比随机数与探索概率的大小，根据对比结果从价值表或所有数据提供者中选择；
[0103]
其中，当所述随机数小于探索概率，从所有数据提供者中选择；
[0104]
当随机数大于或等于探索概率，通过查找价值表选择数据提供者。
[0105]
从参与过所述数据采集的数据提供者中随机选择的概率为30％，从未参与所述数据采集的数据提供者中随机选择的概率为70％。
[0106]
通过查找价值表选择数据提供者的方法包括：
[0107]
根据已选择的数据提供者的情况找到价值表的对应行；
[0108]
根据价值表的对应行判断剩余可选的数据提供者；
[0109]
比较剩余可选数据提供者的价值，选择最高价值的数据提供者，完成对数据提供者的选择。
[0110]
通过选择拥有最高价值的数据提供者可以提高相比于上一轮对目标区域中重点区域和一般区域的覆盖率，从而完成对目标区域的数据采集。
[0111]
重复多轮选择数据提供者对目标区域进行数据采集，整合多轮数据提供者所采集的数据，完成对目标区域的数据采集。
[0112]
重复多轮对数据提供者的选择为一个数据迭代的过程，以实现后续对目标区域的数据采集能够高效化，在避免冷启动的同时，可有效的提高数据采集的高效性。
[0113]
以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：基于微纳星群抵近侦察的空间目标特性测量、侦察方法与流程

一种区域数据的在线采集方法与流程

相关文献

最热文献