兴趣点获取方法、装置、电子设备及存储介质与流程

2022-06-22 16:37:43 来源：中国专利 TAG：

1.本技术涉及互联网技术领域，尤其涉及一种兴趣点获取方法、装置、电子设备以及存储介质。

背景技术：

2.随着互联网技术的进步和移动互联网的崛起，业务的实现与兴趣点(point of interest，poi)有着一定的关联性，越来越多的技术被应用于获取兴趣点。
3.现有的获取兴趣点的方法主要基于历史数据。然而由于历史数据本身的局限性，导致兴趣点的准确性差强人意。

技术实现要素：

4.本技术提供一种兴趣点获取方法，以至少解决相关技术中基于有限的信息数据获取poi的问题。
5.根据本技术公开实施例的第一方面，提供一种兴趣点获取方法，包括：
6.获取第一兴趣点数据和第一信息数据，所述第一兴趣点数据包括与信息数据对应的兴趣点，所述第一信息数据与第一时间信息对应；
7.对所述第一信息数据进行聚类，得到第一类信息数据，所述第一类信息数据为所述第一信息数据的聚类结果、且与第二时间信息对应；
8.根据所述第一类信息数据与第二时间信息，在所述第一类信息数据中确定与第三时间信息对应的第二类信息数据，所述第三时间信息、以及第二时间信息的时间间隔为预定间隔；
9.在所述第一兴趣点数据中，匹配所述第二类信息数据对应的第二信息数据，得到第二兴趣点数据。
10.作为一种可能的实施方式，所述根据所述第一类信息数据与第二时间信息，在所述第一类信息数据中确定与第三时间信息对应的第二类信息数据，包括：
11.以所述第一类信息数据、以及所述第二时间信息为参数，计算所述第一类信息数据所隐含的第三时间信息最大概率的第一类信息数据，
12.确定该最大概率的第一类信息数据为与所述第三时间信息对应的第二类信息数据；
13.其中，第二时间信息的时间间隔大于第三时间信息的时间间隔。
14.作为一种可能的实施方式，所述以所述第一类信息数据、以及所述第二时间信息为参数，计算所述第一类信息数据所隐含的第三时间信息最大概率的第一类信息数据，包括：
15.统计与所述第一类信息数据以及所述第三时间信息相关的所有第一兴趣点数据，得到数据集，
16.基于数据集，确定状态转移概率矩阵、以及观测概率矩阵，
17.利用所述状态转移概率矩阵以及所述观测概率矩阵，确定所述数据集中每个第三时间信息拥有最大概率的第一类信息数据；
18.其中，
19.所述状态转移概率矩阵用于表征：所述数据集中任意两第一类信息数据之间，从源信息数据转移到目的信息数据的次数，占据从所述源信息数据所转移的总次数中的概率；
20.所述观测概率矩阵用于表征：所述数据集中具有任一第三时间信息的任一第一类信息数据的数量，占据所述数据集中该第一类信息数据总数中的概率。
21.作为一种可能的实施方式，所述确定状态转移概率矩阵，包括：
22.构建具有m行m列的状态转移概率矩阵，
23.其中，
24.m为所述第一类信息数据的总数，
25.第i行第j列的矩阵元素为：所述数据集中从第i第一类信息数据转移到第j第一类信息数据的次数与从第i第一类信息数据所转移的总次数之比值。
26.作为一种可能的实施方式，所述确定观测概率矩阵包括：
27.构建具有m行r列的状态转移概率矩阵，
28.其中，
29.m为所述第一类信息数据的总数，r为所述第三时间信息的总数，
30.第i行第r列的矩阵元素为：所述数据集中在第三时间信息er具有第i第一类信息数据的数量与所述数据集中具有第i第一类信息数据信息的总数之比值。
31.作为一种可能的实施方式，所述利用所述状态转移概率矩阵以及所述观测概率矩阵，确定所述数据集中每个所述第二时间信息拥有最大概率的第一类信息数据，包括：
32.利用状态转移概率矩阵和观测概率矩阵，基于当前上一第一类信息数据，前向计算当前第三时间信息拥有最大概率的第一类信息数据，
33.在所述最大概率大于设定的概率阈值的情况下，将所述当前上一第一类信息数据更新为当前第三时间信息拥有最大概率的第一类信息数据，更新后的第一类信息数据用于进行下一第三时间信息拥有最大概率的第一类信息数据的计算；
34.否则，保持所述当前上一第一类信息数据不变，所述当前上一第一类信息数据用于进行下一第三时间信息的拥有最大概率的第一类信息数据的计算。
35.作为一种可能的实施方式，所述第一兴趣点数据以如下方式获得：
36.基于所述信息数据，获取信息序列，其中，所述信息序列为按照时间顺序对所述信息数据进行排序所得到的排序结果；
37.基于所述信息序列，确定轨迹数据；
38.去除轨迹数据中异常的信息序列，得到过滤后的轨迹数据；
39.基于过滤后的轨迹数据，识别目标信息数据，
40.将所述目标信息数据进行兴趣点匹配，得到所述第一兴趣点数据。
41.作为一种可能的实施方式，所述基于所述信息数据，获取信息序列，包括：
42.将所述信息数据中的位置信息按照地理散列转换为字符串；
43.将所述信息数据中的时间信息转换为具有设定单位级别的时间信息；
44.按照设定的时间聚合粒度、和设定的位置聚合粒度，将具有相同字符串和相同时间信息的所述信息数据进行聚合；
45.将聚合后的信息数据按照所述时间顺序进行排序，得到所述信息序列。
46.作为一种可能的实施方式，所述基于所述信息序列，确定轨迹数据，包括：
47.遍历所述信息序列中的每个信息点数据；
48.在任意相邻的第一信息点和第二信息点之间的时间间隔大于设定的分割时间间隔阈值的情况下，将所述第一信息点与第二信息点进行切分，得到至少一条以上轨迹线段的轨迹数据，
49.其中，
50.切分后的信息序列由切分处所确定的序列段组成，每个序列段分别对应为轨迹线段，每个信息点分别对应为轨迹点。
51.作为一种可能的实施方式，所述去除轨迹数据中异常的信息序列，得到过滤后的轨迹数据，包括：
52.检测各轨迹线段的轨迹数据中所存在的速度异常的信息点数据；
53.从不存在速度异常轨迹线段中，选择具有最多信息点的最长轨迹线段，以所述最长轨迹线段的起始信息点向前遍历所述信息序列，以所述最长轨迹线段的末尾信息点向后遍历所述信息序列，过滤掉速度异常的信息点，得到所述过滤后的轨迹数据。
54.作为一种可能的实施方式，所述检测各轨迹线段的轨迹数据中所存在的速度异常的信息点，包括：
55.检测各轨迹线段的轨迹数据中，任意相邻信息点之间的速度大于设定的速度阈值的信息点。
56.作为一种可能的实施方式，所述基于过滤后的轨迹数据，识别目标信息，包括：
57.遍历所述过滤后的轨迹数据；
58.计算当前遍历的轨迹点与其后的各轨迹点之间的距离，直至搜索到大于设定的距离阈值的轨迹点；
59.在所述当前遍历的轨迹点与所搜索到的轨迹点之间的时间间隔大于设定的时间间隔阈值的情况下，将所述当前遍历的轨迹点与所搜索到的轨迹点之间所包含的轨迹点的中心点作为所述目标信息数据，并将与所述所搜索到的轨迹点相邻的下一轨迹点作为当前遍历的轨迹点；
60.在所述当前遍历的轨迹点与所搜索到的轨迹点之间的时间间隔不大于所述时间间隔阈值的情况下，则将与所述所搜索到的轨迹点相邻的下一轨迹点作为当前遍历的轨迹点。
61.作为一种可能的实施方式，所述第一兴趣点数据包括第一多边形兴趣点和第一点状兴趣点，所述将所述目标信息数据进行兴趣点匹配，得到所述第一兴趣点数据，包括：
62.获取与所述目标信息数据处于同一区域内的地图数据，所述地图数据包括第二多边形兴趣点和第二点状兴趣点；
63.确定经过所述目标信息数据的任一射线与所述第二多边形兴趣点的交点，根据所述交点与所述目标信息数据的几何关系，确定包含所述目标信息数据的所述第一多边形兴趣点；
64.在所述第二点状兴趣点中，确定距离所述目标信息数据最近的所述第一点状兴趣点。
65.作为一种可能的实施方式，所述在所述第一兴趣点数据中，匹配所述第二类信息数据对应的第二信息数据，得到第二兴趣点数据，包括：
66.从所述第一兴趣点数据中，映射出与所述第二类信息数据对应的第一信息数据；
67.根据所映射的第一信息数据，确定其所匹配的每个兴趣点，并将每个兴趣点合并为并集；
68.将所述第二类信息数据与所述并集进行匹配，得到所述第二信息数据，
69.确定所述第二信息数据为所述第二兴趣点数据。
70.根据本技术公开实施例的第二方面，提供一种兴趣点获取装置，包括：：第一获取模块，被配置为获取第一兴趣点数据和第一信息数据，所述第一兴趣点数据包括与信息数据对应的兴趣点，所述第一信息数据与第一时间信息对应；
71.第二获取模块，被配置为对所述第一信息数据进行聚类，得到第一类信息数据，所述第一类信息数据为所述第一信息数据的聚类结果、且与第二时间信息对应；
72.确定模块，被配置为根据所述第一类信息数据与第二时间信息，在所述第一类信息数据中确定与第三时间信息对应的第二类信息数据，所述第三时间信息、以及第二时间信息的时间间隔为预定间隔；
73.匹配模块，被配置为在所述第一兴趣点数据中，匹配所述第二类信息数据对应的第二信息数据，得到第二兴趣点数据。
74.作为一种可能的实施方式，所述确定模块被配置为：
75.以所述第一类信息数据、以及所述第二时间信息为参数，计算所述第一类信息数据所隐含的第三时间信息最大概率的第一类信息数据，
76.确定该最大概率的第一类信息数据为与所述第三时间信息对应的第二类信息数据；
77.其中，第二时间信息的时间间隔大于第三时间信息的时间间隔。
78.作为一种可能的实施方式，所述确定模块被配置为：
79.统计与所述第一类信息数据以及所述第三时间信息相关的所有第一兴趣点数据，得到数据集，
80.基于数据集，确定状态转移概率矩阵、以及观测概率矩阵，
81.利用所述状态转移概率矩阵以及所述观测概率矩阵，确定所述数据集中每个第三时间信息拥有最大概率的第一类信息数据；
82.其中，
83.所述状态转移概率矩阵用于表征：所述数据集中任意两第一类信息数据之间，从源信息数据转移到目的信息数据的次数，占据从所述源信息数据所转移的总次数中的概率；
84.所述观测概率矩阵用于表征：所述数据集中具有任一第三时间信息的任一第一类信息数据的数量，占据所述数据集中该第一类信息数据总数中的概率。
85.作为一种可能的实施方式，所述确定模块被配置为：
86.构建具有m行m列的状态转移概率矩阵，
87.其中，
88.m为所述第一类信息数据的总数，
89.第i行第j列的矩阵元素为：所述数据集中从第i第一类信息数据转移到第j第一类信息数据的次数与从第i第一类信息数据所转移的总次数之比值。
90.作为一种可能的实施方式，所述确定模块被配置为：
91.构建具有m行r列的状态转移概率矩阵，
92.其中，
93.m为所述第一类信息数据的总数，r为所述第三时间信息的总数，
94.第i行第r列的矩阵元素为：所述数据集中在第三时间信息er具有第i第一类信息数据的数量与所述数据集中具有第i第一类信息数据信息的总数之比值。
95.作为一种可能的实施方式，所述确定模块被配置为：
96.利用状态转移概率矩阵和观测概率矩阵，基于当前上一第一类信息数据，前向计算当前第三时间信息拥有最大概率的第一类信息数据，
97.在所述最大概率大于设定的概率阈值的情况下，将所述当前上一第一类信息数据更新为当前第三时间信息拥有最大概率的第一类信息数据，更新后的第一类信息数据用于进行下一第三时间信息拥有最大概率的第一类信息数据的计算；
98.否则，保持所述当前上一第一类信息数据不变，所述当前上一第一类信息数据用于进行下一第三时间信息的拥有最大概率的第一类信息数据的计算。
99.作为一种可能的实施方式，所述第一获取模块被配置为：
100.基于所述信息数据，获取信息序列，其中，所述信息序列为按照时间顺序对所述信息数据进行排序所得到的排序结果；
101.基于所述信息序列，确定轨迹数据；
102.去除轨迹数据中异常的信息序列，得到过滤后的轨迹数据；
103.基于过滤后的轨迹数据，识别目标信息数据，
104.将所述目标信息数据进行兴趣点匹配，得到所述第一兴趣点数据。
105.作为一种可能的实施方式，所述第一获取模块被配置为：
106.将所述信息数据中的位置信息按照地理散列转换为字符串；
107.将所述信息数据中的时间信息转换为具有设定单位级别的时间信息；
108.按照设定的时间聚合粒度、和设定的位置聚合粒度，将具有相同字符串和相同时间信息的所述信息数据进行聚合；
109.将聚合后的信息数据按照所述时间顺序进行排序，得到所述信息序列。
110.作为一种可能的实施方式，所述第一获取模块被配置为：
111.遍历所述信息序列中的每个信息点数据；
112.在任意相邻的第一信息点和第二信息点之间的时间间隔大于设定的分割时间间隔阈值的情况下，将所述第一信息点与第二信息点进行切分，得到至少一条以上轨迹线段的轨迹数据，
113.其中，
114.切分后的信息序列由切分处所确定的序列段组成，每个序列段分别对应为轨迹线段，每个信息点分别对应为轨迹点。
115.作为一种可能的实施方式，所述第一获取模块被配置为：
116.检测各轨迹线段的轨迹数据中所存在的速度异常的目标信息点；
117.从不存在速度异常轨迹线段中，选择具有最多目标信息点的最长轨迹线段，以所述最长轨迹线段的起始位置信息点向前遍历所述位置序列信息序列，以所述最长轨迹线段的末尾位置信息点向后遍历所述目标信息序列，过滤掉速度异常的目标信息点，得到所述过滤后的轨迹数据。
118.作为一种可能的实施方式，所述第一获取模块被配置为：
119.检测各轨迹线段的轨迹数据中，任意相邻信息点之间的速度大于设定的速度阈值的信息点。
120.作为一种可能的实施方式，所述第一获取模块被配置为：
121.遍历所述过滤后的轨迹数据；
122.计算当前遍历的轨迹点与其后的各轨迹点之间的距离，直至搜索到大于设定的距离阈值的轨迹点；
123.在所述当前遍历的轨迹点与所搜索到的轨迹点之间的时间间隔大于设定的时间间隔阈值的情况下，将所述当前遍历的轨迹点与所搜索到的轨迹点之间所包含的轨迹点的中心点作为所述目标信息数据，并将与所述所搜索到的轨迹点相邻的下一轨迹点作为当前遍历的轨迹点；
124.在所述当前遍历的轨迹点与所搜索到的轨迹点之间的时间间隔不大于所述时间间隔阈值的情况下，则将与所述所搜索到的轨迹点相邻的下一轨迹点作为当前遍历的轨迹点。
125.作为一种可能的实施方式，所述第一兴趣点数据包括第一多边形兴趣点和第一点状兴趣点，所述第一获取模块被配置为：
126.获取与所述目标信息数据处于同一区域内的地图数据，所述地图数据包括第二多边形兴趣点和第二点状兴趣点；
127.确定经过所述目标信息数据的任一射线与所述第二多边形兴趣点的交点，根据所述交点与所述目标信息数据的几何关系，确定包含所述目标信息数据的所述第一多边形兴趣点；
128.在所述第二点状兴趣点中，确定距离所述目标信息数据最近的所述第一点状兴趣点。作为一种可能的实施方式，所述匹配模块被配置为：
129.从所述第一兴趣点数据中，映射出与所述第二类信息数据对应的第一信息数据；
130.根据所映射的第一信息数据，确定其所匹配的每个兴趣点，并将每个兴趣点合并为并集；
131.将所述第二类信息数据与所述并集进行匹配，得到所述第二信息数据，
132.确定所述第二信息数据为所述第二兴趣点数据。
133.根据本技术公开实施例的第三方面，提供一种电子设备，包括：
134.处理器；
135.用于存储所述处理器的可执行指令的存储器；
136.其中，所述处理器被配置为执行所述可执行指令，以实现任一所述一种的兴趣点获取方法。
137.根据本技术公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的至少一条指令被电子设备的处理器执行时，使得所述电子设备能够实现上述任一实施方式所述一种兴趣点获取方法。
138.根据本技术公开实施例的第五方面，提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述所述一种兴趣点获取方法。
139.本技术公开的实施例提供的技术方案至少带来以下有益效果：
140.本技术提供的兴趣点获取方法，通过从信息数据所获取的第一兴趣点数据，捕捉第一兴趣点数据中具有聚类性的信息数据，从而提供了信息数据受限时的poi预测能力，对第一兴趣点数据给予了补充和完善，解决了基于有限的信息数据的poi获取问题，从而对于基于信息数据的应用提供了有力的支持。
141.应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本技术公开。
附图说明
142.此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本技术公开的实施例，并与说明书一起用于解释本技术公开的原理，并不构成对本技术公开的不当限定。
143.图1是根据一示例性实施例示出的poi获取方法的一种流程示意图；
144.图2是根据一示例性实施例示出的基于信息数据获取第一poi数据的一种流程示意图
145.图3是根据一示例性实施例示出的获取轨迹数据的一种示意图；
146.图4是根据一示例性实施例示出的识别目标信息数据的一种示意图；
147.图5是根据一示例性实施例示出的基于第一poi数据进行预测一种流程示意图；
148.图6是根据一示例性实施例示出的获取状态集的一种示意图；
149.图7是根据一示例性实施例示出的前向计算各时间段具有最大概率的第一类信息数据的一种流程示意图；
150.图8是根据一示例性实施例示出的所述第二类信息数据与所述第一poi数据进行兴趣点融合的一种示意图；
151.图9是根据一示例性实施例示出的一种兴趣点的获取装置的一种示意图；
152.图10是根据一示例性实施例示出的电子设备的一种示意图。
具体实施方式
153.为了使本领域普通人员更好地理解本技术公开的技术方案，下面将结合附图，对本技术公开实施例中的技术方案进行清楚、完整地描述。
154.需要说明的是，本技术公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本技术公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本技术公开的一些方面相一致的装置和方法的例子。
155.本技术提出一种兴趣点的获取方法，从基于信息数据所获取的第一兴趣点数据中，获取具有聚类性的第一类信息数据和其对应的第二时间信息来进行预测，在第一类信息数据中确定与第三时间信息对应的第二类信息数据，并在第一兴趣点数据中，匹配所述第二类信息数据对应的第二信息数据，得到最终的兴趣点数据。
156.参见图1所示，图1是根据一示例性实施例示出的poi获取方法的一种流程示意图。在服务器侧，该方法包括：
157.步骤101，获取第一兴趣点数据和第一信息数据，所述第一兴趣点数据包括与信息数据对应的兴趣点，所述第一信息数据与第一时间信息对应；
158.作为一种示例，在位置服务应用场景中，信息数据是位置信息数据，第一兴趣点数据可以是从位置信息数据中所获取的驻留位置、以及驻留位置所对应的兴趣点，第一信息数据可以为具有第一时间信息的位置信息数据，其中，第一时间信息可以是设定的时间间隔或设定时间段。
159.步骤102，对所述第一信息数据进行聚类，得到第一类信息数据，所述第一类信息数据为所述第一信息数据的聚类结果、且与第二时间信息对应；
160.步骤103，根据所述第一类信息数据与第二时间信息，在所述第一类信息数据中确定与第三时间信息对应的第二类信息数据，所述第三时间信息、以及第二时间信息的时间间隔为预定间隔；
161.步骤104，在所述第一兴趣点数据中，匹配所述第二类信息数据对应的第二信息数据，得到第二兴趣点数据。
162.本实施例丰富和完善了第一poi数据，有效地结合信息数据和第一poi数据，对于信息数据的推荐都有重大意义，例如，借助位置信息数据的poi分析，推荐基于位置的应用服务，从而有利于提高信息数据推送的精准性。
163.参见图2所示，图2是根据一示例性实施例示出的基于信息数据获取第一poi数据的一种流程示意图。该方法包括：
164.步骤201，基于信息数据，获取信息序列，其中，信息序列为按照时间对信息数据进行排序所得到的排序结果，信息序列中的各个信息为各个信息点。
165.以信息数据是带有时间戳的地理位置信息的集合为例，采集频率高时的信息数据会十分密集，作为一种示例，为降低存储和计算成本，将用于表征地理位置信息的经纬度转换为字符串，例如，采用地理散列(geohash)来进行转换；将时间戳转为具有设定单位级别的时间信息，例如，分钟级别；然后按照设定的聚合时间粒度、以及设定的聚合位置粒度，对信息数据进行聚合，以将geohash相同、时间相同的信息数据进行聚合，并将聚合后的信息数据按照时间顺序进行排序，得到信息序列。这样，在不损失精度的情况下大大降低了计算和存储损耗。
166.参见图3所示，图3是根据一示例性实施例示出的获取轨迹数据的一种示意图。图中，原始的信息数据包括地理位置信息的经纬度、以及时间戳信息，其中时间戳信息包括年、月、日、时、分、秒信息。将时间戳信息转化为包括年、月、日、时、分的信息，将经纬度信息转换为一维的字符串；将具有相同的时间戳和字符串的信息数据进行聚合，例如，按照聚合时间粒度为分钟、聚合位置粒度为9位地理散列，将信息数据进行聚合，然后，按照时间升序进行排序。
167.步骤202，基于信息序列，确定轨迹数据。
168.一个实施例中，按照信息序列中相邻的信息点之间时间间隔来切分信息序列，即：
169.遍历信息序列中的每个信息点，当信息序列中任意两相邻的第一信息点和第二信息点之间的时间间隔超过设定的分割时间间隔阈值时，则将第一信息点和第二信息点之间进行切分，
170.这样，所有符合切分条件的信息点都进行了切分，切分后的信息序列由切分处所确定的序列段组成，从而得到至少一段以上的序列段，一个序列段便对应为一条轨迹线段，每个信息点对应为轨迹线段中的轨迹点，这样，信息数据被组织成为轨迹数据。
171.参见图3所示，图中，切分后的信息序列在切分处形成序列段。
172.步骤203，去除轨迹数据中异常的信息，得到过滤后的轨迹数据，即，过滤掉轨迹线段中异常的轨迹点。
173.鉴于正常情况下，轨迹线段中相邻轨迹点之间的速度不会超过设定的速度阈值，例如，在位置服务的应用场景下，速度阈值可以为140m/s。如果相邻轨迹点之间的速度超过设定的速度阈值，则可判定为异常轨迹点。
174.基于此，可检测各轨迹线段的轨迹数据(序列段)中是否存在速度异常的信息点；从不存在速度异常轨迹线段(序列段)中，选择具有最多信息点的序列段，即最长轨迹线段，以所述最长轨迹线段(序列段)的起始信息点向前遍历所述信息序列中的每个信息点，以所述最长轨迹线段(序列段)的末尾信息点向后遍历所述信息序列中的每个信息点，过滤掉速度异常的信息点，得到所述过滤后的轨迹数据。
175.参见图3所示，图中，序列段b为具有最多信息点、且无速度异常的信息点的序列段，则从序列段b中的起始点向前遍历所述信息序列中的每个信息点，从序列段b中的末尾信息点向前遍历所述信息序列中的每个信息点，去除速度异常的信息点。
176.步骤204，基于过滤后的轨迹数据，识别目标信息数据。
177.作为一种示例，
178.遍历所述过滤后的轨迹数据；
179.计算当前遍历的轨迹点与其后的各轨迹点之间的距离，直至搜索到大于设定的距离阈值的轨迹点；
180.在所述当前遍历的轨迹点与所搜索到的轨迹点之间的时间间隔大于设定的时间间隔阈值的情况下，将所述当前遍历的轨迹点与所搜索到的轨迹点之间所包含的轨迹点的中心点作为所述目标信息数据，并将与所述所搜索到的轨迹点相邻的下一轨迹点作为当前遍历的轨迹点；
181.在所述当前遍历的轨迹点与所搜索到的轨迹点之间的时间间隔不大于所述时间间隔阈值的情况下，则将与所述所搜索到的轨迹点相邻的下一轨迹点作为当前遍历的轨迹点。
182.例如，在位置服务应用场景中，可通过轨迹数据确定包含驻留位置信息的目标信息数据。参见图4所示，图4是根据一示例性实施例示出的识别目标信息数据的一种示意图。遍历过滤后的轨迹线上的轨迹点，比如当前遍历到轨迹点p5，然后计算轨迹点p5与其后各轨迹点的距离，直至找到距离大于设定的距离阈值的轨迹点，比如轨迹点p8。如果轨迹点p5和轨迹点p8的时间间隔大于设定的驻留时间间隔阈值，那么则将轨迹点p5到轨迹点p8之间
所包括的轨迹点的中心点作为一个驻留位置，即，第一驻留位置，并予以记录，如图中轨迹点5、6、7、8四个轨迹点的中心点(图中虚线圆形的中心)；然后从与轨迹点p8相邻的下一个轨迹点为当前遍历点，开始继续遍历，如此反复。
183.如果轨迹点p5和轨迹点p8的时间间隔不大于设定的时间间隔阈值，则说明不满足驻留的时间条件，将与轨迹点p8相邻的下一个轨迹点为当前遍历点，开始继续向后遍历。
184.本步骤通过采用线性复杂度的目标信息数据识别，在o(n)的时间复杂度下即可完成目标信息数据的识别，相对于现有所普遍采用的时空算法，大大降低了目标信息数据识别的时间复杂度。
185.步骤205，将目标信息数据进行兴趣点匹配，得到第一兴趣点数据。
186.作为一种示例，在位置服务应用场景中，将步骤204所得到的目标信息数据与地图数据中的poi进行匹配。
187.由于目标信息数据和poi的数据量都很大，为降低时间复杂度，先初步粗匹配，以获取与所述目标信息数据处于将同一区域内的所述目标信息数据和地图数据，即，将位于同一块区域的驻留位置和地图数据中的poi匹配一起。
188.鉴于poi一般包括两类：一类是具有区域范围的第二多边形poi，其为带有边界坐标集合，例如，具有一定区域范围的公园，其poi为表征该公园区域范围的多边形，另一类是第二点状poi，其只有一个坐标点，例如，不需要表征区域范围的小店、加油站等，故而，
189.对于第二多边形poi，则利用射线法，找到包含目标信息数据例如驻留位置的多边形poi，具体为：确定经过所述目标信息数据的任一射线与多边形的交点，根据交点与目标信息数据的几何关系，找到包含目标信息数据的多边形兴趣点，得到第一兴趣点数据中的第一多边形兴趣点；
190.对于第二点状poi，则利用距离计算找到距离目标信息数据最近的y个点状poi，得到第一兴趣点数据中的第一点状兴趣点，其中，y的大小可根据需要设定。
191.这样，便完成目标信息数据与poi精确匹配，得到第一poi数据，例如，第一驻留位置的poi数据。第一poi数据记为d1＝{(t1,x1),(t2,x2),...,(t
l
,x
l
)}，其中，t
l
表示与信息数据x
l
对应的兴趣点，l为第一poi数据的总数、为正整数，信息数据x
l
具有时间属性。
192.本实施例第一poi获取过程中，避免了因为信息数据量较大和时空算法所的o(n2)的时间复杂度而造成较大的计算消耗，避免了对原始的信息数据采样后计算所面临的精度损失的风险。
193.参见图5所示，图5是根据一示例性实施例示出的基于第一poi数据以及其关联的原始信息数据进行预测的一种流程示意图。包括：
194.步骤501，从步骤205所得到的第一兴趣点数据中，获取用于进行预测的数据集。
195.作为一种示例，具体包括：
196.步骤5011，按照设定的第一时间信息，从第一兴趣点数据中，获取第一信息数据，第一信息数据与第一时间信息对应；
197.例如，获取设定第一时间阈值n内的第一poi数据，并构建马尔科夫链：
198.工作日：历史1个月工作日的数据所述一个月前的最后一个信息数据预测日之前的一个信息数据
199.休息日：历史1个月休息日的数据所述一个月前的最后一个信息数据预测日之
前的一个信息数据
200.其中，第一兴趣点数据存储于本地或存储于服务器，存储于服务器的数据被授权可访问。
201.步骤5012，对第一信息数据进行聚类，得到第一类信息数据，其中，第一类信息数据为第一信息数据的聚类结果、且与第二时间信息对应；
202.参见图6所示，图6是根据一示例性实施例示出的对第一信息数据进行聚类的一种示意图。对设定第二时间阈值内的第一信息数据进行聚类，得到t个聚类信息数据，例如，对历史n天的信息数据进行聚类。其中，聚类可采用dbscan(density-based spatial clustering of applications with noise)算法。由于此时聚类的数据是第一兴趣点数据中与兴趣点匹配的信息数据，数据量远远小于原始的信息数据，因此采用dbscan聚类也不会带来过多计算消耗。其中，t、n为正整数。
203.从t个聚类信息数据中，取频次高于设定频次阈值的聚类信息数据作为状态集合，得到v个聚类信息数据，记为{x1,x2,...,xv}，以作为状态集，v为正整数。
204.上述t个聚类信息数据或v个聚类信息数据属于第一类信息数据。
205.例如，在位置服务应用中，上述聚类处理是基于第一poi数据中的第一驻留位置来进行，故而，所得到的聚类驻留位置便为第一驻留位置中的聚类驻留位置。
206.步骤5013，获取观测集；
207.按照第三时间信息例如设定的时间段，划分为不同的观测集合，记为{e1,e2,...,er}，其中，er表示时间段r，
208.例如，将一天分为24个时间段，得到观测集合，记为{e1,e2,...,e
24
}。
209.上述第一时间信息、第二时间信息、第三时间信息的时间间隔依次减小。
210.步骤5014，统计与所述第一类信息数据以及所述第三时间信息相关的所有第一兴趣点数据，得到数据集，
211.作为一种示例，根据状态集和观测集，获取用于进行预测的数据集；
212.统计与状态集和观测集相关的所有第一poi数据，例如，按照状态集，统计第一类信息数据所对应的第一poi数据，按照观测集，统计具有第三时间信息的第一poi数据，将所统计的poi数据的交集确定为数据集，得到离散化后的数据集合，记为d2＝{(t1,x1),(t2,x2),...,(tk,xk)}，tk表示具有第三时间信息的第一类信息数据xk的兴趣点，k为该数据集中第一poi数据的总数。
213.步骤502，根据所述第一类信息数据与第二时间信息，在所述第一类信息数据中确定与第三时间信息对应的第二类信息数据，
214.作为一种示例，以所述第一类信息数据、以及所述第二时间信息为参数，计算所述第一类信息数据所隐含的第三时间信息最大概率的第一类信息数据，确定该最大概率的第一类信息数据为与所述第三时间信息对应的第二类信息数据；
215.具体地，基于所述数据集，进行预测，得到第二类信息数据：
216.步骤5021，确定状态转移概率矩阵，状态转移概率矩阵用于表征：所述数据集中任意两第一类信息数据之间，从源信息数据转移到目的信息数据的次数，占据从所述源信息数据所转移的总次数中的概率；
217.具体地，构建具有m行m列的状态转移概率矩阵，
218.其中，
219.m为所述第一类信息数据的总数，
220.第i行第j列的矩阵元素为：所述数据集中从第i第一类信息数据转移到第j第一类信息数据的次数与从第i第一类信息数据所转移的总次数之比值。
221.例如，在位置服务应用场景中，状态转移概率矩阵用于表征：所述数据集中任意两驻留位置之间，从所述两驻留位置中的源驻留位置离开到所述两驻留位置中的目的驻留位置的次数，占据从所述源驻留位置离开的次数中的概率；
222.作为一种示例，构建具有m行m列的状态转移概率矩阵p(m
×
m)，其中，第i行第j列的元素p
ij
表示：状态集中从xi到xj的次数与状态集中从xi离开的次数之比值；m表示聚类驻留位置的总数。数学式表示为：
223.p
ij
＝从xi到xj的次数/从xi离开的次数其中，i、j为自然数，m为正整数。
224.步骤5022，确定观测概率矩阵，所述观测概率矩阵用于表征：所述数据集中具有任一第三时间信息的任一第一类信息数据的数量，占据所述数据集中该第一类信息数据总数中的概率。
225.具体地，构建具有m行r列的状态转移概率矩阵，
226.其中，
227.m为所述第一类信息数据的总数，r为所述第三时间信息的总数，
228.第i行第r列的矩阵元素为：所述数据集中在第三时间信息er具有第i第一类信息数据的数量与所述数据集中具有第i第一类信息数据信息的总数之比值；r与第三时间信息er对应。
229.例如，在位置服务应用场景中，所述观测概率矩阵用于表征：所述数据集中任一设定时间段位于所述数据集中任一驻留位置的次数，占据所述数据集中位于该驻留位置的次数中的概率；
230.作为一种示例，构建具有m行r列的观测概率矩阵o(m
×
r)，其中第i行第r列元素o
ir
表示：观测集中在时段er位于xi的次数与观测集中位于xi的次数之比值；r为设定的时间段。数学式表示为：
231.o
ir
＝在时段er位于xi的次数/观测集中位于xi的次数
232.其中，i、r为自然数，m、r为正整数。
233.步骤5023，利用所述状态转移概率矩阵以及所述观测概率矩阵，确定所述数据集中每个第三时间信息拥有最大概率的第一类信息数据；
234.作为一种示例，利用状态转移概率矩阵和观测概率矩阵，基于当前上一第一类信息数据，前向计算当前第三时间信息拥有最大概率的第一类信息数据，
235.在所述最大概率大于设定的概率阈值的情况下，将所述当前上一第一类信息数据更新为当前第三时间信息拥有最大概率的第一类信息数据，以进行下一第三时间信息拥有最大概率的第一类信息数据的计算；
236.否则，保持所述当前上一第一类信息数据不变，进行下一第三时间信息的拥有最大概率的第一类信息数据的计算。
237.例如，在位置服务应用场景中，利用所述状态转移概率矩阵以及所述观测概率矩阵，确定所述数据集中每个所述设定时间段拥有最大概率的驻留位置，该驻留位置为第二
驻留位置。
238.作为一种示例，利用状态转移概率矩阵和观测概率矩阵，以及上一驻留位置x
before
，前向计算当前时段拥有最大概率p的驻留位置，当最大概率p大于设定的概率阈值时，判定该时段的驻留位置为所述最大概率p的驻留位置，然后基于此驻留位置作为上一个状态继续迭代计算。
239.参见图7所示，图7是根据一示例性实施例示出的前向计算各时间段具有最大概率的第一类信息数据的一种流程示意图。计算过程包括：
240.步骤701，初始化上一第一类信息数据x
before
、时间段er，
241.步骤702，利用状态转移概率矩阵和观测概率矩阵，基于上一第一类信息数据，前向计算当前时间段er拥有最大概率p的第一类信息数据x
max
，
242.步骤703，判断所述最大概率p是否大于设定的概率阈值，如果是，则输出当前时间段er拥有最大概率p的第一类信息数据x
max
，将当前上一个第一类信息数据x
before
更新为时间段er拥有最大概率p的第一类信息数据x
max
，更新当前时间段er为相邻的下一时间段e
r 1
，返回步骤702，更新后的第一类信息数据用于计算下一时间段的拥有最大概率的第一类信息数据，反复执行，直至观测集中的各个时间段都计算完毕。
243.否则，保持当前上一第一类信息数据不变，更新当前时间段er为相邻的下一时间段e
r 1
，返回步骤702，以计算下一时间段的拥有最大概率的第一类信息数据，反复执行，直至观测集中的各个时间段都计算完毕。
244.这样，便可得到观测集中各时间段拥有最大概率的第一类信息数据，作为预测的第二类信息数据，记为(x
max
，er)。
245.步骤503，在所述第一兴趣点数据中，匹配所述第二类信息数据对应的第二信息数据，得到第二兴趣点数据。
246.作为一种示例，从所述第一兴趣点数据中，映射出与所述第二类信息数据对应的第一信息数据；
247.根据所映射的第一信息数据，确定其所匹配的每个兴趣点，并将每个兴趣点合并为并集；
248.将所述第二类信息数据与所述并集进行匹配，得到第二信息数据，
249.确定第二信息数据为第二兴趣点数据。
250.例如，在位置服务应用场景中，将所述第二驻留位置与所述第一驻留位置进行兴趣点融合，得到兴趣点数据；
251.作为一种示例，将第二驻留位置，与，第一驻留位置的poi数据中与所述第二驻留位置对应的第一驻留位置其各poi的并集，进行匹配；
252.作为一种示例，根据第二驻留位置，从第一驻留位置的poi数据中映射出所述第二驻留位置对应的第一驻留位置；根据所映射出的第一驻留位置，确定其所匹配的各个poi，并将所匹配的各个poi合并为并集；将第二驻留位置与所述并集进行匹配，得到第二驻留位置的poi数据。其中，匹配的方式可以与步骤205相同。
253.参见图8所示，图8是根据一示例性实施例示出的所述第二类信息数据与所述第一兴趣点融合的一种示意图。由于第二类信息数据具有聚类性，故而，一个第二类信息数据可能会对应多个目标信息数据，而所示多个目标信息数据中每个目标信息数据各自匹配有兴
趣点，所匹配的兴趣点形成并集，用于所对应的第二类信息数据进行匹配，从而达到了对第一poi数据进行补充的效果。
254.上述步骤501～503，基于预测的第二类信息数据的poi分析，使用考虑隐马尔可夫模型来捕捉信息数据中日常的周期性和规律性，从而提供了信息数据有限的情形下poi获取能力。
255.参见图9所示，图9是根据一示例性实施例示出的一种兴趣点的获取装置的一种示意图。第一获取模块91，被配置为获取第一兴趣点数据和第一信息数据，所述第一兴趣点数据包括与信息数据对应的兴趣点，所述第一信息数据与第一时间信息对应；
256.第二获取模块92，被配置为对所述第一信息数据进行聚类，得到第一类信息数据，所述第一类信息数据为所述第一信息数据的聚类结果、且与第二时间信息对应；
257.确定模块93，被配置为根据所述第一类信息数据与第二时间信息，在所述第一类信息数据中确定与第三时间信息对应的第二类信息数据，所述第三时间信息、以及第二时间信息的时间间隔为预定间隔；
258.匹配模块94，被配置为在所述第一兴趣点数据中，匹配所述第二类信息数据对应的第二信息数据，得到第二兴趣点数据。
259.所述第二获取模块92包括：
260.第一子模块921，被配置为按照设定的第一时间阈值，从所述第一的兴趣点数据中，获取第一信息数据，
261.第二子模块922，被配置为确定所述状态集以及观测集，
262.第三子模块923，被配置为统计与所述状态集以及观测集相关的所有第一兴趣点数据，得到所述数据集。
263.其中，所述第二子模块922被配置为：
264.从所述第一兴趣点数据中，筛选出符合设定的第二时间阈值的第一信息数据，并对所筛选的第一信息数据进行聚类，得到第一类信息数据，
265.从所述第一类信息数据中，筛选出频次高于设定频次阈值的第一类信息数据，得到所述状态集；
266.按照设定时间段，确定观测集。
267.所述确定模块93包括：
268.状态转移概率矩阵计算子模块931，被配置为确定状态转移概率矩阵，
269.观测概率矩阵计算子模块932，被配置为确定观测概率矩阵，
270.第二识别子模块933，利用所述状态转移概率矩阵以及所述观测概率矩阵，确定所述数据集中每个所述设定时间段拥有最大概率的第二类信息数据。
271.所述状态转移概率矩阵子模块931被配置为：
272.构建具有m行m列的状态转移概率矩阵，
273.其中，
274.m为所述状态集中第一类信息数据的总数，
275.第i行第j列的矩阵元素为：所述数据集中从第i第一类信息数据转移到第j第一类信息数据的次数与从第i第一类信息数据所转移的总次数之比值。
276.所述观测概率矩阵子模块932被配置为：
277.构建具有m行r列的状态转移概率矩阵，
278.其中，
279.m为所述状态集中第一类信息数据的总数，r为所述设定时间段的总数，
280.第i行第r列的矩阵元素为：所述数据集中在设定时段er具有第i第一类信息数据的数量与所述数据集中具有第i第一类信息数据的总数之比值。
281.所述第二识别子模块933被配置：
282.利用状态转移概率矩阵和观测概率矩阵，基于当前上一第一类信息数据，前向计算当前设定时间段拥有最大概率的第一类信息数据，
283.在所述最大概率大于设定的概率阈值的情况下，将所述当前上一第一类信息数据更新为当前时间段拥有最大概率的第一类信息数据，更新后的第一类信息数据用于进行下一时间段拥有最大概率的第一类信息数据的计算；
284.否则，保持所述当前上一第一类信息数据不变，所述当前上一第一类信息数据用于进行下一时间段的拥有最大概率的第一类信息数据的计算。
285.所述匹配模块94包括：
286.映射子模块941，被配置为从所述第一兴趣点数据中映射出与所述第二类信息数据对应的第一类信息数据；
287.poi并集子模块942，被配置为根据所映射的第一类信息数据，确定其所匹配的每个兴趣点，并将每个兴趣点合并为并集；
288.第二兴趣点匹配子模块943，被配置为将所述第二类信息数据与所述并集进行匹配，得到所述第二信息数据，确定所述第二信息数据为所述第二兴趣点数据。
289.所述第一获取模块91包括：
290.信息序列获取子模块911，被配置为基于所述信息数据，获取信息序列，其中，所述信息序列为按照时间顺序对所述信息数据进行排序所得到的排序结果；
291.轨迹切分子模块912，被配置为基于所述信息序列，确定轨迹数据；
292.过滤子模块913，被配置为去除轨迹数据中异常的信息数据，得到过滤后的轨迹数据；
293.第一识别子模块914，被配置为基于过滤后的轨迹数据，识别目标信息数据，
294.第一兴趣点匹配子模块915，被配置为将所述目标信息数据进行兴趣点匹配，得到所述第一兴趣点数据。
295.所述信息序列获取子模块911包括：
296.位置信息转换单元9111，被配置为将所述信息数据中的位置信息按照地理散列转换为字符串；
297.时间信息转换单元9112，被配置为将所述信息数据中的时间信息转换为具有设定单位级别的时间信息；
298.聚合单元9113，按照设定的时间聚合粒度、和设定的位置聚合粒度，将具有相同字符串和相同时间信息的所述信息数据进行聚合；
299.排序单元9114，将聚合后的信息数据按照所述时间顺序进行排序，得到所述信息序列。
300.所述轨迹切分子模块912被配置为：
301.遍历所述信息序列中的每个信息点；
302.在任意相邻的第一信息点和第二信息点之间的时间间隔大于设定的分割时间间隔阈值的情况下，将所述第一信息点与第二信息点进行切分，得到至少一条以上轨迹线段的轨迹数据，
303.其中，
304.切分后的信息序列由切分处所确定的序列段组成，每个序列段分别对应为轨迹线段。
305.所述过滤子模块913被配置为：
306.检测各轨迹线段的轨迹数据中是否存在速度异常的信息点；
307.从不存在速度异常轨迹线段中，选择具有最多信息点的最长轨迹线段，以所述最长轨迹线段的起始信息点向前遍历所述信息序列，以所述最长轨迹线段的末尾信息点向后遍历所述信息序列，过滤掉速度异常的信息点，得到所述过滤后的轨迹数据。
308.所述过滤子模块被配置913为：
309.检测各轨迹线段的轨迹数据中，任意相邻信息点之间的速度是否大于设定的速度阈值，在所述速度大于所述速度阈值的情况下，判定为存在速度异常的信息点。
310.所述第一识别子模块914第被配置为：
311.遍历所述过滤后的轨迹数据；
312.计算当前遍历的信息点与其后的信息点之间的距离，直至搜索到大于设定的距离阈值的信息点；
313.在所述当前遍历的信息点与所搜索到的信息点之间的时间间隔大于设定的时间间隔阈值的情况下，将所述当前遍历的信息点与所搜索到的信息点之间所包含的信息点的中心点作为所述目标信息数据，并将与所述所搜索到的信息点相邻的下一信息点作为当前遍历的信息点；
314.在所述当前遍历的信息点与所搜索到的信息点之间的时间间隔不大于所述时间间隔阈值的情况下，则将与所述所搜索到的信息点相邻的下一信息点作为当前遍历的信息点。
315.所述第一兴趣点匹配子模块915被配置为：
316.获取与所述目标信息数据处于同一区域内的地图数据，所述地图数据包括第二多边形兴趣点和第二点状兴趣点；
317.确定经过所述目标信息数据的任一射线与所述第二多边形兴趣点的交点，根据所述交点与所述目标信息数据的几何关系，确定包含所述目标信息数据的所述第一多边形兴趣点；
318.在所述第二点状兴趣点中，确定距离所述目标信息数据最近的所述第一点状兴趣点。
319.参见图10所示，图10是根据一示例性实施例示出的电子设备的一种示意图。该电子设备包括处理器；用于存储所述处理器的可执行指令的存储器；
320.其中，所述处理器被配置为执行所述可执行指令，以实现任一所述一种的兴趣点获取方法。
321.在示例性实施例中，还提供了一种包括至少一条指令的计算机可读存储介质，例
如包括至少一条指令的存储器，上述至少一条指令可由计算机设备中的处理器执行以完成上述实施例中所述一种兴趣点获取方法。
322.可选地，上述计算机可读存储介质可以是非临时性计算机可读存储介质，例如，该非临时性计算机可读存储介质可以包括rom(read-only memory，只读存储器)、ram(random-access memory，随机存取存储器)、cd-rom(compact disc read-only memory，只读光盘)、磁带、软盘和光数据存储设备等。
323.在示例性实施例中，还提供了一种计算机程序产品，包括一条或多条指令，该一条或多条指令可以由计算机设备的处理器执行，以完成上述各个实施例所述业务标签展示方法。
324.本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本技术公开的其它实施方案。本技术公开旨在涵盖本技术公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本技术公开的一般性原理并包括本技术公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本技术公开的真正范围和精神由下面的权利要求指出。
325.应当理解的是，本技术公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本技术公开的范围仅由所附的权利要求来限制。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：用于存储器子系统的实时(JIT)调度器的制作方法

兴趣点获取方法、装置、电子设备及存储介质与流程

相关文献

最热文献