基于时空关系的对象聚类方法、装置和电子设备与流程

2021-11-10 03:13:00 来源：中国专利 TAG：

1.本技术涉及数据处理领域，具体地，涉及一种基于时空关系的对象聚类方法、装置和电子设备。

背景技术：

2.所谓聚类，就是将物理或抽象对象的集合构成为由类似的对象组成多个类或簇的过程。由聚类所生成的簇是一组数据对象的集合，同一簇中的数据对象应尽可能相似，不同簇中的数据对象应尽可能相异。随着科技的发展、技术的进步，聚类算法如今在很多领域得到了广泛的应用，如医疗卫生领域、社交网络平台、商场、线上购物平台等。
3.目前，在进行对象聚类时，特别是通过k
‑
means算法进行对象聚类时，是选定一个数据集直接聚类输出聚类结果，输出的聚类结果容易受到选取的k值或离群点等的影响，一旦k值选取不准确，便会导致聚类结果出现偏差，使得目前的聚类算法的准确度较低。

技术实现要素：

4.本技术实施例中提供了一种基于时空关系的对象聚类方法、装置和电子设备，用于解决目前的聚类算法准确度较低的问题。
5.根据本技术实施例的第一个方面，提供了一种基于时空关系的对象聚类方法，所述方法包括：
6.获取原始数据，并对所述原始数据进行预处理，获得处理后的时空数据，其中，所述时空数据包括对象数据及各个对象的时空信息；
7.根据预设的窗口属性为所述时空数据分配至少两个时间窗，其中，相邻的时间窗部分重叠，每个时间窗包括至少一个对象，每个对象包括至少一条时空信息；
8.针对每一个时间窗，根据所述时间窗内的时空信息获取各个对象的初始聚类结果；
9.针对每个对象，当所述对象在不同时间窗内的多个初始聚类结果不同时，对所述初始聚类结果进行筛选，获得所述对象的目标聚类结果；
10.输出各个对象的目标聚类结果。
11.根据本技术实施例的第二个方面，提供了一种基于时空关系的对象聚类装置，所述装置包括：
12.数据处理模块，用于获取原始数据，并对所述原始数据进行预处理，获得处理后的时空数据，其中，所述时空数据包括对象数据及各个对象的时空信息；
13.时间窗分配模块，用于根据预设的窗口属性为所述时空数据分配至少两个时间窗，其中，相邻的时间窗部分重叠，每个时间窗包括至少一个对象，每个对象包括至少一条时空信息；
14.聚类模块，用于针对每一个时间窗，根据所述时间窗内的时空信息获取各个对象的初始聚类结果；
15.结果筛选模块，用于针对每个对象，当所述对象在不同时间窗内的多个初始聚类结果不同时，对所述初始聚类结果进行筛选，获得所述对象的目标聚类结果；
16.输出模块，用于输出各个对象的目标聚类结果。
17.根据本技术实施例的第三个方面，提供了一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当所述电子设备运行时，所述处理器与所述存储器之间通过所述总线通信，所述机器可读指令被所述处理器执行时执行第一方面提供的基于时空关系的对象聚类方法。
18.根据本技术实施例的第四个方面，提供了一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行第一方面提供的基于时空关系的对象聚类方法。
19.本技术实施例提供了一种基于时空关系的对象聚类方法、装置和电子设备，所述方法包括：对获取到的原始数据进行预处理，获得时空数据，时空数据包括对象数据和各个对象的时空信息；为时空数据分配时间窗，使得每个时间窗包括至少一个对象，每个对象包括至少一条时空信息；针对每个时间窗，根据时间窗内的时空信息获取各个对象的初始聚类结果；当对象在不同时间窗内的多个初始聚类结果不同时，对该对象的初始聚类结果进行筛选，获得对象的目标聚类结果；最后输出各个对象的目标聚类结果。本技术通过设置至少两个时间窗，从而可以先对每个时间窗中的对象进行聚类，获得聚类结果，再采用纠错机制，当同一对象在多个不同时间窗的聚类结果不同时，对聚类结果进行筛选，以排除某些时间窗由于数据不完整导致聚类结果出现偏差，提高了聚类结果的准确性。
附图说明
20.此处所说明的附图用来提供对本技术的进一步理解，构成本技术的一部分，本技术的示意性实施例及其说明用于解释本技术，并不构成对本技术的不当限定。在附图中：
21.图1为本技术实施例提供的基于时空关系的对象聚类方法的流程图；
22.图2为本技术实施例提供的时间窗分配示意图；
23.图3为本技术实施例提供的步骤s13的子步骤流程图；
24.图4为本技术实施例提供的步骤s14的子步骤流程图；
25.图5为本技术实施例提供的基于时空关系的对象聚类装置的功能模块图；
26.图6为本技术实施例提供的电子设备的示意图。
具体实施方式
27.在实现本技术的过程中，发明人发现，在实际场景下，数据的聚类与分簇结果与数据的采样率正相关，但是高采样率会显著提高数据规模，进而呈指数级的放大计算规模，对计算资源的依赖与需求显著提升，进而提升了实际应用的成本。为了解决这一问题，需要对数据进行增量计算。增量计算是指在不需要重新计算历史数据的情况下，对新数据进行计算，并且不断调整最终聚类结果。
28.但是现有的聚类算法，特别是k
‑
means算法，无法实现数据的增量计算。而且在使用k
‑
means算法进行对象聚类时，是选定一个数据集直接聚类输出聚类结果，输出的聚类结果容易受到选取的k值或离群点等的影响，一旦k值选取的不准确，便会导致聚类结果出现
偏差，使得目前的聚类算法的准确度较低。
29.针对上述问题，本技术实施例中提供了一种基于时空关系的对象聚类方法、装置和电子设备，所述方法包括：对获取到的原始数据进行预处理，获得时空数据，时空数据包括对象数据和各个对象的时空信息；为时空数据分配时间窗，使得每个时间窗包括至少一个对象，每个对象包括至少一条时空信息；针对每个时间窗，根据时间窗内的时空信息获取各个对象的初始聚类结果；当对象在不同时间窗内的多个初始聚类结果不同时，对该对象的初始聚类结果进行筛选，获得对象的目标聚类结果；最后输出各个对象的目标聚类结果。本技术通过设置滑动的时间窗，可以在某一个时间窗内找到对象的较为完整的时空信息，从而保证数据的完整性，再采用纠错机制，当同一对象在多个不同时间窗的聚类结果不同时，对聚类结果进行筛选，以排除某些时间窗由于数据不完整导致聚类结果出现偏差，提高了聚类结果的准确性。
30.为了使本技术实施例中的技术方案及优点更加清楚明白，以下结合附图对本技术的示例性实施例进行进一步详细的说明，显然，所描述的实施例仅是本技术的一部分实施例，而不是所有实施例的穷举。需要说明的是，在不冲突的情况下，本技术中的实施例及实施例中的特征可以相互组合。
31.请参照图1，图1为本技术实施例提供的基于时空关系的对象聚类方法的流程图。在本实施例中，所述方法包括：
32.步骤s11，获取原始数据，并对原始数据进行预处理，获得处理后的时空数据。
33.其中，所述时空数据包括对象数据及各个对象的时空信息；
34.步骤s12，根据预设的窗口属性为时空数据分配至少两个时间窗。
35.其中，相邻的时间窗部分重叠，每个时间窗包括至少一个对象，每个对象包括至少一条时空信息；
36.步骤s13，针对每一个时间窗，根据时间窗内的时空信息获取各个对象的初始聚类结果。
37.步骤s14，针对每个对象，当对象在不同时间窗内的多个初始聚类结果不同时，对初始聚类结果进行筛选，获得对象的目标聚类结果。
38.步骤s15，输出各个对象的目标聚类结果。
39.值得说明的是，在本实施例中，对象可以是人、车、物品，只要能通过相关算法标识出个体的、可以移动出现的东西都可以作为对象，比如在牧场上的牛羊、道路上的车辆等。
40.在上述步骤中，本技术实施例通过设置至少两个时间窗，先对每个时间窗内的对象进行聚类，若窗口大小设置得合理，则可以在某一个时间窗内找到对象的较为完整的时空信息，从而保证数据的完整性，再采用纠错机制，当同一对象在多个不同时间窗的聚类结果不同时，对聚类结果进行筛选，以排除某些时间窗由于数据不完整或由于离群点导致聚类结果出现偏差，提高了聚类结果的准确性和鲁棒性。
41.可选地，在本实施例中，步骤s11，获取原始数据，并对原始数据进行预处理，获得处理后的时空数据，具体包括：
42.对所述原始数据进行数据清洗及数据反规范化处理，其中，数据清洗包括数据过滤、格式转换、归一化及数据采样中的至少一种操作，所述反规范化处理包括数据的属性扩展和/或为数据添加自定义规则。
43.在本实施例中，在从各个数据源获取到原始数据之后，需要对数据进行清洗，包括不合理数据的过滤、数据格式转换、重复数据过滤、高密度数据抽样等操作。
44.具体地，在对数据进行过滤时，可以将不符合预定义的标准格式的数据进行丢弃，例如若预定义中要求数据具有坐标信息，但实际获取到的数据并没有坐标信息，则这部分数据可以直接丢弃；再例如，本实施例需要采集实时数据，若获取到的数据的时间戳与系统当前时间差距过大，则这部分数据也会被过滤。
45.数据格式转换是指将获取到的原始数据的格式转换为本技术实施例需要的格式，例如时间信息格式或空间信息格式。
46.在格式转换后，还需要对数据进行归一化处理。在归一化处理中，各个对象的时间信息按照时间顺序进行归一化处理，各个对象的空间信息则需要先设置一个原点，并建立直角坐标系，通过建立的直角坐标系确定各个空间信息的位置。
47.当对象在同一坐标下，且在较短的时间内采集到多条记录时，这些数据虽然不是重复的数据，但是需要对这些数据进行采样处理，以防数据采集过度导致聚类结果不准确。
48.可选地，在对原始数据进行清洗之后，为加快后续处理速度、简化执行流程，还需要对数据进行反规范化处理。具体地，反规范化处理包括完善数据的扩展属性信息及为数据添加自定义规则。
49.原始数据一般使用规范化的信息，对象聚类还需要与对象相关的其他属性信息，例如关联对象的分类、分组信息、对象所属位置信息等，因为这些信息相对固定，将这些与对象关联的维表信息事先通过广播加载到数据流的处理节点，再与实时产生的流式记录联接(join)，即可实现为数据扩展属性的反规范化处理。
50.除了对象属性，应用对象的场景不同，或者对某些场景有特殊需求，其聚类参数也可以人为干预和设置，这些自定义规则也作为维表，与流式记录联接，携带在原始数据中以便后续处理。
51.在对数据进行预处理后，获得时空数据，时空数据包括对象数据及各个对象的时空信息。然后需要根据预设的窗口属性为时空数据分配时间窗。
52.可选地，在本实施例中，可以根据数据的产生时间和自定义的窗口属性为时空数据分配时间窗。窗口属性包括窗口大小、窗口滑动步长，且窗口滑动步长小于窗口尺寸，从而使得两个时间窗之间存在重叠的部分，因此，对象的时空信息可能会出现在多个时间窗内。
53.若时间窗的窗口大小可以为1个小时，窗口滑动步长可以为10分钟，则时间窗1可以是0时
‑
1时，时间窗2可以是0:10
‑
1:10，以此类推。在为时空数据分配时间窗后，每个时间窗中都包括了至少一个对象，以及每个对象对应的至少一条时空信息。
54.例如，请参照图2，图2为本技术实施例提供的时间窗分配示意图。在本实施例中，id_1、id_2、id_3分别表示三个对象，id_1对应的时空信息为
①‑⑨
，id_2对应的时空信息为
①‑⑩
、id_3对应的时空信息为
①‑⑥
。在图2中，时间窗的窗口滑动步长为1分钟，窗口大小为4分钟，图2中示出了两个时间窗，分别是12:00
‑
12:04以及12:01
‑
12:05。
55.在本示例中，时间窗12:00
‑
12:04中包括了三个对象，分别是id_1、id_2、id_3，其中，id_1在时间窗12:00
‑
12:04中的时空信息为
①‑⑧
，id_2在时间窗12:00
‑
12:04中的时空信息为
①‑⑦
，id_3在时间窗12:00
‑
12:04中的时空信息为
①‑⑤
。时间窗12:01
‑
12:05中也
包括三个对象，分别是id_1、id_2、id_3，其中，id_1在时间窗12:01
‑
12:05中的时空信息为
③‑⑨
，id_2在时间窗12:01
‑
12:05中的时空信息为
③‑⑩
，id_3在时间窗12:01
‑
12:05中的时空信息为
③‑⑥
。
56.因此，在为时空数据分配了时间窗之后，每个时间窗内都包括至少一个对象以及各个对象对应的至少一条时空信息。
57.值得说明的是，本实施例中的窗口滑动步长及窗口大小可以由用户根据使用需求进行自定义。
58.在为时空数据分配时间窗后，即可根据每个时间窗内的时空信息获取各个对象的初始聚类结果。具体地，请参照图3，图3为本技术实施例提供的步骤s13的子步骤流程图。在本实施例中，步骤s13包括以下子步骤：
59.步骤s131，从时间窗内的时空信息中选择第一数量个对象，从每个选择的对象中选择第二数量个时空信息作为聚类中心。
60.步骤s132，计算时间窗内的其他的时空信息与聚类中心之间的欧氏距离。
61.步骤s133，针对每个对象，计算对象的每条时空信息到时间窗的每个聚类中心的欧式距离平方和。
62.步骤s134，根据多个欧式距离平方和中的最小值，获得各个对象在本轮迭代运算中的聚类结果。
63.步骤s135，判断是否满足迭代条件。
64.若否，则返回至从所述时间窗内的时空信息中选择第一数量个对象，从每个选择的对象中选择第二数量个时空信息作为聚类中心的步骤；若是，则结束迭代，获得各个对象的初始聚类结果。
65.在上述步骤中，每个时间窗内包括至少一个对象，每个对象包括至少一条时空信息。例如，时间窗x内包括m个对象，则x＝{x1,x....x
m
}，每个对象x包括若干条时空信息，则x＝{v1，v....v
m
}，每条时空信息由时间信息和空间信息组成，即v
j
＝{t
j
，px
j
，py
j
/。
66.在挑选各个时间窗内的聚类中心时，首先从该时间窗内的多个对象中选择k个对象，再从这k个对象的每个对象中，挑选k1条时空信息，将这k1条时空信息作为该时间窗的聚类中心。
67.由于，有的对象在该时间窗内的时空信息数量可能小于k1，此时，则抽取该对象在该时间窗内的所有时空信息；若对象在该时间窗内的时空信息的数量若高于k1，则采用时间分层抽样，尽量使得抽取的时空信息可以完整。
68.例如，某一时间窗内包括两个对象，分别为a、b，对象a在该时间窗内存在10条时空信息，对象b在该时间窗内存在2条时空信息。若选取的对象为2，每个对象需要抽取3条时空信息，即k＝2，k1＝3。那么最终抽取的作为聚类中心的时空信息为5条，其中，对象a抽取3条，对象b抽取2条。
69.因此，由于每个对象在该时间窗内的时空信息各不相同，所以抽取的聚类中心的数量是一个范围，范围为(k，k*k1)。
70.可选地，在本实施例中，k值可以由用户进行自定义，若用户没有自定义，则可以根据该时间窗内的对象数量及平均簇大小计算获得。
71.具体地，可以根据公式计算k值，其中，n为该时间窗内的对象数量，c为配置的聚类场景的平均簇大小。
72.在挑选出k个对象后，可以计算这k个对象的时空信息的中位数，将计算获得的中位数作为k1。
73.可选地，在抽取聚类中心之后，则需要计算其他不为聚类中心的时空信息到各个聚类中心的欧式距离。
74.在本实施例中，可以根据以下公式计算该时间窗内的其他的时空信息与聚类中心之间的欧氏距离：
[0075][0076]
其中，distance为欧式距离，t1为第一时空信息的时间，t2为第二时空信息的时间，tr1为t1的调节参数，tr2为t2的调节参数，px1为第一时空信息的横坐标，px2为第二时空信息的横坐标，pxr1为px1的调节参数，pxr2为px2的调节参数，py1为第一时空信息的纵坐标，py2为第二时空信息的纵坐标，pyr1为py1的调节参数，pyr2为py2的调节参数。
[0077]
在本实施例中，tr1、tr2、pxr1、pxr2、pyr1、pyr2的默认值为1，用户可以根据使用场景对tr1、tr2、pxr1、pxr2、pyr1、pyr2进行自定义，若用户想要欧式距离变小，即想要某个时间段、地点或者对象的聚类能力变强，就将上述参数调小，反之则调大。
[0078]
例如，若时间窗内包括2个对象，分别为a、b，对象a包括3条时空信息，分别为a1、a2、a3，对象b包括5条时空信息，分别为b1、b2、b3、b4、b5，其中，a1、b3为聚类中心，则需要根据上述的欧式距离计算公式分别计算a2、a3、b1、b2、b4、b5到聚类中心a1、b3的欧式距离。
[0079]
在计算出其他时空信息到各个聚类中心的欧式距离之后，针对每个对象，计算该对象的每条时空信息到该时间窗的每个聚类中心的欧式距离平方和。
[0080]
继续以上述示例为例，针对对象a，需要计算对象a的每条时空信息a1、a2、a3到聚类中心a1的欧式距离平方和，以及对象a的每条时空信息a1、a2、a3到聚类中心b3的欧式距离平方和。
[0081]
a1、a2、a3到聚类中心a1的欧式距离平方和dis
sum1
＝dis(a1,a1)2 dis(a2,a1)2 dis(a3,a1)2，a1、a2、a3到聚类中心b3的欧式距离平方和dis
sum2
＝dis(a1,b3)2 dis(a2,b3)2 dis(a3,b3)2，其中，dis(a2,a1)表示时空信息a1和时空信息a2之间的欧式距离。
[0082]
针对每个对象，在计算出两个欧式距离平方和之后，可以根据欧式距离平方和中的最小值，获得该对象在本轮迭代运算中的聚类结果。例如，针对对象a，若dis
sum1
小于dis
sum2
，则表示对象a聚类到a上，即对象a自成一类，若dis
sum1
大于dis
sum2
，则表示对象b聚类到a上，即对象a和对象b为一个类。
[0083]
然后判断是否满足迭代条件，其中，迭代条件可以为迭代次数达到预设次数，或上轮对象聚类结果跟本轮对象聚类结果完全一致，任意一个迭代条件满足，即可结束迭代。
[0084]
若不满足迭代条件，则返回至步骤s131，重新选择聚类中心进行迭代运算。
[0085]
在迭代运算结束后，即可获得各个对象的初始聚类结果。
[0086]
由于各个时间窗内包括的各个对象的时空信息是不同的，因此，可能导致各个时间窗针对同一对象获得的聚类结果是不同的，此时则需要对聚类结果进行筛选。例如，若某
个对象的时空信息主要集中在时间窗a中，但该对象在时间窗b和时间窗c中也存在少量的时空信息，在这种情况下，时间窗a、b、c计算出来的聚类结果有可能是不同，此时需要筛选出有用的时间窗(时间窗a)的聚类结果，从而排除部分离群点对聚类结果的影响。
[0087]
可选地，请参照图4，图4为本技术实施例提供的步骤s14的子步骤流程图。在本实施例中，步骤s14，包括：
[0088]
步骤s141，判断对象在不同时间窗内的多个初始聚类结果是否相同。
[0089]
步骤s142，若不相同，则判断不同时间窗的重叠度是否达到预设值；
[0090]
步骤s143，若达到预设值，则对对象的多个初始聚类结果进行筛选，获得对象的目标聚类结果。
[0091]
在上述步骤中，若某两个时间窗的重叠度达到预设值(例如75％)，且这两个时间窗内对于同一对象的聚类结果不同，则需要对该对象的聚类结果进行筛选，从中筛选出该对象的目标聚类结果，以排除某些时间窗由于数据不完整导致结果出现偏差，择优输出最终的聚类结果，提升准确度。
[0092]
可选地，在本实施例中，步骤s143，所述对象的多个初始聚类结果进行筛选，获得所述对象的目标聚类结果，包括：
[0093]
根据公式计算所述对象在各个时间窗内的平衡参数，其中，r为平衡参数，distance_sum为所述对象在各个时间窗内的欧式距离平方和的最小值，c为所述对象在各个时间窗内的时空信息的总数量。
[0094]
选择平衡参数最小的时间窗对应的聚类结果作为所述对象的目标聚类结果。
[0095]
例如，若对象a在时间窗x、y、z的聚类结果都不相同同，则分别计算对象a在时间窗x、y、z内的平衡参数。distance_sum为对象在各个时间窗内的欧式距离平方和的最小值，若计算对象a在时间窗x内的平衡参数，则distance_sum为对象a在时间窗x内的多个欧式距离平方和中的最小值。以前述的示例为例，若对象a在时间窗x内的欧式距离平方和包括dis
sum1
和dis
sum2
，若dis
sum1
小于dis
sum2
，则distance_sum为dis
sum1
，反之则为dis
sum2
。
[0096]
再计算出对象a在各个时间窗的平衡参数后，根据平衡参数的大小确定该对象的目标聚类结果。例如，若对象a在时间窗x、y、z内的平衡参数分别为r1、r2、r3，其中，最小值为r2，则对象a的目标聚类结果为时间窗y对应的聚类结果。
[0097]
本技术实施例通过为数据分配时间窗，从而能够在某个窗口内找到对象的较为完整的时空信息，以保证数据完整性，再采用纠错机制对不同时间窗内的同一对象的聚类结果进行筛选，排除其他窗口因为数据不全导致结果产生偏差，择优输出聚类结果，达到近似增量计算的效果。
[0098]
可选地，在本实施例中，在步骤s15，输出各个对象的目标聚类结果之后，还可以根据各个对象的目标聚类结果形成各个对象的关联网，即每个对象维护一个星形数据(所述星形数据是借用数据仓库中的星型结构数据，所有维表直接链接到事实表上)，可以理解为将所有跟某一个对象产生亲密关系的其他对象，直接链接到该对象上，通过对象之间的亲密度表示各个对象之间的连线的权重。可选地，在步骤s15之后，所述方法还包括：
[0099]
根据各个对象的目标聚类结果计算各个对象之间的亲密度分数；构建存在亲密度分数的对象的时空信息矩阵，并计算所述时空信息矩阵的矩阵相似度；根据所述矩阵相似
度对所述亲密度分数进行校正，输出校正后的亲密度分数。
[0100]
具体地，在上述步骤中，
[0101]
以一天为例，首先需要将各个对象在单日(0时至24时)的聚类结果进行排序。其中，对象为x，与对象x产生关联关系的对象列表为x
j
＝{x1,x2....x
m
}，对象列表在对象x
i
上出现的次数n
j
＝{n1,n2.....n
m
}。
[0102]
然后根据以下公式计算各个对象之间的亲密度分数：
[0103][0104]
其中，a
j
为亲密度分数，n
j
为对象列表在对象x
i
上出现的次数，n为各个对象被聚类为同一簇的次数，c
jn
表示在每个时间窗内，对象j的到访记录数量，distance_sum
jn
表示在每个窗口内，对象j与对象i之间的欧式距离。
[0105]
在计算出亲密度分数之后，对存在亲密度分数的对象生成时空信息矩阵，将时间信息作为横向指标，将空间信息作为纵向指标。可根据以下条件构建时空信息矩阵：
[0106][0107]
然后根据以下公式计算时空信息矩阵之间的矩阵相似度：
[0108][0109]
其中，s
ij
为矩阵相似度，m
i
表示对象i的时空矩阵，m
j
表示对象j的时空矩阵，m
ij
表示对象i和对象j的时空矩阵的乘积。
[0110]
然后将矩阵相似度的度量归一化到0至1之间：
[0111][0112]
其中，s
ij’为归一化后的矩阵相似度，a
j
为亲密度分数，s
ij
为矩阵相似度，k为常数，取值范围为0至1，m为对象i和对象j在单日内被聚类为同一簇的次数，s
j
表示对象j和对象i在不同的时间窗内的欧式距离的平方和的最小值。
[0113]
然后根据归一化后的矩阵相似度对亲密度分数进行矫正，获得最终的亲密度a
j’，矫正公式如下：
[0114]
a
j’＝a
j
*s
ij’[0115]
其中，a
j’为矫正后的亲密度分数，s
ij’为归一化后的矩阵相似度，a
j
为亲密度分数。
[0116]
通过上述步骤，可以计算出各个对象之间的亲密度，从而构建出各个对象之间的关联网，以表示各个对象之间的关联关系。
[0117]
综上所述，本技术实施例提供了一种基于时空关系的对象聚类方法、装置和电子设备，所述方法包括：对获取到的原始数据进行预处理，获得时空数据，时空数据包括对象数据和各个对象的时空信息；为时空数据分配时间窗，使得每个时间窗包括至少一个对象，
每个对象包括至少一条时空信息；针对每个时间窗，根据时间窗内的时空信息获取各个对象的初始聚类结果；当对象在不同时间窗内的多个初始聚类结果不同时，对该对象的初始聚类结果进行筛选，获得对象的目标聚类结果；最后输出各个对象的目标聚类结果。本技术通过设置滑动的时间窗，可以在某一个时间窗内找到对象的较为完整的时空信息，从而保证数据的完整性，再采用纠错机制，当同一对象在多个不同时间窗的聚类结果不同时，对聚类结果进行筛选，以排除某些时间窗由于数据不完整导致聚类结果出现偏差，提高了聚类结果的准确性。
[0118]
本技术实施例还提供了一种基于时空关系的对象聚类装置，如图5所示，图5为本技术实施例提供的基于时空关系的对象聚类装置110的功能模块图。在本实施例中，所述装置包括：
[0119]
数据处理模块1101，用于获取原始数据，并对所述原始数据进行预处理，获得处理后的时空数据，其中，所述时空数据包括对象数据及各个对象的时空信息；
[0120]
时间窗分配模块1102，用于根据预设的窗口属性为所述时空数据分配至少两个时间窗，其中，相邻的时间窗部分重叠，每个时间窗包括至少一个对象，每个对象包括至少一条时空信息；
[0121]
聚类模块1103，用于针对每一个时间窗，根据所述时间窗内的时空信息获取各个对象的初始聚类结果；
[0122]
结果筛选模块1104，用于针对每个对象，当所述对象在不同时间窗内的多个初始聚类结果不同时，对所述初始聚类结果进行筛选，获得所述对象的目标聚类结果；
[0123]
输出模块1105，用于输出各个对象的目标聚类结果。
[0124]
本技术实施例还提供了一种电子设备，请参照图6，图6为本技术实施例提供的电子设备10的示意图。在本实施例中，电子设备10包括：处理器11、存储器12和总线13，存储器12存储有处理器11可执行的机器可读指令，当电子设备10运行时，处理器11与存储器12之间通过总线13通信，机器可读指令被处理器11执行时执行本技术实施例提供的基于时空关系的对象聚类方法。
[0125]
本技术实施例还提供了一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行上述实施例提供的基于时空关系的对象聚类方法。
[0126]
本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd
‑
rom、光学存储器等)上实施的计算机程序产品的形式。
[0127]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0128]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特
定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0129]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0130]
尽管已描述了本技术的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
[0131]
显然，本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样，倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内，则本技术也意图包含这些改动和变型在内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种荧幕显示自动调节系统及调节方法与流程

基于时空关系的对象聚类方法、装置和电子设备与流程

相关文献

最热文献