一种数据处理方法、基于事件时间的检索方法和装置与流程

2022-04-16 14:58:04 来源：中国专利 TAG：

1.本技术属于数据检索技术领域，尤其涉及一种数据处理方法、基于事件时间的检索方法和装置。

背景技术：

2.在数字经济时代，用户获取的数据呈爆炸式增长，如何整合和检索这些数据，成为人们关注的焦点。
3.现有技术中通常以时间和其他关键词对数据进行整合和检索，以时间维度进行数据整合的具体步骤为：
4.①
给数据添加唯一标识，将数据组织成《eventid,event》两个字段进行存储，其中eventid表示事件标识，event表示事件原始数据。
5.②
从原始事件数据中抽取事件时间t，由于一个事件数据可能涉及多个时间，所以抽取出的时间表示为t1，t2，t3
…
6.③
然后将抽取出的事件时间与事件id进行一一对应的组合《t1,eventid》，《t2,eventid》，《t3,eventid》
…
7.④
重复
②
～
③
步骤。
8.⑤
所有事件数据都处理完成之后，将处理结果行保存。
9.以时间维度进行数据检索步骤：
10.①
通过对事件时间t进行范围过滤来查询事件唯一标识eventid列表；
11.②
对事件唯一标识eventid列表进行去重、统计；
12.③
通过去重后的事件唯一标识eventid列表来获取原始事件数据event列表。
13.然而，由于整合后的数据持续增长，导致检索存在关联关系的事件数据的过程中，涉及的数据量不断增加，进而增加数据关联过程消耗的时间和资源，从而降低数据处理效率。

技术实现要素：

14.鉴于上述的分析，本技术旨在提出一种数据处理方法、基于事件时间的检索方法和装置，节省检索存在关联关系的事件数据所使用的时间。
15.本技术的目的主要是通过以下技术方案实现的：
16.第一方面，本技术提供了一种数据处理方法，包括：
17.抽取事件数据的时间信息和为事件添加数据标识；
18.将所述时间信息转化成统一的时间格式，转换成所述时间格式后所述时间数据的时间单位包括：年、月、日、时、分和秒中的至少一个，并按照年月日时分秒的顺序进行排列；
19.根据所述时间格式，确定至少一个时间维度；
20.分别建立各所述时间维度和相应事件数据的对应关系；
21.根据所述时间维度和所述对应关系，在相应的位图中存储所述事件数据标识，所
述位图与所述时间维度一一对应。
22.进一步地，所述时间信息包括：基准时间和时间语义信息，所述时间语义信息包括：文字、数字或其组合；
23.所述将所述时间信息转化成统一的时间格式，包括：
24.根据所述基准时间和所述时间语义信息，确定所述时间语义信息对应的时间；
25.将所述时间语义信息对应的时间转化成相应的时间格式。
26.进一步地，所述根据所述时间格式确定至少一个时间维度，包括：
27.按照年月日时分或年月日时分秒的顺序，依次检测所述时间数据中是否存在相应的时间单位；
28.每确定一个所述时间单位存在时，将当前所有存在的时间单位和各所述存在的时间单位对应的数值组成一个时间维度。
29.进一步地，所述根据所述时间维度和所述对应关系，在相应的位图中存储所述事件数据标识，包括：
30.检测所述时间维度是否存在对应的位图；
31.当确定不存在时，创建新的位图，所述新的位图对应所述时间维度；
32.在所述新的位图中，存储相应的事件数据标识。
33.第二方面，本技术实施例提供了一种基于事件时间的检索方法，用于检索按照第一方面任一项所述方法得到的数据，方法包括：
34.接收用户输入的时间索引信息，所述时间索引信息为时间间隔或时间点；
35.根据所述时间索引信息的时间格式，确定所述时间索引信息对应的至少一个目标时间维度；
36.分别查找各所述目标时间维度是否存在对应的位图，所述位图用于存储事件数据标识，且每一个所述事件数据标识对应至少一个位图；
37.获取所述目标时间维度对应的位图；
38.从所述获取到的位图中提取事件数据标识，所述目标时间维度和所述位图一一对应，所述目标时间维度对应至少一个所述事件数据标识；
39.根据所述事件数据标识，返回相应的事件数据。
40.进一步地，所述时间索引信息为时间间隔时，根据所述时间索引信息的时间格式，确定所述时间索引信息对应的至少一个目标时间维度，包括：
41.所述时间索引信息的时间格式具体为：时间单位为年、月、日、时、分和秒，并按照年月日时分秒的顺序进行排列；
42.根据所述时间索引信息的时间格式，按照年月日时分秒顺序，依次确定所述时间间隔的整时长，所述整时长包括：整年、整月、整日、整小时和整分钟；
43.根据所述整时长，确定所述目标时间维度；
44.所述目标时间维度包括以下各项中的一个或多个：各整年年份，各整月月份及其对应的年份，各整日日期其对应的年份和月份，各整小时对应的年份、月份和日期，各整分钟及其对应的年份、月份、日期和小时。
45.进一步地，所述根据所述时间索引信息的时间格式，按照年月日时分秒顺序，依次确定所述时间间隔的整时长，包括：
46.针对时间单位年，时间间隔是否包含整年；
47.包含整年时，将所述时间间隔分为整年时段和非整年时段；
48.针对时间单位月，确定所述非整年时段是否包含有整月；
49.包含整月时，将所述时间间隔分为整月时段和非整月时段；
50.针对时间单位日，确定所述非整月时段是否包含有整日；
51.包含整日时，将所述时间间隔分为整日时段和非整日时段；
52.针对时间单位时，确定所述非整日时段是否包含有整时；
53.包含整时时，将所述时间间隔分为整时时段和非整时时段；
54.针对时间单位分，确定所述非整时时段是否包含有整分；
55.包含整分时，将所述时间间隔分为整分时段和非整分时段。
56.进一步地，所述整时长还包括：整秒；
57.在所述将所述时间间隔分为整分时段和非整分时段之后，所述方法还包括：
58.针对时间单位秒，确定所述非整分时段是否包含有整秒；
59.包含整秒时，确定其中所包含的整秒时段。
60.进一步地，所述时间索引信息为时时间点时，根据所述时间索引信息的时间格式，确定所述时间索引信息对应的至少一个目标时间维度，包括：
61.所述时间索引信息的时间格式具体为：时间单位为年、月、日、时、分和秒，并按照年月日时分秒的顺序进行排列；
62.所述时间点对应的时间即为所述目标时间维度。
63.第三方面，本技术实施例提供了一种基于事件时间的检索装置，包括：接收模块，数据处理模块和结果返回模块；
64.所述接收模块用于接收用户输入的时间索引信息，所述时间索引信息为时间间隔或时间点；
65.所述数据处理模块用于根据所述时间索引信息的时间格式，确定所述时间索引信息对应的至少一个目标时间维度；根据各所述目标时间维度，分别从相应的位图中提取相应的事件数据标识，所述目标时间维度和所述位图一一对应，所述目标时间维度对应至少一个所述事件数据标识；
66.所述数据返回模块用于根据所述事件数据标识，返回相应的事件数据。
67.与现有技术相比，本技术至少能实现以下技术效果之一：
68.1.利用事件数据里时间数据对事件数据进行多维度分类，以增强事件之间的关联关系。以位图的形式存储事件数据标识，且位图与时间一一对应，以实现存储各维度与事件数据的对应关系。检索时，可以根据时间维度提取相应位图中的全部事件数据标识，再根据提取到的事件数据标识，返回事件数据。通过上述方式，检索时不需要逐条比对事件数据，也不需逐条比对事件数据间的关系，就能筛选出相关联的数据，从而节省了检索存在关联关系的事件数据所使用的时间。
69.2.将事件数据中的时间语义信息(如，上个月、月初等)，转化为标准的时间格式(例如，年月日时分秒)，更全面地获取事件数据对应的时间维度，从而增强事件数据的关联性。
70.3.检索时，先确定时间间隔的整时长。并根据整时长，将检索条件转化成多个时间
维度，结合位图便于查找的特性，提高了检索效率。
71.本技术的其他特征和优点将在随后的说明书中阐述，并且，部分的从说明书中变得显而易见，或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
附图说明
72.附图仅用于示出具体实施例的目的，而并不认为是对本技术的限制，在整个附图中，相同的参考符号表示相同的部件。
73.图1为本技术实施例提供的一种数据处理方法的流程图；
74.图2为本技术实施例提供的一种基于事件时间的检索方法的流程图；
75.图3为本技术实施例提供的实施例1-3的整体流程图。
具体实施方式
76.下面结合附图来具体描述本技术的优选实施例，其中，附图构成本技术一部分，并与本技术的实施例一起用于阐释本技术的原理，并非用于限定本技术的范围。
77.事件数据用于表征事件发展的过程和事件产生的效果，包括时间、地点、人物、起因、经过、结果、影响等。通过事件数据可以寻找事件之间的关联。寻找事件的关联通常为两种情况，一种是已知存在关联关系的事件，一种是未知存在关联的事件。
78.对于未知存在关联的事件，统计事件发生的次数有利于得出各事件之间的关联关系。具体地，在同一时间范围内，事件a和b同时发生的次数越多，两者存在关联的可能性越大，反之两者存在关联的可能性越小。因此，如何统计事件数量是找到事件之间是否存在关联的重要前提。然而，当下事件数据的产生速率极快，关键词时间其它要素的检索方法需要根据条件逐条比对，因此随着事件数据不断增加，确定事件数量的效率也逐步降低，最终导致确定事件关联的效率降低。
79.对于已知存在关联关系的事件，其事件数据的表现形式以文字叙述为主，文字叙述过程中可能包含大量对话。而事件发展过程、事件产生的效果、对话和文体导致事件数据的关键词不容易得到，特别是包含大量对话的事件数据，几乎很难用关键词体现对话传达的语义。因此，在该种场景下，传统的检索方式很难得到令人满意的结果，不是噪音过大就是遗漏大量数据，最终不能精确地筛选出存在关联关系的数据。
80.基于上述技术问题，如图1所示，本技术实施例提供了一种数据处理方法，以实现对事件数据进行整合，包括以下步骤：
81.步骤1、采集事件数据的时间数据和事件数据标识。
82.在本技术实施例中，在进行数据处理之前，对事件数据进行预处理，包括给事件数据添加唯一标识。此外，还可以根据实际需求，针对性的建立数据仓库，以便于后续的检索。例如，想得到事件a和事件b的关联关系，那么只需采集与事件a和事件b的事件数据，且只针对事件a和事件b的事件数据设定标识，以便于后续的数据处理和检索只针对事件a和事件b。优选地，为了匹配位图的存储方式，事件数据标识必须为整数，不可以是字符串或其他格式。
83.步骤2、将时间数据转化成统一的时间格式。
84.在本技术实施例中，转换成所述时间格式后时间数据的时间单位包括：年、月、日、时、分和秒中的至少一个，并按照年月日时分秒的顺序进行排列。优选地，统一的时间格式为yyyymmddhhmmss，例如20010101000000表征2001年1月1日0时0分0秒。
85.事件数据中的抽取的结果可能包含一些口语化的时间词汇，不利于后续的检索、统计，例如，明天下午，下月中旬等。此时需要先确定基准时间，再根据基准时间和时间语义信息，确定时间语义信息对应的时间；将时间语义信息对应的时间转化成相应的时间格式。具体地，对于文本类的事件数据，可以文本的发布时间、撰稿时间为基准时间，或者以文本中记载的明确时间为基准时间，例如文本记录“某年某月某日，发生a事件”，则a事件发生的时间可以被定基准时间。优选地，本技术实施例利用正则表达式将口语化的时间词汇转成具有相应时间格式的时间数据，具体地：
86.1.使用正则表达式对年相关的词汇进行格式转换。如：明年，转换为2022年(当前为2021年)。
87.2.使用正则表达式对月相关的词汇进行格式转换。如：上个月，转换为10月(当前月份为11月)。
88.3.使用正则表达式对日相关的词汇进行格式转换。如：月初，则转换为1日(假设指定月初为1日)。
89.4.使用正则表达式对小时相关的词汇进行格式转换。如：下午，则转换为15点(假设指定下午为15点)。
90.5.使用正则表达式对分钟相关的词汇。如：3点1刻，则转换为15分。
91.6.使用正则表达式对秒相关的词汇进行格式转换。如：如17分32，则转换为17分32秒。
92.对于具有明确时间含义的时间数据，例如2001/01/03，8:15，可以根据其时间含义转换其时间格式，例如将2001/01/03转换成20110103000000，8:15转换成081500。
93.步骤3、根据时间格式，确定至少一个时间维度。
94.在本技术实施例中，将时间数据转换成标准格式后，按照年月日时分或年月日时分秒的顺序，依次检测事件数据中是否存在相应的时间单位；每确定一个时间单位存在时，将当前所有存在的时间单位和各存在的时间单位对应的数值组成一个时间维度。具体地，以2001年1月2日3时4分5秒为例，先确定上述时间存在时间单位年，则2001年为该时间的时间维度。再确定上述时间存在时间单位月，则2001年1月为该时间的时间维度。以此类推，该时间数据的其他时间维度分别为2001年1月2日，2001年1月2日3时，2001年1月2日3时4分和2001年1月2日3时4分5秒。实际使用中，秒对应的维度数量远大于其他维度，且用户很少以秒为维度进行查询，为了节约计算及存储资源，优选地以年月日时分的顺序设定时间维度。
95.步骤4、分别建立各时间维度和相应事件数据的对应关系。
96.在本技术实施例中，一个事件数据可能会包括多个时间数据，而每一个时间数据又对应多个时间维度。将每一个维度和相应的事件数据进行保存，可以更容易找到相关联的事件。例如，事件a发生于2001年，事件b发生在2005年且与事件a相关，如果事件a的事件数据和事件b的事件数据均含有2001年，那么可以通过检索条件“2001年”就可以同时找出具有关联关系的a事件和b事件。此外，也可以通过预处理得到只含有事件c和事件d的样本数据，并利用时间条件，筛选出事件c和事件d同时发生的时段，在以该时段为背景对事件c
和事件d进行分析，从而为确定两者是否存在关联提供依据。
97.步骤5、根据时间维度和对应关系，在相应的位图中存储事件数据标识。
98.在本技术实施例中，优选roaringbitmap(高效压缩位图)存储事件数据标识，以更好地节约存储空间，其中，位图与时间维度一一对应。需要说明的是，在实施例中所述“位图”用于指示roaringbitmap。存储时，检测是否存在存储时间维度的位图；当确定不存在存储时间维度的位图时，创建新的位图；在新的位图中，存储相应的事件数据标识。需要说明的是，由于事件数据会比较大，因此只将事件数据对应的标识存储到位图中。此外，单独设置一个全量位图，全量位图会存储所有的事件数据标识，以应对用户以秒为维度进行数据检索。
99.具体方法为：b1：以事件时间yyyymmddhhmm(年月日时分)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
100.b2：以事件时间yyyymmddhh(年月日时)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
101.b3：以事件时间yyyymmdd(年月日)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
102.b4：以事件时间yyyymm(年月)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
103.b5：以事件时间yyyy(年)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
104.b6：将b1～b5步骤创建的位图组织成《type,t,bmp》三个字段进行存储，其中type表示日期的格式，如：yyyy、yyyymm、yyyymmdd、yyyymmddhh、yyyymmddhhmm、yyyymmddhhmmss；t表示对应的日期，如：2021、202101、20210101、2021010108、202101010803、20210101080305；bpm表示事件时间对应的位图二进制数据。
105.b7：构建全量维度，将所有事件数据标识存储在位图中。
106.通过上述方法，实现了在时间层面，建立了事件和事件的关联关系，为后续检索奠定了技术基础。
107.在本技术实施例中，也可以根据实际需求，以事件时间yyyymmddhhmmss(年月日时分秒)为维度，建立位图。其具体过程为以事件时间yyyymmddhhmmss(年月日时分秒)为维度判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。之后执行b1。
108.基于上述实施例的得到数据，本技术实施例提供了一种基于事件时间的检索方法，如图2所示，包括以下步骤：
109.步骤s1，接收用户输入的时间索引信息。
110.步骤s2，根据时间索引信息的时间格式，确定时间索引信息对应的至少一个目标时间维度。
111.在本技术实施例中，时间索引信息为时间间隔或时间点，时间索引信息的时间格式具体为：时间单位为年、月、日、时、分和秒，并按照年月日时分秒的顺序进行排列。优选地，时间索引信息的时间格式为yyyymmddhhmmss，例如20010101000000表征2001年1月1日0时0分0秒。
112.时间索引信息为时间间隔时，根据时间索引信息的时间格式，确定时间间隔的整时长，整时长包括：整年年份，整月月份，整日日期、整小时和整分钟。目标时间维度包括以下各项中的一个或多个：各整年年份，各整月月份及其对应的年份，各整日日期其对应的年份和月份，各整小时对应的年份、月份和日期，各整分钟及其对应的年份、月份、日期和小时。
113.确定整时长的过程为：
114.针对时间单位年，时间间隔是否包含整年；
115.包含整年时，将时间间隔分为整年时段和非整年时段；
116.针对时间单位月，确定非整年时段是否包含有整月；
117.包含整月时，将时间间隔分为整月时段和非整月时段；
118.针对时间单位日，确定非整月时段是否包含有整日；
119.包含整日时，将时间间隔分为整日时段和非整日时段；
120.针对时间单位时，确定非整日时段是否包含有整时；
121.包含整时时，将时间间隔分为整时时段和非整时时段；
122.针对时间单位分，确定非整时时段是否包含有整分；
123.包含整分时，将时间间隔分为整分时段和非整分时段；
124.此外，当整时长还包括整秒时，在将所述时间间隔分为整分时段和非整分时段之后，上述方法还包括：针对时间单位秒，确定所述非整分时段是否包含有整秒；包含整秒时，确定其中所包含的整秒时段。
125.例如，时间索引信息为起始时间t1为2008-12-10 12:00:00，结束时间t2为2011-02-08 11:00:00。
126.首先确定整年，将时间t1-t2拆分为[2008-12-10 12:00:00～2008-12-3123:59:59]、[2009年]、[2010年]、[2011-01-01 00:00:00～2011-02-08 11:00:00]四个子时段。[2009年]和[2010年]即为整年时段，同时也是目标时间维度。
[0127]
其次确定整月，将[2011-01-01 00:00:00～2011-02-08 11:00:00]拆分成[2011年1月]、[2011-02-01 00:00:00～2011-02-08 11:00:00]两个子时段。1月为整月时段，[2011年1月]目标时间维度。
[0128]
再次确定整日，将[2011-02-01 00:00:00～2011-02-08 11:00:00]拆分成[2011-02-08 00:00:00～2011-02-08 11:00:00]、[2011-02-01～2011-02-07]八个子时段。其中，01-07日为整日时段，[2011-02-01]、[2011-02-02]、[2011-02-03]、[2011-02-04]、[2011-02-05]、[2011-02-06]、[2011-02-07]均为目标时间维度。同理将，[2008-12-10 12:00:00～2008-12-31 23:59:59]拆分成22个子时段，其中21个整日时段，[2008-12-11]～[2008-12-31]均为其对应的目标时间维度。
[0129]
最后，以此类推，分别得到整时时段和整分时段，以及相应的目标时间维度。
[0130]
需要说明的是，在上述过程中，当所有子时段的整时长为0时，结束当前流程。
[0131]
时间索引信息为时间点时，时间点对应的时间即为目标时间维度。例如，时间索引信息为2001年1月1日，则2001年1月1日即为目标时间维度。需要说明的是，在本技术实施例中，时间间隔是指时间索引信息存在起始时间和终止时间，而时间点是指时间索引信息只有一个时间，与其代表的时间长度无关。例如时间间隔为2001年1月-2001年3月代表3个月，而时间点2001年代表一年。
[0132]
步骤s3，分别查找各目标时间维度是否存在对应的位图。
[0133]
步骤s4、获取目标时间维度对应的位图；
[0134]
步骤s5、从获取到的位图中提取事件数据标识，目标时间维度对应至少一个事件数据标识。
[0135]
在本技术实施例中，位图用于存储事件数据标识，且每一个事件数据标识对应至少一个位图。因此，在目标时间维度在对应的位图时，可能获取多个包含同一事件数据标识的情况。上述情况会导致用户查询到很多重复的数据，为了提高用户体验，本技术对上述情况下获取到的位图进行合并。
[0136]
具体地，从数据存储的角度讲，一个位图可以视为一个集合，位图中存储的事件数据标识为该集合的元素。因此合并位图过程可以视为集合运算中的并运算。通过并运算可以直接将多个相同的事件数据标识合并，得到唯一的事件数据标识合并。例如，位图a包含1和2，位图b包含2和3，合并位图a和位图b后，得到位图c。此时位图c包含1、2和3。
[0137]
步骤s6，根据事件数据标识，返回相应的事件数据。
[0138]
在本技术实施例中，可以将事件数据存储到云端或其他数据库，再根据得到的时间数据标识调用相关的数据。
[0139]
为了说明上述实施例的可行性，本技术给出下述实施例，其中实施例1为数据处理过程，实施例2为数据检索过程，实施例3为数据统计过程。其中，实施例1-3的整体过程如图3所示，实施例1：开始
→a→b→
结束。
[0140]
实施例2：开始
→c→d→
结束。实施例3：开始
→c→e→
结束。
[0141]
实施例1
[0142]
a1：给事件数据添加唯一标识eventid(long类型；从1开始，步长为1)，以《eventid,event》将事件数据存入es(elasticsearch，搜索引擎)，其中eventid表示事件标识，event表示事件数据。
[0143]
a2：使用预训练的时间提取机器学习模型获取事件时间文本列表{t1,t2,t3
…
}。
[0144]
在本技术实施例中，时间提取机器学习模型为crf模型、隐马尔可夫模型或bilstm 最大熵。
[0145]
a3：使用基于正则表达式的时间标准化算法将事件时间文本列表中的内容转换为yyyymmddhhmmss格式，得到事件时间标准化列表{t1’,t2’,t3
’…
}。
[0146]
a4：将转换好的事件时间标准化列表中的每个元素与事件唯一标识组织成《t’,eventid》格式，如：《t1’,eventid》,《t2’,eventid》,《t3’,eventid》
…
[0147]
a5：将a4得到的结果存入es。
[0148]
a6：以事件时间yyyymmddhhmmss(年月日时分秒)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
[0149]
a7：以事件时间yyyymmddhhmm(年月日时分)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
[0150]
a8：以事件时间yyyymmddhh(年月日时)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
[0151]
a9：以事件时间yyyymmdd(年月日)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
[0152]
a10：以事件时间yyyymm(年月)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
[0153]
a11：以事件时间yyyy(年)为维度，判断是否创建过对应的位图，如果没有创建过，则创建一个新的位图，如果创建过，则跳过创建；然后将对应的事件唯一标识写入该位图。
[0154]
a12：将步骤a6～a12创建的位图组织成《type,t,bmp》三个字段进行存储，其中type表示日期的格式；t表示对应的日期；bpm表示事件时间对应的位图二进制数据。
[0155]
实施例2
[0156]
c1：获取查询条件中的时间范围。
[0157]
c2：分别对查询条件中的开始日期和结束日期以秒、分、时、日、月为顺序判断该条件对应的时间格式，然后根据时间格式，构建该条件对应的时间维度。
[0158]
c3：根据c2构建的时间维度获取相应的位图。
[0159]
c4：对c3获取的位图进行合并操作，除去重复的事件数据标识。
[0160]
c5：根据步骤c4中的事件数据标识，生成查询命令中的事件标识列表。
[0161]
c6：使用事件标识列表在es中查询对应的事件数据。
[0162]
c7：将c6查询到的事件数据作为最终结果进行返回。
[0163]
实施例3
[0164]
e1：判断步骤c4获取到的事件数据标识的个数。
[0165]
e2：将e1获取到的事件数据标识个数作为最终结果进行返回。
[0166]
本技术实施例提供了一种基于事件时间的检索装置，包括：接收模块，数据处理模块和结果返回模块；
[0167]
接收模块用于接收用户输入的时间索引信息，时间索引信息为时间间隔或时间点；
[0168]
数据处理模块用于根据时间索引信息的时间格式，确定时间索引信息对应的至少一个目标时间维度；根据各目标时间维度，分别从相应的位图中提取相应的事件数据标识，目标时间维度和位图一一对应，目标时间维度对应至少一个事件数据标识；
[0169]
数据返回模块用于根据事件数据标识，返回相应的事件数据。
[0170]
在本技术实施例中，时间索引信息为时间间隔时，数据处理模块用于根据时间索引信息的时间格式，按照年月日时分秒顺序，依次确定时间间隔的整时长，整时长包括：整年、整月、整日、整小时、整分钟和整秒；根据整时长，确定目标时间维度；
[0171]
时间索引信息的时间格式具体为：时间单位为年、月、日、时、分和秒，并按照年月日时分秒的顺序进行排列；
[0172]
目标时间维度包括以下各项中的一个或多个：各整年年份，各整月月份及其对应的年份，各整日日期其对应的年份和月份，各整小时对应的年份、月份和日期，各整分钟及其对应的年份、月份、日期和小时，各秒及其对应的年份、月份、日期、小时和分钟。
[0173]
以上所述，仅为本技术较佳的具体实施方式，但本技术的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本技术揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本技术的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：交易额变化趋势预测方法、装置和终端设备与流程

一种数据处理方法、基于事件时间的检索方法和装置与流程

相关文献

最热文献