一种无界流数据关联处理方法、装置、设备及存储介质与流程

2021-12-07 21:18:00 来源：中国专利 TAG：

1.本发明实施例涉及计算机技术领域，尤其涉及一种无界流数据关联处理方法、装置、设备及存储介质。

背景技术：

2.在流处理应用中，数据流之间是存在关联关系的，为实现对相互关联的数据流的关联分析，常用的处理方式是采用流处理窗口采集接收关联关系的数据流的数据，根据流处理窗口接收到的数据进行关联流之间的数据分析。
3.在实现本发明的过程中，发明人发现现有技术中至少存在以下技术问题：当任一数据流延迟或网络抖动时无法获取完整的关联数据，导致数据丢失，数据处理效果差。

技术实现要素：

4.本发明实施例提供了一种无界流数据关联处理方法、装置、设备及存储介质，以实现保证关联数据流数据的完整性，提高数据处理效果。
5.第一方面，本发明实施例提供了一种无界流数据关联处理方法，包括：
6.获取主数据流和与主数据流关联的关联数据流；
7.确定主数据流的主数据获取路径，以及关联数据流的关联数据获取路径，主数据获取路径或关联数据获取路径包括本地缓存，本地缓存用于存储变更频率大于设定频率阈值的业务数据；
8.基于主数据获取路径获取目标主数据，基于关联数据获取路径获取目标关联数据；
9.对目标主数据和目标关联数据进行关联处理，得到关联处理结果。
10.第二方面，本发明实施例还提供了一种无界流数据关联处理装置，包括：
11.数据流获取模块，用于获取主数据流和与主数据流关联的关联数据流；
12.获取路径确定模块，用于确定主数据流的主数据获取路径，以及关联数据流的关联数据获取路径，主数据获取路径或关联数据获取路径包括本地缓存，本地缓存用于存储变更频率大于设定频率阈值的业务数据；
13.数据获取模块，用于基于主数据获取路径获取目标主数据，基于关联数据获取路径获取目标关联数据；
14.数据处理模块，用于对目标主数据和目标关联数据进行关联处理，得到关联处理结果。
15.第三方面，本发明实施例还提供了一种计算机设备，设备包括：
16.一个或多个处理器；
17.存储装置，用于存储一个或多个程序；
18.当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如本发明任意实施例所提供的无界流数据关联处理方法。
19.第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例所提供的无界流数据关联处理方法。
20.本发明实施例通过获取主数据流和与主数据流关联的关联数据流；确定主数据流的主数据获取路径，以及关联数据流的关联数据获取路径，主数据获取路径或关联数据获取路径包括本地缓存，本地缓存用于存储变更频率大于设定频率阈值的业务数据，保证了快速变化的数据、对状态变更敏感的数据关联准确性；基于主数据获取路径获取目标主数据，基于关联数据获取路径获取目标关联数据；对目标主数据和目标关联数据进行关联处理，得到关联处理结果，避免了数据流延迟或网络抖动时数据的丢失，提高了数据处理的准确度。
附图说明
21.图1是本发明实施例一所提供的一种无界流数据关联处理方法的流程图；
22.图2a是本发明实施例二所提供的一种无界流数据关联处理方法的原理图；
23.图2b是本发明实施例二所提供的一种关联流持久化存储的流程示意图；
24.图2c是本发明实施例二所提供的一种数据流关联计算的流程示意图；
25.图3是本发明实施例三所提供的一种无界流数据关联处理装置的结构示意图；
26.图4是本发明实施例四所提供的一种计算机设备的结构示意图。
具体实施方式
27.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。
28.实施例一
29.图1是本发明实施例一所提供的一种无界流数据关联处理方法的流程图。本实施例可适用于对无界流数据进行关联处理时的情形。该方法可以由无界流数据关联处理装置执行，该无界流数据关联处理装置可以采用软件和/或硬件的方式实现，例如，该无界流数据关联处理装置可配置于计算机设备中。如图1所示，该方法包括：
30.s110、获取主数据流和与主数据流关联的关联数据流。
31.在本实施例中，主数据流和关联数据流是用于进行关联分析的数据流。主数据流和关联数据流均可以根据数据处理需求确定。以电商平台为例，若数据处理需求为订单交易成功特征分析，考虑到订单中物品的浏览、收藏、配送速度等可能均与订单交易成功具有关联关系，则可以将订单流作为主数据流，将浏览流、收藏流、物流信息流等作为关联数据流。可以理解的是，主数据流与不同关联数据流之间的关联键可能不同，也可能相同。以主数据流为订单流，关联数据流为浏览流、收藏流和物流信息流为例，订单流和浏览流及收藏流之间的关联键可以为物品标识，订单流和物流信息流之间的关联键可以为物流标识。
32.一个实施例中，获取主数据流和与主数据流关联的关联数据流，包括：响应于检测到的数据处理请求，根据数据处理请求的数据处理类型确定主数据流以及关联条件；根据关联条件确定主数据流关联的关联数据流，以及主数据流与关联数据流之间的关联键。可
选的，在检测到数据处理请求时，根据数据处理请求确定主数据流和关联数据流。示例性的，用户可以人为设定主数据流及关联条件，并携带上述信息发起数据处理请求。无界流数据关联处理装置接收到数据处理请求后，对数据处理请求进行解析，得到主数据流及关联条件。还可以预先设定数据处理类型对应的主数据流及关联条件，用户发起数据处理请求后，无界流数据关联处理装置根据数据处理请求的数据处理类型，基于预先设定的对应关系确定数据处理请求的主数据流及关联条件。其中，关联条件可以为一个，也可以为多个。如关联条件可以为物品标识关联，或关联条件为用户标识或物品标识关联。得到关联条件后，即可根据各数据流中携带的信息确定至少一个关联数据流，最后根据主数据流和关联数据流之间的关联关系确定主数据流和每个关联数据流之间的关联键。
33.在上述方案的基础上，方法还包括：确定主数据流与关联数据流的连接类型；根据连接类型从主数据流和关联数据流中选取一数据流作为存储数据流；将关联键作为存储数据流的存储主键，基于存储主键将存储数据流进行存储。。在对主数据流和关联数据流中的数据进行关联分析时，需要根据主数据流中的数据和关联数据流中的数据聚合连接组成组合进行处理。不同的连接类型对应不同的连接方式。为保证任意连接方式均能获取完整的关联数据，在本实施例中，根据连接类型判断将主数据流进行持久化存储或将关联数据流进行持久化存储。在进行存储数据流的持久化存储时，可以在文件中通过key
‑
value的格式，写入表名、主键等信息。
34.s120、确定主数据流的主数据获取路径，以及关联数据流的关联数据获取路径，主数据获取路径或关联数据获取路径包括本地缓存，本地缓存用于存储变更频率大于设定频率阈值的业务数据。
35.在本实施例中，为避免数据流延迟或网络抖动时数据的丢失，降低数据处理的准确度，可以将某一数据流的数据存储至存储空间中，在进行数据处理时，从实时数据流和存储空间中获取数据进行关联处理。而在将数据进行存储时，考虑到变更敏感的数据存储至被动缓存中会引起数据状态的不一致，如订单表中的订单状态，在不断发生变化，放到被动缓存中，假设被动缓存时间是30分钟，则30分钟内订单状态就不会发生变化，因此，为保证数据存储的准确度，需要从原始的数据流中主动更新缓存，即在本地缓存中添加主动缓存层，将对变更敏感的数据(即存储变更频率大于设定频率阈值的业务数据，或预先设定的变更敏感的数据)，例如不断变化更新的数据放到缓存中，并用原始数据流程不断的主动更新本地缓存中的主动缓存层。需要说明的是，在用原始数据流更新主动缓存时，需要将同一个数据表缓存至同一实例中，读写均使用同一个共享的缓存。
36.可选的，变更敏感的数据可以根据业务数据类型或业务场景的变更频率确定，其中，业务数据类型或业务场景的变更频率可以根据历史数据计算得到；变更敏感的数据也可以人为设定，如根据业务数据场景的特点设置，如，订单状态场景，变化比较快，下游计算时需要快速了解到订单的变化情况，因此订单状态数据可以设置为变更敏感数据；再如商品信息，比如商品名称、重量、长宽高等，下游对这些变更可以接受延迟，可以设置为变更不敏感数据。
37.在本发明的一种实施方式中，确定主数据流的主数据获取路径，以及关联数据流的关联数据获取路径，包括：根据主数据流和关联数据流的连接类型确定主数据流的主数据获取路径和关联数据流的关联数据获取路径。可选的，为保证不同的连接类型均能合理
的获取到完整的关联数据，在本实施例中针对不同的连接类型，设定了不同的数据流的处理方式。因此，在进行数据获取时，不同的连接类型，不同的数据流具有不同的数据获取路径。
38.一般的，主数据流中主数据和关联数据流中关联数据的连接方式包括内连接、左外连接、右外连接和全外连接四种。当连接类型为内连接时，仅将主数据流和关联数据流中匹配的数据聚合成组合；当连接类型为左外连接时，将主数据流中的所有数据聚合成组合；当连接类型为右外连接时，将关联数据流中的所有数据聚合成组合；当连接类型为全外连接时，将主数据流和关联数据流中的所有数据聚合成组合。为保证不同的连接类型均能获取完整的数据，连接类型对应的连接方式，从主数据流和关联数据流中选取一数据流作为存储数据流，进行持久化存储。具体的，当连接类型为内连接和右外连接时，将关联数据流作为存储数据流，将关联数据流的实时数据进行持久化存储。当连接类型为左外连接和全外连接时，将主数据流作为存储数据流，将主数据流的实时数据进行持久化存储。
39.在上述方案的基础上，当连接类型为内连接和右外连接时，将关联数据流作为存储数据流。因此，当连接类型为内连接和右外连接时，根据主数据流和关联数据流的连接类型确定主数据流的主数据获取路径和关联数据流的关联数据获取路径，包括：确定主数据获取路径为实时数据流，关联数据获取路径为实时数据流及存储空间，存储空间包括本地缓存和持久化存储单元。具体的，从实时数据流中获取主数据流的数据，从实时数据流以及存储空间中获取关联数据流的数据。可选的，从存储空间中获取关联数据流的数据包括：从本地缓存中获取主动缓存层中关联数据流的主动缓存数据和持久化存储单元中关联数据流的持久化存储数据。
40.当连接类型为左外连接和全外连接时，将主数据流作为存储数据流，将主数据流的实时数据进行持久化存储。因此，连接类型为左外连接和全外连接时，根据主数据流和关联数据流的连接类型确定主数据流的主数据获取路径和关联数据流的关联数据获取路径，包括：确定关联数据获取路径为实时数据流，主数据获取路径为实时数据流及存储空间，存储空间包括本地缓存和持久化存储单元。具体的，从实时数据流中获取关联数据流的数据，从实时数据流以及存储空间中获取主数据流的数据。可选的，从存储空间中获取主数据流的数据包括：从本地缓存中获取主动缓存层中主数据流的主动缓存数据和持久化存储单元中主数据流的持久化存储数据。
41.s130、基于主数据获取路径获取目标主数据，基于关联数据获取路径获取目标关联数据。
42.在确定各个数据流的数据获取路径后，基于确定的数据获取路径获取各数据流的数据。
43.当主数据流的获取路径为实时数据流，关联数据流的获取路径为实时数据流及存储空间时，基于关联数据获取路径获取目标关联数据，包括：获取主数据流和关联数据流之间的关联键；将关联键作为主键从实时数据流中获取实时关联数据，根据目标主数据和实时关联数据确定目标主数据中未匹配到的未匹配主数据；将未匹配主数据的关联键作为主键从存储空间中获取未匹配主数据对应的存储关联数据；将实时关联数据和存储关联数据合并去重，得到目标关联数据。具体的，从实时数据流中获取目标主数据。从实时数据流中获取实时关联数据，确定目标主数据中与实时关联数据未匹配到的未匹配主数据，然后将
未匹配主数据的关联键作为主键从存储空间中获取未匹配主数据对应的存储关联数据，将实时关联数据和存储关联数据合并去重，得到目标关联数据。可选的，存储空间可以包括本地缓存和持久化存储单元，本地缓存的空间小，但数据处理速度快，持久化存储单元的空间较大，但数据处理速度相对较慢。相应的，将未匹配主数据的关联键作为主键从存储空间中获取未匹配主数据对应的存储关联数据可以具体为：遍历本地缓存中是否存在与关联键对应的关联数据，若存在，则将关联数据作为存储关联数据；若不存在，则遍历持久化存储单元中是否存在与关联键对应的关联数据，若存在，则将关联数据作为存储关联数据，并将存储关联数据与关联键对应存储至本地缓存中。
44.当关联数据流的获取路径为实时数据流，主数据流的获取路径为实时数据流及存储空间时，基于主数据获取路径获取目标主数据，包括：获取主数据流和关联数据流之间的关联键；将关联键作为主键从实时数据流中获取实时主数据，根据目标关联数据和实时主数据确定目标关联数据中未匹配到的未匹配关联数据；将未匹配关联数据的关联键作为主键从存储空间中获取未匹配关联数据对应的存储主数据；将实时主数据和存储主数据合并去重，得到目标主数据。具体的，从实时数据流中获取目标关联数据。从实时数据流中获取实时主数据，确定目标关联数据中与实时主数据未匹配到的未匹配关联数据，然后将未匹配关联数据的关联键作为主键从存储空间中获取未匹配关联数据对应的存储主数据，将实时主数据和存储主数据合并去重，得到目标关联数据。可选的，将未匹配关联数据的关联键作为主键从存储空间中获取未匹配关联数据对应的存储主数据可以具体为：遍历本地缓存中是否存在与关联键对应的数据，若存在，则将数据作为存储主数据；若不存在，则遍历持久化存储单元中是否存在与关联键对应的数据，若存在，则将数据作为存储主数据，并将存储主数据与关联键对应存储至本地缓存中。
45.s140、对目标主数据和目标关联数据进行关联处理，得到关联处理结果。
46.得到目标主数据和目标关联数据后，将目标主数据和目标关联数据存储至内存数据库中进行关联计算，并将计算结果下发至结果流中。具体的关联计算方式可以基于数据处理需求确定，在此不再赘述。
47.本发明实施例通过获取主数据流和与主数据流关联的关联数据流；确定主数据流的主数据获取路径，以及关联数据流的关联数据获取路径，主数据获取路径或关联数据获取路径包括本地缓存，本地缓存用于存储变更频率大于设定频率阈值的业务数据，保证了快速变化的数据、对状态变更敏感的数据关联准确性；基于主数据获取路径获取目标主数据，基于关联数据获取路径获取目标关联数据；对目标主数据和目标关联数据进行关联处理，得到关联处理结果，避免了数据流延迟或网络抖动时数据的丢失，提高了数据处理的准确度。
48.实施例二
49.本实施例在上述方案的基础上，提供了一种优选实施例。本实施例以关联数据流为存储数据流为例，对无界流数据关联处理方法进行说明。
50.图2a是本发明实施例二所提供的一种无界流数据关联处理方法的原理图。如图2a所示，主数据流1、关联数据流2进行实时关联时，先经过数据预处理。在关联数据流2的处理流程中增加了持久化存储单元以及主动缓存层。持久化存储单元将数据存储到持久化存储装置中，例如hbase中。主动缓存层可以为本地的内存缓存(例如guava cache)，将对变更敏
感的数据，例如不断变化更新的数据放到缓存中，并用原始数据流程不断的主动更新缓存。当两个流关联计算时，通过数据加载器，去主动缓存、持久化存储中捞取没有关联到的数据。这样即使数据流的数据发生延迟，等数据下发后仍然可以从存储空间中获取到数据，去进行计算，保障了两个流中所有已经存在的数据都会被关联计算，从而不会丢数据，并且通过添加主动缓存，加速了关联计算，降低了持久化存储的读取。
51.图2b是本发明实施例二所提供的一种关联流持久化存储的流程示意图。如图2b所示，关联流持久化存储包括确定主键、更新配置文件、窗口内数据去重和更新持久化存储四部分。确定主键：首先根据两个流关联计算的关联条件，确定每个流程使用时的关联键，作为持久化存储的主键。更新配置文件：为了方便后期任务管理，增加配置文件，记录每个实时流对应的持久化存储的表名，主键等信息。确定好主键后，需要将实时流名称、持久化存储表名、主键、使用到的字段信息等更新到配置文件中。窗口内数据去重：为了减少与持久化存储的交互，可以设置流处理窗口(例如2秒钟一个窗口)，在流处理窗口内进行去重操作，同一个主键的数据，只保留最新状态的一条数据，这样可以减少对持久化存储的写操作。确定可以主动缓存的表：将去重后的数据，写入到本地缓存中的主动缓存以及持久化存储系统中。
52.图2c是本发明实施例二所提供的一种数据流关联计算的流程示意图。如图2c所示，数据流关联计算过程主要包括：
53.1、加载主数据流1数据，提取关联键。以主数据流1为主流，在当前窗口的数据组织成数据集形式，如map1<key,data>形式。map1中的key为关联键，也是持久化存储中的主键。
54.2、从持久化存储中加载关联数据流2需要关联的数据。
55.(1)通过主键查询本地缓存，如果缓存命中，则将命中的存储关联数据dataloadstream2<key,data>返回，进入步骤3。
56.如果缓存没有命中，将未命中的数据标记为未关联数据unjoinstream1，进入步骤(2)。
57.(2)遍历unjoinstream1中的关联键值，查询持久化存储，得到命中的数据持久关联数据dataloadstream2<key,data>。
58.(3)将持久关联数据dataloadstream2<key,data>写入到本地缓存，以使后续可以在本地缓存中命中该数据，加快处理速度。
59.3、数据合并
60.将主数据流1的map1<key,data>、从缓存或持久化存储中加载的存储关联数据dataloadstream2<key,data>，进行合并得到需要计算的数据集tobecalculatedmap1<key,data>。
61.4、将合并后得到的数据集加载到内存数据库中。
62.5、在内存数据库中进行关联计算。
63.6、将计算结果下发到结果流中。
64.本实施例提供的无界流数据关联处理方法经过测试，主动缓存命中率在60％多，大大降低了hbase集群的访问压力。
65.本发明实施例在海量数据实时计算过程中，通过流处理窗口将两个或多个流进行关联计算时，当其中某个流出现延迟或者抖动时，通过引入持久化存储自动加载未关联上
的数据，巧妙的解决了数据关联不上不进行下发，结果流中少数据的情况，并在持久化缓存上面添加了主动缓存(本地缓存)，保证了变更敏感数据的准确性，进而提升了数据处理的准确性，有效地加强了海量数据多流实时关联计算的鲁棒性、稳定性、容错性，为海量实时计算的运维提供了自动化，智能化的便利。
66.实施例三
67.图3是本发明实施例三所提供的一种无界流数据关联处理装置的结构示意图。该无界流数据关联处理装置可以采用软件和/或硬件的方式实现，例如该无界流数据关联处理装置可以配置于计算机设备中。如图3所示，该装置包括数据流获取模块310、获取路径确定模块320、数据获取模块330和数据处理模块340，其中：
68.数据流获取模块310，用于获取主数据流和与主数据流关联的关联数据流；
69.获取路径确定模块320，用于确定主数据流的主数据获取路径，以及关联数据流的关联数据获取路径，主数据获取路径或关联数据获取路径包括本地缓存，本地缓存用于存储变更频率大于设定频率阈值的业务数据；
70.数据获取模块330，用于基于主数据获取路径获取目标主数据，基于关联数据获取路径获取目标关联数据；
71.数据处理模块340，用于对目标主数据和目标关联数据进行关联处理，得到关联处理结果。
72.本发明实施例通过获取主数据流和与主数据流关联的关联数据流；确定主数据流的主数据获取路径，以及关联数据流的关联数据获取路径，主数据获取路径或关联数据获取路径包括本地缓存，本地缓存用于存储变更频率大于设定频率阈值的业务数据，保证了快速变化的数据、对状态变更敏感的数据关联准确性；基于主数据获取路径获取目标主数据，基于关联数据获取路径获取目标关联数据；对目标主数据和目标关联数据进行关联处理，得到关联处理结果，避免了数据流延迟或网络抖动时数据的丢失，提高了数据处理的准确度。
73.可选的，在上述方案的基础上，获取路径确定模块320具体用于：
74.根据主数据流和关联数据流的连接类型确定主数据流的主数据获取路径和关联数据流的关联数据获取路径。
75.可选的，在上述方案的基础上，连接类型包括内连接和右外连接，获取路径确定模块320具体用于：
76.确定主数据获取路径为实时数据流，关联数据获取路径为实时数据流及存储空间，存储空间包括本地缓存和持久化存储单元。
77.可选的，在上述方案的基础上，数据获取模块330具体用于：
78.获取主数据流和关联数据流之间的关联键；
79.将关联键作为主键从实时数据流中获取实时关联数据，根据目标主数据和实时关联数据确定目标主数据中未匹配到的未匹配主数据；
80.将未匹配主数据的关联键作为主键从存储空间中获取未匹配主数据对应的存储关联数据；
81.将实时关联数据和存储关联数据合并去重，得到目标关联数据。
82.可选的，在上述方案的基础上，连接类型包括左外连接和全外连接，获取路径确定
模块320具体用于：
83.确定主数据获取路径为实时数据流及存储空间，关联数据获取路径为实时数据流，存储空间包括本地缓存和持久化存储单元。
84.可选的，在上述方案的基础上，数据获取模块330具体用于：
85.获取主数据流和关联数据流之间的关联键；
86.将关联键作为主键从实时数据流中获取实时主数据，根据目标关联数据和实时主数据确定目标关联数据中未匹配到的未匹配关联数据；
87.将未匹配关联数据的关联键作为主键从存储空间中获取未匹配关联数据对应的存储主数据；
88.将实时主数据和存储主数据合并去重，得到目标主数据。
89.可选的，在上述方案的基础上，数据流获取模块310具体用于：
90.响应于检测到的数据处理请求，根据数据处理请求的数据处理类型确定主数据流以及关联条件；
91.根据关联条件确定主数据流关联的关联数据流，基于关联条件确定主数据流与关联数据流之间的关联键。
92.可选的，在上述方案的基础上，装置还包括存储数据流确定模块，用于：
93.确定主数据流与关联数据流的连接类型；
94.根据连接类型从主数据流和关联数据流中选取一数据流作为存储数据流；
95.将关联键作为存储数据流的存储主键，基于存储主键将存储数据流进行存储。
96.本发明实施例所提供的无界流数据关联处理装置可执行本发明任意实施例所提供的无界流数据关联处理方法，具备执行方法相应的功能模块和有益效果。
97.实施例四
98.图4是本发明实施例四所提供的一种计算机设备的结构示意图。图4是本发明实施例六所提供的计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性计算机设备412的框图。图4显示的计算机设备412仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。
99.如图4所示，计算机设备412以通用计算设备的形式表现。计算机设备412的组件可以包括但不限于：一个或者多个处理器414，系统存储器428，连接不同系统组件(包括系统存储器428和处理器414)的总线418。
100.总线418表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器414或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(isa)总线，微通道体系结构(mac)总线，增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
101.计算机设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备412访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。
102.系统存储器428可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(ram)430和/或高速缓存存储器432。计算机设备412可以进一步包括其它可移动/
不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储装置434可以用于读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如cd
‑
rom，dvd
‑
rom或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储器428可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。
103.具有一组(至少一个)程序模块442的程序/实用工具440，可以存储在例如存储器428中，这样的程序模块442包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本发明所描述的实施例中的功能和/或方法。
104.计算机设备412也可以与一个或多个外部设备414(例如键盘、指向设备、显示器424等)通信，还可与一个或者多个使得用户能与该计算机设备412交互的设备通信，和/或与使得该计算机设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口422进行。并且，计算机设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(lan)，广域网(wan)和/或公共网络，例如因特网)通信。如图所示，网络适配器420通过总线418与计算机设备412的其它模块通信。应当明白，尽管图中未示出，可以结合计算机设备412使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
105.处理器414通过运行存储在系统存储器428中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的无界流数据关联处理方法，该方法包括：
106.获取主数据流和与所述主数据流关联的关联数据流；
107.确定主数据流的主数据获取路径，以及关联数据流的关联数据获取路径，主数据获取路径或关联数据获取路径包括本地缓存，本地缓存用于存储变更频率大于设定频率阈值的业务数据；
108.基于主数据获取路径获取目标主数据，基于关联数据获取路径获取目标关联数据；
109.对目标主数据和目标关联数据进行关联处理，得到关联处理结果。
110.当然，本领域技术人员可以理解，处理器还可以实现本发明任意实施例所提供的无界流数据关联处理方法的技术方案。
111.实施例五
112.本发明实施例五还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明实施例所提供的无界流数据关联处理方法，该方法包括：
113.获取主数据流和与主数据流关联的关联数据流；
114.确定主数据流的主数据获取路径，以及关联数据流的关联数据获取路径，主数据获取路径或关联数据获取路径包括本地缓存，本地缓存用于存储变更频率大于设定频率阈值的业务数据；
115.基于所述主数据获取路径获取目标主数据，基于所述关联数据获取路径获取目标
关联数据；
116.对所述目标主数据和所述目标关联数据进行关联处理，得到关联处理结果。
117.当然，本发明实施例所提供的一种计算机可读存储介质，其上存储的计算机程序不限于如上的方法操作，还可以执行本发明任意实施例所提供的无界流数据关联处理方法的相关操作。
118.本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd
‑
rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
119.计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
120.计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、rf等等，或者上述的任意合适的组合。
121.可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c ，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
122.注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：订单拆分处理方法、装置、设备及可读存储介质与流程

一种无界流数据关联处理方法、装置、设备及存储介质与流程

相关文献

最热文献