一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

Redis集群的扩容方法、装置、电子设备和存储介质与流程

2022-07-16 17:20:37 来源:中国专利 TAG:

redis集群的扩容方法、装置、电子设备和存储介质
技术领域
1.本发明涉及计算机技术领域,尤其涉及一种redis集群的扩容方法、装置、电子设备和存储介质。


背景技术:

2.redis指的是一个开源的使用ansic语言(ansic语言是美国国家标准协会制定的一个c语言的标准)编写、支持网络、可基于内存亦可持久化的日志型、键值型数据库,并提供多种语言的应用程序界面。redis集群是一个去中心化的集群,每个节点都会跟其他节点保持连接,用来交换彼此的信息。
3.现有技术进行redis集群扩容时候,通常采用手动处理的方法,即管理员在收到业务人员告知的对redis集群进行扩容通知后,在redis集群上输入相关命令对redis集群进行操作。
4.现有技术主要在以下三个方面问题:
5.第一,redis集群扩容过程复杂,容易出错。
6.第二,redis集群迁移数据过程耗时长,一次扩容迁移可能需要十几个小时,如在晚上进行运维服务,运维难度较大。
7.第三,redis集群中的大key等情况容易导致扩容失败,对异常情况没有对应的处理,存在很大隐患。


技术实现要素:

8.下文呈现各种示例性技术方案的概述。在以下概述中可以进行一些简化和省略,其意在突出并介绍各种示例性技术方案的一些方面,但不限制本发明的范围。将在后续部分呈现足以允许本领域的普通技术人员产生并使用本发明概念的示例性技术方案的详细描述。
9.未克服现有技术存在的问题,本发明的技术方案提供一种redis集群的扩容方法,包括:将新增节点加入集群,平均地分配槽位到所有节点,确定槽位迁移计划;获取需要迁移的槽位的配置;执行槽位迁移计划,将需要迁移的槽位从源节点迁移到目标节点;判断迁移过程是否有异常,如果有异常,则判断是否是已知异常,如果是已知异常,则进行兼容处理,如果不是已知异常,则发送告警信息。
10.可选地,所述平均地分配槽位到所有节点,包括:总的槽位数除以节点数,得到每个节点的平均槽位数,若有余数,则将余数随机分配到各个节点。
11.可选地,所述需要迁移的槽位的配置包括槽位迁移速度。
12.可选地,所述执行槽位迁移计划,包括:采用多线程的方式执行槽位迁移计划。
13.可选地,所述执行槽位迁移计划,包括:在一个线程中,以单个槽位为维度,在迁移完一个槽位后,根据上一个槽位迁移情况判断是否迁移下一个槽位。
14.可选地,所述方法还包括:迁移完成后设置归属节点,采取锁的方式,同一时刻不
允许并发地设置节点归属。
15.可选地,在所述确定槽位迁移计划之后,还包括;手动调整槽位迁移计划。
16.可选地,所述方法还包括:将迁移的重要事件节点发送通知,所述重要事件包括:开始迁移、迁移成功、迁移时间、迁移速度。
17.本发明的技术方案还提供一种redis集群的扩容装置,包括:计算模块,被配置为将新增节点加入集群,平均地分配槽位到所有节点,确定槽位迁移计划;配置模块,被配置为获取需要迁移的槽位的配置;迁移模块,被配置为执行槽位迁移计划,将需要迁移的槽位从源节点迁移到目标节点;处理模块,被配置为判断迁移过程是否有异常,如果有异常,则判断是否是已知异常,如果是已知异常,则进行兼容处理,如果不是已知异常,则发送告警信息。
18.可选地,所述装置还包括:锁模块,被配置为在迁移完成后设置归属节点,采取锁的方式,同一时刻不允许并发地设置节点归属。
19.可选地,所述装置还包括:通知模块:将迁移的重要事件节点发送通知,所述重要事件包括:开始迁移、迁移成功、迁移时间、迁移速度。
20.可选地,所述迁移模块还被配置为:在一个线程中,以单个槽位为维度,在迁移完一个槽位后,根据上一个槽位迁移情况判断是否迁移下一个槽位。
21.本发明的技术方案还提供了技术方案还提供了一种终端,包括:处理器、存储器以及存储在存储器上运行的计算机程序,其特征在于,所述处理器执行计算机程序时实现上述任一技术方案方法的步骤。
22.本发明的技术方案还提供了一种计算机可读存储介质,所述计算机程序被处理器执行时实现上述任一技术方案方法的步骤。
23.本发明具有以下三方面有益效果:
24.第一,采取算法,可自动化计算槽位节点归属,平均地分配槽位给所有节点。
25.第二,采取多线程多并发的方式,可以提升迁移速度,并发量可以通过线程数量控制,也可以变动批量迁移key的数量,从而动态的控制速度。
26.第三,在一个线程中以单个槽位为维度,每次迁移槽位前进行条件判断,重新拉取配置,迁移过程中可以暂停迁移,恢复迁移,调节迁移速度。
附图说明
27.为了更好地理解各种示例性实施例,可以参考附图,在附图中:
28.图1示出了实施例提供的一种redis集群的扩容方法的流程示意图;
29.图2示出了实施例提供的一种redis集群的扩容方法的流程示意图;并且
30.图3示出了实施例提供的一种redis集群的扩容装置的结构示意图。
31.为了便于理解,相同的附图标记已用于指代具有基本上相同或类似结构和/或基本上相同或类似功能的元件。
具体实施方式
32.描述和图式示出了本发明的原理。因此,将了解,本领域的技术人员将能够设计各种布置,尽管本文中未明确地描述或示出所述布置,但所述布置体现本发明的原理且包括
在本发明的范围内。此外,本文中所引述的所有例子主要旨在明确地用于教学目的,以帮助读者理解本发明的原理和由发明人提供的用以深化本领域的概念,并且所有例子应视为并不限于此类特定引述的例子和条件。另外,如本文中所使用,除非另有指示(例如,“或另外”或“或在替代方案中”),否则术语“或”是指非排他性的或(即,和/或)。并且,本文中所描述的各种实施例不一定相互排斥,因为一些实施例可以与一个或多个其它实施例组合以形成新的实施例。
33.图1示出了实施例提供的一种redis集群的扩容方法,包括以下步骤:
34.步骤s101,将新增节点加入集群,平均地分配槽位到所有节点,确定槽位迁移计划。
35.例如,redis集群中可以内置16384个哈希槽位(slot),在接到redis集群扩容指令时,根据算法,计算迁移计划,这个计算有两个原则:一是源节点和目标节点尽可能平均化占用槽位,二是尽可能少从源节点迁移槽位。
36.可选的,可以按照以下算法计算:总的槽位数除以节点数,得到每个节点的平均槽位数,若有余数,则将余数随机分配到各个节点,最终得到每个节点的槽位数。如当需要在redis集群中放置一个key-value时,redis先对key使用crc16算法算出一个结果,然后把结果对16384求余数,这样每个key都会对应一个编号在0-16383之间的哈希槽,redis会根据节点数量大致均等的将哈希槽映射到不同的节点。举个例子,原先所有的16384个哈希槽全部对应1个节点(节点1),后来redis集群接收扩容命令,增加2个节点(节点2和节点3),那总共就是3个节点,总的槽位数除以节点数就是16384/3=5461余1,计算得出平均每个节点占5461个槽位,剩余1个槽位随机分配给3个节点,其中有2个节点分到5461个槽位,1台机器分到5462个槽位,例如,节点1(即原来的那个节点)可以对应0-5461号槽位,节点2可以对应5462-10922号槽位,节点3可以对应10923-16383号槽位。
37.可选的,分析源节点,保留要留下的slot,从而可以计算得到每个源节点要迁移出去的slot。接着分析上面的例子,需要进行数据迁移,把5462-10922号槽位从源节点(节点1)迁移到目标节点(节点2),把10923-16383号槽位从源节点(节点1)迁移到另一个目标节点(节点3)。
38.可选的,分析目标节点,从源节点迁移出来的slot去获取要迁移slot,尽量保证slot是连续的、整段的。
39.自动计算完后,就生成对应迁移计划,关键数据,源节点,目标节点。
40.可选地,还包括:手动调整生成的迁移,形成更好的迁移计划,如果目标节点对应的槽位比较零散,可以手动调整,保证槽位尽量是连续、合理的。
41.步骤s102,获取需要迁移的槽位的配置。
42.可选地,所述配置包括slot迁移速度。在进行slot迁移前从缓存中获取slot迁移对应配置。配置包含是否暂停迁移,迁移slot批量迁移key的数目。
43.步骤s103,执行槽位迁移计划,将需要迁移的槽位从源节点迁移到目标节点。
44.可选地,可以采用多线程的方式执行槽位迁移计划。线程的数量可以用来调节迁移速度。多线程进行执行迁移计划,每个计划任务,单个节点只能参与一次,对计划进行判断是否有slot需要迁移。多个客户端服务,可以job方式(分布式节点)启动,每个客户端服务采用线程池执行1个生成的计划。
45.可选地,在一个线程中,以单个槽位为维度,在迁移完一个槽位后,根据上一个槽位迁移情况判断是否迁移下一个槽位。单个slot迁移完成之后,再次判断单个slot迁移是否有异常。可能有两种情况,一种是正常迁移,如果还有迁移的slot,那么继续迁移。另外一种情况是迁移失败。迁移失败分为运行异常迁移失败,暂停服务迁移失败等。对不同的异常失败可以找到对应的程序进行处理。
46.进行单个slot进行迁移,有两种结果,异常结果和成功结果。单个slot进行数据迁移,先设置好slot状态,目标节点迁入,源节点迁出,然后对源节点该slotkey进行批量迁移,遇到大key的时候,暂时跳过,迁移能迁移的key。迁移好key的时候,加锁去设置slot归属。成功结果:成功将数据迁移到目标节点,设置好slot的归属关系。异常情况包括:暂停迁移,大key,迁移过程其他未知情况。
47.步骤s104,判断迁移过程是否有异常,如果有异常,则判断是否是已知异常,如果是已知异常,则进行兼容处理,如果不是已知异常,则发送告警信息。
48.可选地,如果没有异常,成功将数据迁移到目标节点,设置好slot的归属关系。如果有异常,暂停迁移。
49.对于异常结果,触发对于异常补偿程序。暂停情况直接跳过,节点归属情况尝试恢复集群节点归属。第一种情况:slot已经属于节点,这时候通知集群节点说明该slot归属;第二种情况slot不属于源节点,这时候查询源节点记录的节点是否用于该节点,如果属于该节点那么通知整个集群,否则发送告警,运维人进行处理。
50.步骤s105,迁移完成后设置归属节点,采取锁的方式,同一时刻不允许并发地设置节点归属。
51.可选地,还包括:将迁移的重要事件节点发送通知,所述重要事件包括:开始迁移、迁移成功、迁移时间、迁移速度。
52.可选地,还包括:进行校验集群状态。顺利迁移的,进行校验集群状态,发送迁移任务进度。顺利迁移后,检验每个节点slot情况是否一致,每个节点的集群信息是否一致,来保证集群的正确性。
53.参见图2示出了实施例提供的一种redis集群的扩容方法的流程示意图。图2具体显示了槽位迁移的具体流程。这里以一个线程为例。
54.开始
55.201生成槽位迁移,根据算法,平均分配槽位到各个节点。
56.202是否执行下一个槽位迁移;如果为是,则执行203,是否执行下一个槽位迁移可以根据上一个槽位迁移是否成功来判断,如果成功则继续执行下一个槽位迁移。
57.203获取迁移配置参数,包括迁移速度、是否暂停迁移、批量迁移key的情况。
58.205单个槽位迁移,执行完后回到步骤202,循环执行。单个slot进行数据迁移,先设置好slot状态,目标节点迁入,源节点迁出,然后对源节点该slotkey进行批量迁移,遇到大key的时候,暂时跳过,迁移能迁移的key。迁移好key的时候,加锁去设置slot归属。进行单个槽位进行迁移,有两种结果,异常结果和成功结果。成功结果:成功将数据迁移到目标节点,设置好slot的归属关系。异常情况包括:暂停迁移,大key,迁移过程其他未知情况。
59.执行完步骤202后,执行204再次判断单个slot是否有异常,如果是,则执行206,如果否,则执行208。有两种情况,一种是上一个槽位正常迁移,那么继续迁移下一个槽位。另
外一种情况是迁移失败。迁移失败分为运行异常迁移失败,暂停服务迁移失败等。对不同的异常失败可以找到对应的程序进行处理。
60.206触发补偿机制;暂停情况直接跳过,节点归属情况尝试恢复集群节点归属。第一种情况:slot已经属于节点,这时候通知集群节点说明该slot归属;第二种情况slot不属于源节点,这时候查询源节点记录的节点是否用于该节点,如果属于该节点那么通知整个集群,否则发送告警,运维人进行处理。
61.207发送异常告警,通知运维人。
62.208顺利迁移、进行校验、发送通知。
63.结束。
64.参见图3示出了实施例提供的一种redis集群的扩容装置的结构示意图。
65.一种redis集群的扩容装置,包括:计算模块301、配置模块302,迁移模块303、处理模块304、锁模块305。
66.计算模块301,被配置为将新增节点加入集群,平均地分配槽位到所有节点,确定槽位迁移计划。
67.可选的,可以按照以下算法计算:总的槽位数除以节点数,得到每个节点的平均槽位数,若有余数,则将余数随机分配到各个节点,最终得到每个节点的槽位数。如当需要在redis集群中放置一个key-value时,redis先对key使用crc16算法算出一个结果,然后把结果对16384求余数,这样每个key都会对应一个编号在0-16383之间的哈希槽,redis会根据节点数量大致均等的将哈希槽映射到不同的节点
68.可选的,计算模块301分析源节点,保留要留下的slot,从而可以计算得到每个源节点要迁移出去的slot。接着分析上面的例子,需要进行数据迁移,把5462-10922号槽位从源节点(节点1)迁移到目标节点(节点2),把10923-16383号槽位从源节点(节点1)迁移到另一个目标节点(节点3)。
69.可选的,计算模块301分析目标节点,从源节点迁移出来的slot去获取要迁移slot,尽量保证slot是连续的、整段的。
70.计算模块301自动计算完后,就生成对应迁移计划,关键数据,源节点,目标节点。
71.可选地,计算模块301还手动调整生成的迁移,形成更好的迁移计划,如果目标节点对应的槽位比较零散,可以手动调整,保证槽位尽量是连续、合理的。
72.配置模块302,被配置为获取需要迁移的槽位的配置。
73.可选地,所述配置包括slot迁移速度。在进行slot迁移前从缓存中获取slot迁移对应配置。配置包含是否暂停迁移,迁移slot批量迁移key的数目。
74.迁移模块303,被配置为执行槽位迁移计划,将需要迁移的槽位从源节点迁移到目标节点。
75.可选地,可以采用多线程的方式执行槽位迁移计划。线程的数量可以用来调节迁移速度。多线程进行执行迁移计划,每个计划任务,单个节点只能参与一次,对计划进行判断是否有slot需要迁移。多个客户端服务,可以job方式(分布式节点)启动,每个客户端服务采用线程池执行1个生成的计划。
76.可选地,在一个线程中,以单个槽位为维度,在迁移完一个槽位后,根据上一个槽位迁移情况判断是否迁移下一个槽位。单个slot迁移完成之后,再次判断单个slot迁移是
否有异常。可能有两种情况,一种是正常迁移,如果还有迁移的slot,那么继续迁移。另外一种情况是迁移失败。迁移失败分为运行异常迁移失败,暂停服务迁移失败等。对不同的异常失败可以找到对应的程序进行处理。
77.进行单个slot进行迁移,有两种结果,异常结果和成功结果。单个slot进行数据迁移,先设置好slot状态,目标节点迁入,源节点迁出,然后对源节点该slotkey进行批量迁移,遇到大key的时候,暂时跳过,迁移能迁移的key。迁移好key的时候,加锁去设置slot归属。成功结果:成功将数据迁移到目标节点,设置好slot的归属关系。异常情况包括:暂停迁移,大key,迁移过程其他未知情况。
78.处理模块304,被配置为判断迁移过程是否有异常,如果有异常,则判断是否是已知异常,如果是已知异常,则进行兼容处理,如果不是已知异常,则发送告警信息。
79.可选地,如果没有异常,成功将数据迁移到目标节点,设置好slot的归属关系。如果有异常,暂停迁移。
80.对于异常结果,触发对于异常补偿程序。暂停情况直接跳过,节点归属情况尝试恢复集群节点归属。第一种情况:slot已经属于节点,这时候通知集群节点说明该slot归属;第二种情况slot不属于源节点,这时候查询源节点记录的节点是否用于该节点,如果属于该节点那么通知整个集群,否则发送告警,运维人进行处理。
81.可选地,所述装置还包括:锁模块305,被配置为在迁移完成后设置归属节点,采取锁的方式,同一时刻不允许并发地设置节点归属。可选地,还包括:将迁移的重要事件节点发送通知,所述重要事件包括:开始迁移、迁移成功、迁移时间、迁移速度。
82.可选地,所述装置还包括:通知模块:将迁移的重要事件节点发送通知,所述重要事件包括:开始迁移、迁移成功、迁移时间、迁移速度。
83.可选地,还包括:进行校验集群状态。顺利迁移的,进行校验集群状态,发送迁移任务进度。顺利迁移后,检验每个节点slot情况是否一致,每个节点的集群信息是否一致,来保证集群的正确性。
84.实施例还提供了一种终端,包括:处理器、存储器以及存储在存储器上运行的计算机程序,其特征在于,所述处理器执行计算机程序时实现上述任一实施例方法的步骤,例如步骤s101至s105,或者所述处理器执行所述计算机程序时实现上述各实施例中各模块/单元的功能,例如图1所示单元201至205的功能。所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端中的执行过程。
85.所述终端可以是智能手机等移动终端,或者是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端可包括,但不仅限于,处理器、存储器,可以包括更多或更少的部件,或者组合某些部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字消息队列的管理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处
理器等。所述存储器可以是所述终端的内部存储单元,例如终端的硬盘或内存。所述存储器也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器还可以既包括所述终端的内部存储单元也包括外部存储设备。
86.实施例还提供了一种计算机可读存储介质,所述计算机程序被处理器执行时实现上述任一实施例方法的步骤。
87.在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
88.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
89.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
90.在本技术所提供的实施例中,应该理解到,所揭露的装置、终端和方法,可以通过其它的方式实现。例如,以上所描述的装置、终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间
接耦合或通讯连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
91.以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献