一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

分布式集群管理软件的在线升级方法、装置、设备及介质与流程

2021-12-17 21:54:00 来源:中国专利 TAG:


1.本发明涉及软件升级技术领域,更具体地说,涉及一种分布式集群管理软件的在线升级方法、装置、设备及介质。


背景技术:

2.在互联网时代,分布式存储集群承载着互联网海量的计算和存储工作。集群管理软件肩负着管理整个集群的职责。传统的升级方式中,升级前需要关闭管理软件,并且升级前的检查项过于单一,导致在升级过程中会因为各种在升级前可避免的问题导致整个升级的失败。因此,如何在不影响管理软件功能的前提下,提高升级效率,是本领域技术人员需要解决的问题。


技术实现要素:

3.本发明的目的在于提供一种分布式集群管理软件的在线升级方法、装置、设备及介质,以在不影响管理软件功能的前提下,提高升级效率。
4.为实现上述目的,本发明提供的一种分布式集群管理软件的在线升级方法,包括:
5.在对管理软件升级前,执行检查任务获得检查结果;所述检查任务用于对升级包、集群环境、各节点环境进行检查;
6.判断所述检查结果中是否存在检查不通过的目标检查项;
7.若存在,则对所述目标检查项进行自动修复;若不存在,则对各从节点的管理软件进行升级;
8.对各从节点的管理软件升级结束后,对原备主节点的管理软件进行升级,将升级后的原备主节点作为目标主节点,并将原主节点的管理软件虚拟ip漂移至所述目标主节点;对所述原主节点的管理软件进行升级,将升级后的原主节点作为所述目标主节点的目标备主节点。
9.其中,所述执行检查任务获得检查结果,包括:
10.将所述检查任务添加至任务管理器,以通过所述任务管理器监控所述检查任务的执行进度;
11.执行所述检查任务获得各检查项的检查结果,并将各检查项的检查结果通过界面进行展示。
12.其中,在对各节点环境进行检查时,所述执行检查任务获得检查结果包括:
13.将待检查节点划分至不同的节点组;
14.依次对每个节点组进行检查,在对每个节点组进行检查时,节点组内的各待检查节点通过并发方式进行检查。
15.其中,所述对各从节点的管理软件进行升级,包括:
16.将各从节点的管理软件升级任务添加至在线升级任务管理器,通过所述在线升级任务管理器以并发形式升级各从节点的管理软件。
17.其中,所述对各从节点的管理软件进行升级时,还包括:
18.若检测到从节点的管理软件升级失败,则将升级失败的从节点的管理软件版本,回退至升级前的管理软件版本。
19.其中,对所述原主节点进行升级之前,所述在线升级方法还包括:
20.将所述原主节点的数据库内的数据信息,按照升级后的数据库格式迁移至所述目标主节点的数据库。
21.其中,所述将升级后的原主节点作为所述目标主节点的目标备主节点之后,还包括:
22.对分布式集群内各节点进行检查;
23.若检查结果出现异常,则生成升级异常提示信息;所述检查结果出现异常包括如下情况中的至少一者:各节点升级后的管理软件版本不一致、升级后的管理软件服务异常、数据库异常。
24.为实现上述目的,本发明进一步提供一种分布式集群管理软件的在线升级装置,包括:
25.升级前检查模块,用于在对管理软件升级前,执行检查任务获得检查结果;所述检查任务用于对升级包、集群环境、各节点环境进行检查;
26.判断模块,用于判断所述检查结果中是否存在检查不通过的目标检查项;
27.修复模块,用于在所述检查结果存在检查不通过的目标检查项时,对所述目标检查项进行自动修复;
28.第一升级模块,用于在所述检查结果不存在检查不通过的目标检查项时,对各从节点的管理软件进行升级;
29.第二升级模块,用于对各从节点的管理软件升级结束后,对原备主节点的管理软件进行升级,将升级后的原备主节点作为目标主节点;
30.ip漂移模块,用于将原主节点的管理软件虚拟ip漂移至所述目标主节点;
31.第三升级模块,用于对所述原主节点的管理软件进行升级,将升级后的原主节点作为所述目标主节点的目标备主节点。
32.为实现上述目的,本发明进一步提供一种电子设备,包括:
33.存储器,用于存储计算机程序;
34.处理器,用于执行所述计算机程序时实现上述分布式集群管理软件的在线升级方法的步骤。
35.为实现上述目的,本发明进一步提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述分布式集群管理软件的在线升级方法的步骤。
36.通过以上方案可知,本发明实施例提供的一种分布式集群管理软件的在线升级方法,包括:在对管理软件升级前,执行检查任务获得检查结果;该检查任务用于对升级包、集群环境、各节点环境进行检查;判断检查结果中是否存在检查不通过的目标检查项;若存在,则对目标检查项进行自动修复;若不存在,则对各从节点的管理软件进行升级;对各从节点的管理软件升级结束后,对原备主节点的管理软件进行升级,将升级后的原备主节点作为目标主节点,并将原主节点的管理软件虚拟ip漂移至所述目标主节点;对原主节点的
管理软件进行升级,将升级后的原主节点作为目标主节点的目标备主节点。可见,本方案在对各节点的管理软件升级之前,需要对升级包、集群环境、各节点环境均进行检查,并在检测不通过时自动修复,通过该方式,可避免在升级过程中出现问题导致升级失败,提高升级效率;并且,本方案对主节点的升级方式,可在升级过程中避免关闭管理软件,从而不影响管理软件的正常运行。本发明还公开了一种分布式集群管理软件的在线升级装置、设备及介质,同样能实现上述技术效果。
附图说明
37.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
38.图1为本发明实施例公开的一种分布式集群管理软件的在线升级方法流程示意图;
39.图2为本发明实施例公开的升级前检查流程示意图;
40.图3为本发明实施例公开的一种分布式集群管理软件的在线升级装置结构示意图;
41.图4为本发明实施例公开的一种电子设备结构示意图。
具体实施方式
42.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
43.本发明实施例公开了一种分布式集群管理软件的在线升级方法、装置、设备及介质,以在不影响管理软件功能的前提下,提高升级效率。
44.参见图1,本发明实施例提供的一种分布式集群管理软件的在线升级方法流程示意图,包括:
45.s101、在对管理软件升级前,执行检查任务获得检查结果;检查任务用于对升级包、集群环境、各节点环境进行检查;
46.需要说明的是,本方案为了避免因升级前可避免的问题导致升级失败,在本方案中,在升级之前需要执行检查任务,该检查任务用于对升级包、集群环境、各节点环境进行检查;其中,对升级包进行检查是指对升级包的正确性进行检查,对集群环境进行检查是指对服务状态、服务版本、网络状态等进行检查,对节点环境进行检查是指对节点的硬件版本、软件版本、硬件匹配度等进行检查;如:通过md5(message

digest algorithm 5)信息摘要算法计算升级包的md5值,并与升级包的原md5值进行比对,若相同,则说明升级包是正确的,验证通过,再对下一个检查项进行检查,得到最终的检查结果;最终的检查结果包括各个检查项的检查结果。
47.可以理解的是,在升级之前,用户可通过界面自定义设置检查项及检查项阈值,
如:检查项是剩余内存空间,检查项阈值为80%,则在对剩余内存空间进行检查时,若剩余内存空间小于80%,则检测不通过。这种通过界面设置的方式,可增加检查项设置的灵活性,提升检查内容的丰富度,方便用户设置及查看,提高用户使用体验,提高升级效率。
48.s102、判断检查结果中是否存在检查不通过的目标检查项;若存在,则执行s103;若不存在,则执行s104;
49.s103、对目标检查项进行自动修复,并继续执行s102;
50.具体来说,本方案执行检查任务获得检查结果时,可将检查任务添加至任务管理器,通过任务管理器监控检查任务的执行进度;执行检查任务获得各检查项的检查结果,并将各检查项的检查结果通过界面进行展示。也就是说:本方案将检查任务加入任务管理器后,可通过任务管理器监控检查任务执行进度,其中:监控检查任务执行进度包括如下方面:异常情况处理、断点执行及任务自动拉起等功能;异常情况处理是指针对检查不通过的检查项,会根据修复系统的建议进行自动修复,如:剩余内存空间这一检查项不通过,则可通过清理内存的方式提高剩余内存空间,从而达到自动修复的目的;断点执行及任务自动拉起是指:当集群断电或其他情况导致后台任务中断,在集群恢复后可将未执行完的检查任务自动拉起继续执行。任务管理器还可以将检查进度、检查结果通过界面进行展示,如:将升级包检查结果、集群环境检查结果、各节点检查结果进行输出展示,检查不通过项用红色字体展示,检查不通过的可通过系统或者人工进行修复。
51.在本实施例中,针对超大规模的集群,可采用分组检查方式提高检查效率。具体来说,本方案在对各节点环境进行检查时,可将待检查节点划分至不同的节点组,依次对每个节点组进行检查,在对每个节点组进行检查时,节点组内的各待检查节点通过并发方式进行检查。也即:本方案中的节点检查流程为:组间串联执行,组内并发,通过该方式可在提高检查效率的同时,减少对集群资源的消耗。参见图2,本发明实施例提供的升级前检查流程示意图,通过图2可以看出,本方案在检查时,首先设置检查项及检查项阈值,然后将检查任务加入任务管理器,任务管理器执行升级包检查、集群环境检查、节点环境检查,在执行节点环境检查时,首先需要对节点分组,然后按组分发节点环境检查指令,若所有节点组全部执行完检查任务,则记录检查结果,完整升级前检查。
52.需要说明的是,在本方案中,只有升级前的检查结果中,所有检查项均通过检查,才允许对管理软件进行升级,若存在目标检查项检查不通过的情况,此时就算直接升级,也可能因出现异常情况导致升级失败,因此本方案在检查结果中存在未通过检查的目标检查项时,不允许升级。并且,本方案在升级前检查完成后,用户可对检查报告进行下载,在下载时可选择生成word、html报告,方便信息归档。
53.s104、对各从节点的管理软件进行升级;
54.需要说明的是,本方案对管理软件在线升级的过程,需要将各从节点的管理软件升级任务添加至在线升级任务管理器,通过在线升级任务管理器以并发形式升级各从节点的管理软件。也即:本方案首先需要获取从节点列表,将从节点升级任务加入在线升级任务管理器,该在线升级任务管理器将升级任务发送至各从节点,并接收升级结果。本方案通过在线升级任务管理器升级从节点时,可对各升级任务进行管理和监控。在线升级任务管理器可实时监控集群资源的使用情况,在控制各从节点并发执行升级任务时,可保证在不过度消耗集群资源的情况下,实现最大化并行执行节点升级任务;在线升级任务管理器还可
实现断点执行功能,也即:当集群断电或其他情况导致后台任务中断,在集群恢复后可将未执行完成的升级任务自动拉起继续执行。
55.在线升级任务管理器还可实现版本回退功能,也即:若检测到从节点的管理软件升级失败,则将升级失败的从节点的管理软件版本,回退至升级前的管理软件版本,并将升级失败信息上报。其中,各从节点在对管理软件升级时,若遇到执行异常情况,则可通过异常处理模块进行异常处理,处理成功则继续执行升级,处理失败则退出节点升级,并将异常信息进行上报。如:在升级过程中,出现网络异常导致升级失败,此时可进行自动修复,若修复成功,则继续升级,若升级失败,则将异常信息上报。
56.s105、对各从节点的管理软件升级结束后,对原备主节点的管理软件进行升级,将升级后的原备主节点作为目标主节点,并将原主节点的管理软件虚拟ip漂移至目标主节点;
57.s106、对原主节点的管理软件进行升级,将升级后的原主节点作为目标主节点的目标备主节点。
58.在本实施例中,对各从节点的管理软件升级结束后,还需要对主节点升级,本方案中的主节点包括原主节点和原备主节点,原主节点为虚拟ip节点,即管理软件虚拟ip所在的节点,原备主节点为未挂载虚拟ip的主节点。本方案为了保证管理软件正常运行,可先对原备主节点升级得到目标主节点,将原主节点的管理软件虚拟ip漂移至升级成功的目标主节点,然后再对原主节点升级,并将升级成功的原主节点作为目标主节点的目标备主节点。在此,对该过程进行具体说明,该过程包括备主节点升级及主节点升级两部分,其中,备主节点升级的过程为:将待升级的备主节点从主节点队列中移出,并加入新建的主节点队列,然后执行备主节点升级,所有备主节点的升级为串行升级,直至升级完全部备主节点;主节点升级的过程为:将虚拟ip节点漂移至已完成升级的备主节点上,该备主节点成为新的管理软件虚拟ip所在的节点,然后执行原主节点的升级,原主节点升级完成后加入备节点队列。
59.需要说明的是,本方案对原主节点进行升级之前,还需要将原主节点的数据库内的数据信息,按照升级后的数据库格式迁移至目标主节点的数据库。可见,本方案这种数据库数据迁移方式,可在升级虚拟ip所在节点前,将虚拟ip所在节点上的数据库信息按照升级后的数据库格式迁移至虚拟ip所在的新节点的数据库,升级后的目标主节点可直接访问数据库中的数据。
60.进一步,本方案在升级结束后,还需要对分布式集群内各节点进行检查;若检查结果出现异常,则生成升级异常提示信息;该检查结果出现异常包括如下情况中的至少一者:各节点升级后的管理软件版本不一致、升级后的管理软件服务异常、数据库异常等。然后生成最终的升级报告,该升级报告可以为html升级报告,该报告内记录详细升级过程及检查结果,该报告具有便携性,便于下载归档。
61.综上可见,在本方案中,用户可在升级前通过界面自动以设置检查项及检查项阈值,升级检查内容丰富,提高升级效率;针对超大规模集群,还可采用分组检查模式,在减少集群资源占用的同时提供高并发执行能力。在检查过程中,还具有自动修复功能,针对可预见或已知原因的异常可执行进行修复处理,提交检查效率;本方案还可通过虚拟ip漂移方式,实现管理软件在线升级,在保证页面功能的情况下实现管理软件自升级。在线升级任务
管理器还可实现大规模集群下的升级调度、断点执行、版本回退等功能,在保证不影响原集群业务的情况下能够高效的执行管软升级任务。
62.下面对本发明实施例提供的升级装置、设备及介质进行介绍,下文描述的升级装置、设备及介质与上文描述的升级方法可以相互参照。
63.参见图3,本发明实施例提供的一种分布式集群管理软件的在线升级装置结构示意图,包括:
64.升级前检查模块11,用于在对管理软件升级前,执行检查任务获得检查结果;所述检查任务用于对升级包、集群环境、各节点环境进行检查;
65.判断模块12,用于判断所述检查结果中是否存在检查不通过的目标检查项;
66.修复模块13,用于在所述检查结果存在检查不通过的目标检查项时,对所述目标检查项进行自动修复;
67.第一升级模块14,用于在所述检查结果不存在检查不通过的目标检查项时,对各从节点的管理软件进行升级;
68.第二升级模块15,用于对各从节点的管理软件升级结束后,对原备主节点的管理软件进行升级,将升级后的原备主节点作为目标主节点;
69.ip漂移模块16,用于将原主节点的管理软件虚拟ip漂移至所述目标主节点;
70.第三升级模块17,用于对所述原主节点的管理软件进行升级,将升级后的原主节点作为所述目标主节点的目标备主节点。
71.其中,所述升级前检查模块包括:
72.监控单元,用于将所述检查任务添加至任务管理器,以通过所述任务管理器监控所述检查任务的执行进度;
73.执行单元,用于执行所述检查任务获得各检查项的检查结果;
74.展示单元,用于将各检查项的检查结果通过界面进行展示。
75.其中,所述升级前检查模块包括:
76.划分单元,用于将待检查节点划分至不同的节点组;
77.检查单元,用于依次对每个节点组进行检查,在对每个节点组进行检查时,节点组内的各待检查节点通过并发方式进行检查。
78.其中,所述第一升级模块具体用于:将各从节点的管理软件升级任务添加至在线升级任务管理器,通过所述在线升级任务管理器以并发形式升级各从节点的管理软件。
79.其中,所述第一升级模块还用于:若检测到从节点的管理软件升级失败,则将升级失败的从节点的管理软件版本,回退至升级前的管理软件版本。
80.其中,该装置还包括:
81.数据迁移模块,用于在对所述原主节点进行升级之前,将所述原主节点的数据库内的数据信息,按照升级后的数据库格式迁移至所述目标主节点的数据库。
82.其中,该装置还包括:
83.升级后检查模块,用于将升级后的原主节点作为所述目标主节点的目标备主节点之后,对分布式集群内各节点进行检查;
84.信息生成模块,用于在检查结果出现异常时,生成升级异常提示信息;所述检查结果出现异常包括如下情况中的至少一者:各节点升级后的管理软件版本不一致、升级后的
管理软件服务异常、数据库异常。
85.参见图4,本发明实施例提供的一种电子设备结构示意图,包括:
86.存储器21,用于存储计算机程序;
87.处理器22,用于执行所述计算机程序时实现上述方法实施例所述的分布式集群管理软件的在线升级方法的步骤。
88.在本实施例中,设备可以是pc(personal computer,个人电脑),也可以是智能手机、平板电脑、掌上电脑、便携计算机等终端设备。
89.该设备可以包括存储器21、处理器22和总线23。
90.其中,存储器21至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器21在一些实施例中可以是设备的内部存储单元,例如该设备的硬盘。存储器21在另一些实施例中也可以是设备的外部存储设备,例如设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,存储器21还可以既包括设备的内部存储单元也包括外部存储设备。存储器21不仅可以用于存储安装于设备的应用软件及各类数据,例如执行升级方法的程序代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
91.处理器22在一些实施例中可以是一中央处理器(central processing unit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器21中存储的程序代码或处理数据,例如执行升级方法的程序代码等。
92.该总线23可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
93.进一步地,设备还可以包括网络接口24,网络接口24可选的可以包括有线接口和/或无线接口(如wi

fi接口、蓝牙接口等),通常用于在该设备与其他电子设备之间建立通信连接。
94.可选地,该设备还可以包括用户接口25,用户接口25可以包括显示器(display)、输入单元比如键盘(keyboard),可选的用户接口25还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light

emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在设备中处理的信息以及用于显示可视化的用户界面。
95.图4仅示出了具有组件21

25的设备,本领域技术人员可以理解的是,图4示出的结构并不构成对设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
96.本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法实施例所述的分布式集群管理软件的在线升级方法的步骤。
97.其中,该存储介质可以包括:u盘、移动硬盘、只读存储器(read

only memory,
rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
98.综上可见,在本方案中,提供一种针对大规模分布式集群管理软件在线升级方案,旨在能在不影响管理软件以及集群功能的前提下,能够快速简洁的完成集群管理软件的版本升级;具体来说,本方案在对管理软件升级之前,可对升级包、集群环境、各节点环境进行检查,输出检查结果,并对检查不通过的检查项进行修复,避免在升级过程中因可避免的问题导致升级失败;在对管理软件升级时,可不中断管理软件服务的情况下实现管理软件的升级,在升级后,还可对升级后的集群环境进行检查,判断集群节点是否升级成功,并输出集群异常内容。
99.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
100.对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献