一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种计算机集群的管理方法、计算机及计算机集群与流程

2022-03-22 23:10:55 来源:中国专利 TAG:


1.本技术属于计算机技术领域,尤其涉及一种计算机集群的管理方法、计算机及计算机集群。


背景技术:

2.计算机集群由多个计算机组成。计算机集群中不同的计算机可以同时运行处理不同的数据,提高数据处理的速度。
3.由于计算机集群中存在多个计算机,为了保证各个计算机有序运行,需要对计算机集群中的计算机进行统一管理。目前,往往通过一个总控制器对计算机集群中的各个计算机进行管理,例如,使用总控制器确定计算机集群中的主机和从机等。由于需要总控制器管理计算机集群,在安装计算机集群时不仅需要安装各个计算机还需要安装一个总控制器,提高了计算机集群的复杂性和使用成本。


技术实现要素:

4.本技术实施例提供了一种计算机集群的管理方法、计算机及计算机集群,可以解决计算机集群的管理复杂、使用成本较高的问题。
5.第一方面,本技术实施例提供了一种计算机集群的管理方法,包括:
6.在第一计算机接收到第二计算机的上线消息后,若所述第一计算机为第一计算机集群中的主机,所述第一计算机确定第二计算机集群中的主机,其中,所述第二计算机集群为所述第一计算机集群中加入所述第二计算机后形成的集群;
7.若确定所述第二计算机集群的主机为所述第二计算机,所述第一计算机广播第一消息,其中,所述第一消息用于指示所述第二计算机广播第一集群数据,所述第一集群数据包括所述第二计算机集群中主机的信息和所述第二计算机集群中从机的信息;
8.所述第一计算机接收到所述第一集群数据后,将所述第一计算机存储的集群数据更新为所述第一集群数据。
9.第二方面,本技术实施例提供了一种计算机,包括:
10.主机确定模块,用于在第一计算机接收到第二计算机的上线消息后,若所述第一计算机为第一计算机集群中的主机,所述第一计算机确定第二计算机集群中的主机,其中,所述第二计算机集群为所述第一计算机集群中加入所述第二计算机后形成的集群;
11.消息广播模块,用于若确定所述第二计算机集群的主机为所述第二计算机,所述第一计算机广播第一消息,其中,所述第一消息用于指示所述第二计算机广播第一集群数据,所述第一集群数据包括所述第二计算机集群中主机的信息和所述第二计算机集群中从机的信息;
12.第一数据更新模块,用于所述第一计算机接收到所述第一集群数据后,将所述第一计算机存储的集群数据更新为所述第一集群数据。
13.第三方面,本技术实施例提供了一种计算机,包括:存储器、处理器以及存储在所
述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述第一方面中任一项所述的计算机集群的管理方法。
14.第四方面,本技术实施例提供了一种计算机集群,包括上述第三方面所述的计算机。
15.第五方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述第一方面中任一项所述的计算机集群的管理方法。
16.第六方面,本技术实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行上述第一方面中任一项所述的计算机集群的管理方法。
17.本技术第一方面实施例与现有技术相比存在的有益效果是:在第一计算机接收到第二计算机的上线消息后,若第一计算机为第一计算机集群中的主机,第一计算机确定第二计算机集群中的主机;若确定第二计算机集群的主机为第二计算机,第一计算机广播第一消息,以使得第二计算机广播第一集群数据;第一计算机接收到第一集群数据后,将第一计算机存储的集群数据更新为第一集群数据;本技术不用总控制器对计算机集群进行管理,使用计算机集群中的计算机即可完成对计算机集群中的计算机的管理,使对计算机集群的管理更简单,成本更低。
18.可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
19.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
20.图1是本技术一实施例提供的计算机集群的计算机的运行流程示意图;
21.图2是本技术一实施例提供的计算机集群的管理方法的流程示意图;
22.图3是本技术一实施例提供的第一计算机确定从机运行状态的流程示意图;
23.图4是本技术一实施例提供的计算机的结构示意图;
24.图5是本技术另一实施例提供的计算机的结构示意图。
具体实施方式
25.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
26.应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
27.还应当理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关
联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
28.另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
29.在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
30.每个计算机都是一个单独的、自成一体的电子计算机器。每个计算机均可以单独处理一项输入任务,并输出处理结果。但是随着大数据的发展,需要处理的数据的数量越来越大,若仅使用一个计算机完成处理任务,需要花费较长时间。为了适应日渐增长的数据的数量,计算机集群应运而生。计算机集群中可以包括多个计算机,多个计算机可以并行,也就是多个计算机可以同时处理多个数据,以达到快速处理多个任务的目的。在多个计算机均处理完成输出处理结果后,将多个计算机输出的处理结果汇总,得到需要的数据。由于计算机集群中包括多个计算机,需要对多个计算机进行管理。本技术提出一种计算机集群的管理方法,不需要额外增加管理器,使用计算机集群中的计算机即可完成对计算机集群中的各个计算机的管理。
31.本技术提供的一种计算机集群的示意图,参照图1,对该计算机集群中的计算机的运行过程详述如下:
32.计算机集群可以包括一个或多个计算机。本技术中可以将当前时间已经在线或已经上电的计算机记为第一计算机集群。随着当前时间的改变,计算机可能存在故障,因此,第一计算机集群中的计算机也可能发生改变。本技术中计算机故障可以包括计算机下线、计算机下电和计算机运行错误等。
33.若当前时间存在新上线或新上电的计算机,则可以更新第一计算机集群,将新上线的计算机记为第二计算机,将第二计算机加入至第一计算机集群,将更新后的第一计算机集群,也就是加入第二计算机的第一计算机集群记为第二计算机集群。
34.作为举例,若当前时间为3点10分,当前时间存在计算机a、计算机b、计算机c和计算机d。计算机a、计算机b、计算机c为当前时间已经上电的计算机,计算机a、计算机b、计算机c组成第一计算机集群。若当前时间存在计算机e上线,则将计算机e记为第二计算机,第一计算机集群和第二计算机组成第二计算机集群。
35.若当前时间变为4点,在4点时有计算机c和计算机d在线,则第一计算机集群包括计算机c和计算机d,若在4点存在计算机f上线和计算机a上线,则第二计算机集群包括计算机a、计算机c、计算机d和计算机f。
36.在本实施例中,计算机集群中的计算机可以为局域网中的计算机,各个计算机通过传输控制协议(transmission control protocol,tcp)通信。
37.在各个计算机上线后,计算机需要将自身存储的集群数据初始化。集群数据可以以列表的形式存在。集群数据初始化是将列表中其他数据删除,列表中可以仅留自身数据。自身数据可以包括自身的身份标识和性能信息等。性能信息可以包括cpu性能、可用存储空
间、计算机架构等。计算机在进行集群数据初始化后可以创建线程,使计算机广播自身的上线消息,以便于其他在线的计算机接收到自身的上线消息。具体的,计算机在广播自身的上线消息时,可以利用看门狗定时器进行计时,若看门狗定时器超时,也就是计算机发生故障或下线,则再次进行集群数据初始化,并再次广播自身的上线消息。另外,计算机还可以接收外部信息,具体的,计算机可以通过tcp/udp端口接收外部信息。
38.在本实施例中,第二计算机集群中的各个计算机均可以接收外部信息。为了便于描述,本技术中仅以第一计算机集群中的一个计算机为例进行说明,以下将该计算机记为第一计算机,第一计算机集群中的其他计算机也可以实现本技术中所描述的第一计算机可以实现的功能。
39.如图1所示,在一种可能的实现方式中,若在当前时间第一计算机接收到一网络信息,第一计算机判断该网络信息是主机信息还是新计算机的上线消息。
40.若该网络信息为第二计算机广播的第二计算机的上线消息。第一计算机先根据自身存储的集群数据确定第一计算机所在的第一计算机集群中是否已经存在主机。
41.在本实施例中,若第一计算机集群中存在主机,判断第一计算机自身是否为第一计算机集群的主机。若第一计算机自身不是第一计算机集群的主机,则忽略第二计算机的上线消息,也就是对第二计算机的上线消息不做处理,第一计算机继续接收其他外部信息。
42.在本实施例中,若第一计算机自身是第一计算机集群的主机,可以先将第一计算机内当前时间存储的集群数据进行更新,也就是将当前时间存储的集群数据中加入第二计算机的信息,且第二计算机是以从机加入到第一集群数据中的,得到第二集群数据,第二集群数据中包括当前主机的信息和从机的信息。
43.第一计算机在确定自身为第一计算机集群的主机后,第一计算机根据第二计算机的信息和自身的信息,确定第二计算机集群的主机。具体的,可以根据计算机的性能信息或预设的优先级确定计算机集群的主机。例如,可以根据第一计算机的性能信息和第二计算机的性能信息判断第二计算机集群的主机。可选的,可以根据预设方法判断第二计算机集群的主机,例如,将cpu性能高的作为主机。可选的,还可以将计算机的性能信息输入至深度学习模型中,得到第二计算机集群的主机。
44.具体的,第一计算机在确定自身为第一计算机集群的主机后,若第一计算机确定第二计算机集群的主机为第二计算机。第一计算机集群中的各个第一计算机存储的集群数据中的主机需要更新。第一计算机广播第一信息,第一信息包括主机更新信息和第一计算机的上线消息。其中,主机更新信息用于提示第一计算机集群中其他计算机需要更新主机的信息,第一计算机集群中其他计算机为第一计算机集群中除第一计算机之外的计算机。若第一计算机确定第二计算机集群的主机为第二计算机,第一计算机退出主机模式,第一计算机将存储的集群数据进行初始化,第一计算机广播自身的上线消息。
45.第一计算机集群中的从机接收到第一计算机广播的主机更新信息后,第一计算机集群中的从机对自身存储的集群数据进行初始化处理,第一计算机集群中的从机广播自身的上线消息。此时,第二计算机集群中的各个计算机中不存在主机,第二计算机集群中的各个计算机获取其他计算机的上线消息,第二计算机集群中的各个计算机确定第二计算机集群的主机。经过确定,第二计算机集群中的各个计算机确定出的第二计算机集群的主机均为第二计算机,第二计算机也会根据接收到的上线消息确定第二计算机集群的主机。第二
计算机在确定自身为第二计算机集群的主机后,第二计算机进入主机模式,第二计算机将存储的集群数据进行更新得到第一集群数据,并广播第一集群数据。第一集群数据包括第二计算机集群中的主机的信息和第二计算机集群中的从机的信息。第二计算机集群中的从机本技术可以记为第四计算机,第四计算机为第二计算机集群中除第二计算机之外的计算机。第四计算机在接收到第一集群数据后,将第四计算机自身存储的集群数据更新为第一集群数据,并进入从机模式。
46.另外,第二计算机在进入主机模式后,还可以创建集群看门狗线程,以预设间隔时间发出第二请求,第二请求用于确定第四计算机是否为下线状态,第二请求可以包括握手信息。第四计算机在接收到第二请求后,若第四计算机为在线状态,第四计算机向第二计算机返回第二数据。若第二计算机在发送第二请求后的第三预设时间段内未接收到第四计算机返回的第二数据,第二计算机确定该第四计算机为下线状态。第二计算机基于下线状态的第三计算机的信息更新存储的集群数据,得到第六集群数据,第六集群数据中不包括下线状态的第四计算机的信息。第二计算机广播第六集群数据,以便于在线状态的第四计算机在获取到第六集群数据后,更新自身存储的集群数据。
47.在本实施例中,第一计算机在确定自身为第一计算机集群的主机后,若第一计算机确定第二计算机集群的主机为第一计算机,第一计算机基于所述第二计算机的信息更新所述第一计算机的集群数据为第二集群数据,广播所述第二集群数据。第四计算机获取到第二集群数据后,第四计算机将存储的集群数据更新为第二集群数据,以保证第二计算机集群中的各个计算机中的集群数据相同,便于计算机集群中的主机对从机进行管理。第二集群数据包括所述第二计算机集群中主机的信息和所述第二计算机集群中从机的信息,所述第二计算机集群中的从机为所述第二计算机集群中除主机之外的计算机。
48.在本实施例中,若第一计算机为第二计算机集群的主机,第一计算机向第四计算机发送第一请求。若在第一计算机发送所述第一请求后的第一预设时间段内未接收到第四计算机返回的第一数据,第一计算机确定该第四计算机发生故障。第一计算机基于发生故障的第四计算机的信息更新第二集群数据,得到第三集群数据,广播第三集群数据。第二计算机集群中的第三计算机在接收到第三集群数据后,将自身存储的集群数据更新为第三集群数据。第三计算机为第二计算机集群中除发生故障的计算机之外的第四计算机。
49.在本实施例中,第一计算机在接收到第二计算机的上限消息后,若确定第一计算机集群中不存在主机,例如,当前时间第一计算机集群中的主机正好故障,或第二计算机集群中仅存在两个计算机。在第一计算机集群中不存在主机时,第一计算机集群中的各个在线的计算机均会广播自身的上限消息,以便于其他在线的计算机可以接收到该上线消息。第一计算机根据自身的信息和第二计算机的信息确定第二计算机集群中的主机。若第一计算机确定自身为第二计算机集群的主机,第一计算机更新自身存储的集群数据,并广播更新后的集群数据。若第一计算机确定第二计算机为第二计算机集群中的主机。第一计算机等待接收第二计算机发送的集群数据。第二计算机在根据接收到的各个计算机的信息确定自身为第二计算机集群的主机后,第二集群更新自身存储的集群数据,并广播更新后的集群数据。第二计算机更新后的集群数据包括第二计算机集群的主机的信息和第二计算机集群的从机的信息。若第二计算机集群中的主机为除第一计算机和第二计算机之外的计算机,则该主机可以广播集群数据。
50.在一种可能的实现方式中,第一计算机若接收到的网络信息为第一计算机集群的主机或第二计算机集群的主机发送的主机信息。若主机信息为主机更新信息,第一计算机将存储的集群数据进行初始化,并广播自身的上限消息。若主机信息为集群数据,第一计算机将自身存储的集群数据更新为接收到的集群数据。
51.以下对本技术实施例的计算机集群的管理方法进行详细说明。
52.图2示出了本技术提供的计算机集群的管理方法的示意性流程图,参照图2,对该方法的详述如下:
53.s101,在第一计算机接收到第二计算机的上线消息后,若所述第一计算机为第一计算机集群中的主机,所述第一计算机确定第二计算机集群中的主机。
54.在本实施例中,第二计算机集群为第一计算机集群中加入第二计算机后形成的集群。当前时间已经在线的计算机组成第一计算机集群。
55.在本实施例中,第二计算机上线后,先将自身存储的集群数据进行初始化,将自身的信息存储在集群数据中。第二计算机在上线后,还可以广播自身的上线消息,以便于第一计算机集群中的计算机可以接收到第二计算机的上线消息。
56.在本实施例中,第一计算机为第一计算机集群中的任一计算机,为了便于说明,本技术中以第一计算机集群中一个计算机为例进行说明,并将该计算机记为第一计算机。
57.在本实施例中,第一计算机在接收到第二计算机广播的上线消息后,第一计算机需要根据自身存储的集群数据确定第一计算机集群中是否存在主机。若第一计算机确定第一计算机集群中存在主机,还需要确定第一计算机是否为第一计算机集群的主机。若第一计算机确定自身为第一计算机集群的主机,第一计算机可以继续根据自身的信息和第二计算机的信息,确定第二计算机集群的主机。具体的,可以根据各个计算机的性能信息确定第二计算机集群的主机。
58.s102,若确定第二计算机集群的主机为第二计算机,第一计算机广播第一消息。
59.在本实施例中,第一消息用于指示所述第二计算机广播第一集群数据,所述第一集群数据包括所述第二计算机集群中主机的信息和所述第二计算机集群中从机的信息。
60.具体的,步骤s102的实现过程可以包括:
61.s1021,所述第一计算机广播主机更新信息,其中,所述主机更新信息用于指示所述第一计算机集群中的其他计算机广播所述其他计算机的上线消息,所述第一计算机集群中的其他计算机为所述第一计算机集群中除所述第一计算机之外的计算机,所述第一消息包括所述主机更新信息。
62.具体的,若第一计算机确定第二计算机集群的主机为第二计算机,由于第一计算机集群中各个计算机当前时间存储的集群数据中均设置的是第一计算机为主机,第一计算机需要通知第一计算机集群中的其他计算机主机需要更新了,第一计算机集群中除第一计算机之外的计算机为第一计算机集群的从机,以便于第一计算机集群中的从机在接收到主机更新信息后,广播自身的上线消息。
63.在本实施例中,各个计算机广播的上线消息中可以包括计算机的信息,例如,计算机的识别信息、计算机的标识信息、计算机的性能信息等。
64.s1022,所述第一计算机广播所述第一计算机的上线消息。
65.在本实施例中,上线消息用于指示所述第二计算机基于接收到的上线消息确定所
述第二计算机集群的主机,并在第二计算机确定所述第二计算机集群的主机为所述第二计算机时,基于接收到的上线消息生成所述第一集群数据,广播所述第一集群数据,所述第一消息包括所述第一计算机的上线消息。
66.具体的,第二计算机可以接收第一计算机集群中各个计算机广播的上线消息。第二计算机根据接收到的各个上线消息确定第二计算机集群的主机。第二计算机在确定自身为第二计算机集群的主机后,基于第一计算机集群中各个计算机的信息和自身的信息生成第一集群数据,并广播第一集群数据,以便于第一计算机集群中的各个计算机将自身存储的集群数据更新为第一集群数据。
67.s103,第一计算机接收到第一集群数据后,将第一计算机存储的集群数据更新为所述第一集群数据。
68.在本实施例中,第一计算机可以将第一集群数据保存在自身数据库中,在需要查找集群数据时,只需要从第一计算机的数据库中查找即可。
69.本技术实施例中,在第一计算机接收到第二计算机的上线消息后,若第一计算机为第一计算机集群中的主机,第一计算机确定第二计算机集群中的主机;若确定第二计算机集群的主机为第二计算机,第一计算机广播第一消息;第一计算机接收到第一集群数据,将第一计算机存储的集群数据更新为第一集群数据;本技术不用总控制器对计算机集群进行管理,使用计算机集群中的计算机即可完成对计算机集群中的计算机的管理,使对计算机集群的管理更简单,成本更低。另外,将计算机集群中各个计算机中的集群数据均设置为相同的集群数据可以保证各个计算机的集群数据相同,可以便于计算机集群中的计算机的运行和管理。
70.在一种可能的实现方式中,在所述第一计算机确定第二计算机集群中的主机之后,上述方法还可以包括:
71.若确定所述第二计算机集群中的主机为所述第一计算机,所述第一计算机基于所述第二计算机的信息更新所述第一计算机的集群数据为第二集群数据,广播所述第二集群数据。
72.在本实施例中,所述第二集群数据包括所述第二计算机集群中主机的信息和所述第二计算机集群中从机的信息,所述第二计算机集群中的从机为所述第二计算机集群中除主机之外的计算机,所述第二集群数据用于指示所述第二计算机集群中的从机更新所述第二计算机集群中的从机存储的集群数据为所述第二集群数据。
73.在本实施例中,若确定第一计算机自身为第二计算机集群的主机,第一计算机需要把第二计算机的信息以从机的形式存储在自身的集群数据中,得到第二集群数据,并通过广播的形式通知给第二计算机集群中的各个从机。
74.如图3所示,在一种可能的实现方式中,在所述第一计算机确定第二计算机集群中的主机之后,上述方法还可以包括:
75.s201,所述第一计算机向所述第二计算机集群中的从机发送第一请求。
76.在本实施例中,第一请求可以包括握手信息或预设字符等。第一计算机向第二计算机集群中的从机发送第一请求,是为了确定第二计算机集群中各个从机运行是否正常,是否在线。
77.s202,若在第一计算机发送所述第一请求后的第一预设时间段内未接收到所述第
二计算机集群中的从机返回的第一数据,所述第一计算机确定所述第二计算机集群中存在发生故障的从机。
78.在本实施例中,从机发生故障可以包括从机下线、下电和运行不正常等。
79.s203,所述第一计算机基于所述第二计算机集群中发生故障的从机的信息,将所述第二集群数据更新为第三集群数据。
80.在本实施例中,第三集群数据用于指示第三计算机更新第三计算机存储的集群数据为所述第三集群数据,所述第三计算机为所述第二计算机集群的从机中除发生故障的从机之外的从机。
81.在本实施例中,若第二计算机集群中的从机中存在发生故障的从机,第一计算机需要在存储的集群数据中将发生故障的从机进行标注或去除发生故障的从机的信息,因此第一计算机需要更新存储的集群数据,得到第三集群数据。
82.本技术实施例中,第一计算机确定发生故障的从机,并及时更新集群数据,可以更好的管理计算机集群中的计算机。
83.在一种可能的实现方式中,上述方法还可以包括:
84.若所述第一计算机未接收到所述第二计算机的上线消息、且所述第一计算机接收到所述第一计算机集群中的主机发送的第四集群数据,所述第一计算机将所述第一计算机存储的集群数据为第四集群数据。
85.在本实施例中,若当前时间没有新上线的计算机,第一计算机不是第一计算机集群的主机。在第一计算机集群中的主机将自身的集群数据更新为第四集群数据后,第一计算机可以接收第一计算机集群中的主机发送的第四集群数据,并将自身存储的集群数据更新为第四集群数据。第一计算机集群中的主机更新自身的集群数据一方面是在确定自身为第一计算机集群的主机后更新自身的集群数据;另一方面是在第一计算机集群中存在故障的从机时,第一计算机集群的主句需要更新自身的集群数据。
86.第四集群数据包括第一计算机集群的主机的信息和第一计算机集群的从机的信息。
87.在一种可能的实现方式中,在所述第一计算机确定第二计算机集群中的主机之后,上述方法还可以包括:
88.若所述第一计算机集群中存在主机、且所述第一计算机不是所述第一计算机集群的主机,所述第一计算机对所述第二计算机的上线消息不做处理;
89.若所述第一计算机接收到第二信息,所述第一计算机广播所述第一计算机的上线消息,其中,所述第二信息为所述第一计算机集群中的主机在确定所述第一计算机集群中的主机不是所述第二计算机集群中的主机时广播的。
90.在本实施例中,如果第一计算机不是第一计算机集群的主机,且第一计算机集群中的主机不是第二计算机集群的主机,第一计算机可以接收到第一计算机集群的主机发送的第二信息。第一计算机在接收到第二信息后可以广播自身的上线消息,以便于其他计算机接收到自身的上线消息。
91.作为举例,若第一计算机为计算机c,第一计算机集群的主机为计算机d,在有第二计算机e上线后,计算机d确定第二计算机集群的主机不是计算机d,计算机d需要广播第二信息。计算机c在接收到第二信息后,计算机c广播自身的上线消息。
92.在一种可能的实现方式中,在确定所述第二计算机集群的主机为所述第二计算机之后,所述方法还包括:
93.s301,若第一计算机在第二预设时间段内未接收到所述第二计算机发送的第二请求,所述第一计算机确定所述第二计算机发生故障。
94.在本实施例中,若第二计算机集群中的主机为第二计算机、且第二计算机发生故障,第一计算机将不会接收到第二计算机发送的第二请求。第二请求是第二计算机向第二计算机集群中的各个从机发送的,用于确定第二计算机集群中各个从机是否发生故障的请求。第二请求可以包括握手信息。
95.若第一计算机在预设时间间隔或第二预设时间段内未接收到第二计算机发送的第二请求,则可以确定第二计算机可能已经发生故障,第二计算机集群中的各个计算机需要重新确定第二计算机集群的主机。第二预设时间段可以根据需要进行设置,例如,第二预设时间段可以设置为10秒、5秒或3秒等。
96.s302,所述第一计算机确定所述第二计算机发生故障后的所述第二计算机集群的主机。
97.具体的,第一计算机可以根据自身存储的集群数据中各个计算机的信息重新确定第二计算机集群的主机。
98.s303,若所述第一计算机为所述第二计算机发生故障后的所述第二计算机集群的主机,所述第一计算机基于所述第二计算机的信息,将所述第一集群数据更新为第五集群数据,广播所述第五集群数据。
99.在本实施例中,可以将第二计算机发生故障后的第二计算机集群记为第三计算机集群。第五集群数据中包括第三计算机集群的主机的信息和从机的信息。第三计算机集群的从机包括第二计算机集群中除第五计算机集群的主机和发生故障的计算机之外的计算机。
100.在本实施例中,若第一计算机确定第二计算机发生故障后的所述第二计算机集群的主机不是自身,则需要继续接收第二计算机发生故障后的第二计算机集群的主机发送的集群数据,第一计算机将自身存储的集群数据更新为接收到的第二计算机集群中的主机发送的集群数据。
101.作为举例,若第二计算机集群中的主机为计算机d,计算机d若运行正常会定时广播第二请求。第一计算机f若接收不到第二请求,则确定计算机d发生故障。第一计算机f根据接收到的第二计算机集群中各个计算机广播的上线消息重新确定第二计算机集群的主机。第一计算机f若确定第二计算机集群的主机为计算机g。计算机g会广播第五集群数据。第一计算机f接收到第五集群数据后,将自身的集群数据更新为第五集群数据。
102.在一种可能的实现方式中,上述方法还可以包括:
103.在第一计算机接收到第二计算机的上线消息后,若第一计算机集群中不存在主机,第一计算机确定第二计算机集群的主机。若第一计算机确定自身为第二计算机集群的主机,第一计算机将自身存储的集群数据更新为第七集群数据,广播第七集群数据。
104.在本实施例中,第二计算机集群中的从机在接收到第七集群数据后,将自身存储的集群数据更新为第七集群数据。
105.在第一计算机接收到第二计算机的上线消息后,若第一计算机集群中不存在主
机,第一计算机确定第二计算机集群的主机。若第一计算机确定自身不为第二计算机集群的主机。第一计算机将继续接收外部信息。第一计算机在接收到第二计算机集群的主机发送的第八集群数据后,将自身存储的集群数据更新为第八集群数据。
106.应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
107.对应于上文实施例所述的计算机集群的管理方法,图4示出了本技术实施例提供的计算机的结构框图,为了便于说明,仅示出了与本技术实施例相关的部分。
108.参照图4,该计算机400可以包括:主机确定模块410、消息广播模块420和第一数据更新模块430。
109.其中,主机确定模块410,用于在第一计算机接收到第二计算机的上线消息后,若所述第一计算机为第一计算机集群中的主机,所述第一计算机确定第二计算机集群中的主机,其中,所述第二计算机集群为所述第一计算机集群中加入所述第二计算机后形成的集群;
110.消息广播模块420,用于若确定所述第二计算机集群的主机为所述第二计算机,所述第一计算机广播第一消息,其中,所述第一消息用于指示所述第二计算机广播第一集群数据,所述第一集群数据包括所述第二计算机集群中主机的信息和所述第二计算机集群中从机的信息;
111.第一数据更新模块430,用于所述第一计算机接收到所述第一集群数据后,将所述第一计算机存储的集群数据更新为所述第一集群数据。
112.一种可能的实现方式中,消息广播模块420具体可以用于:
113.所述第一计算机广播主机更新信息,其中,所述主机更新信息用于指示所述第一计算机集群中的其他计算机广播所述其他计算机的上线消息,所述第一计算机集群中的其他计算机为所述第一计算机集群中除所述第一计算机之外的计算机,所述第一消息包括所述主机更新信息;
114.所述第一计算机广播所述第一计算机的上线消息,其中,所述上线消息用于指示所述第二计算机基于接收到的上线消息确定所述第二计算机集群的主机,并在所述第二计算机确定所述第二计算机集群的主机为所述第二计算机时,基于接收到的所述上线消息生成所述第一集群数据,广播所述第一集群数据,所述第一消息包括所述第一计算机的上线消息。
115.在一种可能的实现方式中,与主机确定模块410相连的还包括:
116.第二数据更新模块,用于若确定所述第二计算机集群中的主机为所述第一计算机,所述第一计算机基于所述第二计算机的信息更新所述第一计算机的集群数据为第二集群数据,广播所述第二集群数据,其中,所述第二集群数据包括所述第二计算机集群中主机的信息和所述第二计算机集群中从机的信息,所述第二计算机集群中的从机为所述第二计算机集群中除主机之外的计算机,所述第二集群数据用于指示所述第二计算机集群中的从机更新所述第二计算机集群中的从机存储的集群数据为所述第二集群数据。
117.在一种可能的实现方式中,第二数据更新模块具体可以用于:
118.所述第一计算机向所述第二计算机集群中的从机发送第一请求;
119.若在所述第一计算机发送所述第一请求后的第一预设时间段内未接收到所述第二计算机集群中的从机返回的第一数据,所述第一计算机确定所述第二计算机集群的从机发生故障,其中,发生故障的从机为所述第二计算机集群中未返回所述第一数据的计算机;
120.所述第一计算机基于所述第二计算机集群中发生故障的从机的信息,将所述第二集群数据更新为第三集群数据,广播所述第三集群数据,其中,所述第三集群数据用于指示第三计算机更新第三计算机存储的集群数据为所述第三集群数据,所述第三计算机为所述第二计算机集群的从机中除发生故障的从机之外的从机。
121.在一种可能的实现方式中,该计算机400还包括:
122.第三数据更新模块,用于若所述第一计算机未接收到所述第二计算机的上线消息、且所述第一计算机接收到所述第一计算机集群中的主机发送的第四集群数据,所述第一计算机将所述第一计算机存储的集群数据更新为第四集群数据。
123.在一种可能的实现方式中,主机确定模块410具体可以用于:
124.若所述第一计算机集群中存在主机、且所述第一计算机不是所述第一计算机集群的主机,所述第一计算机对所述第二计算机的上线消息不做处理。
125.在一种可能的实现方式中,消息广播模块420具体可以用于:
126.若第一计算机在第二预设时间段内未接收到所述第二计算机发送的第二请求,所述第一计算机确定所述第二计算机发生故障;
127.所述第一计算机确定所述第二计算机发生故障后的所述第二计算机集群的主机;
128.若所述第一计算机为所述第二计算机发生故障后的所述第二计算机集群的主机,所述第一计算机基于所述第二计算机的信息,将所述第一集群数据更新为第五集群数据,广播所述第五集群数据。
129.需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
130.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
131.本技术实施例还提供了一种计算机,参见图5,该计算机500可以包括:至少一个处理器510、存储器520以及存储在所述存储器520中并可在所述至少一个处理器510上运行的计算机程序,所述处理器510执行所述计算机程序时实现上述任意各个方法实施例中的步骤,例如图2所示实施例中的步骤s101至步骤s103。或者,处理器510执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块410至430的功能。
132.示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器520中,并由处理器510执行,以完成本技术。所述一个或多个模块/单
元可以是能够完成特定功能的一系列计算机程序段,该程序段用于描述计算机程序在计算机500中的执行过程。
133.本领域技术人员可以理解,图5仅仅是计算机的示例,并不构成对计算机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如输入输出设备、网络接入设备、总线等。
134.处理器510可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
135.存储器520可以是计算机的内部存储单元,也可以是计算机的外部存储设备,例如插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。所述存储器520用于存储所述计算机程序以及计算机所需的其他程序和数据。所述存储器520还可以用于暂时地存储已经输出或者将要输出的数据。
136.总线可以是工业标准体系结构(industry standard architecture,isa)总线、外部设备互连(peripheral component,pci)总线或扩展工业标准体系结构(extended industry standard architecture,eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本技术附图中的总线并不限定仅有一根总线或一种类型的总线。
137.本技术实施例提供的计算机可以应用于平板电脑、笔记本电脑、上网本、个人数字助理(personal digital assistant,pda)等终端设备上,本技术实施例对终端设备的具体类型不作任何限制。
138.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
139.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
140.在本技术所提供的实施例中,应该理解到,所揭露的终端设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
141.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
142.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
143.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被一个或多个处理器执行时,可实现上述各个方法实施例的步骤。
144.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被一个或多个处理器执行时,可实现上述各个方法实施例的步骤。
145.同样,作为一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述各个方法实施例中的步骤。
146.其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
147.以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献