一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于工业互联网的IoT设备高可用方法与流程

2021-12-14 22:27:00 来源:中国专利 TAG:

一种基于工业互联网的iot设备高可用方法
技术领域
1.本发明涉及物联网领域,尤其涉及一种基于工业互联网的iot设备高可用方法。


背景技术:

2.随着5g和物联网的快速发展,智能的iot网关设备已经应用到越来越多的行业中。对于智能家居类型的一般民用物联网设备,iot网关对可用性的要求相对不高。因为民用设备的运行环境较好,温度、湿度和电流电压都比较稳定。
3.在大量的工业领域,设备运行的环境比较苛刻,例如高温、高湿、电流电压变化大,同时对于设备的运行状态,工业领域也有明确的要求。不能像民用设备一样,设备停止服务时间有严格要求。没有高可用的设备,服务会中断、业务数据就会造成丢失,乃至对于工业运行造成损失。工业面向风险的设计,工业级的一种基于工业互联网的iot设备高可用方法就显得非常重要,旨在提高iot设备的可用能力,抵御多种风险而造成的服务中断。
4.现有iot物联网智能网关设备厂商们通常只是在设备的运行稳定上下功夫。例如提供宽温、宽压等运行环境的耐久,提升设备的运行稳定度。但是依旧无法解决,设备故障后数据无法采集与回传、业务无法响应、造成数据丢失等问题;只能等待维修,维修时常和维修恢复程度也是无法评估的;即单一设备依旧无法保证工业iot在业务上的稳定性需求。同时随着工业化数字转型的加快,单一的边缘网关往往会出现数据计算与处理的瓶颈,影响整体业务的预测与响应。


技术实现要素:

5.鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种基于工业互联网的iot设备高可用方法。
6.根据本发明的一个方面,提供了一种基于工业互联网的iot设备高可用方法,所述设备高可用方法包括:
7.raft集群包括多个网关,在任何确定的时间段内,每个所述网关都处于三种状态之一,主网关、选举网关和候选网关,且三种状态之间可以相互转换;
8.当整个集群中没有收到主服务心跳信息时,其中一台网关变更状态为候选人;
9.候选人网关会面向其他网关发起升主投票;
10.通过半数投票后,所述候选人网关成功升级为集群中的主网关服务器;
11.边缘网关负责采集新能源设备中的数据,并将所述数据发送至数据队列中,所述边缘网关之间通过心跳监听能力判断集群中的网关是否正常提供采集服务,如果是,正常工作;否则,由其他网关代替故障网关工作。
12.可选的,所述设备高可用方法还包括:
13.新增边缘网关至集群,通过配置网关进行网关注册操作;
14.发起注册请求后,网关会每10秒进行一次,检查三次,如果状态失败,则返回注册失败信息,并等待重新注册;如果状态成功,集群会以当前的采集负载为权重,为新注册的
网关分配数据采集任务,完成分配操作。
15.可选的,所述设备高可用方法还包括:边缘网关故障报警,当所述边缘网关出现问题时,由集群中的其他网关进行检查,发现故障后进行问题记录和发出报警。
16.本发明提供的一种基于工业互联网的iot设备高可用方法,所述设备高可用方法包括:raft集群包括多个网关,在任何确定的时间段内,每个所述网关都处于三种状态之一,主网关、选举网关和候选网关,且三种状态之间可以相互转换;当整个集群中没有收到主服务心跳信息时,其中一台网关变更状态为候选人;候选人网关会面向其他网关发起升主投票;通过半数投票后,所述候选人网关成功升级为集群中的主网关服务器;边缘网关负责采集新能源设备中的数据,并将所述数据发送至数据队列中,所述边缘网关之间通过心跳监听能力判断集群中的网关是否正常提供采集服务,如果是,正常工作;否则,由其他网关代替故障网关工作。能够自由支持新的网关加入或者退出集群,这样即使单点或者多点同时出现问题,能够保证业务处理的稳定性,能够快速提高业务的整体处理和响应能力。
17.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
18.为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
19.图1为本发明实施例提供的基于raft算法的高可用选举流程图;
20.图2为本发明实施例提供的边缘网关故障切换示意图;
21.图3为本发明实施例提供的边缘网关故障切换有限状态示意图;
22.图4为本发明实施例提供的新增边缘网关至集群示意图;
23.图5为本发明实施例提供的新增边缘网关至集群有限状态机图示意图;
24.图6为本发明实施例提供的边缘网关故障报警示意图;
25.图7为本发明实施例提供的边缘网关故障报警有限状态机图示意图。
具体实施方式
26.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
27.本发明的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
28.下面结合附图和实施例,对本发明的技术方案做进一步的详细描述。
29.如图1所示,raft集群包含多个网关,允许系统容忍一个故障。在任何给定时间,每个网关都处于以下三种状态之一,主网关,选举网关或候选网关。这几个状态可以相互转
换。
30.raft使用心跳机制来触发主网关选举。当网关启动时,它们以选举者的身份开始。只要网关从主网关或候选者接收到有效的请求,网关就会保持选举者状态。主网关向所有选举者发送定期心跳以保持其权限。如果一个选举者在称为选举超时的一段时间内没有接到任何通信,该选举者认为没有可行的主网关并开始选举新的主网关。
31.如图2所示,边缘网关故障切换,边缘网关负责采集新能源设备中的数据,并将数据推送至数据队列中。边缘网关之间通过心跳监听能力判断集群中的网关是否正常提供采集服务。当集群中正在运行的某一台数据采集网关硬件出现故障时,就会与新能源设备出现链路通信断开问题,导致数据无法采集。此时集群中会立刻由其他网关代替故障网关工作,从而确保数据采集服务的正常提供。
32.如图3所示,边缘网关故障切换有限状态机图,边缘网关集群中的设备都存在心跳检查机制,集群中的网关每5秒钟进行一次网关存活状态的检测,当集群中某台网关设备出现问题时,集群中的一台网关会进行故障网关的数据采集任务接替。当接替完成后,网关设备会再次进入状态检查模式,保证数据采集任务的正常运行。
33.如图4和图5所示,当有新的边缘网关加入集群时,通过配置网关首先会进行网关注册操作。发起注册请求后,网关会每10秒进行一次,检查三次。如状态失败,则返回注册失败信息,并等待重新注册;如状态成功,集群会以当前的采集负载为权重,为新注册的网关分配数据采集任务,完成分配操作,即开始对新能源设备的数据采集任务。
34.如图6所示,边缘网关故障报警,如图7所示,边缘网关故障报警有限状态机图。边缘网关故障报警,当所述边缘网关出现问题时,由集群中的其他网关进行检查,发现故障后进行问题记录和发出报警。
35.有益效果:技术架构旨在控制风险,保护公司的价值;基于raft算法编码化的边缘网关集群高可用切换方案;故障与切换后的自动化问题通知;集群的算力提升方式。
36.本发明提供的一种基于工业互联网的iot设备高可用方法,采用raft算法构建的分布式多网关集群管理服务,保证业务稳定性的同时,业务数据处理能力也得到提升;只需保证集群对于稳定度的最小网关数,就可以自由支持新的网关加入/退出集群,这样即使单点或多点同时出现问题,也依然可以保证业务处理的稳定性。同时在数据处理性能出现瓶颈的同时,加入新的网关,快速提高业务的整体处理与响应能力。
37.以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献