一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于城市火势蔓延预测的集分式多无人机救援系统的制作方法

2022-02-22 03:12:23 来源:中国专利 TAG:


1.本发明涉及传感技术、无人机技术以及路径规划技术领域,具体而言,尤其涉及一种基于城市火势蔓延预测的集分式多无人机救援系统。


背景技术:

2.城市突发事件的多样性以及火势蔓延的不可预测性导致城市救援建模极其复杂,目前缺乏对城市火灾的动态预测建模技术。
3.虽然多无人机协同路径规划相关文献很多,但应用于城市火灾场景中的多无人机引导救援路径规划难以满足实际要求,如没有综合考虑安全路径长度、火场的突发事件、火势蔓延的可预测性、被困人员潜意识中的逃生避险心理机制、航迹平滑度、避碰情况下的可行系统。


技术实现要素:

4.鉴于现有技术的不足,本发明提供一种基于城市火势蔓延预测的集分式多无人机救援系统。本发明主要通过lstm模型预测火势蔓延,同时通过一种改进的q-learning方法对多无人机引导被困人员撤离到安全位置的路径进行优化。
5.本发明采用的技术手段如下:
6.一种基于城市火势蔓延预测的集分式多无人机救援系统,包括:中心层无人机和若干个同构的执行层无人机;
7.所述中心层无人机包括用于采集初始环境信息和被困人员信息的第一传感器模块、对环境信息进行分析处理生成环境模型的第一环境分析模块以及用于与执行层无人机进行通信的第一通信模块;
8.任意所述执行层无人机包括用于采集实时环境信息的第二传感器模块、用于对当前突发环境信息进行分析的第二环境分析模块、用于与中心层无人机以及执行层其余无人机进行通信的第二通信模块、根据环境模型进行路径规划的决策模块、根据规划路径控制执行层无人机行进的控制模块以及用于引导被困人员避险的执行模块,其中所述当前突发环境信息包括新的火势信息和被困人员信息;
9.遇险时,中心层无人机将构建的初始环境模型通过第一通信模块发送至执行层无人机,执行层无人机根据接收初始环境模型信息中的被困人员信息进行搜救,在搜索过程中进行实时信息采集,当采集到当前突发环境信息时,将采取中断的方式将当前突发环境信息通过第二传感器模块反馈回中心层无人机,中心层无人机重新对火势进行预测,并将更新后的环境模型通过第一通信模块再次发送至执行层无人机,形成闭环,最终引导被困人员脱险。
10.进一步地,所述第一环境分析模块基于环境信息建立环境模型,包括:
11.根据初始环境信息构建当前火场态势模型;
12.基于长短期记忆神经网络结合当前火场态势模型构建预测火场态势模型。
13.进一步地,所述无人机将被困人员信息发送给执行层无人机之前,对被困人员信息进行分配,使每一个执行层无人机负责救援一个被困人员。
14.进一步地,任意执行层无人机接收到分配的被困人员信息后,结合环境模型进行搜救路径规划,并通过改进的q-learning方法求解最优搜救被困人员路径。
15.进一步地,任意执行层无人机搜救到被困人员后,结合当前环境模型进行引导路径规划,并通过改进的q-learning方法求解最优引导路径。
16.进一步地,所述执行层无人机根据接收的被困人员信息进行搜救时,根据第二传感器模块采集的当前环境信息更新所述第二传感器模块的探测概率。
17.较现有技术相比,本发明具有以下优点:
18.1、本发明通过无人机引导救援,能够降低了火灾对于消防人员安全危害。无人机可直接采集环境信息,掌握火灾动态。此外无人机部署快速、灵活,能够在第一时间投入到救援行动中。
19.2、本发明执行层采取分布式结构的多同构无人机,可替换性强,提高了系统容错率。无人机传感器模型设计依据不同烟雾浓度的影响采取不同的探测概率方案,能够在不同复杂程度的火灾环境中采取合适的探测概率灵活应对,一定程度上预防了被困人员的遗漏情况。
20.3、本发明采用lstm对火势蔓延进行预测。lstm的隐藏层内部结构比rnn复杂,针对循环神经网络(rnn)存在受激活函数的影响,随着隐藏层层数的增加,反向传递误差越来越小的问题,lstm通过引入胞体状态,将每一步的输入信息保存在存储单元中,改进rnn面临的难以解决的长期依赖问题。lstm在不同领域的应用结果表明,它不仅可以捕捉数据的变化趋势,而且可以表征时间序列数据之间的依赖关系。
21.4、本发明设计救援路径规划多目标函数评价体系,考虑了路径长度、安全性、航迹平滑度、避碰因素,使得搜救过程更安全流畅。此外,本发明设计了一种改进的q-learning方法对路径规划问题进行求解,所得路径符合被困人员潜意识中的逃生心理机制。传统q-learning作为一种在线学习方法,所有q值一般随机初始化或置零,因此需要进行大量的试错训练,这使得q表收敛较慢。本专利利用人工势场法(artificial potential field,apf)初始化q表,省去训练中的探索阶段进而直接进入利用阶段的更新。
附图说明
22.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
23.图1为本发明集分式多无人机救援系统架构图。
24.图2为本发明三维环境模型建模示意图。
25.图3为本发明中采用的lstm结构示意图。
26.图4为本发明系统救援流程图。
具体实施方式
27.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
28.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
29.如图1所示,本发明提供了一种基于城市火势蔓延预测的集分式多无人机救援系统,包括:中心层无人机和若干个同构的执行层无人机。中心层无人机包括用于采集初始环境信息和被困人员信息的第一传感器模块、对环境信息进行分析处理生成环境模型的第一环境分析模块以及用于与执行层无人机进行通信的第一通信模块。任意所述执行层无人机包括用于采集实时环境信息的第二传感器模块、用于对当前突发环境信息进行分析的第二环境分析模块、用于与中心层无人机以及执行层其余无人机进行通信的第二通信模块、根据环境模型进行路径规划的决策模块、根据规划路径控制执行层无人机行进的控制模块以及用于引导被困人员避险的执行模块,其中所述当前突发环境信息包括新的火势信息和被困人员信息。遇险时,中心层无人机将构建的初始环境模型通过第一通信模块发送至执行层无人机,执行层无人机根据接收初始环境模型信息中的被困人员信息进行搜救,在搜索过程中进行实时信息采集,当采集到当前突发环境信息时,将采取中断的方式将当前突发环境信息通过第二传感器模块反馈回中心层无人机,中心层无人机重新对火势进行预测,并将更新后的环境模型通过第一通信模块再次发送至执行层无人机,形成闭环,最终引导被困人员脱险。
30.下面通过具体的应用实例,对本发明的方案和效果做进一步说明。
31.本发明的多无人机系统采取集中-分布式控制结构。中心层无人机负责整体环境信息,并根据执行层反馈建立环境模型信息,将信息发送到下面的各执行层无人机,执行层有nv架同构无人机采取分布式结构,每架无人机包括信息采集模块、环境分析模块、通信模块、决策模块、控制模块、执行模块。
32.中心层无人机u
l
通过信息采集模块在火灾现场上方采集全局环境和被困人员信息,并通过长短期记忆神经网络(long-short term memory,lstm)预测火势蔓延(创新点),然后通过环境分析模块建立环境模型;将初始环境和被困人员信息通过通信模块发送,执行层无人机通过通信模块接收;执行层中的每一架无人机负责救援一名被困人员,执行层无人机都有通信、信息采集、决策、控制与执行模块,具备了通信、信息采集、决策、控制与执行能力;执行层无人机分配到被困人员可能存在的位置;通过信息采集模块搜索被困人员,设计传感器探测概率将根据烟雾浓度而改变(创新点);通过决策模块中改进的q-learning
算法(创新点)配合符合被困人员潜意识中的逃生心理机制的多目标函数奖惩方案(创新点)进行路径优化;然后经过控制模块控制无人机进行动作。系统架构如图1所示。
33.应用本发明系统进行救援的具体过程包括:
34.1)中心层无人机u
l
通过观察以执行层发送的信息建立三维救援环境o模型,将空间分为l
x
×
ly×
lz个单元。并对单元进行编号,每个单元用cella表示,如图2所示,其中:
35.a=x (y-1)
×
l
x
(z-1)
×
l
x
×
ly,x∈{1,2,...,l
x
},y∈{1,2,...,ly},z∈{1,2,...,lz}。
36.2)u
l
建立每个单元的信息集ξa(k)={ba(k),da(k),ta(k)},其中ba(k)∈{0,1}表示由观察现场迹象得来的危险函数,ba(k)=1为危险单元,ba(k)=0为安全单元,具体地,危险区域可以描述为:
[0037][0038]
其中,(x
*
,y
*
)为易爆点;h
*
是可调参数,表示危险区域的高度。da(k)为被困人员数量。ta(k)是单元cella在k时刻的燃料床温度,ta(k)可描述为:
[0039][0040]
其中,cs表示构成燃料床的可燃物在固体阶段的比热容;ρs和ρ
ext
分别为实际可燃物密度和残灰密度;h
μ
代表相对燃料水分;c
l
是水的比热容;te和t
ev
分别代表环境温度和蒸发阈值温度;l
ev
是水的蒸发潜热;是狄拉克符号;为指前因子(也称频率因子,由阿伦尼乌斯定律推导可得);rs为摩尔气体常数;es为活化能;λs为热传导率,当非线性函数f(hf)取值为正时,λs为零;f(hf)为当前单元吸收的总辐射功率密度,取值随相邻单元火焰高度hf变化。考虑风速vm对火焰高度hf的影响,f(hf)是一个非线性函数。当燃料床温度ta(k)等于材料的着火点t
ig
时,认为cella被点燃;燃料床温度ta(k)大于蒸发阈值温度t
ev
时,则cella为危险区,此时ba(k)=1。
[0041]
3)采取lstm对火域蔓延态势进行预测,并更新到三维环境模型中。lstm结构如图3所示,个胞体状态串联在一起组成一个隐藏层,第个胞体的忘记门定义为:
[0042][0043]
其中,σ为sigmoid激活函数,数学形式为
[0044][0045]w(
·
)
为权重;b
(
·
)
是偏置量;是输入量;为第个胞体的输出。决定了上个胞体状态在当前胞体状态留下多少信息,即“忘记”作用。输入门由两部分组成:
[0046][0047][0048]
其中,是候选信息;选择出的一部分;tanh为激活函数,数学形式为
[0049][0050]
忘记门与输入门相加获得新的胞体状态:
[0051][0052]
其中,为点积符号。输出门定义为:
[0053][0054]
其中,
[0055][0056]
由于每个隐藏层具有个胞体,网络的输入为经过批次化处理的风速序列,以hf(k)的预测为例,将输入定义为风速,隐藏层为火焰高度hf(k),网络输入为个输入一次送入。经过隐藏层计算,最终将通过softmax函数进行归一化处理得到网络的输出,即当前预测的火焰高度hf(k)。
[0057]
4)设计了多目标函数r(k)对救援路径规划进行评估。
[0058][0059]
r(k)包括最短逃生路线长度收益j
l
(k)、路径安全性收益js(k)、航迹调整代价ja(k)、碰撞代价jc(k),为权重。
[0060]
建立三维无人机运动模型:
[0061][0062]
其中,[xi,yi,zi]
t
代表无人机vi在全球坐标系下的坐标;为无人机速度,需要满足为无人机vi的偏航角,θi为其俯仰角;η
maxi
和分别对应上述角度的最大角速度且受vi性能的约束。。定义状态变量定为s(k)=(si(k),i=1,2,...,nv
),控制决策变量为
[0063]
6)中心层无人机将初始环境信息发送给执行层无人机,被给执行层各无人机分配救援目标。
[0064]
7)在上述模型的基础上,使用深度学习中的q-learning方法进行路径规划。改进了q-learning中q表的初始化过程,通过apf方法初始化q表。基于人工势场法的思想,将每个单元所处位置的势场作为初始q值。在路径规划任务中,一般认为障碍物周围存在斥力场势函数e
rep
。相反,在目标周围有一个引力场势函数e
att
。e
att
和e
rep
关于是距离的函数,通常写成:
[0065][0066][0067]
其中,cell
goal
,cella,cell
obs
,分别代表安全出口位置,普通单元,以及障碍物单元。k
att
为引力场常量,k
rep
为斥力场常量;σ1与σ2为可调参数,cell
a-cell
goal
和cell
a-cell
obs
为cella到安全出口和障碍物单元的欧氏距离;d0代表障碍物影响半径,因此cella所受总的势力场函数为:
[0068]etotal
(cella)=e
att
(cella)-∑
obserep
(cella)
ꢀꢀ
(公式15)
[0069]
其中,obs为障碍物数量。由此,初始化q表,从第到第行有
[0070][0071]
8)q值表通过q值函数更新公式为:
[0072][0073]
进行不断学习,持续优化无人机路线,求解最优引导逃生路径。式中α为学习率,γ为折扣因子。
[0074]
9)执行层无人机根据路径规划方案搜索被困人员。
[0075]
10)设计火灾环境下受烟雾浓度影响的无人机传感器模型。描述为
[0076][0077]
其中,pd表示探测概率;表示理想状态下的探测概率;ρ
χ
代表传感器检测到的烟雾浓度;表示烟雾对探测概率的影响系数;为常数,表示三个烟雾浓度临界值。
[0078]
11)当搜索到被困人员后再利用q-learning方法进行路径规划,求解引导被困人员到达安全出口的最优路径。
[0079]
12)执行层无人机根据路径规划方案进行引导。
[0080]
13)执行层无人机在执行任务过程中如遇突发事件(包括新的火源或被困人员信息),将信息反馈给中心层无人机。
[0081]
14)中心层更新环境模型及火势蔓延信息,并将更新后的信息发送给执行层无人机,执行层无人机根据过程17)重新进行路径规划。
[0082]
15)所有被困人员安全撤离,任务结束。
[0083]
系统工作流程图如图4所示。
[0084]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0085]
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0086]
在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0087]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0088]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0089]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0090]
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献