一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

面向多智能体对抗场景的威胁态势评估方法、装置及设备

2022-06-01 00:53:33 来源:中国专利 TAG:


1.本技术涉及威胁态势评估技术领域,特别涉及一种面向多智能体对抗场景的威胁态势评估方法、装置及设备。


背景技术:

2.现代信息化条件下,对于环境中可探测范围日益扩展,信息来源愈益广泛,这使得获取的信息数量大,含义杂,变化快,已经大大超出了人脑的信息综合能力,极易造成指控人员的认知过载现象。因此,基于多源信息融合的多智能体对抗场景理解判断,已经成为对抗环境信息系统的核心技术之一。当前,在对抗场景下态势理解所面临的关键问题在于,没有成熟的模型对场景中的多源信息进行统一量化,导致难以对当前态势做出准确快速的判断。
3.在各种态势之中,威胁态势是最主要的类别之一,其描述的是对抗场景中多智能体对于特定区域的威慑力。威慑力来源于多种方面,例如使用各种途径进行打击、利用自身物理体积进行撞击等。在进行对抗时,智能体之间有可能会产生合作、博弈等行为交互,使得态势会变得相对复杂。
4.现有的对态势的建模主要分为以下几类:
5.(1)基于时间的风险评估量化方法:在城市交互场景中,经常使用诸如thw(time headway,车头时距)、ttc(time to collision,碰撞时间)、ttr(time to reaction,反应时间)等。该类态势评估方法的优势在于便于计算,模型简单,然而其无法应对复杂的多智能体对抗环境,仅仅能够描述两个智能体之间特定的某种行为(例如碰撞),泛化性较差;
6.(2)基于多层分级的对抗场景信息模型:美国学者提出了在对抗场景一级数据(对环境中目标位置和身份等的估计)融合处理的基础上,建立的关于越野行动、事件、时间、位置、装备要素等组织形式的一张多重视图,它将所观测到的越野力量分布与活动和周围环境、对方意图以及机动性等有机地联系起来,识别已发生的事件和计划,得到对对方组织结构、部署、行动方向与路线的估计结果,指出对方的行为模式,推断对方的意图,做出对当前越野情景的合理解释,即对抗场景态势理解,并对临近时刻的态势变化做出预测,即对抗场景态势预测,最终形成越野综合态势图。该类威胁态势评估方法考虑的因素较多,然而无法形成统一量化的评估方法,只能给出一种相对主观的评价,同时依赖评估人员经验,权威性较低;
7.(3)包含部分量化环节的态势建模方法:不少学者都对打击方式、感知能力等智能体属性进行了量化建模,因此在整体的态势评估中某些环节具备量化输出,例如路遥等研究了基于时间序列加权与模糊理论的无人机态势评估方法,根据各个时间段态势信息数据在无人机环境态势评估中重要程度的不同,对时间序列进行加权,通过模糊综合评判得出态势分析结果。该类方法虽然能够体现一定的量化特性,然而依旧无法摆脱整体主观性评价的框架,同时不同模块的量化方法不统一,无法给出归一、有效的整体态势结论。
8.(4)基于机器学习的态势评估方法:近年来,随着机器学习方法的发展,许多学者
也将此应用到了装备效能评定领域中。部分学者利用支持向量机(svm)及其拓展方法进行装备系统效能评定。这些方法虽然能够实现各评价维度权重的自确定,但仍需采用传统的专家经验等方法才能确定真值,因此实用性不大。
9.综上,有必要开发一种能够综合体现智能体之间各种交互行为,能够有效体现智能体各种威慑能力的量化威胁态势评估方法。
10.申请内容
11.本技术提供一种面向多智能体对抗场景的威胁态势评估方法、装置、设备及介质,以解决威胁态势评估的泛化性差、无法形成统一量化的评估方法且无法适应复杂环境导致难以对当前态势做出准确快速的判断等问题。
12.本技术第一方面实施例提供一种面向多智能体对抗场景的威胁态势评估方法,包括以下步骤:
13.获取多智能体的智能体信息和环境信息;
14.基于所述智能体信息和所述环境信息,分解瞄准过程、躲避过程和破坏过程中的对抗行为;以及
15.利用预先训练的威胁能量模型由分解的对抗行为得到在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量,并基于所述威胁能量评估威胁态势。。
16.根据本技术的一个实施例,所述智能体信息包括静态特征、机动性能和协同行为中的至少一项,且所述环境信息包括地图信息、天气信息和实际能见度中的至少一项。
17.根据本技术的一个实施例,所述利用威胁能量模型由分解的对抗行为得到在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量,包括:
18.以命中率、威胁能量强度、环境影响因子与调整系数对所述分解的对抗行为进行量化,分别得到第一至第四量化结果;
19.将所述第一至第四量化结果相乘,得到所述在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量。
20.根据本技术的一个实施例,所述基于所述威胁能量评估威胁态势,包括:
21.对于所述抗场景对应的实际地图进行栅格化,生成多个栅格区域;
22.基于所述在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量计算每个栅格区域的威胁能量,并获取整体智能体对所述抗场景中的威胁态势。
23.根据本技术的一个实施例,面向多智能体对抗场景的威胁态势评估方法,还包括:
24.根据评估的所述威胁态势生成所述对抗场景的直瞄单元威胁能量场态势图、间瞄单元威胁能量场态势图、整体威胁能量场态势图。
25.根据本技术实施例的面向多智能体对抗场景的威胁态势评估方法,获取多智能体的智能体信息和环境信息并分解瞄准过程、躲避过程和破坏过程中的对抗行为;利用预先训练的威胁能量模型由分解的对抗行为得到在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量,并基于威胁能量评估威胁态势。由此,解决了相关技术中威胁态势评估的泛化性差、无法形成统一量化的评估方法且无法适应复杂环境导致难以对当前态势做出准确快速的判断等问题,通过对多智能体对抗行为的本质分析,从量化
的多种因素出发,以高精度确立体融合感知结果作为输入,从而快速精准的获得威胁态势评估方法。
26.本技术第二方面实施例提供一种面向多智能体对抗场景的威胁态势评估装置,包括:
27.获取模块,用于获取多智能体的智能体信息和环境信息;
28.分解模块,用于基于所述智能体信息和所述环境信息,分解瞄准过程、躲避过程和破坏过程中的对抗行为;以及
29.评估模块,用于利用预先训练的威胁能量模型由分解的对抗行为得到在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量,并基于所述威胁能量评估威胁态势。
30.根据本技术的一个实施例,所述智能体信息包括静态特征、机动性能和协同行为中的至少一项,且所述环境信息包括地图信息、天气信息和实际能见度中的至少一项。
31.根据本技术的一个实施例,所述评估模块包括:
32.量化单元,用于以命中率、威胁能量强度、环境影响因子与调整系数对所述分解的对抗行为进行量化,分别得到第一至第四量化结果;
33.计算单元,用于将所述第一至第四量化结果相乘,得到所述在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量。
34.根据本技术的一个实施例,所述基于所述威胁能量评估威胁态势,包括:
35.对于所述抗场景对应的实际地图进行栅格化,生成多个栅格区域;
36.基于所述在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量计算每个栅格区域的威胁能量,并获取整体智能体对所述抗场景中的威胁态势。
37.根据本技术的一个实施例,所述面向多智能体对抗场景的威胁态势评估方法,还包括:
38.根据评估的所述威胁态势生成所述对抗场景的直瞄单元威胁能量场态势图、间瞄单元威胁能量场态势图、整体威胁能量场态势图。
39.根据本技术实施例的面向多智能体对抗场景的威胁态势评估装置,获取多智能体的智能体信息和环境信息并分解瞄准过程、躲避过程和破坏过程中的对抗行为;利用预先训练的威胁能量模型由分解的对抗行为得到在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量,并基于威胁能量评估威胁态势。由此,解决了相关技术中威胁态势评估的泛化性差、无法形成统一量化的评估方法且无法适应复杂环境导致难以对当前态势做出准确快速的判断等问题,通过对多智能体对抗行为的本质分析,从量化的多种因素出发,以高精度确立体融合感知结果作为输入,从而快速精准的获得威胁态势评估方法。
40.本技术第三方面实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的面向多智能体对抗场景的威胁态势评估方法。
41.本技术第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以以实现如上述实施例所述的面向多智能体对抗场景的威胁态势评
估方法。
42.本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
43.本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
44.图1为根据本技术实施例提供的面向多智能体对抗场景的威胁态势评估方法的流程图;
45.图2为根据本技术一个实施例的威胁态势场所考虑的影响因素的示意图;
46.图3为根据本技术一个实施例的威胁行为分解的示意图;
47.图4为根据本技术一个实施例的面向多智能体对抗场景的威胁态势评估方法的流程示意图;
48.图5为根据本技术一个实施例的间瞄单元射程的示意图;
49.图6为根据本技术一个实施例的目标可视面积的示意图;
50.图7为根据本技术一个实施例的威胁能量场模型测试的示意图;
51.图8为根据本技术一个实施例的直瞄单元威胁能量场态势图的示意图;
52.图9为根据本技术一个实施例的间瞄单元威胁能量场态势图的示意图;
53.图10为根据本技术一个实施例的整体威胁能量场态势图的示意图;
54.图11为根据本技术实施例的面向多智能体对抗场景的威胁态势评估装置的示例图;
55.图12为根据本技术实施例提供的电子设备的结构示意图。
具体实施方式
56.下面详细描述本技术的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本技术,而不能理解为对本技术的限制。
57.下面参考附图描述本技术实施例的面向多智能体对抗场景的威胁态势评估方法、装置及设备。
58.在介绍本技术实施例的面向多智能体对抗场景的威胁态势评估方法之前,先简单介绍下相关技术中四类威胁态势评估方法优缺点,其中,相关技术中四类威胁态势评估方法优缺点如表1所示。
59.表1
[0060][0061]
正是基于上述问题,本技术提供了一种面向多智能体对抗场景的威胁态势评估方法,在该方法中,获取多智能体的智能体信息和环境信息并分解瞄准过程、躲避过程和破坏过程中的对抗行为;利用预先训练的威胁能量模型由分解的对抗行为得到在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量,并基于威胁能量评估威胁态势。由此,解决了相关技术中威胁态势评估的泛化性差、无法形成统一量化的评估方法且无法适应复杂环境导致难以对当前态势做出准确快速的判断等问题,通过对多智能体对抗行为的本质分析,从量化的多种因素出发,以高精度确立体融合感知结果作为输入,从而快速精准的获得威胁态势评估方法。
[0062]
具体而言,图1为本技术实施例所的流程示意图。
[0063]
如图1所示,该面向多智能体对抗场景的威胁态势评估方法包括以下步骤:
[0064]
在步骤s101中,获取多智能体的智能体信息和环境信息。
[0065]
进一步地,在一些实施例中,智能体信息包括静态特征、机动性能和协同行为中的至少一项,且环境信息包括地图信息、天气信息和实际能见度中的至少一项。
[0066]
具体地,如图2所示,进行威胁态势场建模之前,首先确定需要量化的因素,尤其是能够对智能体态势产生显著影响的因素,如1)智能体类型:不同类型的单元,其产生威胁的原理不同,因此对威胁态势的影响不同;2)单元最大速度:最大速度直接影响着智能体的机动性能,代表着智能体躲避对方威胁的能力,进而影响对抗态势;3)气象条件:当对抗场景中气象条件不同时,对对抗行为会产生不可忽视的影响,进而影响对抗态势。通过文献调研,本技术实施例列举了多种考虑因素,为态势量化模型提供统一、全面、直观、可解释的信息层输入。
[0067]
在步骤s102中,基于智能体信息和环境信息,分解瞄准过程、躲避过程和破坏过程中的对抗行为。
[0068]
具体地,如图3所示,本技术实施例以高精确度立体融合感知结果作为输入,即认为对抗场景中的单元处于完全可知的状态,同时暂不考虑电磁干扰对智能体瞄准系统的影响,因此可将单元的一次对抗行为完全分解为以下三个过程:瞄准过程、躲避过程、破坏过程。
[0069]
在步骤s103中,利用预先训练的威胁能量模型由分解的对抗行为得到在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量,并基于威胁能量评估威胁态势。
[0070]
进一步地,在一些实施例中,利用威胁能量模型由分解的对抗行为得到在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量,包括:以命中率、威胁能量强度、环境影响因子与调整系数对分解的对抗行为进行量化,分别得到第一至第四量化结果;将第一至第四量化结果相乘,得到在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量。
[0071]
进一步地,在一些实施例中,基于威胁能量评估威胁态势,包括:对于抗场景对应的实际地图进行栅格化,生成多个栅格区域;基于在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量计算每个栅格区域的威胁能量,并获取整体智能体对抗场景中的威胁态势。
[0072]
进一步地,在一些实施例中,面向多智能体对抗场景的威胁态势评估方法,还包括:根据评估的威胁态势生成对抗场景的直瞄单元威胁能量场态势图、间瞄单元威胁能量场态势图、整体威胁能量场态势图。
[0073]
具体地,如图4所示,在将单元的一次对抗行为分别分解为瞄准过程、躲避过程及破坏过程后,对威胁态势量化的重点落在了对命中率p
hit
以及威胁能量att的研究上。其中,p
hit
和att与智能体的威胁行为有关。因此,本技术实施例提出了威胁能量场场能的定义式:
[0074][0075]
其中,p为命中率,是智能体与目标之间距离r等要素的函数;d为命中后的毁伤效果,与单元弹丸所包含威胁能量有关;γ为单元状态调整系数,量化在弹丸充足条件下单元所处状态对威胁能量的影响,同时对威胁能量起到标准化的作用;φ为环境影响因子,综合考虑地形条件、气象条件、道路条件对智能体威胁能量的影响。
[0076]
在对抗环境中,单元的机动性能与威胁能力往往是难以兼顾的,若机动性强,更为灵活的智能体,其威胁能力通常较弱,反之亦然。事实上,现有智能体按照威胁原理,可以分为直瞄单元与间瞄单元两类。直瞄单元灵活性更强,间瞄单元威胁能力更大,二者各有侧重,特点不同。下面根据不同的威胁原理按照直瞄单元与间瞄单元分别进行阐述:
[0077]
(1)直瞄单元;
[0078]
直瞄单元弹丸的飞行轨迹基本为一直线,其特点是弹道平直,威胁范围较小。直瞄单元采用“三点一线”的直瞄方法,因而要求单元至目标之间没有障碍,可以直接看到目标。
[0079]
(2)间瞄单元;
[0080]
间瞄单元的瞄准点与目标不在一条直线上,其弹丸飞行轨迹为弧度很大的抛物线。间瞄单元的瞄准基线和目标不共线,因而属于弹道射击,需要进行弹道解算,根据弹丸的弹道确定需要抬高的角度,使弹丸呈抛物线方式运动,从而命中目标。间瞄单元的特点是弹道弯曲,威胁范围广,同时弹丸可以跨过山丘等地形障碍,适于进行远距离威胁。因此,在四种因素建模时,本技术实施例都将按照直瞄单元与间瞄单元进行分类。
[0081]
进一步地,以下实施例将根据上述分析的四种因素进行数值化威胁态势建模:
[0082]
(1)命中率建模
[0083]
1)直瞄单元;
[0084]
直瞄单元的命中率与单元和目标之间的距离r相关。直瞄单元的最大射程是由可瞄准距离所决定的,在最大射程之外,瞄准难度极大,所谓的“超出射程”,就是命中目标没有任何把握了。假设在距离为0时命中率为100%,则在最大射程之内,命中率自100%开始
逐渐衰减,距离越远,命中率越低;当距离大于等于射程时,命中率为0。即:
[0085][0086]
其中,r为武器与目标之间的距离,r
max
为最大射程,n为距离衰减指数,这里取n=1.5。
[0087]
2)间瞄单元;
[0088]
间瞄单元具有“毁伤半径”与“最大、最小射程”的概念。如图5所示,描述了间瞄单元在不同距离下的命中概率大小,蓝色部分是命中点,灰色圆环是实际碰撞可产生伤害的范围。间瞄单元命中概率的计算需要采用的参数为射击的高低和方向误差。不同单元、使用不同弹丸威胁目标时有不同的射击误差,这些误差需要通过专用数据表查取。当目标处于单元威胁范围之内,且瞄准点在目标中心时,其命中概率可下式计算得出:
[0089][0090]
其中,ey为高低概率偏差;e
x
为方向概率偏差;为简化的拉普拉斯函数;h为目标可见高度;w为目标可见宽度。其中,目标可视面积如图6所示。
[0091]
其中,炮兵射击学中简化拉普拉斯函数的表达式为:
[0092][0093]
其中,d为正态常数,d=0.47693627620447......。
[0094]
简化拉普拉斯函数与误差函数erf(dx)之间的关联,有:
[0095][0096]
其中,式(5)显示了二者之间的关系,因此有关的计算都可以通过误差函数erf(dx)进行。
[0097]
间瞄单元的命中率与目标的可视面积直接相关。当目标距离不同时,现代间瞄单元都可以通过瞄准系统自动调整视野放大倍数,从而使目标的可视面积达到最佳状态。因此,当目标处于间瞄单元威胁范围内时,单元与目标之间的距离r对命中率的影响不大。即间瞄单元命中率计算式如下:
[0098][0099]
其中,r
min
与r
max
分别为单元最小、最大射程,r为单元与目标之间的距离。
[0100]
(2)威胁能量强度建模;
[0101]
1)直瞄单元;
[0102]
直瞄单元主要威胁方式为弹丸撞击产生毁伤。弹丸所产生的威胁力与弹丸的侵彻力与空腔效应有关。现代直瞄单元通过改变弹丸形状、调整弹丸飞行时自旋状态等方法,使得当弹丸命中目标时既具有足够的侵彻力,又能够使弹丸停留在目标内部,从而保证弹丸
所具有的能量完全释放给目标。因此,弹丸的威胁能力可认为是弹丸所具有的动能的函数。另外,虽然弹丸在飞行时受到空气阻力的影响,自身动能会逐渐减小,但弹丸的最大射程是由可瞄准距离所决定。在最大射程之外,难以瞄准,但是弹丸仍然具有很强的威胁能力,因此无需考虑弹丸飞行过程中的动能衰减。在最大射程之内,可以认为弹丸的威胁能量仅与弹丸射出时所具有的动能相关,而与弹丸飞行距离无关。因此,直瞄单元威胁能量强度可由下式计算:
[0103][0104]
其中,e
k_d
为弹丸所具有的出射动能,m为弹丸质量,v为弹丸出射速度。由于智能体自身存在系统误差,因此在射击时,即使瞄准点正对目标,弹丸也有可能发生偏离。弹丸实际落点处在以瞄准点为圆心,以系统偏差长度为半径的圆内。则对系统偏差圆内的任意一点(x,y),威胁能量强度为:
[0105][0106]
其中,r
err
为系统偏差圆半径。
[0107]
2)间瞄单元;
[0108]
间瞄单元产生威胁的方式有碎片威胁与冲击波威胁两种。碎片威胁指弹丸碰撞产生的威力使弹丸碎片及内部钢珠等以超过1000m/s的速度向周围飞出,从而对对方单元产生威胁作用;冲击波威胁则是指碰撞产生强烈的冲击波,对碰撞范围内的单元产生威胁作用。无论是何种方式,威胁能量强度均由间瞄单元弹丸的碰撞范围及碰撞能量所决定。根据可获得的智能体信息,间瞄单元威胁效果可由下式计算:
[0109]ee
=me·
e0;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)
[0110]
其中,me为弹丸所包含炸药质量,e0为单位质量炸药具有的化学能。间瞄单元通过弹丸碰撞对对方目标产生威胁。则在间瞄单元弹丸落点的碰撞范围内的任意一点(x,y),其威胁能量强度为:
[0111][0112]
其中,r
exp
代表间瞄单元弹丸的碰撞范围半径。
[0113]
(3)单元状态调整系数建模;
[0114]
1)直瞄单元;
[0115]
在弹丸储备充足的条件下,直瞄单元可一直保持输出状态,但是单元输出强度却和弹丸射速有关。弹丸射速越快,单元输出强度越大。同时,对于直瞄单元,射击方向的调整也需要一定的时间。因此,必须考虑单元状态对威胁能量的影响。直瞄单元状态调整系数可由下式计算:
[0116]
γd=cd·ad

ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0117]
其中,γd为直瞄单元状态调整系数,cd为单元射速调整系数,ad为单元朝向调整系数。在计算cd时,为使直瞄单元与间瞄单元的威胁能量相匹配,需要规定相同的周期,计算在一个周期内,直瞄单元所能发射的弹丸数量,即:
[0118]cd
=fd·
t;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0119]
其中,fd代表单元射击频率,即单位时间内所内发射的弹丸数量,t代表单元射速
计算周期,ad计算如下:
[0120]ad
=1-α
·
|θ-θ
target
|;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0121]
其中,α为单元朝向调整速度系数,一般取值为0.5。θ为当前单元朝向在坐标系中与x轴的夹角,θ
target
为单元与目标连线在坐标系中与x轴的夹角。由于单元在调整朝向时,速度是一定的,因此,单元朝向调整系数与单元需调整的角度之间为线性关系。
[0122]
2)间瞄单元
[0123]
对于间瞄单元,由于单元朝向的调整同样需要一定的时间,另外间瞄单元是否处于冷却状态对其威胁能量影响重大,因此,同样必须考虑单元所处状态对威胁能量的影响。由下式表示:
[0124]
γ
id
=c
id
·
l
id
·aid

ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0125]
其中,γ
1d
为间瞄单元状态调整系数,c
id
为单元射速调整系数,l
id
为单元冷却状态系数,a
id
为单元朝向调整系数。具体计算如下:
[0126]cid
=f
id
·
t;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0127]
其中,f
id
代表单元射击频率,即单位时间内所内发射的弹丸数量,t代表单元射速计算周期。
[0128][0129]aid
=1-α
·
|θ-θ
target
|;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)
[0130]
其中,间瞄单元朝向调整系数与直瞄单元取值相同。
[0131]
(4)环境因子建模
[0132]
在非结构化道路条件下,智能体的威胁能量还受到自然条件、道路条件、地形条件等多种因素的影响。在本技术实施例中,采用综合评判法对环境的影响进行量化。在综合评判法中,环境因素对直瞄单元和间瞄单元的影响的量化方法相同。环境影响因子由风、雨、雾、雪、路、域(地形条件)等多方面因素构成。设影响权重矩阵为:
[0133]eep
=[w,r,f,s,rd,ev];
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(18)因各种智能体目标要素种类不同,各类环境条件在环境影响矩阵中的权重也不同。权重参数符号采用表2方法表示,典型的权重影响参数如表3所示,在进行环境影响评估时,应根据威胁要素的种类选择环境影响权重。
[0134]
表2
[0135][0136]
其中,w
x
r
x
f
x
s
x
rd
x
ev
x
=1。
[0137]
表3
[0138][0139]
使用综合评判法进行环境影响评估时,根据环境因素的条件状况,将其划分为离散化的评判数据集,构成环境因素评判数据集矩阵:
[0140]eer
=[w1,r2,f3,s4,rd5,ev6];
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(19)
[0141]
矩阵中的元素分别对应风、雨、雾、雪、路、域(地形条件)因素,对应的典型离散化评判数据集如表4所示:
[0142]
表4
[0143][0144]
环境影响因子由权重矩阵与评判数据集矩阵的转置计算获取:
[0145][0146]
例如,对某间瞄智能体,其影响权重矩阵为:
[0147]eep
=[w,r,f,s,rd,ev]=[0.05,0.15,0.15,0.25,0.2,0.2];
ꢀꢀ
(21)
[0148]
若此时对抗场景中气象条件为微风,小雨,薄雾,无雪,单元所处道路为空旷野外的平原道路,则评判数据集矩阵为:
[0149]eer
=[w1,r2,f3,s4,rd5,ev6]=[0.8,0.6,0.8,1,1,1];
ꢀꢀ
(22)
[0150]
则此时威胁能量的环境影响因子为:
[0151][0152]
(5)威胁能量场力计算与样例测试。
[0153]
对对抗场景中的智能体,其产生的威胁能量计算方法如下式所示:
[0154]
直瞄单元:
[0155]
[0156]
间瞄单元:
[0157][0158]
在量化单体智能体威胁能力时,需要将命中率与单元朝向调整等因素排除在外,只考虑单元毁伤效果、环境影响因子、单元射速调整系数即可,可由下式表示:
[0159]
直瞄单元:
[0160][0161]
间瞄单元:
[0162][0163]
在得到了各个智能体对对抗场景环境中某一点的威胁能量后,假设环境中一方共有nd个直瞄单元和n
id
个间瞄单元,则环境中某一点(x,y)的威胁能量att(x,y)计算方式如下式所示:
[0164][0165]
由上述申请内容可知,对方单个目标能够受到毁伤的被威胁范围称为毁伤幅员。因此,在毁伤幅员内受到的总威胁能量即为所得的预期威胁能量场力dam:
[0166][0167]
其中,s
damage
为智能体的毁伤幅员。
[0168]
完成威胁能量场的建模之后,下面通过样例测试模型的效果。测试样例场景如图7所示,样例图为一块100m
×
50m的区域。其中,蓝色(左侧i、c、d)为我方智能体,红方(右侧i、c、d)为对方智能体。“d/d”代表直瞄单元,“i/i”代表间瞄单元,“c/c”代表指控单元,各单元坐标位置如表5所示:
[0169]
表5
[0170][0171]
其中,直瞄单元(d1、d2、d1、d2)样例参数如表6所示:
[0172]
表6
[0173][0174][0175]
间瞄单元(i1、i2、i1、i2)样例参数如表7所示:
[0176]
表7
[0177][0178]
指控单元(c1、c1)样例参数如表8所示:
[0179]
表8
[0180][0181][0182]
将以上参数输入威胁能量场计算模型中,从而分别得到如图8所示的直瞄单元威胁能量场态势图,如图9所示的间瞄单元威胁能量场态势图以及如图10所示的整体威胁能量场态势图。
[0183]
综上,本技术提出的一种面向多智能体对抗场景的威胁态势评估方法,考虑到了四类智能体在对抗场景下的特点作为变量输入:静态特征、机动性能、协同行为以及环境因素,从瞄准、躲避以及破坏过程分解对抗行为。其中,具体的威胁能量建模过程分为三个步骤,首先依照命中率、威胁能量强度、环境影响因子以及单元状态调整系数四个模块进行可解释的量化建模,得到四个数值;随后将四个量化结果相乘,得到在某一时刻下对抗场景中所有一方的参与对抗的智能体对于某一个区域的威胁能量;最后对于地图进行栅格化,并对每一个栅格区域均计算威胁能量,最终得到整体智能体对抗场景中的威胁态势评估。由此,通过对多智能体对抗行为的本质分析,从分析威胁本质来源入手,基于智能体分类与单类的物理特性得到可解释性的模型。通过样例验证,本方法能够获得整体对抗场景的同阵营威胁能量态势评估,为后续智能体的协同智能决策提供支撑。
[0184]
根据本技术实施例的面向多智能体对抗场景的威胁态势评估方法,获取多智能体的智能体信息和环境信息并分解瞄准过程、躲避过程和破坏过程中的对抗行为;利用预先训练的威胁能量模型由分解的对抗行为得到在任一时刻下对抗场景中所有一方的参与对抗的智能体对于任一区域的威胁能量,并基于威胁能量评估威胁态势。由此,解决了相关技术中威胁态势评估的泛化性差、无法形成统一量化的评估方法且无法适应复杂环境导致难以对当前态势做出准确快速的判断等问题,通过对多智能体对抗行为的本质分析,从量化的多种因素出发,以高精度确立体融合感知结果作为输入,从而快速精准的获得威胁态势评估方法。
[0185]
其次参照附图描述根据本技术实施例提出的面向多智能体对抗场景的威胁态势评估装置。
[0186]
图11是本技术实施例的面向多智能体对抗场景的威胁态势评估装置的方框示意图。
[0187]
如图11所示,该面向多智能体对抗场景的威胁态势评估装置10包括:获取模块100、分解模块200、评估模块300。
volatile memory),例如至少一个磁盘存储器。
[0208]
如果存储器1201、处理器1202和通信接口1203独立实现,则通信接口1203、存储器1201和处理器1202可以通过总线相互连接并完成相互间的通信。总线可以是工业标准体系结构(industry standard architecture,简称为isa)总线、外部设备互连(peripheral component,简称为pci)总线或扩展工业标准体系结构(extended industry standard architecture,简称为eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图12中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0209]
可选的,在具体实现上,如果存储器1201、处理器1202及通信接口1203,集成在一块芯片上实现,则存储器1201、处理器1202及通信接口1203可以通过内部接口完成相互间的通信。
[0210]
处理器1202可能是一个中央处理器(central processing unit,简称为cpu),或者是特定集成电路(application specific integrated circuit,简称为asic),或者是被配置成实施本技术实施例的一个或多个集成电路。
[0211]
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的面向多智能体对抗场景的威胁态势评估方法。
[0212]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或n个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0213]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“n个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0214]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更n个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
[0215]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或n个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),
可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在计算机存储器中。
[0216]
应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,n个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0217]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0218]
此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0219]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献