一种演化博弈网络信息体系资源选择方法及系统

2022-09-07 23:31:09 来源：中国专利 TAG：

1.本发明属于网络资源分配领域，具体涉及一种演化博弈网络信息体系资源选择方法及系统。

背景技术：

2.目前，我国作战资源的选取主要依靠预案，选择想定与当前战场态势相近的预案，再根据预案选取节点资源完成任务。随着人工智能技术的发展，ai技术越来越多的应用于战场，依靠预案的方式进行资源集成有明显不足。一方面随着智能、无人设备的大量使用，其能力通过自学习发生变化与预案设计基础不符；另一方面当前作战是一种快速决策、动态干扰的作战样式，预案难以覆盖复杂的未来战场态势，使得资源集成不精确、动态调整资源组合效率低。因此在高动态环境未来战场，如何根据战场态势精确给出资源集成方案是网络信息体系建设中亟待解决的难题。

技术实现要素：

3.本发明的目的在于提供一种演化博弈网络信息体系资源选择方法及系统，在网络信息体系中部分物理节点损毁后，精确给出资源集成方案以恢复体系核心能力，提升网络信息体系的抗毁性。
4.为达到上述目的，本发明所采用的技术方案是：
5.本发明第一方面提供了一种演化博弈网络信息体系资源选择方法，包括：
6.获取军事对抗网络中的决策空间，构建决策空间中各资源节点执行任务过程中的任务完成度函数；
7.将各资源节点的任务完成度函数进行叠加获得任务目标函数，对任务目标函数添加能耗约束建立军事对抗博弈决策模型；
8.随机选择策略形成决策组合，计算各资源节点执行决策组合的收益值；根据个体收益值对军事对抗博弈决策模型进行演化求解并更新决策组合；按照更新后的决策组合对军事对抗网络进行资源选择。
9.优选的，所述决策空间为存活的资源节点集合s；所述资源节点集合s包括感知节点、情报处理节点、决策节点和火力节点。
10.优选的，构建感知节点执行任务过程中的任务完成度函数的方法包括：
11.所述感知节点提供高精度感知范围aoh为：
[0012][0013]
s.t.(x-si.oo
x
)2 (y-si.ooy)2≤si.ro2[0014]
感知节点执行高精度监测任务的完成度，表达公式为：
[0015]
[0016]
所述感知节点提供中精度感知范围aom为：
[0017][0018]
s.t.(x-si.oo
x
)2 (y-si.ooy)2≤si.ro2[0019]
感知节点执行高精度监测任务的完成度，表达公式为：
[0020][0021]
所述感知节点提供高精度感知范围aol为：
[0022][0023]
s.t.(x-si.oo
x
)2 (y-si.ooy)2≤si.ro2[0024]
感知节点执行高精度监测任务的完成度，表达公式为：
[0025][0026]
公式中，si表示为资源节点，s
′
表示为执行任务的资源节点集合，minus(
·
)表示为范围的相减计算；ins(
·
)表示为范围的相交计算；si.cl＝ob表示为资源节点为感知节点；si.do＝h表示为选择高精度感知取值范围；si.do＝m表示为选择中精度感知取值范围；si.do＝l表示为选择低精度感知取值范围；x和y表示输入变量；oo
x
和ooy表示为感知范围的圆心；si.ro表示为感知范围半径。
[0027]
优选的，构建情报处理节点执行任务过程中的任务完成度函数的方法包括：
[0028]
执行任务过程中的情报分析力co为：
[0029][0030]
情报处理节点的任务完成度函数，表达公式为：
[0031][0032]
公式中，si.cl＝or表示为资源节点为情报处理节点；si.po表示为节点分析力常数；coli表示为情报分析能力下限；coui表示为情报分析能力上限。
[0033]
优选的，决策节点执行任务过程中的任务完成度函数的表达式为：
[0034]
执行任务过程中的决策力cd为：
[0035][0036]
决策节点的任务完成度函数，表达公式为：
[0037][0038]
公式中，si.cl＝d表示为资源节点为决策节点；si.pd表示为节点决策力常数；cdli表示为决策能力下限；cdui表示为决策能力上限。
[0039]
优选的，火力节点执行任务过程中的任务完成度函数的表达式为：
[0040]
所述火力节点提供高精度感知范围aah为：
[0041][0042]
s.t.(x-si.oa
x
)2 (y-si.oay)2≤si.ra2[0043]
火力节点执行高精度监测任务的完成度，表达公式为：
[0044][0045]
所述火力节点提供中精度感知范围aam为：
[0046][0047]
s.t.(x-si.oa
x
)2 (y-si.oay)2≤si.ra2[0048]
火力节点执行高精度监测任务的完成度，表达公式为：
[0049][0050]
所述火力节点提供高精度感知范围aal为：
[0051][0052]
s.t.(x-so.oa
x
)2 (y-si.oay)2≤si.ra2[0053]
火力节点执行高精度监测任务的完成度，表达公式为：
[0054][0055]
公式中，si.cl＝a表示为资源节点为感知节点；si.da＝h表示为选择高精度火力取值范围；si.da＝m表示为选择中精度火力取值范围；si.da＝l表示为选择低精度火力取值范围；oa
x
，oay表示为感知范围的圆心坐标；si.ra表示为火力范围半径。
[0056]
优选的，所述任务目标函数的表达公式为：
[0057][0058]
公式中，ωi表示为第i个资源节点执行任务的需求度。
[0059]
优选的，所述能耗约束的表达公式为：
[0060][0061]
公式中，r
′
表示为故障供电线路集合，r
′i表示为故障供电线路；r
′i.rs表示为故障供电线路上节点集合；r
′i.ren表示为能耗上限；sj.en表示为各资源节点总耗能。
[0062]
优选的，各资源节点执行决策组合的收益值的表达公式为：
[0063][0064][0065][0066]
公式中，t
′
表示为决策组合；当资源节点集合s
′
执行决策组合t
′
可行，记为t
′
＝1；否则，记为t
′
＝0。
[0067]
优选的，根据个体收益值对军事对抗博弈决策模型进行演化求解并更新决策组合的方法包括：
[0068]
资源节点作为博弈个体依次执行决策组合后对决策组合进行反置，博弈个体继续执行反置决策组合；
[0069]
对比执行决策组合和执行反置决策组合过程中收益值，根据收益值更新为决策组合；
[0070]
添加概率为p的扰动过程后，重新随机选择策略形成新的决策组合进行演化迭代，当演化迭代次数达到设置阈值时，输出决策组合。
[0071]
优选的，通过蒙特卡洛反事实后悔值最小化算法，优化所述决策组合。
[0072]
本发明第二方面提供了一种演化博弈网络信息体系资源选择的控制系统，包括：
[0073]
获取模块，用于获取军事对抗网络中的决策空间；
[0074]
模型构建模块，用于构建决策空间中各资源节点执行任务过程中的任务完成度函数；将各资源节点的任务完成度函数进行叠加获得任务目标函数，对任务目标函数添加能耗约束建立军事对抗博弈决策模型；
[0075]
演化模块，用于随机选择策略形成决策组合，计算各资源节点执行决策组合的收益值；根据个体收益值对军事对抗博弈决策模型进行演化求解并更新决策组合；
[0076]
执行模块，用于按照更新后的决策组合对军事对抗网络进行资源选择。
[0077]
与现有技术相比，本发明的有益效果：
[0078]
本发明随机选择策略形成决策组合，计算各资源节点执行决策组合的收益值；根据个体收益值对军事对抗博弈决策模型进行演化求解并更新决策组合；按照更新后的决策组合对军事对抗网络进行资源选择；本发明在网络信息体系中部分物理节点损毁后，精确
给出资源集成方案以恢复体系核心能力，提升网络信息体系的抗毁性。
附图说明
[0079]
图1是本发明实施例提供的演化博弈网络信息体系资源选择方法的流程图；
[0080]
图2是本发明实施例提供的本发明与ga算法的迭代次数对比图；
[0081]
图3是本发明实施例提供的有无扰动限制的迭代次数对比图。
具体实施方式
[0082]
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。
[0083]
实施例一
[0084]
如图1所示，本实施例提供了一种演化博弈网络信息体系资源选择方法，包括：
[0085]
获取军事对抗网络中的决策空间，所述决策空间为存活的资源节点集合s；所述资源节点集合s包括感知节点、情报处理节点、决策节点和火力节点；如表1所示；
[0086]
表1 节点资源属性
[0087][0088]
构建决策空间中各资源节点执行任务过程中的任务完成度函数的方法包括：
[0089]
所述感知节点提供高精度感知范围aoh为：
[0090][0091]
s.t.(x-si.oo
x
)2 (y-si.ooy)2≤si.ro2[0092]
感知节点执行高精度监测任务的完成度，表达公式为：
[0093][0094]
所述感知节点提供中精度感知范围aom为：
[0095][0096]
s.t.(x-si.oo
x
)2 (y-si.ooy)2≤si.ro2[0097]
感知节点执行高精度监测任务的完成度，表达公式为：
[0098][0099]
所述感知节点提供高精度感知范围aol为：
[0100][0101]
s.t.(x-si.oo
x
)2 (y-si.ooy)2≤si.ro2[0102]
感知节点执行高精度监测任务的完成度，表达公式为：
[0103][0104]
公式中，si表示为资源节点，s
′
表示为执行任务的资源节点集合，minus(
·
)表示为范围的相减计算；ins(
·
)表示为范围的相交计算；si.cl＝ob表示为资源节点为感知节点；si.do＝h表示为选择高精度感知取值范围；si.do＝m表示为选择中精度感知取值范围；si.do＝l表示为选择低精度感知取值范围；oo
x
和ooy表示为感知范围的圆心；si.ro表示为感知范围半径。
[0105]
其中，范围的相交计算的表达公式为：
[0106]
ins(f1(x，y)，f2(x，y))＝{(x，y)|
[0107]
(x，y)∈f1(x，y)∧(x，y)∈f2(x，y)}
[0108]
范围的相减计算的表达公式为：
[0109][0110]
公式中，f1(
·
)和f2(
·
)表示为任意函数，x和y表示输入变量。
[0111]
构建情报处理节点执行任务过程中的任务完成度函数的方法包括：
[0112]
执行任务过程中的情报分析力co为：
[0113][0114]
情报处理节点的任务完成度函数，表达公式为：
[0115][0116]
公式中，si.cl＝or表示为资源节点为情报处理节点；si.po表示为节点分析力常数；coli表示为情报分析能力下限；coui表示为情报分析能力上限。
[0117]
决策节点执行任务过程中的任务完成度函数的表达式为：
[0118]
执行任务过程中的决策力cd为：
[0119][0120]
决策节点的任务完成度函数，表达公式为：
[0121][0122]
公式中，si.cl＝d表示为资源节点为决策节点；si.pd表示为节点决策力常数；cdli表示为决策能力下限；cdui表示为决策能力上限。
[0123]
火力节点执行任务过程中的任务完成度函数的表达式为：
[0124]
所述火力节点提供高精度感知范围aah为：
[0125][0126]
s.t.(x-so.oa
x
)2 (y-si.oay)2≤si.ra2[0127]
火力节点执行高精度监测任务的完成度，表达公式为：
[0128][0129]
所述火力节点提供中精度感知范围aam为：
[0130][0131]
s.t.(x-si.oa
x
(2 (y-si.oay)2≤si.ra2[0132]
火力节点执行高精度监测任务的完成度，表达公式为：
[0133][0134]
所述火力节点提供高精度感知范围aal为：
[0135][0136]
s.t.(x-si.oa
x
)2 (y-si.oay)2≤si.ra2[0137]
火力节点执行高精度监测任务的完成度，表达公式为：
[0138][0139]
公式中，si.cl＝a表示为资源节点为感知节点；si.da＝h表示为选择高精度火力取值范围；si.da＝m表示为选择中精度火力取值范围；si.da＝l表示为选择低精度火力取值范围；oa
x
，oay表示为感知范围的圆心坐标；si.ra表示为火力范围半径。
[0140]
将各资源节点的任务完成度函数进行叠加获得任务目标函数，所述任务目标函数的表达公式为：
[0141][0142]
公式中，ωi表示为第i个资源节点执行任务的需求度。
[0143]
对任务目标函数添加能耗约束建立军事对抗博弈决策模型；所述能耗约束的表达公式为：
[0144][0145]
公式中，r
′
表示为故障供电线路集合，r
′i表示为故障供电线路；r
′i.rs表示为故障供电线路上节点集合；r
′i.ren表示为能耗上限；；sj.en表示为各资源节点总耗能。
[0146]
军事对抗博弈决策模型的表达公式为：
[0147][0148]
随机选择策略形成决策组合，计算各资源节点执行决策组合的收益值；各资源节点执行决策组合的收益值的表达公式为：
[0149][0150][0151][0152]
公式中，t
′
表示为决策组合；当资源节点集合s
′
执行决策组合t
′
可行，记为t
′
＝1；否则，记为t
′
＝0。
[0153]
根据个体收益值对军事对抗博弈决策模型进行演化求解并更新决策组合的方法包括：
[0154]
资源节点作为博弈个体依次执行决策组合后对决策组合进行反置，博弈个体继续执行反置决策组合；
[0155]
对比执行决策组合和执行反置决策组合过程中收益值，根据收益值更新为决策组合；
[0156]
添加概率为p的扰动过程后，重新随机选择策略形成新的决策组合进行演化迭代，通过蒙特卡洛反事实后悔值最小化算法，优化所述决策组合；当演化迭代次数达到设置阈值时，输出决策组合；按照更新后的决策组合对军事对抗网络进行资源选择。
[0157]
为保证计算效率，算法对每一代演化具有两个演化回合。算法的目的在于搜索得到使目标函数最大的子集，某个局势在2个回合内未达到的纳什均衡所对应策略组合，可以由其他初始策略演化得到。
[0158]
仿真试验
[0159]
本发明选择在netlogo平台上进行仿真实验。构建了80条雷达、情报分析系统、决策系统、导弹四类装备相关信息的数据集，从数据集中筛选出表1中属性值形成节点资源列表。
[0160]
按照需求描述任务，根据线路添加约束条件，构建任务时，使得任务完全完成需要节点数量为25个左右，即设置节点资源有68.75％冗余。
[0161]
实验参数设置为pr＝0.4模拟物理节点损事件，对ega-ro算法设置扰动概率p＝0.04，对ga设置交叉概率pc＝0.75、变异概率pm＝0.01，终止条件设为进化或演化代数到200代。
[0162]
实验结果可以明显看出ega-ro算法所求集成方案任务完成度明显高于ga算法为更可靠地验证资源优选算法效果，在不同损毁概率、扰动概率、交叉概率与变异概率下，进行36组对比试验，得到数据如表2；实验结果可以明显看出ega-ro算法所求集成方案任务完成度明显高于ga算法为更可靠地验证资源优选算法效果
[0163]
表2 不同参数下ega-ro算法与ga算法对比
[0164]
[0165]
[0166][0167]
如图2所示，对于两种算法取得相同效果的10组数据，实验进一步对比最优值对应方案出现的代数；根据本次实验数据分析，本发明提出ega-ro算法有72.2％的比例获得了比基于基本遗传算法(ga算法)的方法效果更好的解，并且在获得相同解时，ega-ro算法出现最优方案平均代数为38，遗传算法出现最优方案平均代数为95.8。分析结果可以表明，在解决本发明所研究问题时，本发明提出的资源优选方法比目前常用的基于遗传算法的优选方法有明显的优势。
[0168]
其次，根据算法添加扰动过程限制这一改进，实验将算法与无扰动过程限制的算法进行对比。实验分别以损毁概率pr＝0.4、pr＝0.5模拟损毁事件，在同一损毁结果、同一初始策略下以同样的扰动概率p＝0.04求解资源集成方案，两种算法分别重复10次实验。
[0169]
如图3所示，当损毁概率为pr＝0.4时，有50％的增加扰动限制资源优选算法gm低于无扰动限制。当损毁概率增加为pr＝0.5时，有70％的增加扰动限制资源优选算法gm低于无扰动限制。当pr＝0.4时，有/无扰动限制gm分别为29.7和46.6，pr＝0.4时分别为23.5和40.1，根据本次实验数据分析可以看出，扰动限制的添加可以使gm平均提前17，即扰动限制的添加有效提高了算法效率。
[0170]
实施例二
[0171]
本实施例提供了一种演化博弈网络信息体系资源选择的控制系统，本实施例提供控制系统可以应用于实施例一所述控制方法，控制系统包括：
[0172]
获取模块，用于获取军事对抗网络中的决策空间；
[0173]
模型构建模块，用于构建决策空间中各资源节点执行任务过程中的任务完成度函数；将各资源节点的任务完成度函数进行叠加获得任务目标函数，对任务目标函数添加能耗约束建立军事对抗博弈决策模型；
[0174]
演化模块，用于随机选择策略形成决策组合，计算各资源节点执行决策组合的收益值；根据个体收益值对军事对抗博弈决策模型进行演化求解并更新决策组合；
[0175]
执行模块，用于按照更新后的决策组合对军事对抗网络进行资源选择。
[0176]
本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0177]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0178]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0179]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0180]
以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种网络优化方法、装置、设备及存储介质与流程

一种演化博弈网络信息体系资源选择方法及系统

相关文献

最热文献