基于对抗学习的安全自预编码机优化方法

2022-06-01 05:34:51 来源：中国专利 TAG：

1.本发明涉及基于对抗学习的安全自预编码机优化方法，属于无线通信物理层安全技术领域。

背景技术：

2.大规模多输入多输出(multiple-input multiple-output，mimo)系统是下一代移动通信b5g/6g的关键使能技术，它可以提供更加高速的物理层数据传输效率，增加的天线阵列数量可以显著提高信号处理的空间自由度，为基于预编码的物理层安全设计和可靠性增益带来更大的潜力。然而，大规模天线往往需要在天线面板上集成几十～上百根天线单元，尤其是在空间多流传输的场景下，射频链路的数量随着天线数量的增长而增长，进一步增加了发射端的信号处理复杂度和功放等硬件处理开销。于此同时，基于深度学习的端到端收发机设计在近几年引起了学术界和工业界的广泛关注，它利用测量的信道环境数据和先验知识联合训练收发端的网络，不同于以往的通信系统设计采用各功能模块级联的方式实现，各个模块之间独立优化，这种情况下设计的通信系统性能往往不是最优的。而基于深度学习自编码机(autoencoder,ae)的端到端设计，可以对多个级联模块设计统一的目标函数，进行多模块联合优化，实现整体最优。此外，深度学习可以通过将大规模阵列信号处理计算开销卸载到离线训练阶段，通过数据驱动的方式指导模型训练，从而降低在线阶段的信号计算时间，尤其是针对高阶信号调制和更大数量天线系统情况下，具有传统算法不可比拟的优势。
3.目前，深度自编码机开始被用于研究物理层安全通信。部分现有工作对该问题提出了一些解决方案，x.l.zhang采用基于有监督学习的安全预编码设计方法，首先利用迭代优化和注水算法，对预编码方向矢量和功率分配矢量进行了联合优化，求解了针对mimo信道下的信号协方差矩阵次优解。但是基于有监督学习的安全设计方法，尽管相比传统方案降低了计算复杂度，但是所能到达的实际性能上限总是受限于传统方案。因此，c.h.lin研究了一种基于变分自编码器的端到端物理层安全方案，其中指导模型更新的目标函数被设计为三部分的和，分别指导优化通信速率、安全性能以及噪声自适应性能。其中，安全部分通过最小化保密信息和预编码符号之间的互信息来实现，这里的互信息通过相关函数来表征。j.li研究了一种基于互信息神经估计网络模型(mutual information neural estimation,mine),该网络模型可以近似估计神经网络的输入分布和输出分布的互信息大小，进而打开了采用深度学习设计基于信息论的物理层安全通信的大门。此外，r.fritschek研究了一种基于用户误码率的端到端安全自编码器方案，通过设计目标函数，包括最大化窃听用户的误码率和最小化合法用户的误码率来设计基于神经网络的安全发射机。
4.上述方案中设计针对mimo信道的物理层安全技术大部分是基于有监督学习的方法，难以克服安全速率受限于传统方法的问题；而基于无监督学习的安全自编码机方案，要么是针对安全信道编码的设计，要么是对高层对称加密算法的设计，没有针对安全星座图
以及安全预编码等大规模阵列信号处理层面的设计，且大部分的系统仿真都是在小规模天线阵列或者单天线系统条件下进行的。此外，随着人工智能和移动通信的密切结合，非法的窃听用户也有能力通过盲调制识别以及发射机指纹识别等获得发射机的先验知识，提高自己的保密信息接收和破解能力，进一步增加了合法系统被窃听的风险，因此，研究考虑窃听用户自身具备学习能力的物理层安全设计是一个亟待解决的问题。

技术实现要素：

5.针对未来大规模多天线系统安全速率优化问题非凸且复杂度高的问题，本发明提供一种基于对抗学习的安全自预编码机优化方法。通过设计并构建基于自编码机，同时支持多用户、多天线、多数据流传输的安全收发机训练框架，在发射端对信号调制和空间预编码器进行联合优化，使得合法用户接收端以极低的误符号率解调，恢复正确的保密信息，而窃听用户接收端不能正确解调，只能得到错误的保密信息。所训练的安全发射机能够在提高合法用户的通信可靠性的同时，大幅度降低针对窃听用户的可靠性，进而实现安全传输。
6.本发明的目的是通过以下技术方案实现的：
7.本发明针对大规模mimo系统下的安全速率优化问题非凸且复杂度高的技术问题，基于对抗学习训练安全自预编码机。联合优化设计级联的调制模块和空间预编码模块，设计安全的发射机星座图和全数字波束赋形矢量，训练得到安全自预编码机(security auto-precoder,sap)。同时，引入迭代对抗学习训练框架，开发在安全发射机参数已知的情况下，具备更好符号检测能力的窃听接收机，并基于该进化的窃听接收机，对抗训练具备更高合法用户信息可靠性的对抗安全自预编码机(adversarial security auto-precoder,asap)。所训练的安全发射机能够在提高合法用户的通信可靠性的同时，大幅度降低针对窃听用户的可靠性，进而实现安全传输。
8.本发明公开的基于对抗学习的安全自预编码机优化方法，包括以下步骤：
9.步骤一、设定基于自编码机框架的mimo通信系统系统参数，系统参数包括：发射机alice、合法用户bob和窃听用户eve的天线数量m,nb和ne、每符号的比特信息r、符号序列长度j、信道多径数量l、信道参数α
l
，θ
l
，的分布、发射功率约束p、信噪比snr；设定神经网络模型结构、训练/测试数据集参数、以及训练超参数，训练超参数包括：选择的优化器、训练轮次epoch、每轮次的样本长度batch size。
10.步骤二、基于深度自编码机的训练框架，搭建支持多用户、大规模多天线、多流数据传输的mimo通信系统，设计多用户平均ser作为损失函数，训练调制模块和预编码模块级联的发射机网络模型；训练好的模型可以通过空间波束赋形，在有限的发射功率下，实现系统中多用户的可靠性传输。
11.步骤2.1：设计发射端神经网络，包括信号调制模块和空间预编码模块的网络结构。
12.发送端天线映射之后的第j个保密信息对应的发送符号为xj：
[0013][0014]
其中，和分别表示调制模块和预编码模块；mj是待发送的保密信息，从预先
设定的有限保密信息集合中取得。经过调制神经网络模块之后输出调制符号sj同发送端估计信道参数合并之后一同输入预编码神经网络模块对调制符号进行预编码操作，得到预编码之后的信号xj。同样的，j个xj能够并行处理和发送，以实现mimo系统的多流信号传输。训练、测试数据集中的所有参数，包括信道参数和信号参数都采用实部和虚部分开的方式进行表示，即系统中的信道和信号全部表征为实数矩阵。
[0015]
所有的发射端网络都采用全连接神经网络(fully-connected neural network，fcnn)，调制模块神经网络对保密信息序列m的计算处理过程表示如下：
[0016][0017]
其中，和分别表示调制模块神经网络的第g层网络的激活函数、权重矢量和偏移矢量；然后调制之后的所有符号序列s和估计的发射端估计的信道参数进行合并，得到新的训练样本作为空间预编码模块神经网络的输入；空间预编码模块神经网络对调制符号和信道合并后的矩阵u的计算处理过程表示如下：
[0018][0019]
其中，和分别表示调制模块神经网络的t
th
层网络的激活函数、权重矢量和偏移矢量；为了限制发射信号功率|x|≤p，的t
th
层设计为功率约束层，采用自定义的激活函数如下：
[0020][0021]
其中，|x|表示矩阵x的f-范数，p表示最大发射功率；因此，经过步骤2.1就得到了归一化的映射到天线端口的待发射信号。
[0022]
步骤2.2：设计接收端神经网络，包括接收信号检测模块和概率映射模块。
[0023]
合法用户bob和窃听用户eve在该步骤中被视为两个合法用户，搭建两个具有同样网络结构的接收机模型。第j
th
个功率归一化的信号xj分别经过bob和eve各自的mimo信道到达接收端，bob和eve接收到的第j
th
个信号y
b,j
和y
e,j
分别表示如下：
[0024]yb,j
＝hbxj nbꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0025]ye,j
＝hexj neꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0026]
其中，和表示加性高斯白噪声。
[0027]
在接收端，bob和eve的接收机网络采用相同的网络结构，分别表示为：和bob和eve的接收端恢复的第j
th
个保密信息表示为：
[0028]
[0029][0030]
其中，αb,θb,分别表示bob接收端估计的信道参数；αe,θe,分别表示eve接收端估计的信道参数；
[0031]
接收端神经网络最后一层采用softmax激活函数，分别输出bob和eve的预测概率矢量pb和pe；该概率矢量表示和预测的保密信息是保密信息集中某个保密信息对应的概率。
[0032]
步骤2.3：根据分类交叉熵损失函数，设计针对多用户的平均交叉熵损失函数采用反向梯度下降策略，进行自预编码机模型参数的更新。
[0033]
合法用户bob和窃听用户eve的平均交叉熵损失函数设计如下：
[0034][0035]
其中，p
j,m
表示发送的保密信息序列m的独热编码矩阵的第j行、第m列的元素；和分别表示bob和eve的接收机网络的概率预测矩阵和的第j行、第m列的元素；表示在离散参数集合下，batch size个数据样本下计算的损失函数的均值，batch size表示每批次送入神经网络的训练样本的长度。
[0036]
基于tensorflow深度学习框架的优化器，最小化上述的平均交叉熵损失函数使得bob和eve的接收机侧恢复的保密信息，通过端到端的神经网络处理，实现无监督的训练过程，使得接收端恢复的信号和发送端信号一致，实现保密信息的可靠性传输，eve和bob都可以得到一个该信道场景下的最优接收机，同时此时训练的eve也被认为是基于自编码训练的最佳窃听者，基于此窃听用户eve进行后续的安全设计。
[0037]
步骤三、根据步骤二中搭建的多用户、多流mimo自预编码机模型，通过引入针对窃听用户的模糊矩阵p设计新的安全损失函数利用新的安全损失函数指导模型训练，赋予自预编码机安全属性，生成新的安全星座图，保证合法用户bob的接收端能够完成符号检测，而窃听用户eve的接收端不能正确完成符号检测。
[0038]
步骤3.1：类似于步骤二，为实现物理层信号安全传输，引入针对窃听用户的模糊矩阵p设计新的安全损失函数表示如下：
[0039][0040]
其中，p
j,m
，和和公式(9)中的含义一致；引入一个模糊矩阵p来迷惑窃听用户接收机，p
j,m
表示模糊矩阵p的第j行、第m列的元素，模糊矩阵p写为如下形式：
[0041][0042]
根据交叉熵损失函数的原理，随着训练过程的进行，窃听用户eve接收机的预测概率矩阵会越来越接近模糊矩阵p，进而导致eve判断接收符号属于某一类的概率都是一致的，因此无法争取的进行符号检测，而bob能够正确检测，实现保密信息的安全传输。
[0043]
步骤3.2：基于步骤3.1中设计的新的安全损失函数在固定窃听用户接收机参数不变的情况下进行安全训练，训练得到sap。
[0044]
步骤3.2.1：首先，确定总体训练次数n，初始化n＝1；读取步骤二中的预训练自编码机模型参数，包括发射机alice的初始化网络参数φa以及bob和eve的接收机初始化网络参数和
[0045]
步骤3.2.2：初始化训练样本的信道参数和对应的独热编码标签，读取训练数据集；
[0046]
步骤3.2.3：确定训练超参数：包括优化器学习率、训练轮次、每批次样本长度、训练数据集和验证数据集的划分比例；
[0047]
步骤3.2.4：开始训练，基于损失函数(10)，利用adam优化器，更新所有网络模型参数φa′
，和
[0048]
步骤3.2.5：n＝n 1；直到n＝n，结束训练。
[0049]
步骤四：引入对抗学习机制，结合步骤3.1的安全损失函数，设计针对窃听用户的目标损失函数将整个自预编码机分为两部分链路，分别为合法链路main chain和窃听链路eve chain，main chain包括alice发射机和bob的接收机网络，eve chain包括eve的接收机网络，基于步骤二的预训练模型，设计两部分迭代对抗训练算法，得到对抗安全自编码器模型asap。
[0050]
步骤4.1：引入对抗学习机制，结合步骤3.1的安全损失函数，设计针对窃听用户的目标损失函数
[0051][0052]
其中，p
j,m
，的含义和公式(10)中的表示一致；设计该损失函数的目的是在步骤3.2的安全发射机训练完成以后，继续优化针对该安全发射机的虚拟窃听接收机，以获得更低的ser值。
[0053]
步骤4.2：整个自预编码机分为两部分，分别为合法链路main chain和窃听链路eve chain，main chain包括alice发射机和bob的接收机网络，eve chain包括eve的接收机网络，基于步骤二的预训练模型，设计两部分迭代对抗训练算法，得到对抗安全自预编码机
asap。
[0054]
步骤4.2.1：首先，确定总体迭代次数n；确定训练超参数：包括优化器学习率、训练轮次、每批次样本长度、训练数据集和验证数据集的划分比例；
[0055]
步骤4.2.2：判断迭代轮次n＝1？；如果n＝1，读取步骤二中的预训练自预编码机模型参数，包括发射机alice的初始化网络参数φa以及bob和eve的接收机初始化网络参数和如果n≠1，读取n-1轮次更新的模型参数，φa＝φ
′a,
[0056]
步骤4.2.3：初始化训练样本的信道参数和对应的独热编码标签p，读取训练数据集；
[0057]
步骤4.2.4：设置训练次数epoch_1，冻结eve chain的网络参数，根据损失函数(10)，训练main chain的网络模型，更新参数φa＝φ
′a,
[0058]
步骤4.2.5：设置训练次数epoch_2，冻结main chain的网络参数，根据损失函数(12)，训练eve chain的网络模型，更新参数
[0059]
步骤4.2.6：n＝n 1；回到步骤4.2.2，继续执行4.2.3、4.2.4和4.2.5，直到n＝n，结束训练。
[0060]
步骤五：根据步骤四训练得到的对抗安全自预编码机asap，在新的安全传输场景下，通过采集少量的信道样本，继续执行步骤四对模型进行微调，然后利用参数更新的安全自预编码机模型对保密信息进行调制和预编码的联合优化，得到针对目标窃听用户具有保密性质的待发射信号。保证在合法用户bob具有极高可靠性的同时，窃听用户eve只能得到盲猜级别的符号检测性能，实现安全传输。
[0061]
至此，经过步骤一到步骤五，完成基于对抗学习的安全自预编码机优化方法的全部流程。
[0062]
有益效果：
[0063]
1、本发明公开的基于对抗学习的安全自预编码机优化方法，能够在满足最大发射功率约束的条件下，联合优化发射端的信号调制模块和空间预编码模块，优化出全新的安全接收星座图，在提高合法用户接收端信息解码可靠性的同时，显著降低窃听用户接收端的信息可靠性，在任意收发天线关系下可以实现保密信息的安全传输。
[0064]
2、本发明公开的基于对抗学习的安全自预编码机优化方法，能够在安全自预编码机的基础上，通过引入对抗学习策略，对合法链路网络和窃听链路网络进行交替迭代训练，在即使窃听者具备主动学习能力的情况下，继续提高合法用户的保密信息传输可靠性和安全性，同时相比没有对抗学习的安全自预编码机优化方法，降低模型收敛时间，降低空间信号处理复杂度，提高安全传输效率。
[0065]
3、本发明公开的基于对抗学习的安全自预编码机优化方法，在保证信息安全性、可靠性的同时，通过设计合理的接收端星座部署，能够在有限的发射功率下，有效提升通信传输吞吐量，实现通信安全性和有效性的均衡。
附图说明
[0066]
图1是本发明基于对抗学习的安全自预编码机优化方法及实施例中对抗安全自预
编码机整体训练框架流程图；
[0067]
图2是本发明基于对抗学习的安全自预编码机优化方法及实施例中基于深度自编码机的联合调制星座和安全自预编码机优化示意图；
[0068]
图3是本发明基于对抗学习的安全自预编码机优化方法及实施例中基于对抗学习的安全发射机和窃听接收机迭代训练算法示意图；
[0069]
图4是本发明基于对抗学习的安全自预编码机优化方法及实施例中安全自预编码机sap和对抗安全自预编码机asap训练框架下，合法用户bob和窃听用户eve的ser vs snr性能对比示意图；
[0070]
图5是本发明基于对抗学习的安全自预编码机优化方法及实施例中合法用户bob和窃听用户eve在两种安全训练框架下的接收端信号星座对比示意图。
具体实施方式
[0071]
下面将结合附图和实施例对本发明加以详细说明。同时也叙述了本发明技术方案解决的技术问题及有益效果，需要指出的是，所描述的实施例仅旨在便于对本发明的理解，而对其不起任何限定作用。
[0072]
本实施例详细阐述了本发明基于对抗学习的安全自预编码机优化方法在特定系统参数配置、自编码机网络参数配置、和训练超参数配置下具体实施时的步骤。
[0073]
本实施例考虑一个三节点的mimo窃听信道场景，整个通信系统基于深度自编码机的架构搭建；该系统中，alice表示基于神经网络模型训练的安全发射机，bob表示端到端训练得到的合法用户接收机；eve表示同样是端到端训练得到的窃听用户接收机，并且在模型预训练结束后，eve可以训练得到一个接收、解调性能和bob基本一致的接收机。
[0074]
信道符合5g毫米波信道模型，如下所示：(本技术发明和信道模型本身没有约束关系，仅举例说明算法实施过程)
[0075][0076]
其中，l表示散射径的个数；α
l
表示第l条径下的复信道增益；ar(
·
)表示接收天线阵列响应矢量；a
t
(
·
)表示发射天线阵列响应矢量；和θ
l
分别表示到达角和发射角；采用k维的均匀线性阵列(ula),天线的阵列响应矢量表示如下：
[0077][0078]
其中，t表示发射天线数量，d表示天线面板上两个相邻天线之间的距离，λ是电磁波长；同时，设alice已知bob和eve的完美的信道信息接收端也是一样。
[0079]
如图1所示，本实施例公开的基于对抗学习的安全自预编码机优化方法，具体实现步骤如下：
[0080]
步骤一、设定基于自编码机框架的mimo通信系统系统参数，系统参数包括：发射机alice、合法用户bob和窃听用户eve的天线数量m,nb和ne、每符号的比特信息r、符号序列长度j、信道多径数量l、信道参数α
l
，θ
l
，的分布、发射功率约束p、信噪比snr；设定神经网络
模型结构、训练/测试数据集参数、以及训练超参数，训练超参数包括：选择的优化器、训练轮次epoch、每轮次的样本长度batch size。关于系统配置参数，设置发射机alice的天线数量为m＝64；合法用户bob的天线数量为nb＝2；窃听用户eve的天线数量为ne＝2；发射符号序列长度j＝1，每个符号包含r＝4bits的信息；信道多径数量为l＝1，alice，bob和eve的相对位置随机，随着离散信道参数的变化而变化，并且信道参数分布为：最大发射功率为p＝1；同时为了适应多种信噪比场景，采用数据增强的方法，将训练数据集中的snr范围设置为服从均匀分布，即
[0081]
关于模型配置超参数，所有的神经网络模块都采用全连接神经网络(fully-connected neural network,fcnn)；针对调制模块采用5层fcnn，每层的神经元节点个数为[512,256,128,32,2]；针对预编码模块采用5层fcnn，每层的神经元节点个数为[512,512,256,256,128]；针对bob和eve的接收机模块分别采用4层fcnn，每层的神经元节点个数为[128,128,64,16]；另外，每一层的激活函数都采用整流线性单元(rectified linear unit,relu)；采用adam优化器进行模型参数更新；此外，根据上述的系统配置参数，生成了106个模型数据样本，包括离散信道参数和每次信道实现下对应的发送保密信息序列m＝{m1,m2,
…
mj}，以及每个保密信息序列对应的独热编码(one-hot encoder，oe)矩阵；该矩阵作为每个样本在接收端的标签进行使用。迭代训练次数设置为50次，每次迭代的模型训练轮次epoch设置为30次，每次输入网络的样本数量batch size设置为512。
[0082]
步骤二、基于深度自编码机的模型架构和训练方法，搭建支持多用户、大规模多天线、多流数据传输的mimo通信系统。设计信号调制模块和空间预编码模块级联的发射机网络模型，设计多用户平均ser损失函数，通过空间波束赋形，实现系统中多用户的可靠性传输。
[0083]
步骤2.1：设计发送端神经网络，包括级联的调制模块和空间预编码模块。
[0084]
发送端天线映射之后的第j个保密信息对应的发送符号为xj：
[0085][0086]
其中，和分别表示调制模块和预编码模块；mj是待发送的保密信息，经过调制神经网络模块之后输出调制符号sj同离散信道参数合并之后一同输入预编码神经网络模块多个xj可以并行处理和发送，以实现mimo系统的多流信号传输。需要注意的是，目前基于tensorflow的主流深度学习框架，暂时不能直接对复数进行表示，因此，数据集中的所有参数，包括信道参数和信号参数都采用实部和虚部分开的方式进行表示，即所有的信号和信道都表示为实数矩阵。
[0087]
收发端的所有网络结构都采用fcnn，调制模块神经网络对保密信息序列m的计算处理过程表示如下：
[0088]
[0089]
其中，和分别表示调制模块神经网络的第g层网络的激活函数、权重矢量和偏移矢量；然后调制之后的所有符号序列s和估计的稀疏信道参数进行合并，得到新的训练样本作为空间预编码模块神经网络的输入；因此，调制符号序列，在信道先验信息的辅助下，在预编码模块中被映射到天线上，得到了待发射的信号矩阵表示如下：
[0090][0091]
其中，和分别表示调制模块神经网络的t
th
层网络的激活函数、权重矢量和偏移矢量；特别地，为了限制发射信号功率|x|≤p，的t
th
层被设计作为功率约束层，采用自定义的激活函数如下：
[0092][0093]
其中，|x|表示矩阵x的f-范数，p表示最大发射功率约束；
[0094]
步骤2.2：设计接收端神经网络，包括接收信号检测模块和概率映射模块。
[0095]
功率归一化之后的第j
th
个信号xj分别经过bob和eve各自的mimo信道到达接收端，过信道的过程表示如下：
[0096]yb,j
＝hbxj nbꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(19)
[0097]ye,j
＝hexj neꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0098]
其中，和表示加性高斯白噪声。
[0099]
在接收端，bob和eve的接收机网络采用相同的网络结构，分别表示为：和bob和eve的接收端恢复的第j
th
个保密信息表示为：
[0100][0101][0102]
其中，αb,θb,分别表示bob接收端估计的信道参数；αe,θe,分别表示eve接收端估计的信道参数；根据图2所示，接收端神经网络的最后一层采用softmax激活函数，分别输出bob和eve的预测概率矢量pb和pe；该概率矢量表示和预测的保密信息是保密信息集中某个保密信息对应的概率。
[0103]
步骤2.3：根据分类交叉熵损失函数，设计针对多用户的平均交叉熵损失函数指导自预编码机网络训练。
[0104]
bob和eve的平均交叉熵损失函数设计如下：
[0105]
[0106]
其中，p
j,m
表示发送的保密信息序列m的独热编码矩阵的第j行、第m列的元素；和分别表示bob和eve的接收机网络的概率预测矩阵和的第j行、第m列的元素；表示在离散参数集合下，batch size个数据样本下计算的损失函数的均值，batch size表示每批次送入神经网络的训练样本的长度。
[0107]
采用tensorflow深度学习框架自带的adam优化器来最小化上述的平均交叉熵损失函数实现无监督的训练过程。
[0108]
步骤三、根据步骤二中搭建的多用户、多流mimo自预编码机模型，通过引入针对窃听用户的模糊矩阵p设计新的安全损失函数利用新的安全损失函数指导模型训练，赋予自预编码机安全属性，生成新的安全星座图，保证合法用户bob的接收端可以完成符号检测，而窃听用户eve的接收端不能正确完成符号检测。
[0109]
步骤3.1：类似于步骤二，为了实现物理层信号安全传输，引入针对窃听用户的模糊矩阵p设计新的安全损失函数表示如下：
[0110][0111]
其中，p
j,m
，和和公式(23)中的含义一致；引入一个模糊矩阵p来迷惑窃听用户接收机，p
j,m
表示迷惑矩阵p的第j行、第m列的元素，迷惑矩阵p写为如下形式：
[0112][0113]
根据交叉熵损失函数的原理，随着训练过程的进行，窃听用户eve接收机的预测概率矩阵会越来越接近迷惑矩阵p，进而导致eve判断接收符号属于某一类的概率都是一致的，因此无法争取的进行符号检测，而bob可以正确检测，实现保密信息的安全传输。
[0114]
步骤3.2：基于步骤3.1中设计的新的安全损失函数在固定窃听用户接收机参数不变的情况下进行安全训练，训练得到sap。
[0115]
步骤3.2.1：首先，确定总体训练次数n，初始化n＝1；读取步骤二中的预训练自预编码机模型参数，包括发射机alice的初始化网络参数φa以及bob和eve的接收机初始化网络参数和
[0116]
步骤3.2.2：初始化训练样本的信道参数和对应的独热编码标签，读取训练数据集；
[0117]
步骤3.2.3：确定训练超参数：包括优化器学习率、训练轮次、每批次样本长度、训练数据集和验证数据集的划分比例等；
[0118]
步骤3.2.4：开始训练，基于损失函数(24)，利用adam优化器，更新所有网络模型参数φa′
，和
[0119]
步骤3.2.5：n＝n 1；直到n＝n，结束训练。
[0120]
步骤四：引入对抗学习机制，结合步骤3.1的安全损失函数，设计针对窃听用户的目标损失函数将整个自预编码机分为两部分链路，分别为合法链路main chain和窃听链路eve chain，main chain包括alice发射机和bob的接收机网络，eve chain包括eve的接收机网络，基于步骤二的预训练模型，设计两部分迭代对抗训练算法，得到对抗安全自编码器模型asap。
[0121]
步骤4.1：引入对抗学习机制，结合步骤3.1的安全损失函数，设计针对窃听用户的目标损失函数
[0122][0123]
其中，p
j,m
，的含义和公式(24)中的表示一致；设计该损失函数的目的是在步骤3.2的安全发射机训练完成以后，继续优化针对该安全发射机的虚拟窃听接收机，以获得更低的ser值。
[0124]
步骤4.2：根据图3的迭代安全训练算法框图所示，将整个自预编码机模型分为两部分，分别为合法链路main chain和窃听链路eve chain，main chain包括alice发射机和bob的接收机网络，eve chain包括eve的接收机网络，基于步骤二的预训练模型，设计两部分迭代对抗训练算法，得到对抗安全自预编码机asap。
[0125]
步骤4.2.1：首先，确定总体迭代次数n；确定训练超参数：包括优化器学习率、训练轮次、每批次样本长度、训练数据集和验证数据集的划分比例等；
[0126]
步骤4.2.2：判断迭代轮次n＝1？；如果n＝1，读取步骤二中的预训练自预编码机模型参数，包括发射机alice的初始化网络参数φa以及bob和eve的接收机初始化网络参数和如果n≠1，读取n-1轮次更新的模型参数，φa＝φ
′a,
[0127]
步骤4.2.3：初始化训练样本的信道参数和对应的独热编码标签p，读取训练数据集；
[0128]
步骤4.2.4：设置训练次数epoch_1，冻结eve chain的网络参数，根据损失函数(24)，训练main chain的网络模型，更新参数φa＝φ
′a,
[0129]
步骤4.2.5：设置训练次数epoch_2，冻结main chain的网络参数，根据损失函数(26)，训练eve chain的网络模型，更新参数
[0130]
步骤4.2.6：n＝n 1；回到步骤4.2.2，继续执行4.2.3、4.2.4和4.2.5，直到n＝n，结束训练。
[0131]
步骤五：根据步骤四训练得到的对抗安全自预编码机asap，在新的安全传输场景下，通过采集少量的信道样本，继续执行步骤四对模型进行微调，然后利用参数更新的安全自预编码机模型对保密信息进行调制和预编码的联合优化，得到针对目标窃听用户具有保
密性质的待发射信号。保证在合法用户bob具有极高可靠性的同时，窃听用户eve只能得到盲猜级别的符号检测性能，实现安全传输。
[0132]
图4是本发明基于对抗学习的安全自预编码机优化方法及实施例中安全自预编码机sap和对抗安全自预编码机asap训练框架下，合法用户bob和窃听用户eve的ser vs snr性能仿真结果图；
[0133]
图4横坐标为信噪比snr，范围为0-30db，纵坐标为误符号率ser，仿真实验对四种情况进行了对比分析，分别是单用户自预编码机s-ap、两用户自预编码机m-ap、安全自预编码机sap和对抗安全自预编码机asap。可以看到，s-ap和m-ap分别占据了性能的上下限。从波束赋形精度的角度可以理解为，s-ap的波束对准更加精确，接收信号功率大；而m-ap则波束赋形会在用户之间进行权衡，因此每个用户的性能都会下降。sap性能曲线，相比m-ap，由于将另一个用户视为窃听者，因此波束赋形的指向性会明确的偏向合法用户，因此性能相比m-ap略有提升，同时eve的ser几乎等于该场景下信号盲猜检测的概率，因此安全性有很好的保障；asap性能曲线，相比sap，不管是bob还是eve在对抗学习之后有一定提升，但是bob的性能提升更有意义，因为它可以在10db的之后相比sap有一个数量级的提升并且接近自预编码机所能提供的最佳ser性能，即s-ap曲线。
[0134]
图5是本发明基于对抗学习的安全自预编码机优化方法及实施例中合法用户bob和窃听用户eve在两种安全训练框架下的接收信号星座仿真结果图；
[0135]
图5横坐标为接收星座的实部表示，纵坐标为接收星座的虚部表示，仿真实验对四个接收星座图进行了对比分析：其中“bob w al”表示asap框架下bob的接收星座图；“eve w al”表示asap框架下eve的接收星座图；“bob wo al”表示sap框架下bob的接收星座图；“eve wo al”表示sap框架下eve的接收星座图；可以看到，对抗学习前的接收星座图是类似于传统的psk星图调制，只占用信号的相位信息，符号聚类中心的平均距离较小，增加了符号检测出错的概率；对抗学习后的星座图则类似于传统的qam调制，在相同功率约束的情况下，可以同时利用信号的幅值和相位信息，更好的占用二维空间控制符号间干扰。同时，可以看到eve的接收星座图无论是在sap还是asap的情况下都比较混乱，尤其是没有经过对抗学习的eve，接收星座图收缩为很小的范围空间中的一团噪点，具有最差的ser性能。因此，对抗学习对于设计更高安全性的自预编码机和更合理的安全调制星座具有重要意义。
[0136]
以上所述的具体描述，对发明的目的、技术方案和有益效果进行进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施例而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：视频编码中的运动矢量确定方法、装置、设备和存储介质与流程

基于对抗学习的安全自预编码机优化方法

相关文献

最热文献