一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于编码超表面频率响应快速预测的模型压缩方法

2023-02-06 22:07:46 来源:中国专利 TAG:


1.本发明涉及编码超表面设计领域,具体是一种基于编码超表面频率响应快速预测的模型压缩方法。


背景技术:

2.传统电磁超表面的单元结构仍然采用连续的(均匀或非均匀)等效媒质参数描述,因此从电路角度来看,这类超表面与模拟电路类似,可被看作“模拟超表面”。为了实现“数字版”的超表面,有团队提出了一种新型的基于数字表征的编码超表面,即通过数字编码序列来调控电磁波,这种以二值数字逻辑为基础的“数字超表面”极大地简化了超表面的设计流程,提高了调控电磁波的灵活度,扩大了调控范围。近几年,涵盖传统启发式算法和神经网络算法的智能算法在超材料设计中所占的比重逐步上升,基于智能算法设计超材料能够打破传统设计方法在不同基材体系、不同频段以及不同性能指标下设计的局限性,展现出快速设计和架构创新的独特优势。随着深度神经网络性能的提升,网络模型参数量和计算量也日益增长,alexnet、vggnet、googlenet、resnet等经典神经网络模型深度不断增加,逐渐超过100层。
3.深编码超表面频率响应快速预测可用神经网络实现。但是神经网络的部署对计算量和存储资源提出了很高要求,使其难以应用到资源受限的移动和可穿戴设备上,应用受到了很大限制。同时,神经网络中存在很多冗余参数。
4.因此,神经网络进行模型压缩是非常必要的,模型压缩主要有以下五种方法:紧凑结构设计、量化、低秩分解、知识蒸馏、剪枝。紧凑结构设计的应用场景大多是对新的任务的网络设计中,对于已经固定结构的网络应用受限;在对复杂任务的网络进行量化时通常会导致精度下降严重。低秩分解的方法主要采用矩阵分解的方式,但是存在分解后不收敛的问题,且分解的时间成本比较高,加之近些年的模型中采用大量的1
×
1卷积,矩阵分解的适用范围进一步减小。知识蒸馏对于深层网络变浅具有显著作用,可以大大降低网络计算量,但是由于其本身使用softmax函数,对于除分类外的其它任务泛化性受限,同时其压缩比与其它方法还存在一定差距。剪枝按照粒度的粗细可以分为非结构化剪枝和结构化剪枝两种,非结构化剪枝的弱点十分明显,由于内部非规整的连接,需要依赖专门的运行库和硬件设备,所以,结构化剪枝更受青睐
5.卷积核层面的结构化剪枝不仅大大减少了存储空间的使用,而且降低了在线推理的计算成本。结构化剪枝的核心在于卷积核衡量标准的选择,要求在精度损失最小的情况下产生最高的压缩比。现有卷积核层面的结构化剪枝方法可以分为两类:
6.一、不改变卷积神经网络的损失函数,利用神经网络的固有属性进行剪枝,如基于卷积核权重的稀疏程度apoz的结构化剪枝方法、基于卷积核权重l1范数的结构化剪枝方法、基于一阶泰勒展开的结构化剪枝方法。
7.二、改变卷积神经网络的损失函数,需要将剪枝标准嵌入到网络训练损失中,采用联合优化的方式产生自适应剪枝决策,如将bn层的缩放因子嵌入到损失函数中,进行训练,
训练完毕后缩放因子较小的卷积核即可认为相对不重要。
8.与第一类剪枝方法相比,第二类剪枝方法由于联合优化,通常能获得更好的压缩和加速结果。然而,由于损失发生了变化,所需的再训练步骤占用了大量的机器时间和人力,通常需要进行另一轮超参数调优,对于其中一些方法,修改后的损失甚至需要专门的优化器。结构化剪枝的方法也存在着计算量较大的问题,如基于一阶泰勒展开的结构化剪枝方法不仅需要计算梯度,还要对获得的一阶泰勒项进行层正则化处理,同时缺乏对卷积核衡量标准的解释性。
9.基于上述问题,本发明提出了基于lrp(layer-wise relevance propagation)的结构化剪枝方法。区别于应用于分类问题的基于lrp的剪枝方法,本发明将该剪枝方法应用于编码超表面频率响应快速预测的正向网络压缩中。编码超表面频率响应快速预测的正向网络旨在通过大数据集的训练,实现编码超表面与其频率响应的映射,这是一个回归问题。基于lrp(layer-wise relevance propagation)的结构化剪枝方法只需将网络输出由输出层后向传播至输入层,即可获得每层每个卷积核对网络输出的贡献,称为相关性。由于剪枝标准与网络输出直接相关,以及后向传播过程中施加的层与层之间相关性不变的约束,使得通过lrp获得的相关性作为剪枝标准变得可解释。


技术实现要素:

10.发明目的:本发明提出了一种基于编码超表面频率响应快速预测的模型压缩方法,通过基于lrp的结构化剪枝方法,对编码超表面频率响应快速预测的正向网络压缩;使用基于lrp的结构化剪枝方法在网络性能基本不变的前提下大大减小网络参数,解决了现有网络模型参数量和计算量过大导致的网络存储空间要求过大、预测速度较慢等问题。
11.技术方案:一种基于编码超表面频率响应快速预测的模型压缩方法,包括如下步骤:
12.步骤一、通过cst-python联合仿真,导入表示编码超表面单元表面结构的编码矩阵,生成编码超表面频率响应,获得频响曲线,制作数据集;
13.步骤二、对编码超表面频率响应快速预测的正向网络进行预训练,实现编码超表面到频率响应的映射;
14.步骤三、基于步骤二中得到的预训练完备的正向网络,使用lrp将网络输出作为相关性进行后向传播,以卷积核获得的相关性作为结构化剪枝的度量标准对正向网络进行压缩,并对压缩后的正向网络进行再训练;
15.步骤四、将表示编码超表面单元表面结构的编码矩阵输入到步骤三中得到的正向网络中,即可得到超表面频率响应的参数实部曲线、虚部曲线,进而得到幅值和相位值。
16.进一步的,所述步骤一中,编码超表面单元的超表面工作频率为8ghz-12ghz;编码超表面单包括三层,最下层为金属铜板,电导率为5.8e 007s/m;中间层为介质板,介质板为f4b材料,介电常数为2.65,长宽皆为10mm,厚度为2mm;最上层为金属贴片层,最上层共有16*16个单元,由8*8的单元对称而成,每个单元通过1或0去表示贴片的有无,单个贴片的长宽为0.5mm,厚度为0.017mm。
17.进一步的,所述步骤一中,生成的超表面频率响应记为s11,将表示超表面频率响应s11的矩阵,进行间隔采样,得到超表面单元与其频率响应的对应关系,形成若干初始数
据;将初始数据按照8∶1∶1的比例划分成训练集、验证集、测试集;将训练集通过数据增强的方式扩大到2倍;
18.s11的参数表征中,幅值amp、相位实部re、虚部im对应关系如下:
[0019][0020][0021][0022][0023]
进一步的,所述步骤二中编码超表面频率响应快速预测的的正向网络,包括实部子网络rnet、虚部子网络inet,两个子网络为并行联合的形式,且两个子网络采用完全相同的结构;两个子网络的输入均为表示编码超表面单元表面结构的编码矩阵;两个子网络的输出分别对应超表面频率响应s11的实部和虚部表征,基于幅值、相位与实部、虚部的对应关系,计算得到网络输出的幅值和相位;
[0024]
对正向网络进行预训练时:
[0025]
1)网络使用的误差函数为最小均方误差mse,表示为,
[0026][0027]
其中,为正向网络对编码超表面频率响应s11的预测结果,y为编码超表面的实际频率响应,n为频域内对编码超表面频率响应s11进行等间隔采样得到的频点数;
[0028]
2)预训练时的网络损失函数为:
[0029][0030]
其中,loss_train为网络预训练时的损失函数,re、分别为s11参数的实部真实值、实部子网络预测的实部值,im、分别为s11参数的虚部真实值、虚部子网络预测的虚部值。
[0031]
进一步的,所述步骤三中,结构化剪枝方法的步骤如下:
[0032]
步骤a、计算激活值;
[0033]
在训练集中随机选择编码超表面单元作为参考样本,将表征参考样本超材料单元表面结构的编码矩阵输入到步骤二中的预训练完备的正向网络中,正向网络的实部子网络和虚部子网络分别独立进行前向传播,得到实部子网络和虚部子网络中每层的输出值,所述输出值即为激活值,预激活值为未经过层中激活函数的输出值;
[0034]
步骤b、基于lrp的相关性计算;
[0035]
将步骤二中的预训练完备的正向网络输出后向传播至输入层,正向网络的实部子网络和虚部子网络分别独立地将输出后向传播至网络输入层,基于lrp规则依次获取实部子网络和虚部子网络各层中卷积核与网络输出之间的相关性;
[0036]
步骤c、计算每个卷积核的相关性;
[0037]
基于lrp规则,将网络输出后向传播至输入端后,网络中所有层的激活值都获得了与网络输出的相关性,对于卷积层而言,卷积核的相关性即为该卷积核输出的所有激活值相关性之和;
[0038]
步骤d、根据卷积核的相关性,采用整体剪枝的方式进行结构化剪枝;
[0039]
对步骤二中预训练完备的的正向网络的实部子网络和虚部子网络分别单独进行剪枝工作;确定剪枝比例,即被剪卷积核占所有卷积核的比例,根据卷积核的相关性对所有卷积核进行排序,获得相关性阈值;剪去相关性低于阈值的卷积核和对应输入输出连接,得到压缩后的正向网络。
[0040]
进一步的,所述步骤b的具体步骤如下:
[0041]
步骤1、前层与后层卷积核之间的相关性,由该组卷积核之间关联的预激活值与后层卷积核所有相关联的前层卷积核的总预激活值之比来表示,则相关性的传播公式为:
[0042][0043]zij
=aiw
ij
[0044]
其中,为第l 1层第j个预激活值的相关性;为第l 1层第j个预激活值传递给第l层第i个激活值的相关性;zj表示第l 1层第j个卷积核与第l层所有关联卷积核的预激活值的总和;z
ii
为第l层第i个卷积核关联的第l 1层第j个卷积核的预激活值;ai为第l层第i个激活值;w
ij
为第l层第i个激活值与第l 1层第j个预激活值之间的权重;
[0045]
步骤2、考虑到zj值较小时可能产生不受控制的值,加入了预先设置的大于0的数ε,原相关性的传播公式表示为:
[0046][0047]
步骤3、由于相关性在传播过程中会被ε吸收,使得越靠近输入的卷积层获得的相关性之和越小,从而会使得在不同卷积层中相关性比较没有意义,所以将相关性的传播公式表示为:
[0048][0049]
其中,要求α β=1,则可以将预激活值分为大于0和小于0的两部分,其中

’表示大于0的值,
‘‑’
表示小于0的值,有效避免了出现异常值的问题;
[0050]
取α=1,β=0,同时考虑到除输出层外所有层的激活值不小于0,则相关性的传播公式变为:
[0051][0052]
步骤4、在后向传播时,令网络输出置1作为相关性传播的起点,且传播过程中只考虑不小于0的预激活值,使得网络中所有神经元的相关性不小于0;
[0053]
由α=1,β=0时的传播规则可知,在未考虑卷积层偏置项或全连接层偏置项的情况下,不同层的相关性之和相等,即满足:
[0054][0055]
其中f(x)为网络输出,v(l)表示第l层激活值数量,表示第l层第d个激活值的相关性;当考虑卷积层偏置项或全连接层偏置项时,网络传播过程中小部分相关性被偏置项吸收。
[0056]
进一步的,所述步骤d中,对获得压缩后的正向网络,加入物理约束项,通过再训练的方式恢复正向网络的性能:
[0057]
1)对正向网络再训练的网络损失函数为:
[0058][0059][0060]
其中,loss_retrain为剪枝后网络再训练时的损失函数;λ为超参数;re、分别为s11参数的实部真实值、实部子网络预测的实部值,im、分别为s11参数的虚部真实值、虚部子网络预测的虚部值,amp、分别为s11参数的幅值真实值、幅值预测值,分别为s11参数的幅值真实值、幅值预测值,分别为s11参数的相位真实值、相位预测值;幅值预测值和相位预测值可由和计算得到;损失函数中为物理约束项;
[0061]
2)除了网络输出层,网络中其余层的激活函数为relu,relu的函数表达式为
[0062][0063]
由于编码超表面频率响应实部和虚部的取值范围皆为[-1,1],两个子网络输出层的激活函数为tanh:
[0064][0065]
训练时,选择的是adam优化器,训练次数设置为120轮,初始学习率为1e-3,学习率每训练40轮降低一半。
[0066]
有益效果:
[0067]
1)本发明将基于lrp的结构化剪枝方法应用于编码超表面正向预测网络的模型压缩之中,在不对剪枝后网络再训练的情况下,与基于卷积核权重l1范数的剪枝方法进行比较:
[0068]
在实部子网络与虚部子网络上,基于lrp的剪枝方法都比基于卷积核权重l1范数的剪枝方法获得了更好的压缩效果,更适合于编码超表面正向预测网络的压缩。
[0069]
同时,基于lrp的结构化剪枝方法,在剪枝比例一定时,网络精确度变化小,利用每个网络单元对网络输出的贡献来进行剪枝更加合理,每个卷积核的相关性和网络输出直接相关,以及施加的层与层相关性不变的约束,使得相关性作为结构化剪枝的衡量标准可解释,无论是卷积核、bn层、池化层、全连接层,相关性都可以进行后向传播,所以lrp在不同网络中的适应性强。
[0070]
2)本发明使用基于lrp的结构化剪枝方法对编码超表面频率响应正向网络进行不同程度的压缩,可以获得网络参数量、推理速度和网络损失的平衡:
[0071]
使用基于lrp的结构化剪枝方法对正向网络进行压缩在保证网络对频率响应s11(实部表征、虚部表征、幅值表征、相位表征)的预测精度的前提下,使得网络参数量大大减少、网络推理速度明显加快、所占内存空间更小,这使得该预测网络可以应用到资源受限的设备中,提升了网络的可移植性。
附图说明
[0072]
图1为编码超表面的正向设计和反向设计示意图;
[0073]
图2为编码超表面单元的结构图;
[0074]
图3为编码超表面频率响应快速预测方法的流程图;
[0075]
图4为正向网络的单元结构示意图;
[0076]
图5为基于lrp的编码超表面频率响应预测网络的结构化剪枝示意图;
[0077]
图6为正向网络前向传播示意图;
[0078]
图7为基于lrp的后向传播示意图;
[0079]
图8为实部子网络、虚部子网络相关性之和随后向传播的变化曲线;
[0080]
图9为超表面单元每个像素点的相关性图;
[0081]
图10为基于lrp的结构化剪枝方法(样本数量为1)和基于卷积核权重l1范数的结构化剪枝方法在实部子网络的压缩效果对比图;
[0082]
图11为基于lrp的结构化剪枝方法(样本数量为1)和基于卷积核权重l1范数的结构化剪枝方法在虚部子网络的压缩效果对比图;
[0083]
图12为基于lrp的结构化剪枝方法(样本数量为5)和基于卷积核权重l1范数的结构化剪枝方法在实部子网络的压缩效果对比图;
[0084]
图13为基于lrp的结构化剪枝方法(样本数量为5)和基于卷积核权重l1范数的结构化剪枝方法在虚部子网络的压缩效果对比图;
[0085]
图14为基于lrp的结构化剪枝方法(样本数量为10)和基于卷积核权重l1范数的结构化剪枝方法在实部子网络的压缩效果对比图;
[0086]
图15为基于lrp的结构化剪枝方法(样本数量为10)和基于卷积核权重l1范数的结构化剪枝方法在虚部子网络的压缩效果对比图;
[0087]
图16为基于lrp的结构化剪枝方法(样本数量为50)和基于卷积核权重l1范数的结构化剪枝方法在实部子网络的压缩效果对比图;
[0088]
图17为基于lrp的结构化剪枝方法(样本数量为50)和基于卷积核权重l1范数的结构化剪枝方法在虚部子网络的压缩效果对比图;
具体实施方式
[0089]
下面通过附图对本发明技术方案进行详细说明,但是本发明的保护范围不局限于实施例。
[0090]
本发明主要使用神经网络去设计编码超表面。神经网络通过对大数据集的学习,可以实现输入到输出的映射。编码超表面的设计根据神经网络输入和输出的关系,可以大
致分为如图1中所示的正向设计(a)和逆向设计(a)两种。本发明主要研究正向设计如图1中的(a)所示,即通过输入结构参数(如微波结构的几何形状)来预测电磁响应(如透射光谱或微分散射截面)。这些训练后的神经网络被用来代替电磁仿真的数值模拟过程,与在cst中仿真后输出电磁相应相比大大节省了时间,同时更能适应输入结构的变化。
[0091]
如图3所示,本实施例中一种基于编码超表面频率响应快速预测的模型压缩方法,包括如下步骤:
[0092]
步骤一、通过cst-python联合仿真,导入表示编码超表面单元表面结构的编码矩阵,生成编码超表面频率响应,获得频响曲线,制作数据集;
[0093]
所述步骤一中,编码超表面单元的结构如图2所示,超表面工作频率为8ghz-12ghz;编码超表面单包括三层,最下层为金属铜板,电导率为5.8e 007s/m;中间层为介质板,介质板为f4b材料,介电常数为2.65,长宽皆为10mm,厚度为2mm;最上层为金属贴片层,最上层共有16*16个单元,由8*8的单元对称而成,每个单元通过1或0去表示贴片的有无,单个贴片的长宽为0.5mm,厚度为0.017mm;通过改变8*8的单元的0和1的分布(共有2
64
种可能),可以对应不同图案的超表面单元,从而可实现不同的频率响应。
[0094]
所述步骤一中,生成的编码超表面频率响应记为s11,将表示超表面频率响应s11的矩阵,进行间隔采样,得到超表面单元与其频率响应的对应关系,形成若干初始数据;将初始数据按照8∶1∶1的比例划分成训练集、验证集、测试集;将训练集通过数据增强的方式扩大到2倍;s11可用幅值、相位、实部、虚部表示,即{幅值amp,相位实部re,虚部im};s11的参数表征中,幅值amp、相位实部re、虚部im的对应关系如下:
[0095][0096][0097][0098][0099]
本实施例中,s11的矩阵为[1001,4]的矩阵,1001为频域内频率响应的初始频点数,本发明以步长为25的间隔采样,得到41个频点,即得到[41,4]的矩阵,即实现了这个超表面单元与其频率响应的对应关系,形成一个数据,这样的数据初始有40000个。训练集、验证集、测试集的比例为8∶1∶1,其中训练集有32000个,为提高网络泛化能力,基于编码超表面单元的特性,通过数据增强的方式将训练集扩大到64000个。
[0100]
步骤二、对编码超表面频率响应快速预测的正向网络进行预训练,实现编码超表面到频率响应的映射;
[0101]
所述正向网络,包括实部子网络rnet、虚部子网络inet,两个子网络为并行联合的形式,且两个子网络采用完全相同的结构;网络单元结构如图4所示,在训练期间更新参数;两个子网络的输入均为表示编码超表面单元表面结构的编码矩阵;两个子网络的输出分别对应超表面频率响应s11的实部和虚部表征,基于幅值、相位与实部、虚部的对应关系,计算得到网络输出的幅值和相位;
[0102]
对编码超表面频率响应快速预测的正向网络进行预训练时,网络使用的误差函数为最小均方误差mse和网络损失函数如下:
[0103]
1)网络使用的误差函数为最小均方误差mse为:
[0104][0105]
其中,为正向网络对编码超表面频率响应s11的预测结果,y为编码超表面的实际频率响应,n为频域内对编码超表面频率响应s11进行等间隔采样得到的频点数;
[0106]
2)预训练时的网络损失函数为:
[0107][0108]
其中,loss_train为网络预训练时的损失函数,re、分别为s11参数的实部真实值、实部子网络预测的实部值,im、分别为s11参数的虚部真实值、虚部子网络预测的虚部值。
[0109]
步骤三、基于步骤二中得到的预训练完备的正向网络,使用lrp将网络输出作为相关性进行后向传播,以卷积核获得的相关性作为结构化剪枝的度量标准对正向网络进行压缩,并对压缩后的正向网络进行再训练;
[0110]
如图5所示,所述结构化剪枝方法,为基于lrp的编码超表面预测网络的结构化剪枝方法,具体步骤如下:
[0111]
步骤a、计算激活值;
[0112]
在训练集中随机选择编码超表面单元作为参考样本,将表征参考样本超材料单元表面结构的编码矩阵输入到步骤二中的预训练完备的正向网络中,正向网络的实部子网络和虚部子网络分别独立进行前向传播,得到实部子网络和虚部子网络中每层的输出值,所述输出值即为激活值,预激活值为未经过层中激活函数的输出值;正向网络的前向传播示意图如图6所示;
[0113]
步骤b、基于lrp的相关性计算;
[0114]
将步骤二中的预训练完备的正向网络输出后向传播至输入层,正向网络的实部子网络和虚部子网络分别独立地将输出后向传播至网络输入层,基于lrp的后向传播示意图如图7所示,基于lrp规则依次获取实部子网络和虚部子网络各层中卷积核与网络输出之间的相关性;具体步骤如下的:
[0115]
步骤1、依据前向传播计算的关联卷积核之间的激活值,前层与后层卷积核之间的相关性由该组卷积核之间关联的预激活值与后层卷积核所有相关联的前层卷积核的总预激活值之比来表示,即相关性的传播公式如下:
[0116][0117]zij
=aiw
ij
[0118]
其中,为第l 1层第j个预激活值的相关性;为第l 1层第j个预激活值传递给第l层第i个激活值的相关性;zj表示第l 1层第j个卷积核与第l层所有关联卷积核的预激活值的总和;z
ij
为第l层第i个卷积核关联的第l 1层第j个卷积核的预激活值;ai为第l层第i个激活值;w
ij
为第l层第i个激活值与第l 1层第j个预激活值之间的权重;
[0119]
步骤2、考虑到zj值较小时可能产生不受控制的值,加入了预先设置的大于0的数ε,原传播公式表示为:
[0120][0121]
步骤3、由于相关性在传播过程中会被ε吸收,使得越靠近输入的卷积层获得的相关性之和越小,从而会使得在不同卷积层中相关性比较没有意义,所以,将传播公式表示为:
[0122][0123]
其中,要求α β=1,该规则将预激活值分为大于0和小于0的两部分,其中

’表示大于0的值,
‘‑’
表示小于0的值,有效避免了出现异常值的问题;
[0124]
在本实施例中,取α=1,β=0,同时考虑到除输出层外所有层的激活值不小于0,则传播公式变为:
[0125][0126]
步骤4、在后向传播时,本实施例并没有把直接把网络输出f(x)作为输出层的相关性,而是令网络输出置1作为相关性传播的起点,以此来获得结构化剪枝的鲁棒性;后向传播时,由于输出层置1作为相关性的起点且传播过程中只考虑不小于0的预激活值,使得网络中所有神经元的相关性不小于0;
[0127]
由上述α=1,β=0时的传播规则可知,在未考虑卷积层偏置项或全连接层偏置项的情况下,不同层的相关性之和相等,即满足:
[0128][0129]
其中f(x)为网络输出,v(l)表示第l层激活值数量,表示第l层第d个激活值的相关性;当考虑卷积层偏置项或全连接层偏置项时,网络传播过程中小部分相关性被偏置项吸收;
[0130]
实部子网络、虚部子网络的相关性之和随后向传播的变化曲线如图8所示,二者呈现相同特性,由图8可见,从网络输出层到网络输入层,相关性总和只是略微减少,这种减少来源于实部子网络中偏置项的吸收,在没有偏置项的层中进行传播时相关性不变。实部子网络、虚部子网络的相关性由各自输出层传播到网络的输入层,可得到超表面每个像素点对输出的贡献程度,即得到如图9所示的超表面单元每个像素点的相关性图;由于在输出层将每个神经元的相关性置1且采用的是α=1,β=0的lrp规则,所以在网络中所有神经元的相关性大于等于0,r越大表示对网络输出的贡献越大,即在网络中越重要;
[0131]
步骤c、计算每个卷积核的相关性;
[0132]
基于lrp规则,将网络输出后向传播至输入端后,网络中所有层的激活值都获得了与网络输出的相关性,对于卷积层而言,卷积核的相关性即为该卷积核输出的所有激活值相关性之和;基于每个卷积核的相关性和网络输出直接相关,以及施加的层与层相关性不
变的约束,使得相关性作为结构化剪枝的衡量标准可解释;无论是卷积核、bn层、池化层、全连接层,相关性都可以进行后向传播,所以lrp在不同网络中的适应性强;
[0133]
步骤d:根据相关性,采用整体剪枝的方式进行结构化剪枝;
[0134]
由于lrp在传播过程中施加的层与层相关性不变的约束,基于lrp的结构化剪枝不需要考虑卷积层的敏感度,即不需要采用分层剪枝的方式;本发明实部子网络和虚部子网络的结构完全相同,二者采用相同的剪枝比例,进行剪枝;
[0135]
结构化剪枝的具体步骤为:对步骤二中训练完备的正向网络的实部子网络和虚部子网络分别单独进行剪枝工作,确定剪枝比例,即被剪卷积核占所有卷积核的比例,根据相关性对所有卷积核进行排序,获得相关性阈值;剪去相关性低于阈值的卷积核和对应输入输出连接,得到压缩后的正向网络。
[0136]
将获得压缩后的正向网络,加入物理约束项,通过再训练的方式恢复正向网络的性能:
[0137]
1)对正向网络再训练的网络损失函数为:
[0138][0139]
其中,loss_retrain为剪枝后网络再训练时的损失函数;λ为超参数;re、分别为s11参数的实部真实值、实部子网络预测的实部值,im、分别为s11参数的虚部真实值、虚部子网络预测的虚部值,amp、分别为s11参数的幅值真实值、幅值预测值,分别为s11参数的相位真实值、相位预测值;幅值预测值和相位预测值可由和计算得到;损失函数中为物理约束项。在本实施例中λ的大小为0.01;
[0140]
2)除了网络输出层,网络中其余层的激活函数为relu,relu的函数表达式为
[0141][0142]
由于编码超表面频率响应实部和虚部的取值范围皆为[-1,1],两个子网络输出层的激活函数为tanh:
[0143][0144]
训练时,选择的是adam优化器,训练次数设置为120轮,初始学习率为1e-3,学习率每训练40轮降低一半。
[0145]
步骤四、将表示编码超表面单元表面结构的编码矩阵输入到步骤三中得到的正向网络中,即可得到超表面频率响应的参数实部曲线、虚部曲线,进而得到幅值和相位值;
[0146]
压缩后的正向网络,可以代替cst对超表面频率响应进行预测,将16*16的表示编码超表面单元表面结构的编码矩阵输入到正向网络中,可获得频率响应s11参数的实部曲线、虚部曲线,从而进行计算得到幅值和相位值。本实施例中正向网络预测的频响s11和单个超表面的实际频响s11(实部表征和虚部表征)的误差较小。
[0147]
本发明使用的正向网络与resnet34具有相当的预测能力,由于resnet34的参差结
构,resnet34共有16个可剪且不受约束的卷积层,可剪卷积核共有3776个,约占总卷积核数量的44.7%,而本发明提出的正向网络可剪卷积核占总卷积核数量的100%,更利于后续结构化剪枝的执行。
[0148]
分别使用本发明的基于lrp的结构化剪枝方法和基于卷积核权重l1范数的结构化剪枝方法对编码超表面频率响应快速预测网络进行压缩,在不对压缩后网络再训练的情况下,对比相同剪枝比例下网络在测试集上的损失变化,本发明中的参考样本为在训练集中随机选择的编码超表面单元。基于卷积核权重l1范数的剪枝方法是静态的,不需要参考样本,在实际测试中不进行层正则化的基于卷积核权重l1范数的剪枝方法对网络压缩效果较差,而基于lrp的剪枝方法从可解释性的角度不需要进行层正则化处理。二者主要是比较相同比例剪枝下网络在测试集上的损失,同时也关注随着参考样本的增多对基于lrp的剪枝方法效果的影响。为了降低随机性,以下基于lrp剪枝方法的结果为随机五次结果的均值。测试结果如下:
[0149]
1)由图10-11可知,单个参考样本的情况下,基于lrp的剪枝方法在多个剪枝比例上并没有获得优于基于卷积核权重l1范数的剪枝方法的压缩效果。
[0150]
2)基于参考样本的测试结果,将lrp参考样本量(随机选取)分别提升至5、10、50,在其中寻找最优方案,结果如图12-13、14-15、16-17所示。
[0151]
由此可见,随着参考样本的提高,在实部子网络与虚部子网络上,基于lrp的剪枝方法相比于基于卷积核权重l1范数的剪枝方法获得的压缩效果更好,压缩后的网络在测试集上损失更小。基于lrp的剪枝方法在提供可解释剪枝(与网络输出的相关性)的同时,不需要对每层卷积核的相关性进行归一化处理,减少了剪枝流程,加快了速度。
[0152]
本发明用基于lrp的结构化剪枝方法,对提出的编码超表面频率响应快速预测的正向网络进行不同比例下剪枝测试,以获得网络参数量、推理速度和网络损失的平衡。实部子网络、虚部子网络进行相同比例的剪枝。剪枝后,加入物理约束项,通过在训练集上再训练20轮恢复精度,网络再训练的学习率设置为0.00003。正向网络对超表面频率响应s11的幅值表征和相位表征的预测能力越强,物理约束项越小;反之越大。原网络参数量为109m,测试集总损失为0.013625,测试集实部损失为0.001787,测试集虚部损失为0.002021,对于4000个样本的测试集的推理时间为15秒(gpu环境)。
[0153]
本发明通过提高剪枝比例来获得损失和网络参数量、推理时间的平衡,如表1所示。表中总损失为网络剪枝后在训练集上再训练二十轮后的测试集损失,总损失可分为幅值损失、相位损失、实部损失、虚部损失,分别代表压缩且再训练的正向网络对超表面频率响应s11的幅值表征、相位表征、实部表征、虚部表征的预测能力。推理时间为压缩后的网络对4000个样本的测试集的推理时间,batch_size都为128。
[0154]
表1、不同剪枝比例下网络测试集损失、参数量、测试集推理时间
[0155]
[0156][0157]
通过表1,可以看到使用基于lrp的剪枝方法对超表面正向预测网络进行压缩,使得正向预测网络参数量大大减少。当剪枝比例为0.5时,模型压缩后且再训练了二十轮的网络在测试集上总损失相比于原网络甚至更低,幅值损失降低了14.7%,相位损失降低了3%,实部损失升高了22.5%,虚部损失升高了4%,但参数量下降了64%,对于整个测试集的推理时间也由原来的15秒变为5秒,模型压缩后且再训练了二十轮的网络对超表面频率响应s11(实部表征和虚部表征)的预测结果和实际频响误差较小。幅值损失的下降说明了网络对超表面频率响应s11的幅值表征的预测能力得到提升,相位损失的下降说明了网络对超表面频率响应s11的相位表征的预测能力得到提升。
[0158]
从上述结果可见,基于lrp的剪枝方法对超表面正向预测网络进行压缩发的方法,可以在保证超表面正向预测网络性能(对频率响应s11的预测能力)基本不变的前提下使得超表面正向预测网络参数量大大减少、推理速度得到明显提升。
[0159]
本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,本发明的保护范围应以所述权利要求的保护范围为准。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献