一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于前后文宽度学习系统的天线快速优化设计方法与流程

2022-02-22 18:59:40 来源:中国专利 TAG:


1.本发明涉及一种基于前后文宽度学习系统的天线快速设计方法,特别涉及一种新型的基于前后文(auto-context,ac)的训练方法,并成功运用于宽度学习系统(broad learning system,bls),此模型称之为前后文宽度学习系统(auto-context broad learning system,acbls),本发明属于微波电磁技术领域。


背景技术:

2.在微波器件,尤其是天线优化设计领域,在进行优化设计时,很难用一个显式来表达设计变量与目标函数之间的关系,因为其中涉及的数据大部分均为不连续的,即很难能够找到对应的麦克斯韦方程组和边界条件进行精确求解,通常需要借助像高频结构模拟器(high frequency structure simulator,hfss)这类的全波电磁仿真软件来建立这种关系。此类方法计算的结果与实际情况极为吻合,但是,所获得的计算结果的精确程度与耗费的计算时间成正比。故当需要优化的天线较为复杂、尺寸较大时,计算成本高且耗时较长。因此,利用代理模型替代调用全波电磁仿真软件来进行建模分析可以有效节约时间,是天线优化设计的研究热点。目前最常用的有人工神经网络、支持向量机和高斯过程等。但人工神经网络结构难以确定、泛化能力差。支持向量机也存在着核函数难以选择、易过拟合的问题。高斯过程更容易实现、超参数可自适应获取,且其预测输出具有概率意义,但是高斯过程建模时需要采用大量训练数据以保证模型的预测精度,但对于变量数量较多、变量浮动范围较大的复杂结构天线模型时,计算代价极大,而数据量较少时,高斯过程的拟合能力远低于要求。对于拟合能力较强的深度网络,并不适用于作为替代模型使用。原因如下,虽然深层结构神经网络的功能非常强大,但大多数的深层神经网络都需要大量的机器资源和长时间的训练及调参。其中最主要的原因是深层神经网络的结构复杂且拥有大量的待优化参数,对其进行详细的理论分析十分困难;另一方面,在神经网络的训练过程中,常常会通过增加网络的隐藏层数或者调整超参数来得到更高的精度。漫长的网络训练及调参时间使得深层结构神经网络的发展受到了一定的限制。故深度结构并不适用于替代模型使用。
3.因此,近年来一系列以提升训练速度为目的的神经网络逐渐引起了人们的关注。其中,以单隐层前馈神经网络为基础发展而来的宽度学习系统提出了一种不同于深层神经网络的代替方法。此模型是陈俊龙在2017年提出的,是一种相对较新的网络,旨在克服深度学习训练过度耗时的弊端,其结构借鉴了随机向量函数连接神经网络的思想。与传统的单隐层前馈神经网络相比,该模型因其结构简单、训练快速且易扩展的特性受到了学术界的广泛关注,现已成为机器学习领域的研究热点,并成功运用在许多领域。bls以其高效性著称,天线的优化设计中,需要极其精确的电磁关系,而原始bls的泛化能力尽管相对于高斯过程,支持向量机,人工神经网络等网络有着较大的优势,却不足以应用于天线的优化设计,优势在于训练速度快,但是其拟合能力有限,本发明是在现有的bls建模的基础上,提出了一种新型的基于前后文的训练方式,所提出的前后文宽度学习系统的拟合能力相较于原始bls得到了成倍的提升,无论在训练时间还是在精度方面,都足以作为高效的替代模型实
现天线的优化设计。


技术实现要素:

4.本发明的目的是提供一种基于前后文宽度学习系统的天线快速设计方法,提高优化设计的效率。本发明开发了一种基于前后文的新型的模型训练方法,并成功运用于bls,利用当前bls的训练结果作为先验知识,即前后文信息,与原始输入混合作为新的输入,进行再训练,构建的新模型为前后文宽度学习系统。
5.基于前后文宽度学习系统的天线快速优化设计方法,具体实施步骤如下:
6.步骤1:使用hfss获取天线样本数据,作为原始bls的训练样本,其中需要进行优化的天线参数作为输入x,对应的天线的回波损耗s
11
曲线作为输出y,然后将样本分为训练集和测试集;
7.步骤2:使用网格搜索法建立天线的bls回归模型,设置网格搜索的范围,即每个窗口对应的特征节点的数量mg,特征节点窗口的数量fn,以及增强节点的数量en;
8.步骤3:将天线样本数据带入bls模型进行回归建模,根据原始输入随机生成输入权重。bls不直接将原始输入带入网络,而是基于原始数据学习其映射特征得到特征节点;
9.当给定输入输出n为样本的数量,a和b分别为样本的输入以及输入维度,输入数据首先转换为随机的特征节点,使用映射ηi将输入映射为n组特征节点,通常设置为线性映射以减少运算复杂度,第i组特征节点为
10.fi=ηi(xw
ei
β
ei
),i=1,2,

,n
ꢀꢀꢀ
(1)
11.其中,w
ei
和β
ei
是随机生成权重和偏置,将所有特征节点的组合表示为
12.fn=[f1,f2,

,fn]
ꢀꢀꢀ
(2)
[0013]
步骤4:这些特征节点,经过激活函数进行非线性变换得到增强节点,生成增强节点所涉及的权重和偏置均随机生成;
[0014]
所有的特征节点通过非线性变换εj变换为m组增强节点,将第j组增强节点表示为
[0015]ej
=εj(fnw
hj
β
hj
),j=1,2,

,m
ꢀꢀꢀ
(3)
[0016]
同样,权重w
hj
和偏置β
hj
均为随机生成,所有增强节点的组合表示为
[0017]em
=[e1,e2,

,em]
ꢀꢀꢀ
(4)
[0018]
步骤5:特征节点和增强节点两部分构成模型的隐藏层,与输出层相连,设置岭回归参数,使用岭回归算法求解输出权重;
[0019]
得到bls的隐藏层
[0020][0021]
其中,l为隐藏层h的总节点数。宽度学习系统模型的输出为
[0022]
y=hw
ꢀꢀꢀ
(6)
[0023]
其中为连接到输出层的输出权重,由岭回归近似算法得到,如式(7)
[0024][0025]
其中,λ为正则化系数,则输出权重为
[0026]
w=(h
t
h λi)-1htyꢀꢀꢀ
(8)
[0027]
其中,i为单位矩阵。h
t
为h的转置矩阵。当λ

∞时,上述解趋于0,当λ=0时,该问题退化为最小二乘问题,得到输出权重
[0028]
w=h
yꢀꢀꢀ
(9)
[0029]
其中,h 为h的伪逆矩阵,
[0030][0031]
步骤6:使用网格搜索法训练bls,保存bls的最优预测结果,作为先验知识,即前后文信息,与原始输入混合作为新的输入,进行再训练,即重复步骤2-6,完成前后文宽度学习系统的建立;
[0032]
定义yu为对应模型u的预测结果,将此作为前后文信息,与原始输入混合作为每一次迭代的新输入
[0033]
xu=[x|y
u-1
],u=1,2,
…uꢀꢀꢀ
(11)
[0034]
将原始宽度学习系统称之为宽度学习系统模型1,y0为空值矩阵,输入x1即为原始输入x,当前输出则为y1。以此类推,宽度学习系统模型u的输入为xu,输出为yu。首次训练完成后,基于带有前后文信息y
u-1
的新的输入xu,重复步骤2-6建立模型u得到对应的新的输出yu。
[0035]
步骤7:设置迭代终止条件。
[0036]
进一步的:
[0037]
步骤4中,生成特征节点所涉及的权重和偏置均随机生成,且按照以下方式实现:在区间[-1,1]上服从标准的正态分布。
[0038]
步骤5中,使用岭回归算法求解输出权重时对应的岭回归参数λ=2-30

[0039]
步骤6中,由于首次训练没有前后文信息,故将第一次的前后文信息设置为空值。
[0040]
步骤6中,为了节约训练时间,仅保存网格搜索所有结果中的最优预测值作为前后文信息,而不是将每一次的预测结果均传授给下一个宽度模型。
[0041]
步骤7中,迭代终止条件设置为测试误差相比原始误差优化了40%便停止迭代。
[0042]
与现有技术相比,本发明的有益效果是:本发明开发的前后文训练方式,运用于bls,通过前一次的bls训练获取先验知识,传授给下一bls进行进一步的训练,此方法使得模型的拟合能力得到了极大地提升。将基于前后文的宽度学习系统对印刷偶极子天线(printed dipole antenna,pda)进行优化设计,兼具高效性和准确性。
附图说明
[0043]
图1是原始bls的建模结构图;
[0044]
图2是acbls建模结构图;
[0045]
图3是acbls建模流程图;
[0046]
图4是pda的结构图;
[0047]
图5是优化后的pda的仿真结果与真实结果对比图。
具体实施方式
[0048]
下面结合附图和具体实施例对本发明作进一步说明。
[0049]
步骤1:使用hfss获取天线样本数据,作为原始bls的训练样本,其中需要进行优化的天线参数作为输入x,对应的天线的回波损耗s
11
曲线作为输出y,然后将样本分为训练集和测试集;
[0050]
步骤2:使用网格搜索法建立天线的bls回归模型,设置网格搜索的范围,即每个窗口对应的特征节点的数量mg,特征节点窗口的数量fn,以及增强节点的数量en;
[0051]
步骤3:将天线样本数据带入bls模型进行回归建模,根据原始输入随机生成输入权重。bls不直接将原始输入带入网络,而是基于原始数据学习其映射特征得到特征节点;
[0052]
当给定输入输出n为样本的数量,a和b分别为样本的输入以及输入维度,输入数据首先转换为随机的特征节点,使用映射ηi将输入映射为n组特征节点,通常设置为线性映射以减少运算复杂度,第i组映射特征窗口为
[0053]fi
=ηi(xw
ei
β
ei
),i=1,2,

,n
ꢀꢀꢀ
(1)
[0054]
其中,w
ei
和β
ei
是随机生成权重和偏置,将所有特征节点的组合表示为
[0055]fn
=[f1,f2,

,fn]
ꢀꢀꢀ
(2)
[0056]
步骤4:这些特征节点,经过激活函数进行非线性变换得到增强节点,生成增强节点所涉及的权重和偏置均随机生成;
[0057]
此步骤中,生成特征节点所涉及的权重和偏置均随机生成,且按照以下方式实现:在区间[-1,1]上服从标准的正态分布。
[0058]
所有的特征节点通过非线性变换εj变换为m组增强节点,将第j组增强节点表示为
[0059]ej
=εj(fnw
hj
β
hj
),j=1,2,l,m
ꢀꢀꢀ
(3)
[0060]
同样,权重w
hj
和偏置β
hj
均为随机生成,所有增强节点的组合表示为
[0061]em
=[e1,e2,

,em]
ꢀꢀꢀ
(4)
[0062]
步骤5:特征节点和增强节点两部分构成模型的隐藏层,与输出层相连,设置岭回归参数,使用岭回归算法求解输出权重;
[0063]
此步骤中,使用岭回归算法求解输出权重时对应的岭回归参数λ=2-30

[0064]
得到bls的隐藏层
[0065][0066]
其中,l为隐藏层h的总节点数。宽度学习系统的模型的输出为
[0067]
y=hw
ꢀꢀꢀ
(6)
[0068]
其中为连接到输出层的输出权重,由岭回归近似算法得到,如式(7)
[0069][0070]
其中,λ为正则化系数,则输出权重为
[0071]
w=(h
t
h λi)-1htyꢀꢀꢀ
(8)
[0072]
其中,i为单位矩阵。h
t
为h的转置矩阵。当λ

∞时,上述解趋于0,当λ=0时,该问题退化为最小二乘问题,得到输出权重
[0073]
w=h
yꢀꢀꢀ
(9)
[0074]
其中,h 为h的伪逆矩阵,
[0075]
[0076]
步骤6:使用网格搜索法训练bls,保存bls的最优预测结果,作为先验知识,即前后文信息,与原始输入混合作为新的输入,进行再训练,即重复步骤2-6,完成前后文宽度学习系统的建立;
[0077]
此步骤中,由于首次训练没有前后文信息,故将第一次的前后文信息设置为空值。
[0078]
另外,为了节约训练时间,仅保存网格搜索所有结果中的最优预测值作为前后文信息,而不是将每一次的预测结果均传授给下一个宽度模型。
[0079]
定义yu为对应模型u的预测结果,将此作为前后文信息,与原始输入混合作为每一次迭代的新输入
[0080]
xu=[x|y
u-1
],u=1,2,
…uꢀꢀꢀ
(11)
[0081]
将原始宽度学习系统称之为宽度学习系统模型1,y0为空值矩阵,输入x1即为原始输入x,当前输出则为y1。以此类推,宽度学习系统模型u的输入为xu,输出为yu。首次训练完成后,基于带有前后文信息y
u-1
的新的输入xu,重复步骤2-6建立模型u得到对应的新的输出yu。acbls建模图如图2所示,流程图如图3所示。
[0082]
步骤7:设置迭代终止条件。
[0083]
此步骤中,迭代终止条件设置为测试误差相比原始误差优化了40%便停止迭代。
[0084]
应用示例:
[0085]
为了验证本发明用于优化设计天线的可行性,采用所提出的前后文宽度学习系统建模方法对印刷偶极子天线进行实验来验证所提出方法的高效性和准确性。下面示例是对本发明的进一步说明,而不是限制发明的范围:
[0086]
实施例:印刷偶极子天线的优化设计
[0087]
步骤1:使用hfss获取一部分印刷偶极子天线(printed dipole antenna,pda)的样本数据,作为原始bls的训练样本,其中需要进行优化的几个参数作为输入x,对应的天线的回波损耗s
11
曲线作为输出y,最后将样本分为训练集和测试集。
[0088]
以印刷偶极子天线为例,如图4所示,设计指标是工作在2.45ghz。该天线由5个部分组成,分别为介质层、偶极子天线臂、微带巴伦线、微带传输线和天线馈电面。天线介质层的厚度为1.52mm,相对介电常数为4.4。为了达到设计指标,同时优化高频和低频两个天线的各个尺寸参数,其参数取值范围如表1所示,选取5个对天线影响较大的5个变量,每个赋予5个水平,即x=[l1,l2,l3,l4,w3],其中包括传输线长度l1,偶极子一个臂长度l2,巴伦三角形侧边直角边长l3,巴伦三角形底边直角边长l4,微波巴伦长方形部分的宽度w3。单位均为毫米(mm),其他参数为固定值,介质层的厚度h=1.6mm,传输线的宽度w1=3mm,偶极子金属线宽度w2=14mm。
[0089]
表1印刷偶极子天线尺寸参数优化表
[0090][0091]
步骤1:acbls的训练输入集来自于随机选取的31组不重复的[l1,l2,l3,l4,w3]尺寸参数,作为acbls模型的输入,利用仿真软件hfss进行仿真,从而得出对应的回波损耗s
11
参数,并将其作为acbls的输出。工作频率设置在2ghz~3ghz之间,步长设为0.001ghz,故每一组参数样本对应1001个输出,这些输出的集合便为一条s
11
曲线。对于此例,选取其中的25作为训练样本,剩下的6组作为测试样本。根据优化结果,其中一组满足天线标准的尺寸用来拟合s
11
曲线,为[22,21,10,12,3],选择平均百分比误差(average percentage error,ape)作为衡量所提出的算法的性能的标准,如式(21)所示,
[0092][0093]
其中,yi为真实值,yi为预测值,n是输出的个数。
[0094]
步骤2:将样本数据带入bls模型进行训练,采用网格搜索法,设置网格搜索范围[1,10]
×
[1,10]
×
[1,70],来寻找网络的最优结构(fn,mg,en),步长设为1。设置岭回归参数λ为2-30
,除输出权重外,所有的权重和偏置均为随机生成,在区间[-1,1]上服从标准的正态分布。输入权重首先由此方式生成,再由稀疏自动编码器微调以获得更好的特征。对于该例,每个样本对应1001个输出,当ac迭代开始时,对于该搜索范围的设置,bls的训练时间为111.87s,考虑到师徒行为需要持续迭代,当原始bls训练结束后,保存最优的预测值作为固定特征,并将网格搜素的范围压缩至[1,10]
×
[1,10]
×
[1,10]以减少每次迭代所需时间,当前的设置对应的每次迭代时间为26.33s。显然,acbls的训练时间为原始bls的训练时间加上师徒迭代的训练时间,迭代的停止条件为:当前误差至少降为原始误差的40%,第8次迭代满足条件,此时的训练时间共为111.87s(原始bls) 8*26.33s(ac迭代),也就是322.51s。表2的第二行展示了每次迭代模型的最优结构,第三行是当下结构对应的最优回归结果,为了更有效地看清迭代的结果,添加了第四、五行来分别显示每次迭代相对于前一次以及原始数据的优化结果。本实验所使用的计算机配置为intel(r)core(tm)i5-7500 cpu@3.40ghz3.40ghz,ram为4gb.不同优化方法对应的训练时间如表3所示。图5展示了s
11
曲线的拟合图,x轴是扫描频率的范围,y轴是每个频率点对应的值,s
11
在2.45ghz处的值为-23.991db,满足设计要求。可以看出,acbls的预测结果与hfss的仿真结果的两条曲线高度一致,证实了所提出的模型的有效性和高效性,此方法可以作为优秀的替代模型来代替耗时的hfss仿真。由上述实例,验证了本方法在天线优化设计中的可行性,证明了本发明为天线的建模以及快速优化设计提供了一种新的方法。
[0095]
表2 ac迭代结果
[0096][0097]
表3不同方法的时间对比图
[0098][0099]
除上述实施例外,本发明还可以有其他实施方式,凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献