一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于深度强化学习的复杂阵列天线智能设计方法与流程

2022-03-22 22:23:39 来源:中国专利 TAG:

技术特征:
1.一种基于深度强化学习的复杂阵列天线智能设计方法,其特征在于,天线设计步骤为:步骤一:根据所需要的天线辐射频率,天线辐射方向图,以及所处空间环境的要求,确定天线几何尺寸范围,初始化天线模型设计,建立初始天线辐射金属贴片结构,辐射金属贴片为固定尺寸的矩形;步骤二:设定相应求解空间,求解维度,变量约束条件,寻优目标,寻优目标个数,归一化目标因子,状态空间,收敛条件;步骤三:根据所设计初始天线模型,将天线结构进行离散化建模,利用程序进行相应位置的结构序列生成,利用程序代码控制天线相应位置的结构存在与否,通过随机结构位置的生成形成随机结构的天线形状,对天线电流分布以及天线电磁波辐射进行计算求解,得到天线电磁场分布,利用电磁场计算程序或软件进行电磁场辐射场仿真;步骤四:利用markov decision process进行深度算法学习,根据得到的天线电磁场分布和辐射方向图,形成相应数据库,确定归一化的期望目标,采用bellman optimality方式进行学习过程,采用随机梯度策略实现目标自动逼近,确定回退策略,每一个序列的优化中,若优化结果不收敛,则回退进行继续优化,直至收敛为止,停止学习;或者优化至最优结果位置,停止学习;步骤五:确定结果收敛情况,判定是否实现目标逼近或满足最大迭代次数,如果是则接着执行步骤六,如果否则重复步骤三、四;步骤六:计算天线参数结果并输出,基于优化参数结果进行参数化建模,确定计算结果并导出3d模型;步骤七:结束学习。2.根据权利要求1所述的基于深度强化学习的复杂阵列天线智能设计方法,其特征在于,步骤二中,所述求解维度对应被优化天线的几何尺寸及物理属性参数,所述求解空间对应天线的物理参数变化范围,所述变量约束条件对应优化过程中的天线参数对应关系以及结构参数要求,所述寻优目标对应天线设计的各种辐射性能参数优化目标要求,所述寻优目标个数对应天线设计的辐射性能参数优化目标的个数,所述归一化目标因子表示经过权重处理的多寻优目标归一化期望值,所述状态空间对应相应迭代深度强化学习过程中针对所要优化目标的结果,即所优化出的天线参数情况,所述收敛条件对应深度学习算法学习过程中,所计算的目标函数达到期望的条件;其中所述天线的物理参数变化范围,包括:天线辐射源个数、辐射单元尺寸、辐射单元间距、和整体尺寸,天线介电常数,损耗角正切,频率;整体尺寸取决于所述矩形辐射金属贴片的个数、尺寸和间距。。3.根据权利要求1所述的基于深度强化学习的复杂阵列天线智能设计方法,其特征在于,步骤三中,天线的辐射源由所述固定尺寸的矩形辐射金属贴片构成,每一个辐射源的电磁场等效为其中为场强分布,q为等效电电荷电量,为空间中观察点距离一个辐射源的矢量位置,k为相应空间的状态参量,一系列等效的辐射源辐射组合成为随机结构的不规律辐射单元,计算后得到天线电磁场分布。4.根据权利要求1所述的基于深度强化学习的复杂阵列天线智能设计方法,其特征在
于,步骤四中所需要的辐射方向图由理论公式得出,其中z表示辐射方向,l为辐射源的长度,θ表示观察点到阵列天线中心点的直线和过天线中心点的法向直线的夹角,i
n
(z

)和φ
n
(z

)分别表示辐射源沿着天线的幅度和相位分布。5.根据权利要求1所述的基于深度强化学习的复杂阵列天线智能设计方法,其特征在于,步骤四中,采用所述markov decision process进行深度强化学习具体如下:p(s
t 1
,r
t 1
|s0,a0,r1....s
t
,a
t
)=p(s
t 1
,r
t 1
|s
t
,a
t
);即在状态s
t
时,采取动作a
t
后的状态s
t 1
和收益r
t 1
只与当前动作和状态有关,与历史状态无关。6.根据权利要求1所述的基于深度强化学习的复杂阵列天线智能设计方法,其特征在于,步骤四中,采用加权方式,确定归一化的期望目标,每一种辐射性能参数目标都被赋值为一定权重的期望目标值进行优化,对于n个目标,优化整体目标g,g==w1g1 w2g2 .... w
i
g
i
.... w
n
g
n
式子中w
i
为每种目标的权重系数。7.根据权利要求1所述的基于深度强化学习的复杂阵列天线智能设计方法,其特征在于,步骤四中,采用所述bellman optimality等式执行mdp强化学习过程,v(s)=e[r
t 1
γmax v(s
t 1
)|s
t
=s];q(s,a)=e[r
t 1
γmax q(s
t 1
,a

)|s
t
=s,a
t
=a];式子中γ为长期收益的折扣因子,e表示相应空间和状态下的期望值,a为相应状态下采取的动作。8.根据权利要求1所述的基于深度强化学习的复杂阵列天线智能设计方法,其特征在于,步骤四中,对于任一状态空间s
n
,采用所述随机策略梯度方式stochastic gradient descent method进行多目标逼近计算,δ表示梯度的变化量的一个值,表示梯度算符,表示导数算符,α表示迭代步数相关因子,p表示一个给定的概率函数,也就是说,在相应的状态空间s,输出动作服从一个概率分布;对于每次优化的天线场分布结果,逐渐调整结果梯度,朝最优值逼近。9.根据权利要求1所述的基于深度强化学习的复杂阵列天线智能设计方法,其特征在于,步骤四中,所述回退策略采用如下公式进行收益奖励和惩罚,即奖惩策略:式子中v为响应步骤优化得到的结果,为从第i个结果到第n个结果
的平均值,max(v)为第i个结果到第n个结果的最大值,min(v)为第i个结果到第n个结果的最小值,v
c
(x
i
)为回退策略中,该步骤的优化数值,v
c 1
(x
i
)为采用回退策略后下一步骤中,考虑奖惩策略后得到的值。10.根据权利要求10所述的基于深度强化学习的复杂阵列天线智能设计方法,其特征在于,回退策略中,根据bellman optimality等式,采用公式v

(s)=v(s)[v
c 1
(x
i
)
·
r
(n)
]q

(s,a)=q(s,a)[v
c 1
(x
i
)
·
r
(n)
]进行长期收益和期望求解,其中符号
·
为矩阵内积,v

(s)和q

(s,a)为s状态下,得出采取回退策略和奖惩策略后新的辐射性能参数优化目标的综合期望和收益值。

技术总结
本发明所得到的基于深度强化学习的复杂阵列天线智能设计方法,通过把希望设计的天线将要达到的辐射性能参数目标的设计过程,转换成为一个被优化函数的目标极值寻优过程。利用优化策略,调整被优化函数中多个变量的方法,来实现天线多种物理参数的调整;从而实现被优化函数的最优值,即天线的期望辐射性能。利用该方法,在面对复杂电磁环境和复杂天线设计场景时,可以减小天线设计人员对电磁理论知识和经验的依赖,可以极大的提升复杂阵列天线设计效率和减少天线设计时间。效率和减少天线设计时间。效率和减少天线设计时间。


技术研发人员:陈方园 陈小忠 刘宇峰 李文博
受保护的技术使用者:浙江金乙昌科技股份有限公司
技术研发日:2021.09.23
技术公布日:2022/3/21
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献