一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于LSTM神经网络的GaN晶体管行为模型建模方法与流程

2022-03-09 04:19:23 来源:中国专利 TAG:

hemt器件行为模型建模精度低的问题,模型具有较好的泛化能力,主要表现在非线性行为模型中,提出的建模方法展示了强大的外推和内插能力。
7.本发明的技术方案如下:
8.一种基于lstm网络的gan晶体管行为模型的建模方法,具体包括如下步骤:
9.101)搭建lstm神经网络结构;
10.在宽频带状态下,提取gan器件的输入与输出,其中输入特征样本为x
t
,对应的输出特征样本为y
t
,t表示当前时刻,可理解为样本中的一个数据。首先,当前的输入x
t
和之前的短期状态h
t-1
被用来产生四个门参数,f
t
、i
t
、g
t
和o
t
。上一时刻的单元输出和当前时刻的输入被用来决定内部状态的哪些向量应该被更新或保持;遗忘门的信号控制先前的状态信息应该被遗忘多少,而输入门则反应当前单元状态下输入x
t
的影响,最后,输出门控制y
t
或h
t
作为lstm的输出,其中输出y
t
等于h
t
。一个lstm单元结构由以下公式表示:
11.遗忘门:
[0012][0013]
输入门:
[0014][0015][0016]
输出门:
[0017][0018]
状态更新:
[0019][0020][0021]
其中σ()表示sigmoid函数,与tanh()函数均为激活函数,w
hi
,w
hf
,w
ho
和w
hg
是前一个短期状态h
t-1
的权重矩阵,其中w
xi
,w
xf
,w
xo
和w
xg
是输入x
t
的权重矩阵,类似地,bi,bf,bo和bg是偏差项。
[0022]
102)设置网络参数;
[0023]
初始化设计变量,设置迭代次数epochs和批量batch_sizes大小,并导入训练数据;搭建一层lstm层及若干层dense层;选择均方误差作为损失函数;指定具有学习率的全局优化器adam;将训练数据送入网络结构,根据数据特点,采用多维到一维的输入-输出模式。
[0024]
103)通过对学习率、迭代次数epochs、dense层数的设定,确定最佳网络参数及结构来得到最佳行为模型。
[0025]
作为优选,将样本分成小批量样本输入,具体为,将全部输入数据平均分成若干份,设置小批量数据batch_sizes大小为全部是数据量的若干分之一,可以加快模型的提取时间。
[0026]
作为优选,指定具有学习率的全局优化器adam,具体为:
[0027]
adam算法是一种基于低阶矩的自适应估计的一阶梯度优化随机算法,可以解决大规模的高维机器学习问题,该算法可以视为动量法与rmsprop算法的结合,不但使用动量作
为参数更新方向,而且可以自适应调整学习率。
[0028]
adam算法一方面计算梯度平方的指数加权平均,另一方面计算梯度g
t
的指数加权平均
[0029]mt
=β1m
t-1
(1-β1)g
t
ꢀꢀ
公式(7)
[0030][0031]
其中β1和β2分别为两个移动平均的衰减率,通常取值为β1=0.9,β2=0.999。可以把m
t
和g
t
分别看作梯度的均值(一阶矩)和未减去均值的方差(二阶矩)。
[0032]
假设m0=0,g0=0,那么在迭代初期m
t
和g
t
的值会比真实的均值和方差要小,特别是当β1和β2都接近1时,偏差会更大。因此,需要对偏差进行修正:
[0033][0034][0035]
adam算法的参数更新差值为:
[0036][0037]
其中学习率α通常设置为0.001,并且也可以进行衰减,比如
[0038]
作为优选,对于小信号行为模型,所述的宽频带为从1ghz到10ghz宽频带;对于大信号行为模型,所述的输入功率为-20dbm到 30dbm的宽范围。
[0039]
作为优选,对于小信号行为模型,实际测量包括gan hemt器件在固定偏置条件下的四个非线性s参数特性,具有热效应的直流i-v曲线;对于大信号行为模型,实际测量包括gan hemt器件在不同输入功率、不同输入频率下的散射波b21特性。
[0040]
进一步的,测试数据包括gan hemt器件在不同输入功率和不同频率下的散射波b21。
[0041]
本发明相比现有其他技术(支持向量机svr、贝叶斯推论)优点在于:突破了现有gan hemt器件建模技术,能解决现有强非线性器件模型预测精度低的问题,对于小信号行为模型,开发所得器件行为模型具有很好的可行性和准确性。对于大信号行为模型,不仅实现了器件在数据内插时的高精度预测,同时在外插测试中,也能给出合理的预测精度。本发明基于lstm神经网络,开发了gan hemt器件在广泛偏置条件、强非线性状态下的行为预测的模型,获得了较高的精度。基于lstm网络所得的行为模型与实测数据有很好的拟合。
附图说明
[0042]
图1为本发明的lstm网络结构图;
[0043]
图2为本发明的小信号行为模型的拓扑结构图;
[0044]
图3为本发明的测验偏置条件为vgs=0v,vds=0v时小信号s11和s22史密斯原图特性;
[0045]
图4为本发明的测验偏置条件为vgs=0v,vds=0v时小信号s12史密斯原图特性;
[0046]
图5为本发明的测验偏置条件为vgs=0v,vds=0v时小信号s21史密斯原图特性;
[0047]
图6为本发明的直流i-v(ids)曲线;
[0048]
图7为本发明的大信号行为模型的拓扑结构图;
[0049]
图8为本发明的增益曲线;
[0050]
图9为本发明的测验偏置条件为vgs=28v,vds=-3v时,输入频率为5ghz的散射波b21的预测图(内插测试)。
[0051]
图10-1为本发明的测验偏置条件为vgs=28v,vds=-3v时,输入功率为-20dbm的散射波b21的预测图(线性区域);
[0052]
图10-2为本发明的测验偏置条件为vgs=28v,vds=-3v时,输入功率为-5dbm的散射波b21的预测图(线性区域);
[0053]
图11为本发明的测验偏置条件为vgs=28v,vds=-3v时,输入功率为 8dbm、 11dbm和 13dbm的散射波b21的预测图(弱非线性区域);
[0054]
图12为本发明的测验偏置条件为vgs=28v,vds=-3v时,输入功率为 22dbm、 24dbm的散射波b21的预测图(强非线性区域)。
具体实施方式
[0055]
下面结合附图和具体实施方式对本发明进一步说明。
[0056]
如图1至图12所示,一种基于lstm网络的gan晶体管行为模型的建模方法,具体包括如下步骤:
[0057]
101)搭建lstm网络结构步骤:在宽带信号激励下,对gan hemt器件实行建模,所使用的lstm网络结构如图1所示,提取gan器件的输入与输出,其中输入特征样本为x
t
,对应的输出特征样本为y
t
,t表示当前时刻,可理解为样本中的一个数据。首先,当前的输入x
t
和之前的短期状态h
t-1
被用来产生四个门参数,f
t
、i
t
、g
t
和o
t
。上一时刻的单元输出和当前时刻的输入被用来决定内部状态的哪些向量应该被更新或保持。遗忘门的信号控制先前的状态信息应该被遗忘多少,而输入门则反应当前单元状态下输入x
t
的影响,最后,输出门控制y
t
或h
t
作为lstm的输出,其中输出y
t
等于h
t
。一个lstm单元结构可以由以下公式表示:
[0058]
遗忘门:
[0059][0060]
输入门:
[0061][0062][0063]
输出门:
[0064][0065]
状态更新:
[0066][0067][0068]
其中σ()表示sigmoid函数,与tanh()函数均为激活函数,w
hi
,w
hf
,w
ho
和w
hg
是前一个短期状态h
t-1
的权重矩阵,其中w
xi
,w
xf
,w
xo
和w
xg
是输入x
t
的权重矩阵,类似地,bi,bf,bo和bg是偏差项。
[0069]
该晶体管的小信号行为带宽起始在1ghz,截止到10ghz频段上,进行测试。其具体拓扑结构如图2所示,对各组件进行详细说明如下:
[0070]
左侧为输入频率点,右侧的real[sxy],imag[sxy]为对应的特定偏置条件下实测数据得出的s参数特征样本,将该频率点样本作为输入端口的输入,输出则为实测数据得出的s参数的实部和虚部。这样的输入输出样本对应于上述lstm网络的x
t
与y
t

[0071]
该晶体管的大信号行为是在输入功率起始为-20dbm,截止到 30dbm的范围内,偏置条件为vgs=28v,vds=-3v时进行测试。其拓扑结构如图7所示,对各组件进行详细说明如下:
[0072]
左侧为器件端口的入射波的实部与虚部,对应的输出为端口的散射波b21的实部与虚部,将这些数据输入到lstm网络中,同样的,其输入输出样本对应于上述lstm网络的x
t
与y
t

[0073]
102)设置网络参数步骤:初始化设计变量,设置迭代次数epochs和批量batch_sizes大小,并导入训练数据。搭建一层lstm层及若干层dense层。选择均方误差(mse)作为损失函数。指定具有学习率的全局优化器adam。将训练数据送入网络结构,根据数据特点,采用多维到一维的输入-输出模式。
[0074]
103)通过对学习率、迭代次数epochs、dense层数的设定,确定最优网络参数及结构来得到最优行为模型。
[0075]
综上所述,对实际gan hemt器件进行仿真测试,获得该器件在宽频带范围内的s参数特性,包括s11、s12、s21、s22在不同偏置条件下的特性曲线;获得该器件在不同偏置状态下的入射波与散射波b21的特性曲线;对上述测试数据按照本发明的建模方法,实现模型参数提取,获得的该测试晶体管的行为模型参数(包括小信号行为模型、大信号行为模型)。
[0076]
将测试数据与模型仿真数据的进行拟合对比,如图3至图5为工作频率为1ghz到10ghz的特性曲线对比结果,从结果可以看到,提出的模型能很好的预测晶体管的特性,对于给出的某一偏置条件下的s参数在史密斯原图上的表征特性,所提出的模型依然给出很高的预测精度,验证了本方案所提出的器件小信号行为建模技术的有效性,额外的给出了如图6所示的具有热效应的直流i-v(ids)曲线。
[0077]
对于大信号行为而言,如图9至图12为gan器件在不同输入功率与输入频率下的散射波b21的特性曲线。图9给出了频率的内插测试(模型在4.5ghz、5.5ghz下提取,在5ghz下测试),从结果可以看出,在未给出的频率点上,模型很好的预测了散射波b21特性,给出了高精度的预测结果。如图10至图12为晶体管模型的外推能力测试,其用于模型提取与测试的数据在图8中进行了详细说明,从结果可以看出,在仅有少量数据用于模型提取情况下,仍然对未给出的功率点提供了很好的预测结果,相对于现有的其他建模技术(支持向量机svr与贝叶斯推论),所提出的建模技术在保证准确预测的同时给出了很好的建模精度。
[0078]
综上行为模型测试(小信号行为模型、大信号行为模型)表明提出的建模技术有很好的泛化能力,主要表现在内插与外推能力上。
[0079]
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明构思的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献