一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于改进生成对抗网络的超表面单元结构逆设计方法

2022-10-13 00:57:05 来源:中国专利 TAG:


1.本发明涉及电磁超表面设计领域,特别涉及一种基于改进生成对抗网络的超表面单元结构逆设计方法。


背景技术:

2.超表面是由亚波长结构单元所组成的二维超材料,其独特在于对于电磁波的调控能力,能够通过改变超表面的单元结构来获得对不同波段电磁波的调控能力。目前的主要调控目标为电磁波的振幅、相位、极化和角动量等。而在超表面设计中,即使单元结构是简单的图案,其对应的电磁响应特性也可能是复杂的。因此特定的超表面单元结构,其对应电磁响应特性是比较难进行准确计算和获取的。长期以来,对于超表面设计和优化主要依赖于研究人员常年积累的设计经验和稳健的电磁学理论储备来指导一系列的电磁模拟并求解麦克斯韦方程组,直到获得局部优化的解决方案。
3.传统的超表面设计方法通常涉及大量的全波数值模拟(如有限元法(fem)、时域有限差分法(fdtd)和有限积分技术(fit)),这些办法需要复杂的建模过程和大量的仿真测试过程。通常使用电磁仿真软件进行超表面设计和优化需要数百甚至数千个电磁仿真周期,这对于时间和计算资源的消耗是非常巨大的。与此同时,随着研究的推进,超表面单元结构的图案也日渐复杂,进一步提高了设计的难度。最终的验证也需要反复进行试验来实现。
4.随着近几年人工智能相关技术的迅速发展,人工智能的其中一个学科即深度学习技术获得了空前的突破。深度学习算法通过神经网络来推理输入输出对的对应关系,尤其是对没有准确函数或数学对应关系的映射关系有非常不错的拟合效果。因此,引入深度学习来解决超表面设计中所存在的问题是当前较为火热的课题之一。
5.1.专利201910344708.1“一种基于支持向量机算法的电磁超表面设计方法”描述了一种基于自编码器生成网络的深度学习算法模型。但其未采集较为真实的数据集,可能会存在泛化效果较差的问题。
6.2.专利202010260816.3“基于深度学习的电磁超表面设计方法及装置”描述了一种基于深度学习的电磁超表面设计方法及装置。该方法分别构建了前向预测模型和逆向设计模型。但是其输入输出的多样性具有很大限制,受限于超表面单元结构的几何参数。
7.3.南京邮电大学li jiang等人报道了一种基于多层感知机的神经网络模型对纳米结构相位调控超表面进行设计。该网络模型通过处理六个几何参数来准确预测相位值,并通过在输入层和隐藏之间插入一个sigmoid函数、使用mae作为损失函数的方式来解决相位调控超表面逆向设计的相位不连续的问题。但此神经网络模型仅针对六个几何参数的纳米结构相位调控超表面,泛化性和可移植性较低。(jiang l等,“neural network enabled metasurface design for phase manipulation”.optics express,2021,29(2):2521.)
8.4.佐治亚理工大学的zhao cheng liu等人报道了一种基于生成对抗网络的深度神经网络模型。所提出的生成对抗网络模型可以有效地根据输入光谱设计超表面单元图案,具有较好的效果,但网络所采用数据集的超表面图案均较为简单,并且该网络无法解决
超表面设计中存在的一对多对应关系的设计。(liu z等,“a generative model for inverse design of metamaterials supplementary information”.nano letters,2018,18(10):6570-6576.)
9.综上所述,现有的基于深度学习的超表面单元结构逆设计问题如下:
10.1.采用的网络结构单一:大部分网络都采用超表面的电磁响应作为输入,采用超表面单元结构作为输出,其中输出方式一般分为图案化输出和量化的结构参数输出。但是由于网络结构的单一,模型深度不够,其学习和泛化能力都受到了一定的限制,导致其只能处理简单的超表面结构。因此,亟需找寻一种深度足够的神经网络模型来对超表面单元结构进行预测生成,以期能够学习更加复杂的对应关系。
11.2.设计的超表面单元结构单一:目前对于一个电磁响应输入,神经网络通常只能输出一个特定的结果。而超表面单元结构与电磁响应往往存在着一对多的碰撞关系。当神经网络设计的超表面符合电磁响应要求,但是在某些方面如加工难度过高、透光度过低等无法满足设计所需时,神经网络模型就无能为力了,还是只能通过传统的设计方法来设计出符合要求的超表面单元结构。所以亟需找寻一种能够进行一对多映射的网络模型,以期其所设计具有相同电磁响应但是不同单元结构的超表面能够适应不同的场景。
12.3.普通的生成式模型通常难以进行超表面数据集的训练:现有的生成对抗网络仍然无法解决生成对抗网络难以训练的问题,容易在训练过程中存在模式坍塌以及网络崩溃的问题,尤其是在超表面单元结构设计中更为明显。一方面是超表面单元结构以及对应吸收特性之间关系较为复杂,另一方面是超表面单元结构数据集获取和设计难度较高。所以亟需找寻一种能够稳定训练的且能够消除模式坍塌问题的生成式模型。


技术实现要素:

13.本发明提供一种基于改进生成对抗网络的超表面单元结构逆设计方法,其特征在于,所述方法包括:
14.改进生成对抗网络架构,搭建鉴别器模型d,生成器模型g以及训练数据集;取出数据集中的数据,组合后输入鉴别器模型d和生成器模型g,对抗训练鉴别器模型d和生成器模型g,其训练流程为:
[0015]ⅰ、从训练集中取出一组数据;
[0016]ⅱ、将这组数据中的电磁响应、真实类别和m(20≤m≤50)维随机高斯噪声进行拼接;
[0017]ⅲ、将拼接之后的数据输入生成器模型g,生成器模型g经过x次双通道卷积和k次上采样,得到虚假的超表面单元结构,其中x与k的值取决于所需超表面单元结构的尺寸;
[0018]ⅳ、将真实的超表面单元结构、虚假的超表面单元结构与电磁响应拼接,输入鉴别器模型d,鉴别器模型d得到两组输出后,分别取得两组输出的分类损失和wasserstein距离,并更新鉴别器模型d参数;
[0019]

、将拼接之后的数据输入生成器模型g,生成器模型g经过x次双通道的卷积和k次上采样,得到新的虚假的超表面单元结构,其中x与k的值取决于所需超表面单元结构的尺寸;
[0020]ⅵ、将虚假的超表面单元结构与电磁响应拼接,输入进鉴别器模型d,取得输出的
分类损失和wasserstein距离,并更新生成器模型g参数;
[0021]ⅶ、多轮训练之后,生成器模型g和鉴别器模型d的wasserstein距离会趋于稳定,分类损失会趋于0,此时模型训练完毕;
[0022]
输入需求的电磁响应至训练完毕的生成器模型g进行超表面单元结构的逆向设计,得到多组符合要求的超表面单元结构。
[0023]
进一步地,所述的基于改进生成对抗网络的超表面单元结构逆设计方法,训练数据集包括超表面单元结构所属类别,超表面单元结构以及其所对应的电磁响应。
[0024]
进一步地,所述的基于改进生成对抗网络的超表面单元结构逆设计方法,生成器模型g的输入为超表面单元结构所属的真实类别、m(20≤m≤50)维随机高斯噪声和超表面单元结构对应的真实电磁响应,输出为虚假的超表面单元结构;鉴别器模型d的输入为生成器模型g生成的虚假的超表面单元结构、真实的超表面单元结构以及真实的类别,输出为对虚假的超表面单元结构、真实的超表面单元结构类别的预测以及鉴别器模型d与生成器模型g的wasserstein距离。
[0025]
进一步地,所述的所述的基于改进生成对抗网络的超表面单元结构逆设计方法,训练的数据集通过以下方式获取:
[0026]
将超表面单元结构分成n
×
n(8≤n≤64)方格,方格中“1”表示该区域被超表面单元所需材料覆盖,而“0”表示该区域未覆盖,采用电磁仿真软件对k(10000≤k≤40000)组超表面单元结构进行仿真,得到其对应的电磁响应;
[0027]
将超表面单元结构和其对应的电磁响应进行一一组合作为数据集的标签和电磁响应输入,并按照单元结构的样式对超表面单元结构进行分类,作为网络模型的类别输入。
[0028]
进一步地,所述的基于改进生成对抗网络的超表面单元结构逆设计方法,生成器模型g与鉴别器模型d内部采用的是双通道卷积网络,具体包括带上采样的双通道卷积网络和带下采样的双通道卷积网络;其中,一个通道为输入输出的残差拼接,另一个通道为输入输出的通道拼接,并在其中添加了自注意力机制使得网络能够获得超表面整体的信息。
[0029]
进一步地,所述的基于改进生成对抗网络的超表面单元结构逆设计方法,在生成器模型g的输入中添加了m(20≤m≤50)维随机高斯噪声,使其能够在同一电磁响应的输入下,输出多组超表面单元结构。
[0030]
进一步地,所述的所述的基于改进生成对抗网络的超表面单元结构逆设计方法,训练过程中分别参考wasserstein距离和分类损失对算法模型的参数进行更新,具体的,wasserstein距离为:
[0031][0032]
其中pg和p
data
分别为生成器模型g产生的电磁响应和训练集中的真实电磁响应;e表示期望,d代表鉴别器模型d;指wasserstein距离需要满足lipschitz连续性条件;
[0033]
分类目标函数为鉴别器模型d给出的真实的超表面单元结构和生成器模型g生成的超表面单元结构是对应类别的可能性,即:
[0034]
lc=e[logp(c=c∣y)] e[logp(c=c∣y

)]
[0035]
其中e表示期望,c表示当前超表面单元结构所属的真实类别,y为鉴别器模型d给
出的真实的超表面单元结构所属类别,y

鉴别器模型d给出的生成器模型g生成的超表面单元结构所属类别。
[0036]
进一步地,所述的基于改进生成对抗网络的超表面单元结构逆设计方法,定义了随机几何插值结构以作为wasserstein距离的梯度惩罚,使wasserstein距离满足lipschitz连续性条件,带随机几何插值的目标函数为:
[0037][0038]
其中e表示期望,d代表鉴别器模型d,为生成器模型g产生的虚假超表面单元结构,x为训练集中的真实超表面单元结构,为随机几何插值后的超表面单元结构,λ为梯度惩罚的权重。
[0039]
本发明的创新性和良好效果是:
[0040]
1.本发明基于生成对抗网络架构,提出了一种全新的双通道有监督生成式模型,其生成模型受到更多地限制,使得生成的超表面单元结构具有满足要求的电磁响应,其进行超表面结构设计的速度远超传统试错方法。
[0041]
2.本发明提出了一种随机几何插值方法,以使得网络能够适配超表面单元结构,并能够不断探寻新的超表面单元结构,避免因为网络无法满足连续性条件而导致崩溃。
[0042]
3.本发明在有监督生成式模型的基础上引入了m(20≤m≤50)维高斯噪声作为变化量,使得网络可以对一个电磁响应输入产生多组不同的超表面单元结构的输出,设计人员在有不同结构需求的时候能够有更多的选择。
附图说明
[0043]
为了更清楚地说明本发明采用的技术方案,下面对本发明采用或提出的技术方法所需要使用的附图做简要介绍:
[0044]
图1是本发明所述方法的整体流程图。
[0045]
图2是本发明所述生成对抗网络训练流程图。
[0046]
图3是本发明所述生成对抗网络中生成器模型g的结构图。
[0047]
图4是本发明所述生成对抗网络中鉴别器模型d的结构图。
[0048]
图5是本发明所述带上下采样的双通道块。
[0049]
图6是本发明所述无上下采样的双通道块。
[0050]
图7发明所述的随机几何插值示意图。
[0051]
图8本发明所述的数据集制备过程图。
[0052]
图9是本发明所生成的超表面单元结构电磁响应和所需的电磁响应对比图。
[0053]
图10是本发明所述一对多生成超表面单元结构示意图。
[0054]
图11是本发明所生成的超表面单元结构三组实例的吸收特性。
具体实施方式
[0055]
下面将结合本发明的附图,对本发明的所提出的神经网络模型和新技术做一个整体的描述。并以透明吸收型超表面作为实施例。在实现实施例的过程中,对实施例的整体需求为:
[0056]
1.所提出的基于改进生成对抗网络的超表面单元结构逆设计方法能够根据设计人员需求的电磁响应特性来生成对应的吸收型超表面单元结构。
[0057]
2.对于同一个电磁响应特性需求能够得到多个不同的吸收型超表面单元结构供设计人员选择,剔除加工难度过高、透光率过低的超表面单元结构。
[0058]
3.所设计出来的超表面单元结构的电磁响应特性与真实需求的电磁响应特性在吸收频点上接近或者s参数曲线高度重合。
[0059]
针对上述需求,本发明提出了一种基于改进生成对抗网络的超表面单元结构逆设计方法,方法整体流程如图1所示。进一步地,本发明提出了一种双通道的生成对抗网络结构,网络整体训练流程如图2所示。生成器模型g的输入为电磁响应、高斯噪声和电磁响应对应的真实类别,输出为生成的超表面单元结构。鉴别器模型d的输入为超表面单元结构和对应的电磁响应,输出为对生成单元结构、真实单元结构类别的预测以及wasserstein距离。
[0060]
其中网络的目标函数分为分类损失和wasserstein距离两部分,其中wasserstein距离为:
[0061][0062]
其中表示期望,d为鉴别器模型d,为生成器模型g产生的虚假超表面单元结构,x为训练集中的真实超表面单元结构,为随机几何插值后的超表面单元结构,λ为梯度惩罚的权重。
[0063]
分类损失为:
[0064]
lc=e[logp(c=c∣y)] e[logp(c=c∣y

)]
[0065]
其中e表示期望,c表示当前超表面单元结构所属的真实类别,y为鉴别器模型d给出的真实的超表面单元结构所属类别,y

鉴别器模型d给出的生成器模型g生成的超表面单元结构所属类别。
[0066]
因此网络的整体目标函数为:
[0067]
lc和l
[0068]
生成器模型g和鉴别器模型d最小化目标函数的过程中,两个模型都通过调整参数来接近真实的超表面单元结构数据分布。
[0069]
生成器模型g如图3所示,其中上下采样双通道块如图5所示,无上下采样双通道块如图6所示。生成器模型g的输入为对电磁响应进行离散化后的501个频率点、50维度的随机高斯噪声和一个维度的类别相结合的向量。生成器模型g接收输入之后进入多个双通道块进行特征提取,并逐渐上采样得到16
×
16的二值超表面单元结构图像。特别的,在输入中添加高斯噪声可以解决普通神经网络无法进行一对多生成超表面单元结构的问题。
[0070]
鉴别器模型d如图4所示,其中上下采样双通道块如图5所示,无上下采样双通道块如图6所示。鉴别器模型d的输入主要是由电磁响应和超表面单元结构拼接的矩阵,其目的是使鉴别器模型d能够学习到吸收型超表面的电磁响应和超表面单元结构之间的匹配关系。接收到输入以后,经过多个双通道块进行特征提取,并逐渐下采样得到两个1
×
1的向量分别表示可能性和类别。
[0071]
双通道块如图5、图6所示。两种类型的双通道模块除去上下采样部分,其余部分保持一致,具有良好的对称性,能够更好地提取特征。将输入分别与输出进行加和以及拼接,
保证梯度可以向下传递。
[0072]
本发明提出了随机几何插值用于wasserstein距离的梯度惩罚项,使得如图7所示,使模型满足lipschitz连续性条件,能够达到收敛。对于超表面单元结构数据而言,数据中的“1”表示材料部分,“0”表示衬底部分,其他任何的数据无法有效的转换为物理意义。故随机结合生成对抗网络生成的超表面单元结构和真实的超表面单元结构,才能得到具有物理意义的惩罚项,使得网络能够收敛。
[0073]
本发明提供了一种超表面数据集的构建方法,如图8所示,采用emnist字母数据集作为超表面单元结构的参考图案,其包含了16个字母的大小写,保证了超表面单元结构数据集的多样性和丰富性。对数据集中的10万组数据进行全波模拟,挑选其中类间方差最大的12800组作为训练用数据集。
[0074]
对训练完毕的网络分别进行三组测试,其生成的超表面单元结构进行全波仿真的结果与需要的电磁响应对比图如图9所示。可以证明所提出的生成对抗网络模型能够成功识别并构造正确的超表面单元结构图案,相对于真实的电磁响应只有很小的偏差。并且若更改所拼接的噪声向量,可以得到如图10所示的相同电磁响应但是不同性能的超表面单元结构,可以满足不同的设计需求。
[0075]
加工三组超表面单元结构并进行te和tm响应测试,如图11所示,对于te线偏振平面波,三个样件的吸收频点分别为9.03ghz、13.04ghz、14.72ghz,对应吸收率分别为92.61%、99.03%、97.56%;对于tm线偏振平面波,三个样件的吸收频点分别为15.81ghz、13.3ghz、12.8ghz,对应吸收率分别为98.05%、93.34%、97.65%。
[0076]
综上所述,所提出的生成对抗网络模型在经过调整之后,能够进行稳定训练,且适配了超表面数据特征,能够对多种超表面进行结构设计,设计速度远超仿真试错方法。特别的,能够通过不同的噪声输入得到具有相同电磁响应但具有不同单元结构的输出,以应对上述的无法一对多的问题。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献