利用机器学习的半导体制造数据采集仪器的提高的分辨率的制作方法

2021-10-29 22:27:00 来源：中国专利 TAG：光谱半导体披露专利申请图像

利用机器学习的半导体制造数据采集仪器的提高的分辨率
1.相关申请的交叉引用
2.本技术跟据35 u.s.c.
§
119(e)要求于2019年3月15日提交的名称为“deep
‑
learning enhanced spectrometer resolution techniques[深度学习增强的光谱仪分辨率技术]”的美国临时专利申请号62/819,115的优先权权益，该美国临时专利申请的全部披露内容通过援引并入本文。
[0003]
背景
技术领域
[0004]
本披露涉及用于对用于监测半导体处理工艺或监测在半导体衬底上形成的特征的图像和光谱数据进行成像和光谱分辨率改进的技术。具体地，本披露提供了用于向经训练的人工神经网络应用低分辨率图像或光谱数据来生成高分辨率图像或光谱数据的新技术。

背景技术：

[0005]
半导体等离子体蚀刻工艺中广泛使用了宽带紧凑型光谱仪来收集光发射光谱，以用于各种工艺控制目的，比如终点检测。光谱仪系统的信噪比(snr)限定了生成控制信号所依据的信息的质量。snr通常与光谱仪的吞吐量高度地成比例。典型地，光谱仪的性能由几个关键性参数来量化，包括：光谱带宽，即可检测的波长范围；光谱分辨率，即，可解析的最精细光谱特征；光学吞吐量，即，检测器收集的光的百分比。
[0006]
更高分辨率的光谱仪通常将牺牲吞吐量和光谱(波长)范围来获得高分辨率的结果。同样，针对更高吞吐量和更宽光谱范围而设计的光谱仪通常将具有更低分辨率。当前，大部分高分辨率光谱仪没有在维持低分辨率光谱仪的吞吐量和光谱范围的同时解析光谱数据内的更精细细节的能力，尤其是在仪器的成本作为限制性设计因素的情况下。现有的很多光谱仪设计包括设计关键性参数之间的折衷。改善光谱分辨率的一种简单而有效的方式是使用更窄的狭缝作为光谱仪的入口，这有效地缩窄了电荷耦合器件(ccd)检测器上的衍射光谱的每个波长的“图像”；然而，其代价是通过狭缝的光以及对应的信息减少。仅仅通过物理光谱仪设计很难克服分辨率与吞吐量之间的折衷。

技术实现要素：

[0007]
本披露的一个目的是减轻与常规光谱仪相关联的物理设计参数之间的上述折衷。
[0008]
本披露的另一个目的是使得能够使用低分辨率光谱仪来收集光谱数据并能够解析光谱数据或图像内的更精细细节而无需牺牲吞吐量或光谱范围。
[0009]
在本发明概念的一个方面中，提供了一种设备，该设备包括存储器电路系统，该存储器电路系统存储数据集，该数据集指示半导体制造工艺或由其制造的半导体结构的状态。该数据集中的特征能够在受数据分辨率限制的限度内被辨别出。存储器电路系统还存储机器学习模型，该机器学习模型包括参数，这些参数具有受模型训练过程约束的被分配
的相应值。处理器电路通信地耦接到存储器电路系统，并且根据该机器学习模型从该数据集生成输出数据集，使得该输出数据集中的特征能够在受输出数据分辨率限制的限度内被辨别出，该输出数据分辨率比该数据集的数据分辨率更精细。
附图说明
[0010]
图1是其中可以实施本发明概念的示例系统的示意性框图。
[0011]
图2是通过其可以实施本发明的人工神经网络(ann)的示意图。
[0012]
图3是可以用于实施本发明的示例光谱仪的示意图。
[0013]
图4是用于模拟本发明的实施例中的数据的光谱仪入口狭缝及其图像420的示意图。
[0014]
图5是在本发明的实施例中使用的低分辨率光谱仪的欠满和过满实施方式的低分辨率光谱数据的图。
[0015]
图6是在本发明的实施例中使用的高分辨率光谱仪的欠满和过满实施方式的高分辨率光谱数据的图。
[0016]
图7是展示通过其可以实施本发明的示例性训练过程的流程图。
[0017]
图8是展示通过其可以实施本发明的示例性生产过程的流程图。
具体实施方式
[0018]
本发明的概念通过其某些实施例得到最佳描述，在本文中参考附图详细描述了这些实施例，在所有附图中，相似的附图标记指代相似的特征。应当理解，当在本文中使用时，术语“发明”旨在表示下文描述的实施例暗含的发明概念，而并非仅仅表示实施例本身。进一步应理解，一般性发明概念不限于下文描述的例示性实施例，并且应当依据这样的认识来阅读以下描述。
[0019]
词语“示例性”在本文用来意指“用作为示例、实例或例示”。本文指定为示例性的构造、过程、设计、技术等的任何实施例不一定被解释为与其他此类实施例相比更优选或有利。本文指示为示例性的示例的特定质量或适合性既不是有意的，也不应被推断出。
[0020]
另外，本文中包含数学表达式，由此传达的那些原理将被认为利用表达式得到透彻描述。将理解的是，在使用数学运算的情况下，这是用于进行所解释的基本原理的简便描述，除非另外表述，不暗示或不应当推断出任何其他目的。总体上，根据本披露内容将清楚的是本文的数学运算如何涉及本发明以及数学表达式暗含的原理的实施例的意图为何，本领域的普通技术人员将认识到许多技术以执行以数学方式表达的原理的物理表现形式。
[0021]
本披露涉及从由低分辨率(lr)光谱仪或图像捕获装置收集的数据“构建”或生成高分辨率(hr)数据集。换言之，本文披露的技术使得hr光谱仪能够以lr光谱仪的扩展波长范围和较高光吞吐量工作。进一步地，可以使用类似技术的变型来从更低分辨率的图像生成更高分辨率的图像数据。
[0022]
本文描述的发明将深度学习技术与例如由常规光学光谱仪设计收集相对较低分辨率的光谱数据相结合，使用构建于与半导体工艺或半导体衬底上的特征相关联的成对的低分辨率数据集和高分辨率数据集(例如，依据实验的或模拟的)的分析之上的预测模型，以获取更高分辨率的数据。通过这种方式，可以利用与使用现有相对较高分辨率的光谱仪
或成像系统和技术相比成本更低的硬件和更快的循环时间来采集半导体工艺或衬底特征的高分辨率数据。例如，在光谱实施例中，用于定义光谱数据集的质量的关键性标准包括带宽(即，可检测的波长范围)、分辨率(即，可解析的最精细光谱特征)和光学吞吐量(即，检测器收集的光的百分比)。在大部分情况下，通过光谱仪的物理设计折衷来使前述要素彼此平衡，以在最短可能的时间量中实现半导体制造的可预测且有意义的结果(例如，图案、特征或工艺条件)。例如，以更高吞吐量和波长范围为代价，实现获得更高分辨率光谱仪数据集。因此，有利的是获得更高分辨率数据而不用做出这些牺牲。除了光谱实施例之外，还可以将深度学习技术应用于其他低分辨率数据(例如，图像)，以破译出所分析的半导体工艺或衬底特征的更高分辨率的信息或特性。
[0023]
实现这种有利能力的一种方式是构造能够从更低分辨率数据集产生高分辨率数据集的机器学习(ml)模型。理想的是，该模型生成的高分辨率数据可以提供除非通过ml模型来处理此类低分辨率数据否则不容易从低分辨率数据辨别出的信息。该ml模型可以通过以下方式来准备：分析以实验方式或通过模拟来收集的低分辨率训练数据和高分辨率训练数据，以确定可以用于训练人工神经网络(ann)(比如卷积神经网络(cnn))的统计变换或关系。例如，可以训练若干层的cnn以将关于工艺或特征的低分辨率数据与高分辨率数据在统计上进行关联。可以在相似或稍有不同的工艺或特征上收集低分辨率数据和高分辨率数据，以改善数据集之间的统计关系的鲁棒性。通过这种方式，改进ml模型以准确地预测高分辨率结果，并且该模型可以通过将建模结果与实际高分辨率数据进行比较来优化。在验证该模型的准确度和精确度之后，可以将经训练的网络应用于低分辨率数据以生成与半导体工艺或特征相关的对应高分辨率数据或结果。可以使用两个光谱仪来生成表示工艺或衬底特征的对应低分辨率数据集和高分辨率数据集。然而，在其他实施例中，可以通过模拟测量光谱以近似实际工艺条件来生成低分辨率数据集和高分辨率数据集。通过这种方式，可以优化模拟光谱数据，以基于已知或观察到的现象来模拟光谱的具体特性，使得训练数据集可以包括完全模拟的低数据集和高数据集、模拟与实验训练对的组合、或包括模拟数据和实验数据的训练对。
[0024]
图1是其中可以实施本发明概念的示例系统100的示意性框图。出于描述而非限制的目的，系统100可以被构造或以其他方式配置用于半导体制造，其中，制造加工中的大部分发生在一个或多个密封室中，以室5代表性地展示。室5可以包括一个或多个端口(以端口7代表性地展示)，通过这些端口可以监测室5内部发生的工艺，该监测可以通过包括通过光谱技术、光学成像或技术人员已知的其他技术来进行。此类内部工艺可以包括材料沉积和蚀刻，两者都可以利用具有取决于工艺的构成的等离子体。室5内的组分可以通过例如光谱技术来评估。其他工艺可以通过光学成像或电子成像来监测或检查。如技术人员在审阅本披露内容时将认识到的，本发明概念的实施例实施的技术可适用于光谱学的光学采集图像和其他采集图像。
[0025]
系统100可以包括处理器150，该处理器包括通过其存储数据和处理器指令代码的存储器电路系统120、通过其执行数据和控制工艺的处理器电路系统130、以及人类用户通过其与系统100进行接口连接以便除其他外进行数据分析和控制的用户接口电路系统140。如图1所示，存储器电路系统120可以被构造或以其他方式配置为将数据集存储在比如数据存储位置122中，将机器学习模型存储在比如模型存储位置124中，并且将处理器指令代码
存储在比如代码存储位置126中。处理器指令代码可以包括比如在ml引擎代码存储位置127中的ml引擎代码(当ml引擎未硬布线在专用电路系统中时)、以及比如在工艺控制器代码存储位置129中的工艺控制代码。处理器电路系统130可以被构造或以其他方式配置为执行存储在存储器电路系统120中的处理器指令代码，比如以ml引擎132和工艺控制器134所示。
[0026]
系统100还可以包括数据采集机构，以数据采集机构105l和105h代表性地展示。如上所述，可以实施本发明以提高各种不同数据类型的分辨率，这样，代表产生低分辨率数据110l的低分辨率数据采集仪器的仪器105l和代表产生高分辨率数据110h的高分辨率数据采集仪器的105h代表了可以用于收集专用数据(例如图像数据、光谱数据等)的任何数量的装置。将理解，尽管以下描述主要涉及光谱数据集，但在本发明的实施例中也可以使用其他数据。
[0027]
可以在各种条件或变量下收集或生成实验数据或模拟数据，以在低分辨率数据集和高分辨率数据集110l和110h之间建立或定义可预测关系。该关系可以基于工艺条件、特征类型或检测技术之间的公共要素。然而，该关系也可以基于数据集110l和110h之间的差异或不相似要素(例如，装置设置/配置(狭缝大小、视场、孔径大小))来指派。实际上，可以按照多种装置设置/配置选项来收集或生成数据集110l和110h，以获得针对所观测工艺条件或特征的分辨率分布。该训练关系可以将一个或多个低分辨率数据集110l分组到与工艺条件特性相关的一个或多个高分辨率数据集110h，这些工艺条件特性包括但不限于与工艺相关联的化学组成、温度、密度和/或能量或信号。另外，关系可以扩展到室5中实施的工艺条件(例如，设定点)，这些工艺条件可以包括但不限于温度、压力、气体流速、所施加的功率、所施加的电压、旋转速度、平移速度、液体分配速率、液体分配体积。进一步，工艺条件可以包括被布置为相应特性的分布或轮廓的结果的范围。除了工艺条件之外，光谱数据可以表示衬底上一个或多个特征。在这种情况下，特征特性可以包括但不限于特征的厚度、宽度、高度、取向、粗糙度、平坦度、角度、覆盖范围、对准和/或几何轮廓。另外，特征特性可以指特征之间的面积、距离或特征相对于彼此的取向(例如，特征重叠、暴露面积、对准)。生成实验或模拟lr和hr数据集的以上应用中的任何一个都可以用于使用本文描述的技术来训练人工神经网络。
[0028]
系统100可以在两(2)种操作模式下操作：训练模式，其中机器学习模型被配置为提高数据分辨率；以及生产模式，其中基于所配置(经训练)的模型来提高数据分辨率。在生产模式中，通过lr数据采集仪器105l(成像器、光谱仪)获得lr数据集110l(图像、光谱)并将其提供给处理器150。处理器150可以将lr数据集110l传递到ml引擎132，该ml引擎可以根据先前已经训练过的ml模型来处理数据(如下所述)，以提高数据的分辨率。该分辨率提高的数据集可以在用户接口140上呈现，生产人员可以在该用户接口上分析此数据集。在一个实施例中，分辨率提高的数据集被提供给工艺控制器134，通过该工艺控制器分析数据以确定是否已经达到特定目标工艺状态。例如，对分辨率提高的数据集的分析可以揭露室5中的指示工艺终点的特定气体组分。在这样的终点处，工艺控制器134可以指示或以其他方式命令转变工艺或中止室5中发生的所有工艺。
[0029]
图2是通过其可以实施本发明的人工神经网络(ann)200的示意图。本发明不限于特定的ann实施方式，只要实现提高输出数据的数据分辨率的目标即可。在所展示的示例中，ann 200被构造或以其他方式配置为金字塔残差神经网络，其包括输入卷积层210、多个
残差块b1至b
k
(以残差块220和230代表性地展示)、以及输出卷积层240。在ann 200中，1)从ann的输入到输出逐渐增大了内部特征图的大小或特征图通道的数量，并且2)在解决了梯度消失/爆炸问题的捷径中实现了身份映射。
[0030]
在图2的示例性实施例中，可以将lr数据集205a至205m(本文中代表性地称为lr数据集205)提供到输入卷积层210，该输入卷积层除其他可能操作之外将每个数据集205映射到对应特征图215a至215m(本文中代表性地称为(多个)特征图215)。特征图215可以被提供到残差块220(其与ann 200中的所有k个残差块一样)，该残差块可以包括第一卷积层260a、第一激活层265a、第二卷积层260b和第二激活层265b。另外，可以以相应捷径217a至217n(可以在本文中代表性地称为(多个)捷径217)将每个特征图215提供到求和节点225a至225n(本文中代表性地称为(多个)求和节点225)。因此，每个求和节点的输出可以由下式给出：
[0031][0032]
其中，x
k
是第k个残差块的输入，x
k 1
是其输出，ψ是激活函数，(例如，修正线性单元(relu))，*是卷积运算符，和是第k个块的可训练卷积核。应当注意，已经从上述表达式中省略了偏置项。每个卷积层生成的特征图可以由下式给出：
[0033]
γ
k，j
＝∑
i
φ
k，i
*w
k，i，j
β
k，j
ω，
[0034]
其中，γ
k，j
是第k个残差块的第j个卷积层的输出特征图，φ
k，i
是第k个残差块的第i个卷积层的输入特征图，w
k，i，j
是的第i个内核，β
k，j
是可训练偏置项，ω是所有项都设置为1的特征图大小的矩阵。
[0035]
特征图215被残差块220处理并传递到下一残差块，即，残差块230，在该残差块中这些特征图得到类似处理。然而，每个残差块都可以生成维度比前一残差块所产生的更多的特征图(和/或相关联的特征图通道)。例如，残差块220的输入可以包括n个通道227a至227n，残差块220的输出可以包括p个通道232a至232p，其中，p>n。这一维度失配可以例如通过对捷径连接(例如绕过残差块230的捷径连接227a至227n)进行零填充来克服。
[0036]
随着数据集前进通过ann 200并且其维度逐渐增多，可以逐残差块地辨别出越来越精细的特征，以相对于原始数据集205实现分辨率的提高。经处理的特征图进行到输出卷积层240，在此，除了其他可选的处理操作之外，这些特征图被变换成输出数据集245a至245m(本文代表性地称为输出数据集245)。如果ann 200已经训练过，则将输出数据集245提供到ann外部的机构，比如用于数据分析或工艺控制。然而，如果ann 200正在进行训练，则将输出数据集245与被选择为与lr原始数据集205中包含的数据相对应的相应高分辨率训练数据集250a至250m(在本文中代表性地称为hr训练数据集250)进行比较。即，将每个lr原始数据集205与hr训练数据集250相匹配，使得在两者中都呈现，但以不同分辨率呈现相同的特征。在训练中，根据随机初始化函数将lr原始数据集205变换为hr数据集。将经变换的hr数据集与对应的hr训练数据集进行适当比较(比如通过差分)，以确定误差度量。使用这种误差度量来修改ann参数，比如上述和β
k，j
，以使诸如训练损失函数等目标函数最小化(或最大化)。可以将经修改的参数反向传播通过ann 300(以反向传播通道257代表性地展示)，并且可以使用新参数重复该过程以产生其他hr输出数据集。该过程迭代进行，直到已
经实现训练目标为止，比如当可训练网络参数收敛或者当无法实现分辨率的改善时。
[0037]
lr数据集205可以包括lr光谱仪数据，并且hr数据集250可以包括hr光谱仪数据。除了光谱数据本身之外，可以利用与光谱数据相关联的被观测工艺或特征相关的信息来标记hr和lr数据集。取决于基于随机但相似的lr数据集的输入来生成可预测hr结果所需的模型优化的类型，这样的标记可以用于隔离hr/lr数据集的特定方面或使hr/lr数据集的某些方面重叠。可以将hr/lr数据集整理成训练对(这些训练对可以包括一个或多个hr/lr数据集组合)，并且用于基于识别hr/lr训练对之间的关系来训练ann 200。在高层级，训练是迭代过程，其中，使用ml技术将根据ml模型产生的hr数据与用于优化数据集之间的统计关系的hr数据集进行比较。
[0038]
在另一个实施例中，lr数据集205包括可以用于训练ml模型的图像数据。在这种情况下，lr数据集205由lr图像表示，而hr数据集250由hr图像表示。这两种图像可以代表由如上所述的低分辨率数据采集仪器105l和高分辨率数据采集仪器和105h收集的输入数据。除了图像数据之外，可以利用与图像数据相关联的被观测工艺或特征相关的信息来标记hr和lr数据集，使得可以使用标记信息来突出显示数据集之间的差异或相似性。取决于基于随机但相似的lr数据集的输入来生成可预测hr结果所需的模型优化的类型，标记信息可以用于隔离hr/lr数据集的特定方面或使hr/lr数据集的某些方面重叠。将hr/lr数据集整理成训练对(这些训练对可以包括一个或多个hr/lr数据集组合)，并且用于基于识别hr/lr训练对之间的关系使用ml技术来训练ann 200，从而使得ml模型能够使用lr数据集205来预测或创建hr数据集245。
[0039]
应当理解，上文提供的训练示例仅仅是训练本发明的实施例的ann的很多可能性中的一种。在一个实施例中，由数据采集仪器或数据发生器生成的数据集可以被分割为例如：用于训练学习技术的训练集、用于评估模型架构的验证集、以及用于确定该模型是否被适当地推广至不仅仅是用于训练的数据集的测试集。机器学习领域的技术人员将认识到如何使用这样的分割数据集而无需本文阐述的具体细节，并且还将认识到用于实施本发明而不脱离其精神和预期范围的其他机器学习技术。
[0040]
再次返回图1，系统100可以包括高分辨率数据发生器115，通过该高分辨率数据发生器生成模拟数据集以用于模型训练的目的。除了图像和光谱数据之外，还可以使用模拟光谱模型数据来训练ann 200。然而，训练对可以从低分辨率模拟和高分辨率模拟导出，这两种模拟是对来自类似于以下图3所展示的设计的光谱仪的lr和hr光谱仪数据的估计。
[0041]
图3是可以用于实施本发明的示例光谱仪300的示意图。光谱仪300可以遵循车尔尼
‑
特纳(czerny
‑
turner)设计，并且包括入口狭缝310、准直反射镜320、衍射光栅330、折叠式反射镜340和阵列检测器350。光(包括图1的室5中发生的电化学过程中产生的光)通过入口狭缝310进入光谱仪300，并从准直反射镜320反射到衍射光栅330上，在衍射光栅处，入射光被解析为其光谱分量。这些分量从折叠式反射镜340反射到阵列检测器350上，该阵列检测器生成指示所分析的光的光谱内容的电信号。实质上，在阵列检测器350上产生了入口狭缝310的光谱解析图像，可以使用由图1的hr数据发生器115实施的各种光学系统设计/分析技术来模拟这种成像。
[0042]
图4是入口狭缝310及其由光谱仪300的光学系统产生的图像420的示意图。在所展示的实施例中，选择了入口狭缝310上的十二(12)个成像点412a至412l(本文代表性地表示
为成像点412)以进行成像。通过光学设计/分析技术，针对多个所选波长中的每一个，将成像点412转移到阵列检测器350上产生的图像420上，以图像区域425代表性地展示。注意，对于固定大小的狭缝，成像点412的清晰度受到取决于波长的衍射的影响。
[0043]
可以生成针对lr和hr光谱仪的模型数据，模拟来自校准灯的在300nm到900nm光谱上的光，该光在光谱上具有相似强度。出于演示的目的，针对lr和hr实施方式建模了两种不同的光谱仪设计，以形成两组训练对。训练对中的lr数据集使用23um狭缝和1024个ccd来建模，并且通过改变光栅相对于狭缝的放置生成了两个附加的lr数据集。欠满实施例表示与过满实施例相比光栅更接近狭缝定位的光谱仪设计。通过这种方式，lr训练数据集覆盖lr光谱仪设计和/或能力的更宽范围，并且指示这两种不同lr设计之间的性能(例如，snr)差异。例如，图5展示了lr光谱仪设计之间的强度差异，其中，欠满实施例具有比过满实施例更高且更尖锐的轮廓。
[0044]
可以将过满和欠满lr数据集与对应的过满和欠满hr数据集配对。示例hr数据集使用10um狭缝和2048
×
256像素ccd、通过在欠满数据集与过满数据集之间改变光栅距离来生成。图6通过突出强度差异而展示了hr光谱仪设计之间的差异。与lr数据集相反，过满数据集与欠满数据集相比导致了更高强度的信号。
[0045]
一旦ann 200已经训练并验证，就可以将该模型应用于可适用的低分辨率数据集，以输出对应于低分辨率输入的估计高分辨率数据。与该训练方法相比，经训练的模型将接收低分辨率数据(无需高分辨率的对应数据)，并且将该数据应用于该模型以生成对应的高分辨率输出。低分辨率数据可以包括但不限于与半导体处理工艺或半导体衬底上的特征相关的图像或光谱数据。
[0046]
在半导体空间内，根据所观测特征的大小，可以向在宏观应用与微观应用之间的范围内的图像应用深度学习技术。在宏观应用中，所观测的特征可以在整个衬底表面区域到相对较大表面积的区域之间的范围内，以在宏观层面观测和监测工艺趋势。例如，较大表面积的区域可以包括在衬底周边附近延伸的衬底倒角或边缘排除区域(<5mm)。同样，可以观测与边缘排除区域相邻、朝向衬底中心延伸高达20mm的区域，以监测邻近衬底边缘的工艺执行，已知这个区域具有相对于衬底中心的工艺均匀性问题。因此，将衬底的中心和边缘的图像进行比较将有益于观测或检测工艺偏移，或有益于调节工艺以解决原位工艺不均匀或即将产生的工艺不均匀。在一些情况下，根据应用，可以使用中心到边缘的关系来训练低到高模型。在宏观应用中，图像捕获装置可以是产生像素化图像以进行分析的数字系统或模拟到数字系统。在一个实施例中，图像捕获装置可以是ccd相机。相反，相比于宏观应用，微观应用实施例用于观测裸片上的相对较小的特征或裸片内的较小区域。例如，微观应用图像可以具有用于以原子层精度控制和监测工艺的尺度。对晶体管栅极结构(例如，finfet)、晶体管的部件(例如，接触件、隔离件)或后段工艺(beol)特征(例如，金属线间距、通孔)进行原子层控制是极其重要的。在一个实施例中，微观应用图像可以通过扫描电子显微镜(sem)来生成，该扫描电子显微镜利用聚焦的电子束扫描衬底表面/特征，从而提供衬底的形貌和组成信息。可替代地，可以使用光发射光谱技术来生成图像以监测半导体工艺，包括但不限于等离子体处理。
[0047]
图7是展示通过其可以实施本发明的示例性训练过程700的流程图。假设过程700可以访问包括lr和hr数据集(例如，从本文描述的lr和hr光谱仪采集的光谱数据)的匹配对
的数据的训练语料库。训练语料库可以被适当地划分或以其他方式分割成训练体705a、验证体705b和测试体705c。将语料库分割成训练体、验证体和测试体可以遵循机器学习领域中已知的此类技术。实际上，过程700以流程示意图形式表示了可以在本发明的实施例中使用的很多模型构建/训练范式之一。在以下描述中，该模型范式是指上文参考图2描述的范式。将理解的是，图7中的操作顺序和数据流是为了解释简便的目的；也可以使用其他操作顺序和数据流来实施模型构建/训练。
[0048]
如图7中所示，训练体705a可以包括可以通过低分辨率数据采集仪器获得的lr原始数据集707a。在操作710中，根据ann来处理lr数据集707a以产生hr输出数据集715。在操作720中，确定hr输出数据集715与通过高分辨率数据采集仪器获得或通过高分辨率数据发生器模拟的训练数据集709a之间的差异。在操作725中，确定ann参数(权重、偏置)以使目标函数最大化或最小化。在操作730中，将所确定的ann参数反向传播通过ann。
[0049]
一旦训练体用尽，过程700就可以转变到操作735，由此确定该模型是过度拟合数据，还是相反地推广至给定规范。出于此目的，可以通过类似于上文结合训练体705a所述的方式将包括原始lr数据集707b和hr验证集709b的验证体705b应用于经训练的模型。然而，这次重点放在如通过所谓的超参数所表示的模型的架构上，而不是其预测效率上。因此，如果在操作735中发现该模型未很好地推广，可以通过操作740修改其一个或多个超参数。例如，可以去除上文参考图2所述的模型的残差块，或者可以修订每个残差块内的操作块的顺序，等等。技术人员将认识到可以应用很多技术来补救本发明的实施例中的过度拟合。
[0050]
如果在操作735中确定模型推广得很好，则过程700可以转变到操作750，由此确定经训练的模型是否满足性能标准。出于此目的，可以通过类似于上文结合训练体705a和验证体705b所述的方式将包括原始lr数据集707c和hr测试集709c的测试体705c应用于经训练的模型。然而，这次重点是模型的性能，该性能是由准确度(即，来自该模型的预测hr数据集与对观测物的实际测量生成的真实hr数据集的接近程度)和灵敏度(即，hr预测(通过该模型)中以这种方式正确识别的特征的比例)方面的具体性能标准来度量的。如果满足这样的标准，则过程700可以终止。否则，过程700可以转变到操作740，由此再次修改ann超参数。过程700然后可以转变到操作710并从该处继续。
[0051]
图8是展示通过其可以实施本发明的示例性生产过程800的流程图。可以在系统处于生产模式时执行生产过程800。在操作810处，使用lr数据集805来预测对应的hr输出数据集815，其为上述的ann的输出。过程800然后可以转变到操作820，由根据hr输出数据集815来确定工艺状态。如果在操作825中确定达到了目标工艺状态，则生产过程800终止。如果未到达目标工艺状态，则过程800可以利用新采集的lr数据转变到操作810并从该处继续进行。
[0052]
一个实施例包括一种用于训练神经网络以从测得的低分辨率数据提供高分辨率数据的方法。该训练方法可以包括在有形计算机可读存储器中存储与加工室内的半导体工艺或半导体衬底上的特征相关的数据集。数据集可以包括表示工艺或特征的粗糙(低分辨率)数据集、以及表示工艺或特征的详细(高分辨率)数据集，该详细数据集与该粗糙数据集不同。在一个示例中，粗糙数据集和详细数据集之间的差异包括关于工艺或特征的至少一个特性的信息的更宽或更窄范围。使用计算机处理装置来分配粗糙数据集和详细数据集的实例之间的训练关系，并使用神经网络技术来创建模型以至少部分地基于粗糙数据集和详
细数据集之间的训练关系和差异将粗糙数据集与详细数据集进行关联。在一个示例中，对于该至少一个特性，详细数据集包括与粗糙数据集相比更高分辨率的数据。工艺的特性可以是工艺的化学组成、工艺的温度、工艺的密度和/或与工艺相关联的电能。工艺的特性可以包括化学组成、温度、密度和/或电能的分布或轮廓。特征的特性可以包括测得的物理特征，比如特征的厚度、宽度、高度、取向、粗糙度、平坦度、角度、覆盖范围、对准和/或几何轮廓。
[0053]
数据集可以包括工艺或特征的图像、光谱表示或模块模拟。在一个实施例中，数据集至少部分地基于特征或工艺的图像、光谱表示和/或模拟。神经网络技术可以至少部分地基于卷积神经网络技术，并且数据集可以由光谱仪生成。在一些实施例中，粗糙数据集由粗糙光谱仪生成，该粗糙光谱仪具有用于允许光或能量进入粗糙光谱仪的粗糙狭缝，详细数据集由详细光谱仪生成，该详细光谱仪包括允许光或能量进入详细光谱仪的详细狭缝，其中，该详细狭缝包括比粗糙狭缝的对应开口或间隙更小的开口或间隙。数据集还可以由比如电荷耦合器件相机等图像捕获装置生成。可替代地，图像捕获装置可以包括显微镜和相机。
[0054]
训练关系分配至少部分地基于在收集粗糙数据集和详细数据集期间存在的公共要素。该公共要素是半导体工艺的工艺条件或半导体衬底上的特征的特征类型。工艺条件可以包括温度、压力、化学组成、气体流速、所施加的功率、所施加的电压、旋转速度、平移速度、液体分配速率、液体分配体积。特征类型可以包括衬底中的图案或衬底上的图案。在一些示例中，特征类型包括特征的厚度、宽度、高度、长度、取向、粗糙度、平坦度、角度、覆盖范围、对准和/或几何轮廓。特征类型还可以包括特征的临界尺寸、特征的表面积、特征的暴露表面积、特征之间的重叠、特征之间的距离、特征之间的取向和/或特征之间的对准。该方法的训练关系分配可以包括对在工艺期间或在特征上收集的单个粗糙数据集和单个详细数据集进行配对。
[0055]
一个实施例包括一种方法，在此方法期间，在有形计算机可读存储器中存储与半导体工艺或半导体衬底上的特征相关的数据集。该数据集可以包括表示工艺或特征的粗糙(低分辨率)数据集。至少部分地基于与工艺或特征相关的低分辨率数据集与高分辨率数据集之间的差异，将粗糙数据集应用于详细分辨率模型。表示工艺或特征的详细(高分辨率)数据集是使用神经网络技术来生成的，详细数据集与粗糙数据集不同，其中，这些差异至少部分地基于关于工艺或特征的至少一个特性的更大量的信息。神经网络技术可以至少部分地基于卷积神经网络技术。对于该至少一个特性，详细数据集与粗糙数据集相比可以包括更高分辨率的数据，该至少一个特性可以包括：工艺的化学组成、工艺的温度、工艺的密度和/或与工艺相关联的电能，该化学组成、该温度、该密度和/或该电能的分布、均匀性或轮廓，特征的厚度、宽度、高度、取向、粗糙度、平坦度、角度、覆盖范围、对准和/或几何轮廓。
[0056]
数据集可以包括工艺或特征的图像或光谱表示，可以至少部分地基于特征或工艺的图像或光谱表示。数据集可以由光谱仪生成，在某些实施例中，粗糙数据集由粗糙光谱仪生成，该粗糙光谱仪包括用于允许光或能量进入粗糙光谱仪的粗糙狭缝，详细数据集由详细光谱仪生成，该详细光谱仪包括允许光或能量进入详细光谱仪的详细狭缝。详细狭缝可以具有比粗糙狭缝的对应开口或间隙更大的开口或间隙。
[0057]
数据集还可以由图像捕获装置生成，比如包括具有或没有显微镜的电荷耦合器件
相机的那些图像捕获装置。
[0058]
训练关系分配可以至少部分地基于在收集粗糙数据集和详细数据集期间存在的公共要素，还包括向匹配加工室发送调节，其中，该公共要素可以是半导体工艺的工艺条件、半导体衬底上的特征的特征类型、温度、压力、化学组成、气体流速、所施加的功率、所施加的电压、旋转速度、平移速度、液体分配速率、液体分配体积。
[0059]
特征类型可以是衬底中的图案，衬底上的图案，特征的厚度、宽度、高度、长度、取向、粗糙度、平坦度、角度、覆盖范围、对准、几何轮廓，特征的临界尺寸，特征的表面积，特征的暴露表面积，特征之间的重叠，特征之间的距离，特征之间的取向和/或特征之间的对准。
[0060]
存储器电路系统120可以由任何数量的任何类型的常规或其他存储器或存储装置来实施，并且可以是易失性的(例如，ram、高速缓存、闪存等)或非易失性的(例如，rom、硬盘、光学存储装置等)，并且包括任何合适的存储容量。系统中的数据(例如，图像、光谱、模型参数等)存储在存储器电路系统120的存储区域中。
[0061]
处理器电路系统130可以例如是执行存储器中存储的用于过程逻辑的指令的一个或多个数据处理装置，比如微处理器、微控制器、片上系统(soc)或其他固定或可编程逻辑。处理器本身可以是多处理器，并且具有多个cpu、多个核心、包括多个处理器的多个裸片等。另外，处理器电路系统130可以包括专用的机器学习电路系统。显示渲染硬件可以是处理器电路系统的一部分，或者可以是例如单独的图形处理器单元(gpu)。
[0062]
用户接口电路系统140可以包括能够向用户显示信息的任何合适的显示器、屏幕或监视器，例如平板计算机的屏幕或附接到计算机工作站的监视器。用户接口电路系统140可以包括(多个)输入装置，该输入装置可以包括任何合适的输入装置，例如，键盘、鼠标、触控板、触摸输入平板计算机、触摸屏、相机、麦克风、遥控装置、语音合成器等。(多个)输出装置也可以包括在内，例如，扬声器、头戴式耳机、声音输出端口等。
[0063]
如本领域的技术人员将理解的，本发明的各方面可以被实施为系统、方法或计算机程序产品。因此，本发明的各方面可以采用完全硬件实施例、完全软件实施例(包括固件、驻留软件、伪代码等)或在本文中通常被称为“电路”、“模块”或者“系统”的组合软件和硬件方面的实施例的形式。进一步，本发明的各方面还可以采取在一个或多个计算机可读介质中实施的计算机程序产品的形式，该计算机可读介质具有在其上实施的计算机可读程序代码。
[0064]
可以利用(多个)计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读介质可以是例如但不限于电子的、磁性的、光学的、电磁的、红外线的、或半导体系统、设备、或装置，或前述各项的任何合适的组合。计算机可读存储介质的更具体的示例(非详尽列表)将包括以下各项：具有一条或多条导线的电连接、便携式计算机盘、硬盘、固态盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或闪存)、光纤、便携式致密盘只读存储器(cd
‑
rom)、光存储装置、磁存储装置、相变存储器装置或者前述各项的任何合适的组合。在本文献的上下文中，计算机可读存储介质可以是可包含或存储用于由指令执行系统、设备或装置使用或与指令执行系统、设备或装置结合使用的程序的任何有形介质。
[0065]
计算机可读信号介质可以包括具有在其中(例如，在基带中或作为载波的一部分)实施的计算机可读程序代码的传播数据信号。这种传播信号可以采取多种形式中的任何一
种，包括但不限于，电磁的、光的或其任何合适的组合。计算机可读信号介质可以是不是计算机可读存储介质并且可以通信、传播、或输送程序(以用于由指令执行系统、设备或装置使用或与指令执行系统、设备或装置连接)的任何计算机可读介质。可以使用任何合适的介质传输体现在计算机可读介质上的程序代码，这种介质包括但不限于无线、有线、光纤电缆、射频(rf)等，或上述的任何合适的组合。
[0066]
用于执行针对本发明的各方面的操作的计算机程序代码可以按一种或多种编程语言的任何组合来编写，这些编程语言例如为面向对象编程语言(比如，java、python、smalltalk、c 等)、或常规程序编程语言(比如，“c”编程语言或类似的编程语言)。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为独立软件包执行、部分地在用户计算机上执行并部分地在远程计算机上执行、或完全地在远程计算机或服务器上执行。在后一种情况下，远程计算机可以通过包括局域网(lan)或广域网(wan)的任何类型网络连接到用户计算机，或可以进行与外部计算机的连接(例如，使用互联网服务提供商通过互联网)。
[0067]
系统100的各种功能可以通过任何方式分布在任何数量的软件模块或单元、处理或计算机系统和/或电路系统之中，其中，计算机或处理系统可以设置在彼此本地，或远离彼此设置并且经由任何合适的通信介质(例如，lan、wan、内联网、互联网、硬连线、调制解调器连接、无线等)通信。
[0068]
本发明的各方面参考根据本发明的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图来描述。将理解，流程图和/或框图中的每个框以及流程图和/或框图中的框的任何组合可以通过计算机程序指令实施并由处理器电路系统130执行，以生产机器，使得指令创建用于实施流程图和/或框图的一个或多个框中指定的功能/动作的装置。
[0069]
附图中的流程图和框图展示了根据本发明的各个实施例的系统、方法和计算机程序产品的可能实施方式的架构、功能和操作。在这方面，流程图或框图中的每个框都可以表示模块、片段、或代码的一部分，其包括用于实施特定逻辑功能的(多条)可执行指令。还应当注意，在一些替代实施方式中，框中所示的功能可以不按照图中所示的顺序发生。例如，取决于所涉及的功能，可以实际上基本同时执行相继示出的两个框，或有时候可以按相反的顺序执行这两个框。还将注意，可以通过执行特定功能或动作的基于专用硬件的系统或专用硬件和计算机指令的组合来实施框图和/或流程图的每个框及框图和/或流程图中的框的组合。
[0070]
在此所使用的术语仅用于描述特定实施例的目的，并且不旨在对本发明做出限制。如这里所使用的，除非上下文明确指示不包括复数形式，否则单数形式“一个(a)”、“一个(an)”和“所述(the)”意图同样包括复数形式。将进一步理解的是，当在本说明书中使用术语“包括(comprises)”和/或“包括(comprising)”时，其指定陈述的特征、整数、步骤、操作、元件和/或组件的存在，但不排除一个或多个特征、整数、步骤、操作、元件、组件和/或它们的组的存在或添加。
[0071]
以下的权利要求书中的任何和所有装置或步骤加功能要素的对应结构、材料、操作以及等同替换，旨在包括任何用于与在权利要求书中具体指出的其他要素相组合地执行所述功能的结构、材料或操作。
[0072]
以上描述旨在展示本发明概念的可能实施方式，而并非限制性的。在本领域的技
术人员查阅本披露内容后，许多变化、修改和替代方案将变得显而易见。例如，因此，可以替换等效于所示出和描述的部件的部件，可以组合逐个描述的元件和方法，并且可以在很多部件上分布被描述为分立的元件。因此，本发明的范围不应当参考以上描述来确定，而应当参考所附权利要求以及其等同物的全部范围来确定。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：对象位置检测方法、家具位置检测方法及装置与流程

利用机器学习的半导体制造数据采集仪器的提高的分辨率的制作方法

相关文献

最热文献