用于训练和测试分类器的设备和方法与流程

2021-12-17 21:07:00 来源：中国专利 TAG：

1.本发明涉及一种用于训练分类器的方法、一种用于评估分类器是否可以用在控制系统中的方法、一种用于操作致动器的方法、一种计算机程序和一种机器可读存储介质、一种分类器、一种控制系统和一种训练系统。

背景技术：

2.jun
‑
yan zhu、taesung park、phillip isola和alexei a. efros的“unpaired image
‑
to
‑
image translation using cycle
‑
consistent adversarial networks”（https://arxiv.org/abs/1703.10593v1）公开了一种用于使用循环一致生成对抗网络进行不成对图像到图像转化的方法。
3.本发明的优点分类器的监督训练需要大量的标记数据。标记数据可以理解为多个数据点，其中每个数据点被分配对应的标签，当被提供相应的数据点时，分类器将预测该对应的标签。例如，描绘城市交通场景的信号可以被分配“城市交通”作为类标签。可以进一步设想，场景中描绘的车辆用分类器将预测的边界框来标记。
4.尤其是在安全关键环境中使用分类器时，例如对于高度自动化或自主的车辆，用大量的标记数据来训练分类器是至关重要的，因为一般来说，如果在训练期间分类器被提供更多（和多样的）数据，则分类器的性能得到改进。至关重要的是实现尽可能高的性能，因为这减轻了在操作期间对分类器的环境进行错误分类的风险，并且后续改进了使用分类器的产品（例如，自主车辆）的安全性。
5.同样，评估分类器的性能需要大量的标记数据作为测试数据集。作为分类器在训练期间看不见的数据——即，分类器在操作期间将面临的数据——上的真实性能是用测试数据集来近似的，测试数据集越大和越多样化，分类器在操作期间的真实性能的近似就越好。
6.手动获得标记数据是麻烦且耗时的工作。因此，合期望的是允许信号的可靠自动标记的方法，该信号然后可以用于训练或测试分类器。
7.具有独立权利要求1的特征的方法的优点在于，它允许以自动和无监督的方式获得信号的标签，即，不需要人类监督。进而，该方法使能生成高度多样且大的数据集，所述数据集可以用作用于增强分类器性能的训练数据集，或用作更可靠地近似分类器性能的测试数据集。

技术实现要素：

8.在第一方面中，本发明涉及一种用于训练分类器的计算机实现的方法，其中分类器被配置为提供表征输入信号的分类的输出信号，并且基于所提供的训练数据集来训练分类器，其中提供训练数据集包括以下步骤：
•ꢀ
提供第一生成器，其中第一生成器被配置为基于所提供的具有第一类特征的输
入信号来提供具有第二类特征的输出信号，或者其中所述生成器被配置为提供掩模（mask）信号，其中所述掩模信号指示输入信号的哪些部分示出第一类特征；
•ꢀ
由第一生成器基于输入信号提供输出信号或掩模信号；
•ꢀ
提供与输入信号相对应的差异信号，其中所述差异信号是基于在输入信号和输出信号之间的差异来提供的，或者其中所述掩模信号被提供为所述差异信号；
•ꢀ
基于对应的差异信号提供对应于输入信号的期望输出信号，其中期望输出信号表征输入信号的期望分类；
•ꢀ
提供至少一个输入信号和对应的期望输出信号作为训练数据集。
9.分类器可以通过将信号馈送到机器学习模型、尤其是卷积神经网络，来获得输出信号。机器学习模型然后可以提供中间输出信号，该中间输出信号可以被提供为分类器的输出信号。此外，分类器可以在将输入信号馈送到机器学习模型、例如从输入信号提取特征之前对其进行适应。附加地，分类器还可以对中间输出信号进行后处理，并且然后将其提供为输出信号。
10.由输出信号表征的分类可以给信号分配一个或多个类标签。替代地或附加地，可以设想输出信号以对象检测的形式表征分类。替代地或附加地，可以设想输出信号表征信号的语义分割。
11.分类器可以接受各种模态的信号，尤其是图像，诸如例如视频图像、雷达图像、lidar图像和/或超声波图像以及热相机图像。附加地，可以设想信号包括来自多个和/或不同传感器模态的数据，例如视频、雷达和lidar图像的组合。
12.替代地或附加地，信号可以包括音频数据，例如来自麦克风的原始或预处理数据。例如，信号可以包括音频记录的mfcc特征序列。
13.基于包括在信号中的内容，可以从多个类为信号分配至少一个类。从该意义上说，具有一类特征的信号可以理解为包括对该类关键的特性的信号。例如，如果图像包含在其上带有单词“停止”的红色八角形标志，则该图像可能被理解为包含类“停止标志”的特征。在另一个示例中，信号可以是包含第一说话者的口语单词的音频序列，其中包含口语单词的序列部分可以被看作类“第一说话者”的特征。
14.信号可以以预定义的形式组织。例如，信号可以被组织成矩阵，例如，如果图像是灰度相机图像或张量，例如，如果图像是rgb相机图像。因此，信号可以被理解为具有表征其被组织的形式结构的大小。例如，图像信号可以具有宽度和高度。附加地，图像信号的大小可以包括指示每个像素长度的特定深度，即，每个像素可以是预定义长度的数字或向量。例如，rgb图像具有三个深度，即对于红色、绿色和蓝色各一个通道，并且每个像素是三维向量。在另一个示例中，灰度图像包括作为像素的标量。
15.音频信号也可以被组织成矩阵或张量。例如，mfcc特征的序列可以被组织成矩阵。在该情况下，矩阵的行可以包含mfcc特征，并且每行可以表示音频信号记录的某个时间点。
16.以预定义的形式组织信号允许计算关于信号的某些操作。例如，如果信号被组织成矩阵或张量，则确定两个信号之间的差异可以分别通过矩阵
‑
矩阵减法或张量
‑
张量减法来实现。
17.信号可以包括不同的子元素。例如，对于图像信号，像素可以被视为子元素。对于音频信号，个体时间步长可以被视为子元素。子元素可以具有向量形式，例如，rgb图像的像
素或音频序列的特征，诸如mfcc特征。子元素可以具有不同的位置。例如，在图像中具有特定的行和列位置，并且音频序列的特征在序列中具有不同的位置。
18.来自不同信号的两个子元素的位置可以相等。因此，可以可能的是使用第二信号的子元素的位置来参考第一信号的第一子元素。例如，考虑两个100乘100像素的单通道图像，在两个信号中的位置（10，12）处存在一个像素，其中数字10指示像素的行索引，并且数字12指示像素的高度索引。
19.生成器可以被视为用于在给定输入信号的情况下提供输出信号的设备。优选地，生成器是生成对抗网络的一部分。
20.如果从输入信号和输出信号获得差异信号，则差异信号可以通过从输出信号减去输入信号或者从输入信号减去输出信号来获得。
21.在本发明的另一方面中，可以进一步设想，提供第一生成器包括训练cyclegan，其中cyclegan包括第二生成器和第三生成器，其中训练cyclegan包括基于所提供的具有第一类特征的输入信号来训练第二生成器以提供具有第二类特征的输出信号，并且基于所提供的具有第二类特征的输出信号来训练第三生成器以提供具有第一类特征的输入信号，并且在训练cyclegan之后将第二生成器提供为第一生成器。
22.循环一致生成对抗网络（cyclegan）是一种机器学习模型，其允许将具有第一类特征的信号变换为第二类特征。为此，可以用包含两类中任何一类的特征的信号来训练cyclegan。以这种方式训练cyclegan是通过使用两个生成对抗网络（gan）来实现的。第一gan被训练为基于具有第一类特征的信号提供具有第二类特征的信号，而第二gan被训练为基于具有第二类特征的信号提供具有第一类特征的信号。每个gan包括生成器和鉴别器，其中生成器生成相应的信号，并且鉴别器评估信号相对于期望的输出是否看起来逼真。例如，如果训练gan将带有停止标志的信号变换成带有速度限制标志的信号，则生成器首先基于带有停止标志的信号提供带有速度限制标志的信号，并且然后鉴别器确定带有速度限制标志的信号相对于带有速度限制标志的其他信号有多逼真。
23.与普通的gan相比，cyclegan在训练期间强加了附加的约束。如果基于第一信号从第一gan提供的第二信号被提供给第二gan，则由第二gan提供的第三信号必须看起来尽可能接近第一信号。这里，如果第一信号和第三信号的相应子元素值尽可能接近，则第三信号可以被理解为看起来尽可能接近第一信号。
24.第一gan的生成器部分可以理解为第二生成器，而第二gan的生成器部分可以理解为第三生成器。
25.基于cyclegan提供第一生成器的优点在于，第一生成器能够准确地获得具有第二类特征的信号，因为cyclegan是当前用于不成对信号到信号转化的最佳表现模型，即，cyclegan的训练以及进而第一生成器不需要将具有第一类特征的信号与具有第二类特征的信号相匹配。这允许在没有针对个体数据点的约束的情况下从两个类中的任何一个收集大量的数据，来示出另一个类的相似内容。这允许用更多的数据训练生成器，并因此改进其性能，即，它在提供信号时的准确度。
26.在本发明的另一方面中，可以进一步设想，基于由第一或第二生成器提供的具有第一类特征的输入信号提供具有第二类特征的输出信号包括以下步骤：
•ꢀ
基于输入信号确定中间信号和掩模信号；
•ꢀ
确定在掩模信号和中间输出信号之间的哈达玛乘积，并提供确定的哈达玛乘积作为第一结果信号；
•ꢀ
确定在掩模信号的逆与输入信号之间的哈达玛乘积，并提供确定的哈达玛乘积作为第二结果信号；
•ꢀ
提供第一结果信号和第二结果信号之和作为输出信号。
27.可以进一步设想，在第二生成器的训练期间，通过优化损失函数来训练生成器，并且将掩模信号的子元素的绝对值之和添加到损失函数。
28.优选地，掩模信号和/或中间信号具有与输入信号相同的高度和宽度。替代地，掩模信号和/或中间信号可以被缩放为与输入信号具有相同的大小。将掩模信号与中间信号相乘可以理解为逐子元素的乘法，即，在第一结果信号中的位置处的第一子元素可以通过将在掩模信号中的位置处的掩模子元素与在中间信号中的位置处的中间子元素相乘来获得。第二结果信号中的第二子元素可以经过必要的修改后获得。
29.可以通过从与掩模信号具有相同形状的信号减去掩模信号来获得掩模信号的逆，其中信号的子元素是单位向量。
30.可以设想，掩模信号具有深度一，在这种情况下，可以通过首先沿着深度维度堆叠掩模信号的副本以形成与输入信号的深度匹配的新的掩模信号，并且然后使用新的掩模信号作为掩模信号来计算哈达玛乘积，来实现对个体哈达玛乘积的确定。
31.还可以设想，掩模信号由范围从0到1的标量子元素组成。这样，掩模操作可以被视为将中间信号混合在输入信号之上，以便提供输出信号。
32.由第二生成器提供掩模信号的优点是掩模信号允许仅改变输入信号的小区域，以便获得输出信号。通过在训练期间将掩模信号中的绝对值之和加到损失函数，该特性甚至被进一步增强。这激励生成器在掩模信号中提供尽可能少的非零值。这具有如下效果：输入信号仅在包含第一类的不同特征的区域中被改变，该区域需要被改变以便提供具有第二类特征的输出信号。进而，这允许更准确地找到第一类的不同特征，并且因此改进期望输出信号的准确度。
33.在本发明的另一方面中，可以进一步设想，提供期望输出信号包括：确定差异信号的子元素的范数值，其中范数值对应于子元素；并将范数值与预定义阈值进行比较。
34.子元素的范数值可以通过计算子元素的l
p
范数（诸如欧几里德范数、曼哈顿范数或无穷范数）来确定。
35.该方法的优点在于，具有大于1的深度的差异信号仍然可以与预定义阈值进行比较，以便确定类的不同特征位于输入信号中何处。这允许对具有大于1的深度的输入信号采用所提出的方法。
36.在本发明的另一方面中，可以进一步设想，输出信号包括至少一个边界框，其中通过如下操作来提供边界框：确定差异信号中包括多个子元素的区域，其中多个子元素包括其对应的范数值不落入阈值以下的子元素；并且提供该区域作为边界框。
37.该区域优选为矩形区域，其中矩形区域的每个边平行于差异信号的一个边。优选地，该区域正好延伸到包括来自多个子元素的子元素那么远。替代地，也可以设想使该区域围绕多个子元素延伸预定义量的子元素，即，边界框被填充。可以进一步设想，预定义量也取决于多数个子元素的量。例如，预定义量可以通过将多数个子元素的量乘以恒定值来确
定。
38.可以设想，来自信号的多个区域被作为边界框返回。多个区域可以例如通过差异信号的连接分量分析来确定，其中，当且仅当差异信号的子元素的对应范数值不落入阈值以下时，才针对连接分量考虑所述子元素。
39.该方法的优点是，边界框是在没有人类监督的情况下自动生成的，这进而可以用作用于训练分类器来分类信号中的对象的标签。由于不需要人类监督，该过程可以应用于大量的信号，然后可以将所述大量的信号用来训练分类器。这使得分类器能够从更多的信号学习信息，并且进而使得其能够实现更高的分类性能。
40.在本发明的另一方面中，可以进一步设想，期望输出信号包括输入信号的语义分割信号，其中提供语义分割信号包括以下步骤：
•ꢀ
提供与差异信号具有相同高度和宽度的信号；
•ꢀ
确定差异信号中子元素的范数值，其中子元素在差异信号中具有位置；
•ꢀ
如果范数值落入预定义阈值以下，则将信号中该位置处的子元素设置为属于第一类，并且否则将该子元素设置为背景类；
•ꢀ
提供该信号作为语义分割信号。
41.将信号中的子元素设置为类可以理解为设置子元素的值，使得它表征子元素对于特定类的成员资格。例如，信号可以具有深度1，并且如果范数值落入阈值以下，则子元素可以被分配值0以指示对于第一类的成员资格，并且否则为1。
42.该方法可以被理解为确定需要改变哪些子元素来将信号从具有第一类特征变换为具有第二类特征。因此，所确定的子元素确实包含第一信号中的第一类特征。所有其他子元素可以被认为是背景类，即，不包含相关特征。
43.该方法的优点在于，语义分割信号是在没有人类监督的情况下自动确定的，其进而可以用作用于训练分类器来执行信号的语义分割的标签。由于不需要人类监督，因此该过程可以在短量时间内应用于大量信号。所述信号然后可以用来训练分类器。这使得分类器能够在相同量的时间内从比人类可以确定的更多的标记信号中学习信息，并进而使得其能够实现更高的分类性能。
44.在另一方面中，本发明涉及一种用于确定分类器是否可以用在控制系统中的计算机实现的方法，其中，当且仅当分类器在测试数据集上的分类性能指示相对于阈值的可接受准确度时，分类器才可以用在控制系统中，其中，提供测试数据集包括以下步骤：
•ꢀ
提供第一生成器，其中第一生成器被配置为基于所提供的具有第一类特征的输入信号来提供具有第二类特征的输出信号，或者其中所述生成器被配置为提供掩模信号，其中所述掩模信号指示输入信号的哪些部分示出第一类特征；
•ꢀ
由第一生成器基于输入信号提供输出信号或掩模信号；
•ꢀ
提供与输入信号相对应的差异信号，其中所述差异信号是基于在输入信号和输出信号之间的差异来提供的，或者其中所述掩模信号被提供为所述差异信号；
•ꢀ
基于对应的差异信号提供对应于输入信号的期望输出信号，其中期望输出信号表征分类器在被提供输入信号时应提供的期望分类；
•ꢀ
提供至少一个输入信号和对应的期望输出信号作为测试数据集。
45.用于生成测试数据集的方法与本发明第一方面中描述的用于生成训练数据集的
方法等同。
46.取决于分类器的任务，分类性能可以用针对单个标签信号分类的准确度——针对对象检测的（均值）平均精度或针对语义分割的（均值）交并比——来度量。还可以设想，负对数似然被用作分类性能度量。
47.本发明该方面的优点在于，所提出的方法允许获得对分类器内部工作的洞察。它可以充当确定其中分类性能不足以使分类器用于产品中的情形的手段。例如，所提出的方法可以被用作以下的一部分：确定在至少部分自主的车辆中用于检测行人的分类器是否具有足够高的分类性能以被安全地用作至少部分自主的车辆的一部分。
48.可以设想，用于测试分类器的方法被迭代地重复。在每次迭代中，在测试数据集上测试分类器，以确定分类性能。如果性能不足以使分类器用于产品中，则可以通过例如在优选通过根据本发明第一方面的方法生成的新训练数据上训练分类器来增强该分类器。该过程可以重复，直到分类器在测试数据集上实现足够的性能。替代地，可以设想，在每次迭代中确定新的测试数据集。
附图说明
49.将参考以下各图更详细地讨论本发明的实施例。各图示出了：图1
ꢀꢀꢀꢀ
控制系统，包括控制致动器环境中的致动器的分类器；图2
ꢀꢀꢀꢀ
控制至少部分自主的机器人的控制系统；图3
ꢀꢀꢀꢀ
控制制造机器的控制系统；图4
ꢀꢀꢀꢀ
控制自动化个人助理的控制系统；图5
ꢀꢀꢀꢀ
控制访问控制系统的控制系统；图6
ꢀꢀꢀꢀ
控制监控系统的控制系统；图7
ꢀꢀꢀꢀ
控制成像系统的控制系统；图8
ꢀꢀꢀꢀ
用于训练分类器的训练系统；图9
ꢀꢀꢀꢀ
描绘用于提供用于训练的数据集的方法的流程图；图10
ꢀꢀꢀ
基于掩模信号提供输出信号的生成器。
具体实施方式
50.图1中示出的是在致动器（10）的环境（20）中的致动器（10）的实施例。致动器（10）与控制系统（40）交互。致动器（10）及其环境（20）将统称为致动器系统。在优选均匀间隔的时间点，传感器（30）感测致动器系统的状况。传感器（30）可以包括若干个传感器。优选地，传感器（30）是拍摄环境（20）的图像的光学传感器。传感器（30）的输出信号（s）（或者，在传感器（30）包括多个传感器的情况下，每个传感器的输出信号（s））被传输到控制系统（40），该输出信号（s）对感测到的状况进行编码。
51.因此，控制系统（40）接收传感器信号（s）流。然后，它取决于传感器信号（s）流计算一系列致动器控制命令（a），然后传感器信号（s）流被传输到致动器（10）。
52.控制系统（40）在可选的接收单元（50）中接收传感器（30）的传感器信号（s）流。接收单元（50）将传感器信号（s）变换成输入图像（x）。替代地，在没有接收单元（50）的情况下，每个传感器信号（s）可以被直接取作输入图像（x）。输入图像（x）例如可以作为来自传感器
信号（s）的摘录（excerpt）给出。替代地，传感器信号（s）可以被处理以产生输入图像（x）。输入图像（x）包括对应于由传感器（30）记录的信号的图像数据。换句话说，根据传感器信号（s）提供输入图像（x）。
53.输入图像（x）然后被传递到分类器（60）。
54.分类器（60）由存储在参数存储装置（st1）中并由其提供的参数（）参数化。
55.分类器（60）从输入图像（x）确定输出信号（y）。输出信号（y）包括将一个或多个标签分配给输入图像（x）的信息。输出信号（y）被传输到可选的转换单元（80），该转换单元（80）将输出信号（y）转换成控制命令（a）。致动器控制命令（a）然后被传输到致动器（10），用于相应地控制致动器（10）。替代地，输出信号（y）可以直接取作致动器控制命令（a）。
56.致动器（10）接收致动器控制命令（a），被相应地控制，并实行对应于致动器控制命令（a）的动作。致动器（10）可以包括控制逻辑，该控制逻辑将致动器控制命令（a）变换成另外的控制命令，该另外的控制命令然后用于控制致动器（10）。
57.在另外的实施例中，控制系统（40）可以包括传感器（30）。在再另外的实施例中，控制系统（40）替代地或附加地可以包括致动器（10）。
58.在一个实施例中，例如通过将道路表面和/或道路上的标记分类并将车道标识为标记之间的道路表面斑块，分类器（60）可以被设计成标识前方道路上的车道。基于导航系统的输出，然后可以选择用于追逐所选路径的合适车道，并且取决于当前车道和目标车道，然后可以决定车辆（100）是切换车道还是停留在当前车道中。致动器控制命令（a）然后可以通过例如从对应于所标识的动作的数据库中检索预定义的运动模式来计算。
59.替代地或附加地，分类器（60）可以被配置为检测道路标志和/或交通灯。在标识道路标志或交通灯时，取决于道路标志的标识类型或交通灯的标识状态，然后可以从例如数据库中检索针对车辆（100）的可能运动模式的对应约束，可以根据约束计算车辆（100）的轨迹，并且可以计算致动器控制命令（a）以使车辆（100）转向以便沿着轨迹导航。
60.替代地或附加地，分类器（60）可以被配置为检测行人和/或车辆。在标识行人和/或车辆时，可以估计行人和/或车辆的预计未来行为，并且基于估计的未来行为，然后可以选择轨迹以便避免与标识的行人和/或车辆碰撞，并且可以计算致动器控制命令（a）以使车辆（100）转向以便沿着轨迹导航。
61.在仍另外的实施例中，可以设想控制系统（40）代替致动器（10）或附加于致动器（10）而控制显示器（10a）。
62.此外，控制系统（40）可以包括处理器（45）（或多个处理器）和在其上存储指令的至少一个机器可读存储介质（46），该指令如果被实行，则使得控制系统（40）实行根据本发明一个方面的方法。
63.图2示出了实施例，其中控制系统（40）用于控制至少部分自主的机器人，例如至少部分自主的车辆（100）。
64.传感器（30）可以包括一个或多个视频传感器和/或一个或多个雷达传感器和/或一个或多个超声波传感器和/或一个或多个lidar传感器和/或一个或多个位置传感器（例如，像gps）。这些传感器中的一些或全部优选但不是必须集成在车辆（100）中。
65.替代地或附加地，传感器（30）可以包括用于确定致动器系统的状态的信息系统。这样的信息系统的一个示例是确定环境（20）中天气的当前或未来状态的天气信息系统。
66.例如，使用输入图像（x），分类器（60）可以检测在至少部分自主的机器人附近的对象。输出信号（y）可以包括表征对象位于至少部分自主的机器人附近何处的信息。然后可以根据该信息确定致动器控制命令（a），例如为了避免与检测到的对象碰撞。
67.优选集成在车辆（100）中的致动器（10）可以由车辆100的制动器、推进系统、发动机、传动系或转向系统给出。可以确定致动器控制命令（a），使得控制该致动器（或多个致动器）（10），使得车辆（100）避免与检测到的对象碰撞。检测到的对象也可以根据分类器（60）认为它们最有可能是什么——例如行人或树木——来分类，并且致动器控制命令（a）可以取决于分类来确定。
68.在另外的实施例中，至少部分自主的机器人可以由另一个移动机器人（未示出）给出，该另一个移动机器人可以例如通过飞行、游泳、潜水或行走来移动。该移动机器人尤其可以是至少部分自主的割草机，或者至少部分自主的清洁机器人。在所有以上实施例中，可以确定致动器命令控制（a），使得移动机器人的推进单元和/或转向系统和/或制动器被控制，使得移动机器人可以避免与所述标识的对象碰撞。
69.在另外的实施例中，至少部分自主的机器人可以由园艺机器人（未示出）给出，该园艺机器人使用传感器（30）、优选光学传感器来确定环境（20）中植物的状态。致动器（10）可以控制用于喷射液体的喷嘴和/或例如刀片的切割设备。取决于标识的植物品种和/或标识的植物状态，可以确定致动器控制命令（a），以使得致动器（10）向植物喷射合适量的合适液体和/或切割植物。
70.在再另外的实施例中，至少部分自主的机器人可以由家用电器（未示出）给出，该家用电器例如像洗衣机、炉子、烤箱、微波炉或洗碗机。例如光学传感器之类的传感器（30）可以检测将经历由家用电器处理的对象的状态。例如，在家用电器是洗衣机的情况下，传感器（30）可以检测洗衣机内部的衣物的状态。然后可以取决于检测到的衣物材料来确定致动器控制命令（a）。
71.图3中示出的是实施例，其中控制系统（40）用于控制制造机器（11）、例如制造系统（200）的冲压刀具、刀具或枪钻，例如作为生产线的一部分。控制系统（40）控制致动器（10），该致动器（10）进而控制制造机器（11）。
72.传感器（30）可以由光学传感器给出，该光学传感器捕获例如制造产品（12）的特性。分类器（60）可以根据这些捕获的特性来确定制造产品（12）的状态。然后，控制制造机器（11）的致动器（10）可以取决于制造产品（12）的确定状态被控制，以用于制造产品（12）的后续制造步骤。替代地，可以设想，在后续制造的产品（12）的制造期间取决于制造产品（12）的确定状态来控制致动器（10）。
73.图4中示出的是实施例，其中控制系统（40）用于控制自动化个人助理（250）。传感器（30）可以是光学传感器，例如用于接收用户（249）的手势的视频图像。替代地，传感器（30）也可以是音频传感器，例如用于接收用户（249）的语音命令。
74.控制系统（40）然后确定用于控制自动化个人助理（250）的致动器控制命令（a）。致动器控制命令（a）根据传感器（30）的传感器信号（s）来确定。传感器信号（s）被传输到控制系统（40）。例如，分类器（60）可以被配置为例如实行手势识别算法以标识用户（249）做出的手势。控制系统（40）然后可以确定致动器控制命令（a），用于传输到自动化个人助理（250）。然后，它向自动化个人助理（250）传输致动器控制命令（a）。
75.例如，可以根据由分类器（60）识别的所标识的用户手势来确定致动器控制命令（a）。它可以包括使得自动化个人助理（250）从数据库中检索信息并以适合由用户（249）接收的形式输出该检索信息的信息。
76.在另外的实施例中，可以设想，代替自动化个人助理（250），控制系统（40）控制根据所标识的用户手势控制的家用电器（未示出）。家用电器可以是洗衣机、炉子、烤箱、微波炉或洗碗机。
77.图5中示出的是实施例，其中控制系统（40）控制访问控制系统（300）。访问控制系统（300）可以被设计成物理控制访问。例如，它可以包括门（401）。传感器（30）可以被配置为检测与决定是否准许访问相关的场景。例如，它可以是用于提供图像或视频数据的光学传感器，例如用于检测人脸。分类器（60）可以被配置为解释该图像或视频数据，例如通过将身份与存储在数据库中的已知人进行匹配，从而确定该人的身份。然后可以取决于分类器（60）的解释、例如根据确定的身份来确定致动器控制信号（a）。致动器（10）可以是取决于致动器控制信号（a）打开或关闭门的锁。非物理的逻辑访问控制也是可能的。
78.图6中示出的是实施例，其中控制系统（40）控制监控系统（400）。该实施例在很大程度上与图5中所示的实施例等同。因此，将仅详细描述不同的方面。传感器（30）被配置为检测被监控的场景。控制系统（40）不一定控制致动器（10），但是可以替代地控制显示器（10a）。例如，分类器（60）可以确定场景的分类，例如，光学传感器（30）检测到的场景是否可疑。传输到显示器（10a）的致动器控制信号（a）然后可以例如被配置为使得显示器（10a）取决于所确定的分类来调整显示的内容，例如，以突出显示被分类器（60）认为可疑的对象。
79.图7中示出的是用于控制成像系统（500）的控制系统（40）的实施例，该成像系统（500）例如是mri装置、x光成像装置或超声波成像装置。传感器（30）例如可以是成像传感器。分类器（60）然后可以确定感测图像的全部或部分的分类。然后可以根据该分类选择致动器控制信号（a），从而控制显示器（10a）。例如，分类器（60）可以将感测图像的区域解释为潜在异常。在该情况下，可以确定致动器控制信号（a）以使得显示器（10a）显示图像并突出显示潜在异常区域。
80.图8中示出的是用于实行分类器（60）的训练的训练系统（140）的实施例。为此，训练数据单元（150）访问计算机实现的训练数据库（st2），其中存储了训练数据的至少一个集合（t）。集合（t）包括图像和对应的期望输出信号对。
81.训练数据单元（150）然后向分类器（60）提供一批图像（x
i
）。该批图像（x
i
）可以包含来自集合（t）的一个或多个图像。分类器（60）然后通过确定该批中每个图像的输出信号，从该批图像（x
i
）确定一批输出信号（）。该批输出信号（）然后被传递到更新单元（180）。附加地，训练单元（150）将一批对应的期望输出信号（y
i
）传递到更新单元，其中该批对应的期望输出信号（y
i
）包括该批图像（x
i
）中每个图像的对应的期望输出信号。
82.基于该批输出信号（）和该批期望输出信号（y
i
），更新单元然后使用例如随机梯度下降来确定分类器（60）的更新的参数集（）。然后，更新的参数集（）存储在参数存储装置（st1）中。
83.在另外的实施例中，训练过程然后被重复期望的迭代量，其中在每次迭代中，参数存储装置（st1）将更新的参数集（）提供为参数集（）。
84.此外，训练系统（140）可以包括处理器（145）（或多个处理器）和在其上存储指令的
至少一个机器可读存储介质（146），该指令如果被实行，则使得训练系统（140）实行根据本发明方面的训练方法。
85.图9中示出的是描绘用于确定图像集合（t）和期望输出信号的方法的流程图。
86.在第一步骤（901）中，该方法提供第一生成器。通过在具有第一类特征的第一数据集（d1）的图像上和具有第二类特征的第二数据集（d2）的图像上训练cyclegan来提供第一生成器。cyclegan被训练，以将来自第一数据集（d1）的图像变换为看起来像来自第二数据集（d2）的图像。然后，负责从第一数据集（d1）变换到第二数据集（d2）的cyclegan生成器被提供为第一生成器。
87.在第二步骤（902）中，新数据集（d
n
）的图像然后被提供给生成器。对于每个图像，生成器提供输出图像。
88.在第三步骤（903）中，通过从新数据集（d
n
）的对应输出图像减去该图像来为新数据集（d
n
）的每个图像确定差异图像。在另外的实施例中，可以设想通过从图像减去输出图像来确定差异图像。
89.在第四步骤（904）中，基于对应于图像的差异图像，为每个图像确定期望输出信号。例如，期望输出信号可以包括指示图像中某些对象存在的边界框。这些边界框可以通过首先计算差异图像的每个像素的范数值来获得。如果范数值不落入预定义阈值以下，则像素可以被视为包含从图像到输出图像的显著改变的数据。然后可以对其范数不落入阈值以下的像素进行连接分量分析，这可以提供属于同一分量的一个或多个像素集合。这些分量中的每一个都可以被视为相关对象，并且可以为每个分量确定边界框。可以确定边界框，使得它包围分量的所有像素，同时具有最小的大小，即，在分量的像素周围紧紧拟合。替代地，可以想象选择边界框，使得其边与分量的像素具有预定义的最大距离。该方法可以被看作确定在像素周围的填充边界框。
90.边界框不一定需要是矩形的。它可以具有任何形式的凸或非凸形状，而不需要对该方法进行任何修改。
91.集合（t）然后可以被提供为来自新数据集（d
n
）的图像以及对应于每个图像的边界框，即，期望输出信号。
92.在另外的实施例中，可以设想，代替边界框，从差异图像确定语义分割图像。为此，其范数值不落入阈值以下的信号的所有像素可以被标记为属于第一类，而图像的所有其他像素可以被标记为背景类。然后，可以在期望输出信号中提供具有根据该过程标记的像素的信号作为语义分割图像。
93.在另外的实施例中，可以设想在cyclegan中使用的生成器提供掩模图像，并且掩模图像被用作差异图像。图10示出了提供掩模图像（m）以确定输出图像（o）的生成器（g）的实施例。基于输入图像（i），生成器（g）提供掩模图像（m）和中间图像（z）。
94.优选地，生成器（g）被配置为使得所提供的掩模图像（m）仅包含从0到1范围内的值。这可以优选地通过生成器（g）提供初步掩模图像并将sigmoid函数应用于初步掩模图像以获得具有从0到1范围内值的掩模图像（m）来实现。
95.掩模图像（m）然后由逆转单元（inv）逆转，以便获得逆转掩模图像（m
‑1）。然后，在中间图像和掩模图像（m）之间的哈达玛乘积被提供为第一结果图像（r1）。输入图像（i）和逆转掩模图像（m
‑1）之间的哈达玛乘积被提供为第二结果图像（r2）。然后提供第一结果图像（r1）
和第二结果图像（r2）之和作为输出图像（o）。
96.在另外的实施例（未示出）中，可以设想，集合（t）不用于训练分类器（60），而是用于测试它。例如，可以设想，假设分类器（60）用在安全关键产品、诸如自主车辆（10）中。可以进一步设想，分类器（60）在被许可用在产品中之前需要实现预定义的分类性能。
97.可以通过确定分类器（60）在测试数据集上的分类性能来评估分类性能，其中使用如上所述的步骤一（901）至四（904）来提供测试数据集。
98.对分类器（60）的许可可以例如以迭代的方式发生：只要分类器（60）不满足预定义的分类性能，它就可以在新的训练数据上进一步训练，并且然后在所提供的测试数据集上再次测试。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：人脸识别方法及装置、电子设备和存储介质与流程

用于训练和测试分类器的设备和方法与流程

相关文献

最热文献