一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

考虑到不确定性的主动数据生成的制作方法

2022-02-20 16:28:37 来源:中国专利 TAG:


1.本发明涉及一种基于具有单一注释数据点的已有数据生成数据的方法、一种用以此方式生成的数据训练一预测器的方法、一种计算机程序和一种数据载体。


背景技术:

2.在机器学习领域中,一种预测器是多维函数的近似。
3.确定整个数据空间中哪些数据点用于一ai(人工智能)方法的收集、生成和使用通常取决于由人做出的选择、规定的准则或随机进行。
4.例如为能与领域专家进行一“合作学习”,以便在迭代校准或参数化任务中为(人类)专家提供支持,主动数据生成方法是必要的。在这类场景中,专家的任务是手动选择和评估数据点(例如系统参数),以达到一给定的优化目标。主动数据生成方法在一全自动数据收集中也是必要的。
[0005]“主动学习”方法可确定哪些数据点应用目标值(例如类别、职位或kpi(关键绩效指标))进行注释,并以一已有(未注释)数据集为基础。托马索
·
德罗西(tommaso dreossi)、施罗莫娜
·
戈什(shromona ghosh)、姚翔宇(xiangyu yao)、库尔特
·
科茨(kurt keutzer)、阿尔贝托
·
桑乔瓦尼-文森特利(alberto sangiovanni-vincentelli)以及桑吉特
·

·
塞希阿(sanjit a.seshia)于2018年7月发表在第二十七届国际人工智能联合会议论文集(proceedings of the twenty-seventh international joint conference on artificial intelligence)第2071到2078页上的文章“反例引导的数据增强(counterexample-guided data augmentation)”(https://doi.org/10.24963/ijcai.2018/286)描述了一种作为替代选择的方法,该方法也可有针对性地确定应生成哪些数据点。此外,在s.jha和s.a:seshia发表于acta informatica(2017年)第54卷第693页上的文章“通过归纳学习的形式综合理论(a theory of formal synthesis)”(https://doi.org/10.1007/s00236-017-0294-5)描述了一种正式框架理念,它涵盖了一整类理念,而不涉及可能的实现。
[0006]
所述数据的生成和收集是耗时、高成本并片面的,因此对注释过程加以改进是不够的。
[0007]
在现有技术中,已知一种生成数据的方法,该方法使一预测器的预测误差最大化,以根据具有最大预测误差的一数据的数据描述生成新的数据。
[0008]
根据现有技术,选择要生成的数据点是一专家的任务。首先已有选择要生成数据点的自动化方法,但这些方法只考虑了哪些数据点(可能)难以被一ai(人工智能)方法预测,而没有考虑预测的可靠性。因此,无法保证充分涵盖预期的或所需的数据空间。此外,这些已知方法只能用于0/1误差。这种0/1误差并不表示误差程度,而只是区分有误差(=1)和无误差(=0)。
[0009]
尤其为使专家的手工/人工作业最小化,因此数据生成最小化具有较高的重要性。此外,精心选择的训练数据可提高预测的可靠性,并由此提高ai(人工智能)方法的质量。通
过使用一连续的误差度量,也可实现对ai(人工智能)方法质量或误差评估的改进。由此可使用一主动的、经导引的数据生成,它同时考虑了优化目标和数据空间的涵盖。
[0010]
因此,一根据本发明所述方法具有下列步骤:基于已存在数据训练一第一预测器、针对各数据点确定第一预测器的一预测误差、为确定第一预测器的一预期预测误差和不确定性,训练一第二预测器,确定对一预期预测误差和不确定性组合最大化的一数据描述,并根据先前确定的数据描述生成数据。
[0011]
通过有针对性地生成与问题特别相关的数据点并确保充分涵盖数据空间,可减少所需数据的数量。
[0012]
使用一第二预测器所述方法也可用于第一预测器不能反转或预测器输入空间不能用于数据生成的情况。
[0013]
根据本发明所述的另一方法使用通过上述方法生成的数据对一预测器进行训练,并还具有检查是否已达到第一预测器先前确定的质量以及注释新数据并将其添加到现有数据中的步骤。
[0014]
一根据本发明所述计算机程序包括使一计算机系统执行上述方法之一的指令。它具有能特别快速、有效地应用所述方法的优点。
[0015]
上述计算机程序可存储在一根据本发明所述的数据载体上。它具有计算机程序可方便地传输和复制的优点。
[0016]
从以下描述和所附权利要求结合附图,本发明的其他特征也变得显而易见。
附图说明
[0017]
图1该图展示根据现有技术生成数据的一种方法流程图;
[0018]
图2该图展示根据本发明所述生成数据的一种方法流程图;
[0019]
图3该图展示用于训练一预测器的一种方法流程图,所述预测器包括根据本发明所述生成数据的一种方法;
[0020]
图4该图展示一种检验装置的示意图;
[0021]
图5该图展示一车辆示意图,以及
[0022]
图6该图展示根据本发明所述一数据载体的示意图。
具体实施方式
[0023]
图1展示的是根据现有技术用于生成例如适用于训练一预测器数据的一种方法。在此,在步骤a1中基于已注释过的数据对一预测器进行训练,并在步骤a2中确定数据的一预测误差。然后,在步骤a3中确定使预测误差最大化的一数据点描述。随后,基于该描述在步骤a4中生成一个或多个新的数据点。
[0024]
在图2中展示的是一根据本发明所述方法的流程图。根据本发明所述方法从步骤s1开始,基于已存在的注释数据对一第一预测器进行训练。在此,经注释的数据尤其由与训练相关的数据点组成,并还以有益的方式包括一描述。然后,在步骤s2中基于已有经注释数据的至少一部分为这些数据点中的每一个确定第一预测器的一预测误差。
[0025]
然后,在步骤s3中对一第二预测器进行训练,以确定第一预测器的一预期预测误差和一不确定性。这尤其是基于第一预测器的数据点预测误差实现的。为此还以有益的方
式使用数据点的描述或一数据空间/数据区域的描述。
[0026]
然后,在步骤s4中通过一算法确定一将预期预测误差和不确定性组合最大化的数据描述。所述置信上限(ucb)例如可用作这方面的度量,置信上限将预期预测误差和与一可通过一常数扩展或压缩的不确定性的总和最大化。由此,可通过例如随机生成数据描述选择使所述度量最大化的数据描述。
[0027]
然后,在步骤s5中基于先前在s4中确定的数据描述生成新的数据。新的数据例如可描述一数据空间区域的至少一部分,该部分中,第一预测器仍然存在重大误差或未被第一预测器涵盖。
[0028]
借助根据本发明所述用于生成数据的方法训练预测器的一方法包括步骤s1到s5以及一步骤s2.1和一步骤s6,并在图3中以一流程图的形式展示。
[0029]
在步骤s2.1中检查,此处第一预测器的质量对期望的应用是否足够或最高。如果质量足够或最高,则可在此结束该方法,否则在步骤s3中继续该方法。在此,借助一合适的度量或另一合适的计算规则确定此处预测器的质量。例如,第一预测器的质量可从单一数据点预测误差的算术平均值中生成。关于第一预测器的质量应该或必须有多高的决定是根据应用特定的。由此,例如在与安全相关的应用中,通常需要小于1%的误差概率;对其他应用,可通过一估算器估算后果(例如增加的成本),并可确定足以达到指定质量的一极限值。
[0030]
在步骤s6中,对在s5中生成或收集的数据进行注释,并添加到已存在经注释的数据中。然后在步骤s1再继续所述方法。
[0031]
根据本发明所述方法例如可用于生成基于发动机参数预测一发动机性能的预测器数据,以便对这类预测器进行训练。为此,包括发动机参数和所测量性能数据的注释数据被用作基础(图2中的步骤s1)。在此,预测误差的确定(图2中的步骤s2)包括预测到性能和实际测量结果之间的差异。
[0032]
现对预测器的训练进行检查,看其是否已达到所需预测误差,如果已达到所需预测误差,则训练方法在此处结束(图3中的步骤s2.1)。否则,对可映射不确定性的第二预测器进行训练(图2中的步骤s3)。第二预测器用于基于发动机参数预测预期的性能差异。在此,数据空间可包括不同的可能区域,尤其是完整的频谱、发动机参数和可能的功率值。
[0033]
然后确定包括有关第二预测器最大化发动机参数的数据描述(图2中的步骤s4)。
[0034]
基于特定数据描述生成新的数据(图2中步骤s5)在此例如可包括给定发动机参数的一新的评估,尤其是例如在一发动机测试台上进一步的性能测量。然后,为训练预测器,可在必要情况下/可选地对新数据进行注释,并将其添加到已有数据中(图3中的步骤s6),并重新用基于现在包括最初存在数据和新数据的已有数据的第一预测器训练继续训练方法。由此,所述方法可用于为一发动机驱动的车辆生成一预测器,该预测器根据其他发动机参数特别有效或准确地确定发动机性能/功率。这可用于一性能/功率测量台或一车辆中,并方便和优化性能/功率确定。
[0035]
根据本发明所述方法还可用于生成一预测器的数据,该预测器可在印刷电路板图像上找到误差位置,并对这类预测器进行训练。在此,已知缺陷或误差的印刷电路板注释图像被用作数据。然后,第一预测器的预测误差例如可是预测误差和印刷电路板上已知误差的位置偏差。然后可训练第二预测器,以基于印刷电路板描述预测预期的位置偏差。然后选择最大化印刷电路板描述,并生成新的数据。例如,这可包括建立一块或多块故意带有符合
印刷电路板描述的不同误差和误差位置的缺陷印刷电路板。例如,预测器可用于一生产过程后或在一生产过程中检查印刷电路板误差的一检验装置。为此,所述检验装置可具有至少存储有所述预测器,也以有益方式存储有根据本发明所述计算机程序之一的一数据载体,所述计算机程序用于实施根据本发明所述、用于生成数据的方法或用于训练一预测器的方法,尤其还存储用于训练预测器的数据、所述检验装置还包括配置有预测器的一计算单元,该单元用于实施预测器的训练以及数据的生成,检验装置还配置有意用于数据记录的摄像机。所述检验装置可包括用于有线或无线通信的一通信单元,并还可是一网络结构的一部分,尤其是一客户端服务架构、主从架构、云架构、物联网架构,以便使预测器、计算机程序和/或数据至少不必持续存在于检验装置本身。
[0036]
计算单元可控制所述检验装置,尤其是摄像机。计算单元尤其也适用于特别基于可由摄像机拍摄的新数据实施根据本发明所述生成数据的方法并对预测器进行训练。
[0037]
检验装置、预测器、生成数据的方法和训练预测器的方法也可用于其他产品和生产流程,尤其用于那些需要低误差率和/或具有适应性和灵活性的产品和生产流程,以及尤其用于还可快速适应新的和不断变化的参数或误差的产品和生产流程。在光学生产、医疗技术、药物生产和芯片制造领域尤其如此。因此,这类检验装置也可用在上述性能测量台或一车辆中,尤其用于发动机的性能/功率测量以及用于一车辆中的人脸识别。
[0038]
图4中示意性展示的这类检验装置也可是根据本发明所述的检验装置。在此,检验装置1包括一传感器装置,这里设计为摄像机2、一计算单元3和一数据载体4。此外,它还可包括一通信装置5。
[0039]
由此,通过生成数据的方法可有针对性地生成数据,以便尽可能优化地描述数据空间,因此硬件资源较少的系统也适用于实施所述方法。
[0040]
根据本发明所述方法还可用于生成一人脸识别用的数据并对人脸识别、尤其是车辆中人脸识别用的一预测器进行训练。在此,具有例如面部位置等相关注释以及包括例如光照度、车辆类型、人物类型和配件等描述的数据点可供使用。使用数据点的一子集对第一预测器进行训练,其余数据点用于确定预测和注释之间的差异。然后,为确定面部位置,在剩余数据点上确定预测的和注释的面部位置之间的偏差。
[0041]
通过描述数据点和预测与注释的偏差,对第二预测器进行训练,以便基于描述用一定的不确定性预测和注释之间的偏差。第二预测器例如可包括诸如以置信区间的形式确定这类预测值和不确定性的一高斯过程。
[0042]
然后根据描述的可能值生成(随机)描述。对此,预期的预测误差和不确定性由第二预测器确定,并从预测误差和不确定性组合中选择提供的最大值或高值。基于所选描述,生成与这些描述相对应的一个或多个数据点。例如,借助渲染软件,可建立满足这些描述的人脸图像。在以这种方式生成的图像中,可以有益的方式特别简单地实施注释。然后,可将经注释的数据点添加到指定数据点并重新训练第一预测器。
[0043]
结果是用于确定面部位置的一预测器,其中,基于所介绍方法对新图像中预期的预测质量最大化。此外,通过所述方法最大限度地减少所需(图像)数据点数量。同样,也可对预测器或其他预测器进行训练,使其以改进的方式实施面部表情识别以及其他形式的人脸识别。
[0044]
数据生成方法、训练一预测器的方法和预测器本身尤其可用于一车辆中的人脸识
别。在此,所述车辆可包括至少一摄像机或另一传感器,以生成新的数据。车辆还可包括一计算单元,尤其是基于也可由摄像机或传感器记录的新数据实施根据本发明所述用于生成数据、训练所述预测器和若干预测器的方法。所述车辆还可包括一存储有用于训练一预测器的数据和用于实施生成数据、训练指定预测器和若干预测器的方法的计算机程序的数据载体。
[0045]
图5展示的是这类车辆,尤其也可是一根据本发明所述车辆。在此,车辆1包括至少一个在此设计成摄像机2形式的传感器、一计算单元3和一数据载体4。此外,所述车辆还可包括一通信单元5。在此,摄像机2、计算单元3、数据载体4和/或通信单元5也可共同布置在一个或多个装置中。由此,例如计算单元3、数据载体4和/或通信装置5可设置在摄像机2的壳体中。
[0046]
在车辆中,这里所介绍的根据本发明所述方法也可用于能以经训练的算法和数据评估进行工作和改进的其他装置。尤其是,在使用一车辆,尤其是一自主行驶车辆时,在出现情况和数据量快速变化的情况下,这可能是有益的。
[0047]
图6中是一根据本发明所述数据载体4的示意图。在数据载体4上至少可存储一根据本发明所述的计算机程序,以实施根据本发明所述生成数据和训练一预测器的方法,尤其可存储用于训练预测器的数据以及预测器本身。
[0048]
附图标记列表
[0049]
a1

a5方法步骤
[0050]
s1

s6,s2.1方法步骤
[0051]
1检验装置
[0052]
2摄像机
[0053]
3计算单元
[0054]
4数据载体
[0055]
5通信单元
[0056]
10车辆
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献