一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

修改车辆的计算机生成的模型的部件的计算机实施的方法与流程

2022-06-18 05:05:09 来源:中国专利 TAG:


1.本发明涉及一种用于修改机动车辆的计算机生成的模型的部件的计算机实施的方法。在本描述的上下文中,计算机实施的方法应被理解为尤其是指该方法由计算机来执行。例如,计算机可以包括数字数据存储器和处理器。数字数据存储器可以存储指令,这些指令在由处理器执行时使处理器执行该计算机实施的方法。


背景技术:

2.现有技术中使用机动车辆的计算机生成的模型来模拟事故对机动车辆不同部件(例如,车身)的影响。产生模拟事故的视频,并由用户对该视频进行关于部件变形的分析。
3.wo 2008/052743 a1披露了对计算机生成的零件模型执行关于该零件的特定特性的模拟并且借助于计算机实施的方法来改进该特性的实践。


技术实现要素:

4.相比之下,本发明的目的是在无需用户交互的情况下对由计算机生成的事故模拟产生的视频进行评价。
5.这一目的是通过紧接着的几个段落中所述的方法来实现的。还说明了本发明的实施例。
6.该方法用于修改机动车辆的计算机生成的模型的部件。例如,该模型可以是cad模型。计算机生成的模型尤其可能已经由用户与计算机的交互产生。在本描述的上下文中,术语“计算机生成的”应被理解为尤其是指模型仅能以数字数据的形式而不是以真实零件的形式来使用。
7.首先,执行对计算机生成的模型的第一事故的第一计算机生成的模拟。计算机生成的模型包括多个部件,其中一些部件在第一计算机生成的模拟期间变形。根据计算机生成的模拟产生第一视频,该第一视频在视觉上表示模型的第一模拟事故。将该第一视频的帧相互比较。尤其可以仅将两帧相互比较。如果模型的部件发生变形,则这两帧尤其可以是事故之前的一帧和事故之后的一帧。也可以将两个以上的帧相互比较。
8.根据该第一视频的帧的比较来计算第一变形总和。根据部件在第一模拟事故期间的变形来计算该第一变形总和。可以使用全部或仅一些部件的变形来计算该第一变形总和。
9.然后,修改部件中的至少一个部件。还可以对部件的多个实例进行修改。该修改尤其可以在没有用户交互的情况下完全自动地进行。随后,执行对具有至少一个经过修改的部件的模型的第二事故的第二计算机生成的模拟。重要的是应注意,在执行该第二模拟之前,部件并未变形。该第二模拟导致模型的部件变形。根据该第二模拟产生第二视频,该第二视频在视觉上表示模型的第二模拟事故。将该第二视频的帧相互比较。尤其可以仅将两帧相互比较。如果模型的部件发生变形,则这两帧尤其可以是事故之前的一帧和事故之后的一帧。也可以将两个以上的帧相互比较。
10.根据对该第二视频的帧的比较来计算第二变形总和。根据部件在第二模拟事故期间的变形来计算该第二变形总和。将该第二变形总和与该第一变形总和进行比较。将该比较作为对修改进行积极或消极评估的基础。
11.这允许在计算机生成的模型的事故特性方面对该模型进行改进。因为计算机生成的模型和事故模拟两者都非常真实,所以可以假设,被评估为积极的修改对计算机生成的模型所对应的真实机动车辆的事故行为也具有积极影响。
12.对修改进行的积极或消极评估尤其可以呈机器学习的一部分的形式。在这种情况下,所谓的代理做出这些修改。如果修改被评估为积极的,则这代表对代理的奖励。代理尝试获得尽可能多的奖励,其结果是该代理独立地学习,并且模型被反复修改得尤其好。
13.根据本发明的一个实施例,如果修改被评估为积极的,则具有该至少一个经过修改的部件的模型可以被再修改。在本描述的上下文中,应理解,这尤其是指对部件中的一个或多个部件进行修改。例如,可以对已修改的部件进行再修改,或者也可以对其他部件进行第一次修改。另一方面,如果修改被评估为消极的,则具有该至少一个经过修改的部件的模型可以被拒绝。
14.在再修改之后,执行对经过再修改的模型的第三事故的第三计算机生成的模拟,并且根据该第三计算机生成的模拟产生第三视频。
15.该第三计算机生成的模拟导致模型的部件变形。该第三视频在视觉上表示经过再修改的模型的第三模拟事故。将该第三视频的帧相互比较。根据对该第三视频的帧的比较来计算第三变形总和。根据部件在第三模拟事故期间的变形来计算该第三变形总和。根据该第二变形总和与该第三变形总和的比较,将该再修改评估为积极的或消极的。以这种方式,在计算机生成的模型在模拟事故期间的特性方面对该模型进行进一步优化。
16.根据本发明的一个实施例,可以重复该方法的步骤,直到目标变形总和与所述变形总和之一之间的差低于阈值。例如,阈值可以成比例地取决于目标变形总和。例如,阈值可以与目标变形总和相差5%。
17.在本实施例中,在计算机生成的模型在模拟事故期间的特性方面对该模型进行改进,直到至少已近似达到目标变形总和。因为可以在不与用户交互的情况下执行该方法,所以在至少近似达到目标变形总和之前所需的时间不太重要。
18.根据本发明的一个实施例,如果该第二变形总和小于该第一变形总和,则该经过修改的模型可以被评估为积极的。如果该第三变形总和小于该第二变形总和,则该经过再修改的模型可以被评估为积极的。
19.根据本发明的一个实施例,可以通过奖励函数将修改评估为积极的或消极的。奖励函数尤其可以适用于对所有修改的所有评估。奖励函数可以呈自学习形式。在对修改进行评估之前,奖励函数可以从用户对计算机生成的模型的更改、以及使用经用户更改的模型的事故模拟的表现中进行学习。在本描述的上下文中,用户更改应被理解为尤其是指用户所导致的更改。在这种情况下,用户自然可以使用计算机。例如,用户可以是机动车辆开发方面的专家,尤其是工程师。
20.在该实施例中,奖励函数学习哪些用户更改对模型在事故期间的行为具有积极影响,以及哪些用户改变对模型在事故期间的行为具有消极影响。特别地,奖励函数可以从用户更改中学习用户在追求什么样的一个或多个目标。因此,例如,特定部件对于模型在事故
期间的稳定性尤其重要,而其他部件在此方面则不那么重要。因此,自学习奖励函数可以根据用户所追求的目标而将修改评估为积极的或消极的。
21.如果该方法作为使用代理(其因为修改的积极评估而被奖励)的机器学习来执行,则使用奖励函数尤其有利。
22.根据本发明的一个实施例,学习可以导致做出用户更改的用户的行为被一般化。在本描述的上下文中,这应被理解尤其是指在做出有限数量的用户更改后,根据用户的行为来内推出一般方法,这意味着,基于该一般方法,比有限数量的用户更改多得多的用户更改可以用于奖励函数的学习。
23.此外,学习可以导致所述用户更改整体上被评估为与对该计算机生成的模型的其他更改相比为更积极的。然而,例如,其他更改可以被理解为是指不是用户所做出的假设更改。对更改的不同评估意味着奖励函数尤其可以学习哪些修改应被评估为积极的以及哪些修改应被评估为消极的,以便实现对模型在模拟事故期间的行为的尽可能好的改进。为此目的,在学习期间,尤其可以以使得用户更改尽可能地得到积极评估的方式来适配奖励函数。其结果是,甚至是被认为适合实现用户的目标的修改也被尽可能地积极评估。
24.根据本发明的一个实施例,奖励函数可以是各种特征的线性组合。所述特征可能具有不同的权重。可以在学习期间适配该权重。所述特征可以包括成本和/或安全系数,例如,所述安全系数是取决于部件或模型在事故期间的行为的数值。
25.例如,可以根据以下公式来定义奖励函数r:
26.r=w1·
f1 w2·
f2

wn·fn
27.此处,每个wi表示在学习期间可以被更改的权重因子。每个fi表示一个特征。
28.根据本发明的一个实施例,可以根据未变形状态下的所述部件的图片元素与变形状态下的所述部件的对应的图片元素之间的距离来计算所述部件在各个模拟事故期间的相应的变形。未变形状态应被理解为是指在相应的模拟事故之前的状态。对应的图片元素可以是由处于未变形状态下的图片元素的位移而产生的图片元素。然后,可以将所计算的变形相加以计算相应的变形总和。
29.根据本发明的一个实施例,关于修改的信息和关于对修改的评估的信息可以存储在中央数据存储器中。例如,中央数据存储器可以被布置为远离执行计算机实施的方法的计算机。例如,该中央数据存储器可以是云数据存储器。所述变形总和与所述信息可以用于修改其他计算机生成的模型。其他计算机生成的模型可以在一个或多个部件上不同于该计算机生成的模型。
30.因此,也可以考虑已被评估的修改以修改另外的模型,其结果是,与不考虑已被评估的修改相比,有时可以更快地找到可以得出更好评估的修改。
31.根据本发明的一个实施例,来自该数据存储器的针对对其他计算机生成的模型进行修改而获得的数据可以被用于该修改。其他计算机生成的模型可以在一个或多个部件上不同于该计算机生成的模型。因此,有时可以更快地找到更好的修改。
附图说明
32.本发明的进一步的特征和优点将从以下参照附图对优选示例性实施例的描述中变得清楚,其中,相同的附图标记用于相同或相似的特征以及具有相同或相似的功能的特
征,并且在附图中,
33.图1示出了机动车辆的计算机生成的模型的细节的示意性截面视图;
34.图2示出了模拟事故之后的图1的细节的示意性截面视图;
35.图3示出了根据本发明实施例的方法的一部分的示意图;
36.图4示出了根据本发明实施例的迭代执行的方法的示意性表示;
37.图5示出了与中央数据存储器一起使用的图3的方法的示意性表示;
38.图6示出了用于使用多个代理来改进模型的方法的示意性表示;
39.图7示出了用于改进奖励函数的方法的示意性表示;以及
40.图8示出了说明对用户策略的一般化的示意图。
具体实施方式
41.图1所示的模型100包括与机动车辆的真实零件相对应的多个部件。部件在事故模拟之后变形。该状态在图2中示出。根据模拟产生视频。例如,图1可以示出在事故之前该视频的帧的细节。例如,图2可以示出在事故之后该视频的帧的细节。
42.将图1的细节与图2的细节进行比较使得能够确定部件的变形。例如,所述变形可以通过图片元素的位移来指示。因此,可以通过测量图片元素的位移来计算变形的程度。例如,这可以以毫米为单位来实现。可以将各个位移相加以产生变形总和。变形总和越大,部件变形就越严重。
43.因此,例如,可以将两个变形总和相互比较。例如,如果修改了模型的一个或多个部件并且随后模拟了第二事故,则可以将未经修改和经过修改的模型的变形总和相互比较。然后,如果经过修改的模型的变形总和小于未经修改模型的变形总和,则修改可以被评估为积极的。
44.图3示出了代理300、修改301、模拟302、变形总和计算303和评估304。该图示出了基于强化学习的方法的操作。在本发明的一个实施例中,代理300选择对计算机生成的模型100的部件的修改301。修改301也可以被称为代理300的动作。代理300在这样做时遵循某一策略。修改301影响模拟302。模拟302也可以被称为受代理300的动作影响的环境。
45.计算303使得部件的变形得到计算。变形是通过比较事故之前的帧和事故之后的帧来计算的。将所述变形相加以产生变形总和。
46.对修改301的评估304是基于变形总和来实现的。总和越大,则评估越差。特别地,对修改301的评估304可以以将所计算的变形总和与修改301之前所计算的变形总和进行比较的方式来实现。如果修改301之后所计算的变形总和大于所述修改之前所计算的变形总和,则修改301被评估为消极的。如果修改之后所计算的变形总和较小,则修改301被评估为积极的。评估304也可以被称为对代理300的奖励。
47.代理300的策略与评估304进行匹配。例如,如果修改301被评估为消极的,则这会影响代理300的策略,其结果是类似方式的再修改的可能性变小。此外,修改301被拒绝,因为未经修改301的模型100具有更好的事故特性。然后,将未经修改301的模型100作为进一步修改的基础。
48.如果修改301被评估为积极的,则选择经过修改301的模型作为再修改的基础,因为该修改改善了模型的事故行为。该积极评估也影响代理300的策略,其结果是类似方式的
再修改的可能性变大。
49.代理300被编程为获得尽可能多的积极评估。代理300针对不同的修改获得的评估越多,其策略就适配得越好,以便选择对模型100的事故行为有积极影响的尽可能好的修改。
50.评估304尤其可以使用奖励函数来实现。奖励函数可以包括加权特征。例如,所述特征可以包括根据经过修改的模型来生产机动车辆的成本以及目标变形总和与所计算的变形总和之间的差距。例如,目标变形总和可以是期望的低变形总和。权重可以规定应如何对代理300的动作进行评估。例如,如果成本的权重尤其高,则导致成本提高且对变形总和仅有较小的积极影响的修改往往更可能被评估为消极的。然而,如果目标变形总和与所计算的变形总和之间的差距的权重尤其高,则虽然导致成本提高但是对事故行为有显著积极影响的修改更可能被评估为积极的。因为代理300将其策略与评估进行匹配,所以代理300的策略也间接地受到影响。
51.如果计算303导致所计算的变形总和低于阈值,则可以终止该方法。例如,阈值可以是以毫米为单位表示的值。
52.因此,图3所示的方法是反复执行的迭代方法,直到其因为变形总和被视为足够低而终止。为了实现该目标,可以在规划该方法期间使用动态编程、策略迭代方法和/或值迭代方法。无模型控制可以包括使用蒙特卡罗算法、时序差分学习、sarsa、q学习和/或双q学习。还可以通过使用以下类型的算法之一以基于模型的方式执行该方法:dyna-q、蒙特卡罗树搜索、时序差分搜索。此外,可以使用基于模型的强化学习方法,例如查表模型、线性期望模型、线性高斯模型、高斯过程模型和/或深度信念网络模型。
53.图4中的方法首先涉及模拟计算机生成的模型的事故以及计算第一变形总和。然后,对模型的一个或多个部件进行第一修改301。例如,使得特定参数增加、减少或保持不变。然后,针对所有三个第一修改301中的每一个,计算第二变形总和并将其与第一变形总和进行比较。在步骤400中,第一修改301之一被评估为积极的,因为其第二变形总和低于第一变形总和。在步骤401中,第一修改301之一被评估为中性的,因为其第二变形总和与第一变形总和相似或相等。在步骤402中,第一修改301之一被评估为消极的,因为其第二变形总和大于第一变形总和。将被评估为积极的修改301用作第二修改301的基础。因此,将被评估为积极的修改301视为进行第二修改301所针对的模型的一部分。
54.以类似于对第一修改301的结果进行评估的方式对第二修改301的结果进行评估。在第三修改403之后,第三修改403之一在步骤404中被评估为积极的。此外,经过该第三修改403,变形总和满足与目标变形总和的差小于阈值(例如,5%)的条件。这使得该方法被成功终止,并且经过第三修改403(其在步骤404中被评估为积极的)的模型被视为具有根据该方法的目标而改进的事故行为的模型。例如,然后可以该模型将作为制造机动车辆的基础。
55.图5所示的方法大致基于图3的方法。然而,添加了中央数据存储器500,代理300使用该中央数据存储器来存储关于所做的修改301、获得的评估304及代理的策略的信息。然后,其他代理可以使用该信息来对其他计算机生成的模型执行类似的方法,其结果是在其他代理处有时更快地实现更好的结果。
56.此外,其他代理也可以存储关于所做的修改、获得的评估及所述其他代理的策略的信息,其结果是代理300可以访问该信息并且可以更好地适配其修改和/或其策略。
57.图6示出了多个代理300、600和601,所有这些代理(如参考图5所述)都将信息存储在中央数据存储器500中,并且从中央数据存储器500取得其他代理的信息。代理300、600和601都修改同一个计算机生成的模型100。这导致代理300、600和601有时选择不同的修改和策略。基于经由中央数据存储器500交换的信息,代理300、600和601可以各自受益于其他代理的信息并且可以改进其修改和策略,以便获得更多积极评估。特别地,该方法允许至少部分地弥补各个代理300、600和601可能具有的任何缺点。
58.图7所示的方法改进了用于对变形总和进行评估304的奖励函数702。奖励函数702观察做出修改701的用户700的行为,所述修改的变形总和已被评估,如上文参考图3和图4所描述的。奖励函数702包括特征和所述特征的权重。适配特征的权重,以便对用户700的策略获得尽可能多的积极评估。该适配的结果是改进的奖励函数703。
59.图8示出了可以如何一般化用户700的行为。用户做出产生具有不同的变形总和的模型800的修改。y轴是变形总和的度量。变形总和越小,模型800在y轴上标记得越高。
60.使用模型800来产生一般化模型801,该一般化模型也可以通过遵循用户700的策略来实现。然而,因为用户700不能做出无限多次的修改,所以这些模型仅仅是用户700的假设模型801,而该用户实际上从未产生这些模型。
61.然后,使用模型800和801来产生模型的一般化曲线802,其上存在有对应于用户700的策略的所有或至少大多数模型。然后,可以适配奖励函数702以使得这些模型被尽可能地评估为积极的。
62.在对参数进行适当的适配的情况下,该计算机实施的方法自然还可以执行关于对车辆冷却系统的计算以及车辆的空气动力学部件对空气动力学特性的影响的模拟和自动分析。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献