一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于确定制动压力变化的方法与流程

2023-01-15 08:31:48 来源:中国专利 TAG:

1.本发明涉及一种用于确定车辆车轮的制动压力变化以优化制动过程的方法。


背景技术:

2.如果(例如在漂滑现象或者寒冷条件、如暴雨、雪或者冰的情况下)超过车辆车轮与行车道之间的最大摩擦系数值,则即将发生由于车辆车轮对行车道的附着力丧失而不稳定的行驶情形。对于许多驾驶辅助系统以及对于半自动化车辆而言,重要的是不超过最大摩擦系数值,以便始终保正安全的行驶状态或者必要时结束自动驾驶功能。
3.现代机动车具有调节装置、如行驶动力学调节装置(esp,电子稳定程序)。在此,电子稳定程序实质上是滑移调节系统。在进入危急的行驶情形时,那么如例如防抱死制动系统(abs)或者牵引力控制系统(tcs)之类的安全系统进行干预。
4.这种系统以防抱死控制(alc,anti lock control)为基础,亦即以带有建立、解除和维持制动压力的制动压力调节装置为基础,以便抵制车轮抱死并且缩短制动距离。当前的alc具有许多参数,以便为应用工程师给予能够实现针对不同车辆的最优性能的可能性。但是,找到这些参数的最优值是非常费事的。
5.因为应用工程师必须进行不同的alc操纵(manoever),必须触发具有全制动的alc,必须评价测量并且必须评估这些许多参数中的哪些参数要被适配(angepasst),以便改善性能,而且必须多次重复这些,直至达到目标性能。


技术实现要素:

6.本发明的任务是简化用于适配防抱死控制器的参数搜索。控制器要独立学习最佳的制动压力变化,以便保持车辆车轮稳定,并且同时实现尽可能短的制动距离。
7.根据本发明的多个方面,建议了根据独立权利要求的特征的一种用于确定车辆车轮的制动压力变化以优化制动过程的方法、一种用于确定制动压力特性曲线族(kennfeld)的方法、所述方法的应用、一种用于进行操控的方法、一种设备、一种计算机程序以及一种机器可读的存储介质,它们至少部分地解决了上面提到的任务。有利的构建方案是从属权利要求以及随后的描述的主题。
8.在本发明的整个说明书中,方法步骤序列示出为使得,可容易理解该方法。但是,本领域技术人员将认识到,也可以以其他顺序来遍历这些方法步骤中的许多方法步骤,并且这些方法步骤中的许多方法步骤导致相同的或者相对应的结果。在这个意义上,可以相对应地改变这些方法步骤的顺序。
9.根据一个方面,建议了一种用于确定车辆车轮的制动压力变化以优化制动过程的方法,该方法具有下列步骤:在该方法的一个步骤中,提供车轮的当前车轮状态,其中该车轮状态具有多个状态参数。在另一步骤中,确定如下至少一个状态参数:所述至少一个状态参数的值偏离目标车轮状态。在另一步骤中,根据至少一个状态参数与目标车轮状态的偏差,确定制动压力变
化的变化方向。在另一步骤中,提供了用于确定制动压力变化的值的制动压力特性曲线族,其中该制动压力特性曲线族将制动压力变化分配给多个状态参数,并且对于制动压力变化和状态参数变化的所确定的变化方向是特定的。在另一步骤中,利用当前车轮状态和所提供的制动压力特性曲线族,确定制动压力变化的值。
10.在此,多个状态参数、如例如车轮的滑移或者加速度借助如下信号来确定:所述信号由车辆的传感器、如例如惯性传感器或者转速传感器来生成。也就是说,车轮状态例如可以是车轮的滑移和加速度的函数:车轮状态=f(滑移, arad)。
11.借助制动压力,可以改变车轮的制动力矩,其中可以通过制动压力变化的累积来设定制动压力。在此,制动压力变化可以是车轮状态的函数。
12.在此,在根据至少一个状态参数与目标车轮状态的偏差来确定制动压力变化的变化方向这方面,要广义地理解术语“偏差”,并且术语“偏差”尤其是既包括间距意义上的定量偏差,又包括对应于梯度的时间上变化的偏差。
13.如进一步在下面所阐述的那样,利用强化学习方法(英语:reinforcement learning),通过校正相应的制动压力特性曲线族在遍历不同车轮状态时的值,可以始终进一步优化制动压力特性曲线族。针对相应的车辆,在相对应的行驶运行中,可以通过应用工程师来设定不同的车轮状态,其中强化学习方法的智能体根据奖励规则(策略(policy))学习关于制动压力的变化的最佳动作。接着,这些最佳动作可以被存储在相对应的制动压力特性曲线族中,并且可以被提供用于设定制动压力变化。
14.因此,对于这种用于确定制动压力变化的方法,以有利的方式得出一种易于执行的用于适配防抱死控制器的参数搜索方法。
15.在此,用于确定制动压力变化的方法简单地设计为使得,应用工程师(例如通过改变制动压力特性曲线族中的值)可以进行手动改变调节方法。
16.通过其他状态参数(如进一步在下面列出的那样),也可以表征当前的车轮状态。
17.例如通过模式判决模块(mode decision modul),可以确定制动压力变化的变化方向、也就是说因此基于制动压力变化是要提高还是要减少制动压力,使得尽可能快速地达到或维持与目标车轮状态相对应的车轮状态。
18.在此,可以针对车辆的每个轴规定这种目标车轮状态,并且根据状态参数、如例如最小和最大滑移和/或最小或者最大车轮加速度,可以规定该目标车轮状态,使得整个制动系统的性能得到优化。
19.视行驶状态、转弯半径或者路基等而定,也可以动态地规定这种目标车轮状态。
20.为了确定该变化方向,例如可以从多个状态参数中选出所述状态参数之一。这种选出可以依据事先确定的规则进行。例如,为此可以考虑有关车轮的滑移。
21.典型地,在增加制动压力时,提高车轮的滑移,并且进一步制动该车轮,也就是说针对车轮进行负加速。
22.制动压力的减小典型地得到滑移的减少和车轮的更小的制动,也就是说因此得到车轮的加速。
23.对于该方法,例如可以生成四个特性曲线族,所述四个特性曲线族通过这两个状态参数(如滑移和车轮加速度)的相对变化进行区分,也就是说通过状态参数的增加或者减
小进行区分。在此,在正的制动压力变化的情况下,也就是说因此在最终得到的制动压力增加的情况下,可以使用涉及车轮加速度的两个特性曲线族。在负的制动压力变化的情况下,相对应地可以使用涉及状态参数“滑移”的两个特性曲线族。在使用下面所使用的强化学习方法之前,可以利用来自模拟的值计算相对应的特性曲线族。相应的特性曲线族可以将制动压力变化相对应地直接分配给相应的状态参数,或者给出因子,以便借助计算来确定制动压力变化。在此,在相应的状态参数当前增加的情况下,相应的因子可以乘以该因子,并且在相应的状态参数当前减小的情况下,相应的因子可以除以该因子。
24.对于当前增加的滑移,也就是说如果以前的滑移小于当前的滑移,因此得出:dp
target
=
ꢀ‑ksizu * 滑移值,而对于当前减少的滑移,得出:dp
target =
ꢀ‑ksiab
/滑移值。
25.相对应地,对于当前增加的车轮加速度适用:dp
target = k
azu * 车轮加速度,而对于当前减小的车轮加速度相对应地适用:dp
target = k
aab
/ 车轮加速度。
26.在此,针对相应的制动压力变化dp
target
,参数k
sizu
或k
siab
代表滑移值的增加或减小,并且参数k
azu
或k
aab
代表车轮加速度的增加或减小。通过根据状态参数的当前变化确定相应的制动压力变化,因此根据状态参数的变化的相应的方向进行不同的积极调节。
27.这意味着,对于滑移或者车轮加速度的减小的值,不进行比例调节。相反,在滑移或者车轮加速度的值增加的情况下,进行比例调节。
28.有利地,该方法可被用于配备有防抱死控制器的车辆。该方法可针对所有使用车轮调节器的功能被采用,如例如可以在牵引力控制(英语traction control)中被采用。在此,可以相对应地适配目标车轮状态,以便可以实现被改变的任务,即必要时使车轮比车辆参考速度更快。
29.根据一个方面建议了,提供至少一个以前的车轮状态,并且制动压力特性曲线族对于制动压力变化的确定的变化方向和对于至少一个状态参数的变化是特定的。
30.根据一个方面建议了,提供至少一个以前的车轮状态,并且至少一个所提供的制动压力特性曲线族取决于如下至少一个状态参数的变化方向:所述至少一个状态参数的值偏离目标车轮状态。
31.根据尽可能性能好的制动系统,利用针对相应的状态参数和针对每个轴(也就是说车辆的前轴和后轴)的最大和最小值,可以规定这种目标车轮状态。例如,这种目标车轮状态可以通过状态参数“滑移”和“车轮加速度”的下列值域来定义:滑移_min=5%;滑移_max=10%;车轮加速度_min=-20 m/s2;车轮加速度_max=-15m/s2。
32.如果动态选择目标车轮状态,则由此通过如下方式可以在需要时支撑车辆参考速度:接着在确定的时间中针对轴选择小于零的滑移_max。也就是说,车轮应尝试变得比车辆参考速度更快,以便检查该车辆参考速度合理性(plausibilisieren)并在必需时对该车辆参考速度进行修正。
33.除此以外,在车辆在沙地上行驶时,可能希望在前车轴上有较高的滑移,从中可以针对目标滑移值例如规定下列值:滑移_min=25%;以及滑移_max=35%。
34.根据一个方面建议了:至少利用状态参数的以前的和当前的值,确定至少一个状态参数的梯度;并且附加地借助梯度,确定制动压力变化的变化方向的确定。有利地,所确定的坡度使得能够确定相应的制动压力变化,使得尽可能及时地前瞻性设定制动压力,以便使车轮状态尽可能快速地进入目标车轮状态并保持在那里。
35.在此,也可以使用其他的以前的状态参数来确定梯度,也就是说,至少一个状态参数的时间序列可被用于确定梯度,和/或可以使用多个状态参数(如在下面所列出的那样)来确定梯度。
36.这种对梯度的确定使得能够,为了确定制动压力变化的方向,考虑前瞻性地确定制动压力变化所必需的时滞,因为制动压力变化的影响(由于为例如30ms的时滞和每隔为例如5ms的间隔对车辆状态进行确定)稍后才发生作用。
37.根据一个方面建议了:借助多个状态参数,确定制动压力变化的变化方向的确定。
38.这种状态参数的实例是车轮滑移和/或车轮的加速度和/或滑移的梯度和/或车轮的加速度(arad)和/或车轮的颠簸(jerk (rad))和/或相对于车辆加速度的车轮加速度(相对于afahrzeug的arad)。
39.根据一个方面建议了:根据整个系统的用于改变制动压力的时滞,确定制动压力变化的变化方向的确定。
40.根据一个方面建议了:从多个状态参数中,根据优先排列顺序来确定至少一个状态参数。
41.例如,状态参数“滑移”的值可以具有用于规定偏离目标车轮状态的确定的状态参数的较高优先级,因为要避免车轮抱死并且对此可以如此多地减少制动压力,直至相应的车轮具有如下滑移:该滑移小于用来力求目标车轮状态的滑移。
42.根据一个方面建议了,所述状态参数中的多个状态参数具有车轮滑移和/或车轮的加速度和/或滑移的梯度和/或车轮的加速度和/或车轮的颠簸和/或相对于车辆加速度的车轮加速度。
43.建议了一种用于确定针对上面所描述的方法的制动压力特性曲线族的方法,所述方法具有下列步骤:在一个步骤中,提供当前车轮状态,其中该车轮状态具有多个状态参数。在另一个步骤中,提供用于强化学习方法(英语:reinforcement learning)的奖励规则。在另一步骤中,借助奖励规则和当前车轮状态,确定奖励,并且只要已确定了针对该强化学习方法的奖励,就既关于值和变化方向及所分配的制动压力特性曲线族确定最后进行的压力变化,又根据强化学习方法来确定针对所分配的制动压力特性曲线族的修正值。
44.这种奖励规则说明,根据学习环境(environment)要实施何种动作、如例如制动压力变化(在任意行为变型的情况下),或要实施何种观测、如车轮状态与目标车轮状态的偏差,以便使奖励(reward)最大化或者使处罚最小化。
45.实施这种强化学习方法的智能体可以根据相应的状态参数修改利用制动压力特性曲线族定义的压力变化,直至例如状态参数“滑移”始终处于预先定义的阈值以下。这种修改可以通过所规定的百分比变化或者随机地进行。
46.有利地,用于确定制动压力特性曲线族的方法可被用来适配特性曲线族,使得利用这样控制的制动系统来达到最佳性能。在此,奖励规则被定义为使得,可以达到目标性能。
47.如果根据奖励规则(所述奖励规则也可包含相对应的处罚规则)来确定奖励,则修改制动压力变化或者相对应的参数,所述制动压力变化在奖励或惩罚从其得出的某个车轮状态中进行。
48.强化学习方法的智能体借助随机变化或者百分比变化修改参数或制动压力变化,直至制动压力变化的值从在相应的车轮状态下的相对应的制动压力特性曲线族中不可以确定其他奖励。这意味着,车轮状态接着可以处于目标车轮状态之内。接着,状态参数“滑移”可以例如始终处于最大值和最小值之内。
49.此外,在导致滑移的高梯度的某个车轮状态中,例如可以利用奖励规则来处罚压力变化。
50.有利地,在这种方法中,这种实施强化学习方法的智能体承担对调节方法的优化,在该调节方法中,智能体适配相应的制动压力特性曲线族,并且应用工程师通过相对应的驾驶行为来预先给定环境、也就是说不同的车轮状态。由此,得出所力求的对制动调节系统到相应车辆的适配的简化。
51.根据一个方面建议了:在用于确定制动压力特性曲线族的方法中,提供车轮的至少一个以前的车轮状态,并且利用当前的车轮状态和/或至少一个以前的车轮状态来确定奖励。
52.根据一个方面建议了:根据未达到滑移的极限值和/或未达到滑移的在零以下的值和/或压力变化的调制频度,奖励规则确定奖励。
53.建议了将上面描述的用于确定制动压力变化的方法用于调节车轮处的制动压力的应用。
54.建议了用于确定制动压力特性曲线族的方法用于优化车辆车轮的制动压力调节的性能的应用。
55.建议了一种方法,在该方法中,基于所确定的制动压力变化,提供用于操控至少部分自动化的车辆的控制信号;和/或基于所确定的制动压力变化,提供用于警告车辆乘员的警告信号。
56.由此,车辆的控制设备例如可以实现牵引力滑动调节(tcs:牵引力控制系统(traction control system)),其中例如暂时有结冰的底面的车轮被制动,或者在制动过程中,所有车轮都被制动成使得,制动距离在所给的状况下变得最小。
57.术语“基于”要关于如下特征来广义地理解:基于所确定的制动压力变化来提供控制信号。这样要理解的是,所确定的制动压力变化被考虑用于控制信号的每次确定或者计算,其中不排除还有其他输入变量也被考虑用于确定控制信号。相对应的内容相对应地适用于提供警告信号。
58.建议了一种制动系统,该制动系统设立成,执行上面描述的用于确定制动压力变化的方法之一。利用这种设备,可以将相对应的方法容易地集成到不同的系统中。
59.根据另一方面,给出了一种计算机程序,所述计算机程序包括如下指令:在通过计算机实施所述计算机程序时,所述指令促使所述计算机,实施上面描述的方法之一。这种计算机程序使得能够在不同的系统中采用所描述的方法。
60.建议了一种机器可读的存储介质,在所述机器可读的存储介质上存储有上面描述的计算机程序。
61.这里所使用的术语“车辆”也可一般性地被理解为一种移动平台,该移动平台可以是至少部分自动化的移动的系统,和/或可以是驾驶辅助系统。一个实例可以是至少部分自动化的车辆或具有驾驶辅助系统的车辆。也就是说,在这方面,关于至少部分自动化的功能,移动平台包含至少部分自动化的系统,但是移动平台也包含连同驾驶辅助系统在内的车辆和其他移动机器。移动平台的其他实例可以是:具有多个传感器的驾驶辅助系统,如例如机器人吸尘器或者割草机之类的移动多传感器机器人,多传感器监控系统,船舶,飞行器,生产机器,个人助理或者门禁系统。这些系统中的每个系统都可以是完全或者部分自主的系统。
附图说明
62.参考图1至9示出并且在下文更详细地阐述本发明的实施例。
63.图1示出了滑移值和相对应的车轮速度随着时间的推移的变化过程;图2示出了制动系统;图3示出了具有状态值序列的状态图;图4示出了具有状态参数的图;图5示出了特性曲线族连带针对该特性曲线族的值的变化的矩阵;图6示出了被改变的特性曲线族值的图示;图7示出了具有一个随着时间的推移的状态参数的图;图8示出了特性曲线族连带针对该特性曲线族的值的变化的列表;以及图9示出了具有多个随着时间的推移的状态参数的图。
具体实施方式
64.示例性地,图1以图100示出了滑移值120的时间变化过程,并且示出了滑移值s要位于其内的极限s
max
、s
min
。在此,曲线160示出了参考速度v,而曲线140示出了所观察的车轮的速度。
65.图2示出了制动系统200,该制动系统200设立成,执行用于确定制动压力变化以优化制动过程的方法。
66.借助车轮传感器和其他车辆传感器,提供车轮的当前车轮状态210,其中该车轮状态210具有多个状态参数、如例如滑移s和车轮加速度a。在制动系统200的模块220中,确定如下至少一个状态参数:所述至少一个状态参数的值偏离目标车辆状态;并且根据所述至少一个状态参数与所述目标车轮状态的偏差,确定制动压力变化的变化方向。替选地,也可以将制动压力保持恒定。利用所确定的变化方向p

或者p

,选出所提供的制动压力特性曲线族250a、250b、251a、251b,以确定制动压力变化的值,其中制动压力特性曲线族将制动压力变化分配给用于制动的多个状态参数:滑移s或车轮加速度a或d,并且制动压力特性曲线族对于制动压力变化和状态参数变化的确定的变化方向是特定的。也就是说,根据状态参数的变化方向,挑选制动压力特性曲线族。因此,存在对于车轮加速度的增加是特定的制动压力特性曲线族250b,并且存在对于车轮加速度的减小是特定的制动压力特性曲线族250a。与此相应地,对于状态参数“滑移”,制动压力特性曲线族251a适用于滑移增加,而制动压力特性曲线族251b适用于滑移减小。在此,制动压力特性曲线族250a、250b分配给正的
制动压力变化,而制动压力特性曲线族251a、251b分配给负的制动压力变化。由此,制动压力变化dp的值可以利用当前的车轮状态和相对应的所提供的制动压力特性曲线族来确定,并且尤其是可以被转发给车轮的制动系统。状态参数和压力变化的值被转发给模块240,使得利用上面描述的强化学习方法可以修改相对应的制动压力特性曲线族。
67.图3示意性地示出了具有两个状态参数“滑移s”和“车轮加速度a”的多个组合的图300,并概略地绘出了状态值的序列。在此,状态区的目标车轮状态310用粗框来标记。如果该方法从在图300中布置在右上方的车轮状态开始,则可以经由画双重阴影线的区314来标记状态区的序列,在所述状态区中分别每隔为例如5ms的所规定的时间间隔来确定相应的状态,并且在这种情况下,尤其是由于为例如30ms的时滞,进行正的制动压力变化,而没有直接到达目标车轮状态310。用黑色标记的区310标记其中进行负的制动压力变化的状态区。
68.制动压力变化如下地影响图300中的车轮状态的变化:ꢀꢀꢀꢀꢀꢀꢀꢀꢀ滑移(x-轴)ꢀꢀꢀꢀꢀarad(y-轴)压力建立ꢀꢀꢀꢀꢀ较大ꢀꢀꢀꢀꢀꢀꢀꢀ较小压力解除ꢀꢀꢀꢀꢀ较小ꢀꢀꢀꢀꢀꢀꢀꢀ较大。
69.图4示意性示出了具有滑移值s 430的时间序列的图400,滑移值s 430例如处于在上极限值和下极限值之外的范围440中。在此,曲线420表明所属的状态值s,而曲线410根据所累积的制动压力变化表明最终得到的制动压力p的变化过程,并概略地绘出如下范围450:其在范围440的时间范围之前的制动压力变化可以被认为是超过范围450中的滑移值430的原因。因此,利用强化学习,可以适配针对状态420的相对应的制动压力特性曲线族,以便实现如下调节:在调节的情况下,滑移保持在所规定的极限之内。
70.图5概略地绘出了针对增加的压力变化的特性曲线族520,其中针对车轮的加速度的状态参数减小,或制动增加。
71.图6示出了被改变的特性曲线族值的图示,根据状态参数:车轮加速度a和滑移s,所述被改变的特性曲线族值说明,要如何根据状态参数来改变制动压力p。
72.图7示出了具有随着时间的推移的状态参数“滑移s”720的图700,并且要认识到,在范围725中,滑移s处于规定的最小滑移值以下。附加地,在该图700中,还绘入了制动压力p的时间变化过程715。强化学习方法可以标识出最后进行的制动压力变化,并且可以相对应地修改所属的制动压力特性曲线族,以便在未来避免未达到针对相对应的车轮状态的滑移。
73.图8示出了如下特性曲线族,该特性曲线族分配给在车轮加速度减小或制动上升时的正的制动压力变化,并且借助针对特性曲线族的值根据车轮状态的变化的列表,更新该特性曲线族,其中已利用强化学习方法来确定所述列表。
74.图9示出了具有随着时间的推移的如下多个参数和状态参数的图:滑移946,快速压力增加944,缓慢压力增加945,保持恒定的压力943,快速压力减小941,缓慢压力减小942,状态指数947,目标制动压力948。在标记滑移变化的快速序列的范围930中,这种变化可以归因于曲线948中的先前的目标制动压力变化连带在范围920中标记的车轮状态。由于要避免滑移的高频变化,所以压力变化的调制频度可以被集成到强化学习方法的奖励规则中。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献