一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

适应用户驾驶偏好控制自主车辆的制作方法

2022-05-18 22:30:30 来源:中国专利 TAG:


1.本发明总体上涉及自主车辆的控制,更具体地,涉及适应用户驾驶偏好的控制。


背景技术:

2.目前大多数计算机化的高级驾驶者辅助或自主驾驶系统被设计为部署在诸如美国、欧洲或日本市场的发达经济体市场中,这些市场长期以来一直广泛使用私家车并且存在相关的大量有经验的驾驶者,以及严格执行的成文交通法。这些系统倾向于模仿理想化的规则,遵循规避风险的驾驶风格。这些自主驾驶系统通常不会为拥有者提供特定的定制感,而是给车辆更多的通用感——就像出租车而不是你自己的汽车。参见例如us us20150158486a1。
3.自主车辆可将一个或更多个乘客从一个目的地运送到另一目的地。不同的乘客可能对自主车辆有不同的要求或者关于自主车辆的操作有不同的偏好。因此,对于一些用户而言自主驾驶系统的统一风格可能是不可取的。
4.因此,需要提供一种基于用户偏好自适应地控制自主车辆的方法。


技术实现要素:

5.一些实施方式的目的是提供一种用于以适应车辆的一个或多个乘客的驾驶偏好的方式控制自主车辆的系统和方法。另外地或另选地,一些实施方式的目的是提取驾驶偏好而无需乘客驾驶车辆并且将乘客的驾驶偏好映射到适合于自主控制模块的量。
6.当在自主操作中,车辆的乘客,包括坐在驾驶座的那些人,根据定义都是乘客。在普通设计中,车辆设计者通常关心修改操纵和驾驶质量以令驾驶者满意。在常规驾驶期间,可在实际驾驶期间通过评估驾驶者的控制输入来学习驾驶参数。然而,在自主操作中,车辆的乘客,包括坐在驾驶座的那些人(如果有的话)根据定义都是乘客。为此,代替学习驾驶参数,在自主驾驶的情况下,需要从自主车辆的乘客接收这些参数。另外,代替学习主动驾驶者的驾驶偏好,一些实施方式学习被动乘客的舒适偏好。
7.一些实施方式基于这样的认识:乘客舒适度可由g-g图表示,g-g图是车辆乘客所经历的纵向对横向加速度的图,并且g-g图可用作车辆控制器强制执行的性能约束。该认识基于以下认识:g-g图的不同参数表示从新手驾驶者到有经验的驾驶者的驾驶者的不同风格和/或不同体验。因此,这些参数足以指定不同驾驶者的不同舒适度。另外,g-g图提供可用于车辆控制的明确约束。以这种方式,g-g图可用作车辆乘客的舒适度与对车辆控制参数的约束之间的映射。
8.此外,一些实施方式基于这样的认识:四个不同参数形成g-g图。这些参数包括前向加速度的最大大小、后向加速度(即,制动)的最大大小、横向加速度的最大大小以及限定对横向加速度和纵向加速度的混合的约束的g-g图的形状。一些实施方式基于这样的认识:当乘客指示其舒适或不适度时,乘客识别其舒适和/或不适的来源是不切实际的。然而,其感觉的来源可与g-g图的一个或更多个参数有关并且需要识别以便更新g-g图。
9.为此,不同实施方式识别导致来自乘客的舒适反馈的主导因素。不同实施方式在识别主导舒适因素时使用主动方法和被动方法。在被动方法期间,一些实施方式基于g-g图的参数与其最大值的接近度来确定主导因素。在主动方法期间,一些实施方式故意在一个因素占主导的情况下驾驶车辆并请求乘客的反馈。
10.例如,使用被动方法的一个实施方式响应于从乘客接收到舒适反馈,检查车辆的日志以估计在反馈之前的时间接近其最大值的最新参数。例如,如果加速度最接近其最大值,则加速度是主导因素,并且实施方式基于反馈来更新对加速度的约束。如果减速度最接近其最大值,则减速度是主导因素。如果横向加速度最接近其最大值,则横向加速度是主导因素。然而,如果前向/后向加速度和横向加速度均不在其最大值的预定距离内,则主导因素是g-g图的形状。
11.在主动方法期间,一些实施方式按照使得g-g图的四个因素之一与其它因素相比占主导的方式来驾驶车辆。例如,为了学习最大前向加速度,自主车辆在普通驾驶的过程中略微加速超过最大加速度的极限。然后,系统询问指定的乘客(通常是坐在驾驶座的那一个)的反馈。如果乘客肯定响应,则该机动被判断为适当,并且最大加速度被向上修改。如果乘客否定响应,则该机动被判断为不适当,并且最大加速度被向下修改。略微修改以允许探索搜索空间,这促使确定乘客的最大加速度偏好。
12.通过执行使不同参数占主导的不同机动以学习各个参数,实施方式可按照相似的方式学习其它三个参数。为了学习最大制动,一些实施方式执行直路制动机动。为了学习最大横向加速度,一些实施方式控制车辆以恒定速度经历紧曲线。为了学习p参数,一些实施方式控制车辆以跟踪g-g图的边缘的横向加速度和纵向加速度配置(profile)经历曲线。
13.因此,一个实施方式公开了一种用于控制自主车辆的系统。该系统包括:存储器,其被配置为存储限定纵向加速度和横向加速度的值的容许空间的g-g图的参数,g-g图的参数包括最大前向加速度、最大后向加速度、最大横向加速度以及限定连接前向加速度、后向加速度和横向加速度的最大值的曲线的配置的形状参数;输入接口,其被配置为从车辆的乘客接受舒适度作为反馈;处理器,其被配置为确定与反馈对应的主导参数并且基于反馈中指示的舒适度来更新g-g图的主导参数;以及控制器,其被配置为控制车辆将车辆的动力学特性维持在由所更新的g-g图的参数限定的容许空间内。
14.另一实施方式公开了一种用于控制自主车辆的方法,其中,该方法使用与存储的实现该方法的指令联接的处理器,其中,所述指令在由处理器执行时执行所述方法的步骤,所述步骤包括:从车辆的乘客接受舒适度作为反馈;确定与反馈对应的g-g图的主导参数,其中,所述g-g图限定纵向加速度和横向加速度的值的容许空间,g-g图的参数包括最大前向加速度、最大后向加速度、最大横向加速度以及限定连接前向加速度、后向加速度和横向加速度的最大值的曲线的配置的形状参数;基于反馈中指示的舒适度来更新g-g图的主导参数;以及控制车辆将车辆的动力学特性维持在由所更新的g-g图的参数限定的容许空间内。
15.另一实施方式公开了一种非暂时性计算机可读存储介质,其上具体实现有可由处理器执行以用于执行一种方法的程序,该方法包括:从车辆的乘客接受舒适度作为反馈;确定与反馈对应的g-g图的主导参数,其中,g-g图限定纵向加速度和横向加速度的值的容许空间,g-g图的参数包括最大前向加速度、最大后向加速度、最大横向加速度以及限定连接
前向加速度、后向加速度和横向加速度的最大值的曲线的配置的形状参数;基于反馈中指示的舒适度来更新g-g图的主导参数;以及控制车辆将车辆的动力学特性维持在由所更新的g-g图的参数限定的容许空间内。
附图说明
16.[图1a]
[0017]
图1a示出一些实施方式用来将自主车辆的乘客的驾驶偏好变换成自主驾驶控制器可理解的驾驶约束的一些原理的示意图。
[0018]
[图1b]
[0019]
图1b示出一些实施方式用来将自主车辆的乘客的驾驶偏好变换成自主驾驶控制器可理解的驾驶约束的一些原理的示意图。
[0020]
[图2a]
[0021]
图2a示出一些实施方式所使用的g-g图的示意图。
[0022]
[图2b]
[0023]
图2b示出根据一个实施方式的基于驾驶的主导因素更新g-g图的方法的流程图。
[0024]
[图3]
[0025]
图3示出根据一个实施方式的使用被动方法来选择和更新g-g图的主导参数的方法的框图。
[0026]
[图4]
[0027]
图4示出根据一个实施方式的使用主动方法来选择和更新g-g图的主导参数的方法的框图。
[0028]
[图5a]
[0029]
图5a示出根据一些实施方式的使用主动方法来识别主导参数415的一系列机动的示意图。
[0030]
[图5b]
[0031]
图5b示出根据一个实施方式的车辆可在其上自主驾驶以便收集数据的示例轨道的示意图。
[0032]
[图6]
[0033]
图6示出根据一个实施方式的使用虚拟现实来确定指定用户偏好的g-g图的方法的框图。
[0034]
[图7]
[0035]
图7示出接收用于学习乘客的舒适度的标签的过程的示意图。
[0036]
[图8]
[0037]
图8示出根据一些实施方式的变化用于更新g-g图的步长的值的示意图。
[0038]
[图9]
[0039]
图9示出根据一些实施方式的自主车辆的控制的框图。
[0040]
[图10a]
[0041]
图10a是根据本公开的示例方面的自主车辆的控制系统中的各种组件以及与自主车辆关联的云平台或边缘平台的图示。
[0042]
[图10b]
[0043]
图10b是根据本公开的各种实施方式的自主车辆内的计算系统的组件的示意性框图。
[0044]
[图10c]
[0045]
图10c是根据本公开的各种实施方式的自主车辆内的人机接口系统的组件的示意性框图。
[0046]
[图10d]
[0047]
图10d是根据本公开的各种实施方式的自主车辆内以及与自主车辆关联的云/边缘平台中的机器学习系统的组件的示意性框图。
[0048]
[图11]
[0049]
图11示出包括采用一些实施方式的原理的自适应控制器的车辆的示意图。
[0050]
[图12]
[0051]
图12示出根据一些实施方式的自适应控制器与车辆的其它控制器之间的交互的示意图。
具体实施方式
[0052]
图1a和图1b示出一些实施方式用来将自主车辆的乘客的驾驶偏好变换成自主驾驶控制器可理解的驾驶约束的一些原理的示意图。当在自主操作中,车辆的乘客,包括坐在驾驶座的那些人,根据定义都是乘客。在普通设计中,车辆设计者通常关心修改操纵和驾驶质量以令驾驶者满意。在常规驾驶期间,可在实际驾驶期间通过评估驾驶者的控制输入来学习驾驶参数。然而,在自主操作中,车辆的乘客,包括坐在驾驶座的那些人(如果有的话)根据定义都是乘客。为此,代替学习驾驶参数,在自主驾驶的情况下,需要从自主车辆的乘客接收这些参数。另外,代替学习主动驾驶者的驾驶偏好,一些实施方式学习被动乘客的舒适偏好。
[0053]
然而,乘客的反馈,类似我舒适或我不适,不是驾驶控制器可明确理解的指令。当乘客指示她不适时,并不即刻清楚不适的原因。例如,不适可由高车速导致、不适的减速导致和/或可由急转弯导致。另外,即使识别出不适的原因,仍需要手段来将不适变换成控制指令。由于驾驶不适可有许多不同的原因,所以指令应该考虑超过一个原因。换言之,需要自主车辆的乘客的驾驶偏好与该车辆的控制器之间的映射。
[0054]
图1a示出一些实施方式所使用的自主车辆的乘客的驾驶偏好与该车辆的控制器之间的映射120的示意图。实施方式基于这样的认识:乘客舒适度可由g-g图125表示,g-g图是车辆乘客所经历的纵向加速度123对横向加速度127的图。同时,g-g图125可用作车辆控制器强制执行的性能约束。
[0055]
该认识基于以下认识:g-g图的不同参数表示从新手驾驶者到有经验的驾驶者的驾驶者的不同风格和/或不同体验。因此,这些参数足以指定不同驾驶者的不同舒适度。另外,g-g图提供可用于车辆控制的明确约束。以这种方式,g-g图可用作车辆乘客的舒适度与对车辆控制参数的约束之间的映射120。
[0056]
图1b示出根据一些实施方式的不同驾驶偏好与控制的映射的示意图。例如,g-g图可表征不熟练驾驶者、普通驾驶者和熟练驾驶者的驾驶配置。不熟练驾驶者表现出由g-g图
141表示的驾驶配置。在由g-g图141表示的配置中,高水平的纵向加速度至多伴随着相对小的横向加速度,高水平的横向加速度至多伴随着相对小的纵向加速度。不熟练驾驶者有混合横向加速度和纵向加速度的麻烦并且可采用防御性驾驶风格。熟练驾驶者可采用更激进的驾驶风格并且她的g-g图可表现出指定高水平的纵向加速度伴随着相对高的横向加速度以及高水平的横向加速度伴随着相对高的纵向加速度的驾驶配置143。换言之,熟练驾驶者擅长混合纵向加速度和横向加速度。g-g图142表示正常日常驾驶的平均驾驶风格。
[0057]
g-g图可数学上使用以下不等式表征:
[0058][0059]
因此,g-g图由四个参数表征:a是前向加速度的最大大小,b是后向加速度(即,制动)的最大大小,c是横向加速度的最大大小,p确定g-g图的形状。介于0和大约1之间的p对应于比较不熟练的驾驶者,介于大约1和2之间的p对应于比较熟练的驾驶者,大约左右的p对应于普通驾驶者。
[0060]
因此,通过更新130g-g图123的配置,可捕获驾驶偏好140。例如,一些实施方式基于反馈中所指示的舒适度来更新135g-g图。另外,由于g-g图可数学上由其参数表示,所以g-g图限定可用于控制155车辆的约束150。为此,一些实施方式提供了自主车辆的约束控制110,其将车辆的动力学特性维持115在由更新的g-g图的参数限定的容许空间内。以这种方式,她的反馈中指示的用户驾驶偏好被变换为自主驾驶的约束控制的约束。
[0061]
图2a示出一些实施方式所使用的g-g图的示意图。实施方式基于这样的认识:驾驶者作为乘客的舒适偏好与她在乘坐车辆时感觉到的纵向加速度和横向加速度之间的联接有关。该联接由具有参数形式211的g-g图曲线200描述。g-g图通常由一些参数221表示,其中这组参数与驾驶者作为乘客的舒适偏好有关。
[0062]
g-g图曲线的一个实施方式由下式给出
[0063][0064]
其中a
x
和ay是乘客感觉到的纵向加速度和横向加速度,参数θ:={a
max
,b
max
,c
max
,p}是正纵向加速度、负纵向减速度、横向加速度的最大大小,p∈(0,2]是分别与纵向加速度和横向加速度相关的参数。
[0065]
为此,四个不同的参数形成g-g图。这些参数包括前向加速度210的最大大小、后向加速度(即,制动)215的最大大小、横向加速度220和225的最大大小以及限定对横向加速度和纵向加速度的混合的约束的g-g图230的形状。一些实施方式基于这样的认识:当乘客指示其舒适或不适度时,乘客识别其舒适和/或不适的来源是不切实际的。然而,她感觉的来源可与g-g图的一个或更多个参数有关并且需要识别以便更新g-g图。为此,不同实施方式识别导致来自乘客的舒适反馈的主导因素。
[0066]
图2b示出根据一个实施方式的基于驾驶的主导因素更新g-g图的方法的流程图。该实施方式从车辆的乘客接受240舒适度作为反馈。舒适度可通过下述多个不同类型的输
入接口接收。该实施方式确定250与反馈对应的主导参数并基于反馈中指示的舒适度来更新260g-g图的主导参数。步骤250和260的指令可使用连接至输入接口的处理器和存储g-g图的当前参数的存储器来执行。
[0067]
在一些实现方式中,主导参数是g-g图的四个参数之一。不同实施方式在识别主导舒适因素时使用主动方法和被动方法。在被动方法期间,一些实施方式基于g-g图的参数与其最大值的接近度来确定主导因素。在主动方法期间,一些实施方式故意在一个因素占主导的情况下驾驶车辆并且请求乘客的反馈。
[0068]
图3示出根据一个实施方式的使用被动方法选择和更新g-g图的主导参数的方法的框图。该实施方式响应于从乘客接收到舒适反馈305,检查310车辆的日志以估计在反馈之前的时间接近其最大值的最新参数315。例如,如果加速度最接近其最大值,则加速度是主导因素,该实施方式基于反馈来更新对加速度的约束。如果减速度最接近其最大值,则减速度是主导因素。如果横向加速度最接近其最大值,则横向加速度是主导因素。然而,如果前向/后向加速度和横向加速度均不在其最大值的预定距离内,则最大参数和主导因素是g-g图的形状。预定距离可由系统设计者选择。接下来,该实施方式基于反馈中指示的舒适度245来更新320估计的最大参数。
[0069]
在主动方法期间,一些实施方式按照使得g-g图的四个因素之一与其它因素相比占主导的方式来驾驶车辆。例如,为了学习最大前向加速度,自主车辆在普通驾驶的过程中略微加速超过最大加速度的极限。然后,系统询问指定的乘客(通常是坐在驾驶座的乘客)的反馈。如果乘客肯定地响应,则该机动被判断为适当,并且最大加速度被向上修改。如果乘客否定地响应,则该机动被判断为不适当,并且最大加速度被向下修改。略微修改以允许探索搜索空间,这促使确定乘客的最大加速度偏好。
[0070]
图4示出根据一个实施方式的使用主动方法选择和更新g-g图的主导参数的方法的框图。该实施方式请求310车辆的控制器控制车辆以预定方式移动以使g-g图的参数之一占主导415。接下来,该实施方式请求420乘客就车辆以预定方式的移动提供反馈,并且基于反馈来更新430与以预定方式的移动关联的主导参数415。
[0071]
例如,当该实施方式请求控制器在前向加速度的值高于最大前向加速度的情况下使车辆笔直移动时,则前向加速度是主导参数。当该实施方式请求控制器在后向加速度的值高于最大后向加速度的情况下使车辆笔直移动时,则后向加速度是主导参数。当该实施方式请求控制器在横向加速度的值高于最大横向加速度的情况下经过曲线移动时,则横向加速度是主导参数。当该实施方式请求控制器在横向加速度的值和前向加速度的值跟踪g-g图的配置的情况下经过曲线移动时,则横向加速度是主导参数。
[0072]
图5a示出根据一些实施方式的使用主动方法识别主导参数415的一系列机动511的示意图。这些机动是迭代的,因此以使g-g图的参数中的特定参数占主导为目标设计机动。例如,设计机动501以产生关于θ的第一参数的舒适度的数据,设计机动502以产生关于θ的第二参数的舒适度的数据,依此类推,直至对于θ的最终参数,503。在该迭代过程的一个实施方式中,学习参数是指基于曲线125,即,她的个性化参数a
max
、b
max
、c
max
和p来在线识别乘客的内部舒适区域。
[0073]
图5b示出根据一个实施方式的车辆可在其上自主驾驶以便收集数据的示例轨道的示意图。轨道由正在测试的机动的类型标记。有四个机动:a 521、b 531、c 541和p 551,
它们分别产生关于a
max
、b
max
、c
max
和p的信息。在所有机动中,机动涉及根据被设计为达到驾驶者作为乘客的舒适度的预期极限的过程来变化一些车辆相关量,例如沿着轨道的期望速度。
[0074]
本文描述被设计为测试乘客的加速度极限和减速度极限的机动的一个实施方式。这些在轨道的三个笔直段上执行。在机动a 521期间,车辆以最大允许加速度a
max
加速。在机动b 531期间,车辆以最大允许减速度b
max
减速。这通过变化期望的速度来实现,以使得如果车辆完美遵循该速度,则将实现所需加速度或减速度。为了确定期望的速度,假设在笔直段开始附近存在初始速度vi,在结尾附近存在最终离开速度vf。给定乘客的最大加速度a
max
,一些实施方式从沿着路段s-s0的长度方面计算遵循设定为a
max
的恒定加速度的速度配置。该速度配置由下式给出,
[0075][0076]
类似地,给定乘客的最大减速度b
max
,一些实施方式从离开路段s
f-s的结尾的长度方面计算遵循设定为b
max
的恒定减速度的速度配置。该速度配置由下式给出,
[0077][0078]
通常,初始速度vi被设定为车辆在直线段之前离开曲线时的期望速度;最终速度vf被设定为车辆进入下一曲线时的期望速度。为了确保三种速度选择之间的一致性,一些实施方式在沿着笔直段行驶时取三者中的最小值,即,纵向速度被设定为最大速度和通过(3)计算的速度中的最小值,即,
[0079]vd,x
(s)=min{v
d,
(s)v
d,-(s),v
max
}。
[0080]
在测试横向加速度的一个实施方式中,车辆以恒定速度经过曲线移动。轨道的曲线段可被近似为圆弧,意味着车辆的加速度接近恒定。使用向心加速度的表达式,期望速度被设定为其中r1是在两段期间转弯的曲率半径。
[0081]
测试乘客在纵向加速度和横向加速度之间的优选关系的一个实施方式设定期望速度以使得g-g图上的曲线跟随曲线125的周边。为了求解所需速度,我们首先假设和其中r2是转弯的曲率半径。在此示例中,转弯是左转,并且我们获得微分方程,
[0082][0083]
这可用对于多个值p={0.2,0.4,

,2.0},变量的变化来求解。
[0084]
图6示出根据一个实施方式的使用虚拟现实来确定指定用户偏好的g-g图的方法的框图。例如,此方法可用于避免使g-g图的不同参数占主导的实际驾驶和/或可用于以乘客舒适偏好的良好初始猜测进行热启动,以使得参数在训练期间快速收敛并且训练阶段缩短。此方法涉及使用增强或虚拟现实601,其中,人用户从仿真的车辆驾驶环境接收视觉和触觉反馈611。这里可使用上述学习过程,而无需明确地操作车辆。基于对仿真环境中提出的问题651的回答,标签被发送641至g-g图631,其被反馈到仿真车辆621的控制器中。这样,
可获得用户的舒适偏好的粗略理解。增强现实的一些实施方式使用运动仿真器椅、游戏椅等以及可从其获得诸如急动、扭矩、滚动、俯仰、起伏、发动机回转声音等的车辆相关运动或信号的驾驶仿真器软件。
[0085]
图7示出接收用于学习乘客的舒适度的标签的过程的示意图。各个人用户经由交互系统(例如,方向盘701上的显示器711或其它这样的配置)被示出显示对于当前机动正更新哪一参数的机动id 721,并且面对要求一系列回答(例如,是723或否724)的交互问题722。相应地在线学习参数。
[0086]
本文中描述该过程的一些实施方式。对于机动a、b和c,学习过程相同。不失一般性,设yk表示迭代k中的a
max
、b
max
、c
max
之一。在对应机动期间,基于接收的人标签“是”723或“否”624对对应参数进行更新。这种更新的示例是
[0087][0088]
变量和是与适当机动对应的最小值和最大值。变量δyk表示与适当机动对应的步长。其被设定为允许的最大步长与和之差的黄金比γ≈0.618中的较小值,即,最大值和最小值根据这样的逻辑来确定:如果乘客提供与他先前的回答相反的回答,则他已到达极限。具体地,
[0089][0090][0091]
k=-1处的回答被假设为空。
[0092]
在一些实施方式中,pk的学习过程如下。在学习阶段开始时,我们设定并且在机动p期间,我们根据乘客的回答如下修改pk,
[0093][0094]
这样,pk一直减小直至达到其下限。这种选择通过这样的假设引导:乘客具有固定的舒适区域并且a
max
、b
max
、c
max
的初始条件完全在极限内,并且这些由本领域的熟练从业者根据经验设定。因此,在学习阶段开始时,的值将确保区域125将在真正的舒适区域内,并且将仅随着仿真进行开始推动边界。此外,这种假设意味着,一旦达到边界,pk仅可减小,这对于安全考虑很重要。
[0095]
各种实施方式在反馈的舒适度以主导参数的值指示乘客舒适时增大主导参数的最大值,在反馈的舒适度以主导参数的值指示乘客不适时减小主导参数的最大值。主导参数的增大或减小的步长值可在不同实现方式之间变化并且可由系统的设计者选择。另外地
或另选地,在一些实施方式中,步长值可基于主导参数估计的置信度而变化。
[0096]
图8示出根据一些实施方式的变化用于更新g-g图的步长值的示意图。实施方式选择步长δθk以确保随着迭代次数变得足够大,θk收敛到真正的个性化乘客舒适参数θ(理论上仅在k

∞之后发生收敛)。步长选择的一个这种实施方式是确保随着迭代次数变大,步长的大小变小。例如,假定随着g-g图随时间831演变,它从较大的包络801收缩为更紧的包络821。该收缩最初在801和811之间比朝着811和821之间的后续迭代更明显。选择步长的一个方式是在每n次迭代之后乘以介于0和1之间的因子,其中n由设计者预先选择。
[0097]
图9示出根据一些实施方式的自主车辆的控制的框图。控制902包括决策组件942,其生成诸如车轮转角或转向角等的控制动作。控制动作的计算可与或可不与强制执行安全和操作约束944(例如,车道保持或限制加速度约束)同时进行。一些实施方式基于这样的认识:可将驾驶者作为乘客的偏好表示为控制算法942要满足的约束944。
[0098]
对于纵向车辆控制,一些实施方式考虑模型其中v
x
是纵向车辆速度,f
x
是控制器施加在车辆质心上的力,r
x
是所有反作用力之和。一些实施方式假设变速器中不存在打滑以使得发动机速度ωe等于变速器轴速度ω
t
,其经由一些惯性ie与车辆速度线性相关。因此,一些实施方式设计比例控制器来跟踪期望的车辆速度v
d,x
,即,τe=-k
p
(v
x-v
d,x
),其中τ3是作用于发动机上的扭矩。一些实施方式因此获得闭环动力学特性根据这些闭环动力学特性,将k
p
设定为足够大将使得控制器能够紧密地跟踪期望的速度。
[0099]
对于横向车辆控制,我们考虑恒定纵向速度v
x
的单轨误差跟踪模型。误差跟踪模型由下式给出
[0100][0101]
其中这里,ey是车辆位置从参考路径的横向位移,e
ψ
是实际车辆偏航角和期望车辆偏航角之间的差,δ是前轮转角,是期望车辆偏航角速度。系统矩阵由下式给出
[0102][0103]
系数c0=c
α,f
c
α,r
,c1=l
fcα,f
l
rcα,r

[0104]
其它相关系统参数包括纵向车辆速度v
x
、车辆质量m、绕垂直线的惯性矩iz、前后轮胎刚度c
α,f/r
以及前轴和后轴分别与车辆的距离lf,lr。一些实施方式假设期望偏航角速度一些实施方式为系统(1)设计用于调节期望的纵向速度v
d,x
的增益调度控制器。具体地,一些实施方式针对v
x
集合中的v
x
设计状态反馈增益集合例如,v
x
={5,10,...,
150}km/hr。路轮角度被设定为其中是与期望车辆速度对应的最近增益之间的插值。插值的一个示例是线性插值。
[0105]
示例实现方式
[0106]
自主车辆包括至少一个自主驾驶传感器,其被配置为在车辆在自主模式下操作的同时监测至少一个条件。处理装置被配置为在车辆在自主模式下操作的同时控制至少一个车辆子系统。处理装置被配置为根据乘客偏好控制至少一个车辆子系统。可在车辆在自主模式下操作的同时使用在线标签来学习驾驶者作为乘客的偏好。图10a至图10d所示的系统可采取许多不同的形式,并且包括多个和/或替代组件和设施。尽管示出示例系统,但所示的示例组件并非旨在限制。实际上,可使用附加或替代组件和/或实现方式。
[0107]
图10a中示出自主车辆1000的示例组件。自主驾驶传感器1001可包括任何数量的装置,其被配置为生成辅助车辆控制1002以帮助在自主模式下导航车辆的信号。自主驾驶传感器1001的示例可包括雷达传感器、激光雷达传感器、相机、超声传感器、能量收集传感器等。在一些可能的方法中,自主驾驶传感器1001可被配置为从远程源接收信息,例如基于云的传感器,类似专用短距离通信(dsrc)兼容装置(802.11p)、蜂窝接收器、wifi接收器等。
[0108]
车辆控制子系统1002可至少部分地基于自主驾驶传感器1001所生成的信号来控制自主车辆。在车辆在自主模式下操作的同时,车辆控制子系统1002可被配置为根据一个或更多个驾驶者作为乘客的偏好来控制车辆。例如,车辆控制子系统1002可在车辆在非自主模式下操作的同时学习各种驾驶者作为乘客的偏好,将学习的偏好与预定场景关联,并且在车辆在自主模式下操作的同时出现预定场景时应用学习的驾驶者作为乘客的偏好。如果没有驾驶者作为乘客的偏好与特定预定场景关联,则车辆控制子系统1002可被配置为针对该场景应用默认配置控制,直至在车内通过学习系统1030学习偏好或由学习系统1060远程告知偏好。场景的示例可包括道路条件、环境条件和/或交通条件的各种组合。
[0109]
在一些实施方式中,车辆控制1002可被配置为将各个学习的驾驶者作为乘客的偏好与诸如纵向配置控制和/或横向配置控制的一个或更多个配置控制关联。纵向配置控制可限定当纵向行驶(例如,前向或反向)时车辆如何在自主模式下操作。纵向配置控制可包括速度配置控制、减速度配置控制和加速度配置控制。当在自主模式下操作时,速度配置控制可限定相对于标明的速度极限的车辆速度。减速度配置控制可限定当车辆在自主模式下操作时车辆减速的速度,加速度配置控制可限定车辆在自主模式下操作时加速的速度。横向配置控制可限定车辆在自主模式下操作时如何改变方向(例如,转弯和/或左转或右转)。横向配置控制可包括例如转向配置控制。转向配置可限定在转弯期间方向盘角度和变化率的驾驶者作为乘客的偏好。
[0110]
本公开的其它组件包括用于出于各种目的从人用户收集驾驶者作为乘客的偏好信息的人机接口系统1020,包括提供用于机器学习的标签和/或用于加载先前存储的偏好等。为了学习驾驶者作为乘客的偏好的目的和/或为了更新先前偏好等,存在车内学习系统1030。在例如学习系统的计算成本太高难以在车内完成的这些情况下,根据一些实施方式,可存在用于各种目的的外围边缘/云计算平台1040,包括将数据存储在存储器1050中或执行边缘/云机器学习系统1060中的高级机器学习算法所需的复杂计算。
[0111]
通常,如图10b中描绘的计算系统1010的处理器1011可采用任何数量的计算机操
作系统,包括但不限于微软windows操作系统、unix操作系统、aix unix操作系统、linux操作系统、macosx和ios操作系统以及android操作系统的版本和/或变体。计算装置的示例包括但不限于计算机工作站、服务器、台式机、笔记本、膝上型计算机或手持计算机,或者驻留在边缘或云平台1040中的一些其它计算系统和/或装置。
[0112]
计算装置通常包括计算机可执行指令1013,其中指令可由诸如上面所列那些的一个或更多个计算装置执行。计算机可执行指令1013可从使用各种编程语言和/或技术创建的计算机程序编译或解释,包括但不限于单独或组合的java
tm
、c、c 、visualbasic、matlab、python、javascript等。通常,处理器(例如,微处理器)例如从存储器、计算机可读介质等接收指令并且执行指令1013,从而执行一个或更多个处理,包括本文所描述的处理中的一个或更多个。这些指令和其它数据可使用各种计算机可读介质来存储和发送。
[0113]
计算机可读介质(也称为处理器可读介质)包括参与提供可由计算机(例如,由计算机的处理器)读取的数据1012的任何非暂时性(例如,有形)介质。这种介质可采取许多形式,包括但不限于非易失性介质和易失性介质。非易失性介质可包括例如光盘或磁盘和其它持久存储器。易失性介质可包括例如动态随机存取存储器(dram),其通常构成主存储器。这些指令可通过一种或更多种传输介质来发送,包括同轴线缆、铜线和光纤,包括构成联接至计算机的处理器的系统总线的引线。常见形式的计算机可读介质包括例如软盘、柔性盘、硬盘、磁带、任何其它磁性介质、cd-rom、dvd、任何其它光学介质、穿孔卡片、纸带、笔驱动器、具有孔图案的任何其它物理介质、ram、prom、eprom、flash-eeprom、任何其它存储器芯片或盒或者计算机可从其读取数据或指令的任何其它介质。
[0114]
图10c更详细地描述人机接口系统1020。人机接口系统或装置1020可允许自主车辆和人(例如,位于自主车辆内的乘客)之间发生通信、控制和/或其它接口动作。人机接口装置1020可通信上联接至车辆计算系统以允许系统和装置之间诸如经由用户输入1024交换数据、指令和/或请求。人机接口装置可包括或由操作上连接的一个或更多个处理单元1021实现。人机接口装置可以是嵌入式处理器或独立计算装置。在一个特定示例中,人机接口装置可以是定位在自主车辆内(例如,在自主车辆的后座区域内)的平板计算装置。
[0115]
人机接口装置可包括一个或更多个处理器1021和存储器1022。一个或更多个处理器1021可以是任何合适的处理装置(例如,处理器核、微处理器、asic、fpga、控制器、微控制器等),并且可以是操作上连接的一个处理器或多个处理器。存储器1022可包括一个或更多个非暂时性计算机可读存储介质,例如ram、rom、eeprom、eprom、一个或更多个存储器装置、闪存装置等及其组合。
[0116]
人机接口装置可方便自主车辆乘客输入数据的提示、收集和/或输入。具体地,人机接口装置可利用诸如显示器1023的一个或更多个交互用户接口来使得乘客能够输入描述乘客体验的乘客输入数据。具体地,根据本公开的一方面,人机接口装置和/或车辆计算系统可提示乘客提供关于其对自主车辆驾驶会话期间的一个或更多个事件的主观响应的用户输入1024。以这种方式,可收集关于特定实例和/或类型的驾驶机动的用户输入1024和/或反馈,从而允许相对于特定类型的驾驶事件和/或特定物理位置的自主车辆技术的更高级和精细的理解和细化。
[0117]
在一些实现方式中,人机接口装置可包括显示装置1023(例如,触敏显示装置)和/或提供交互用户接口(例如,乘客可通过其提供乘客反馈)的其它输入/输出组件。例如,显
示装置可以是位于自主车辆的后座的乘客可访问的后座显示装置。在一些实现方式中,除了或代替人机接口装置,本公开的系统和方法可包括或利用与作为乘客的驾驶者关联的用户计算装置。例如,在一些实现方式中,除了或代替人机接口装置1020的用户接口的显示器1023,交互用户接口可设置在用户计算装置的显示器上或者可经由用户计算装置的显示器访问。用户计算装置可经由局域网通信上连接至人机接口装置,例如短距离无线连接(例如,蓝牙、zigbee、nfc、红外等)或其它形式的连接(例如,硬连线)。作为示例,用户计算装置可以是智能电话、平板计算装置、可穿戴计算装置、便携式游戏装置、手持显示屏或其它形式的计算装置。在一些实现方式中,用户计算装置可经由网络连接至计算系统。用户界面可显示在人机接口装置的显示部分(例如,座椅显示器、手持显示器等)上、用户计算装置的显示器上或者以其它方式或位置显示。交互用户接口可使得自主车辆的乘客能够在自主车辆驾驶会话期间输入关于乘客体验的乘客反馈(即,乘客输入数据)。例如,触敏显示器可经由触摸接收乘客反馈。也可使用其它输入组件,例如鼠标、键盘或键区、触摸板、点击轮、键盘、球等。
[0118]
在一些实施方式中,用户界面不显示在显示装置(例如,显示器)上,而是可例如基于音频。例如,包括在人机接口装置或其它系统组件中的扬声器可提示用户在自主车辆驾驶会话期间提供包括关于事件的乘客反馈的语音响应。例如,个人助理或其它基于人工智能的技术可经由语音对话与乘客交互以获得反馈。作为另一示例,用户接口可被具体实现于一个或更多个物理按钮、旋钮、滑块、控制杆或其它用户输入组件中,其使得用户能够通过操纵这些物理组件提供乘客反馈。作为另一示例,可通过分析相机所捕获的图像来获得乘客反馈。例如,计算机视觉技术可应用于图像以评估或识别指示乘客舒适和/或满意的手势、言语、眼睛移动和/或面部表情(例如,大拇指向上对大拇指向下)。
[0119]
图10d描述车内的机器学习系统1030、远程平台上的机器学习系统1060或二者的组合。作为示例,机器学习模型可以是或包括下列中的一个或更多个:随机森林分类器;逻辑回归分类器;支持向量机;一个或更多个决策树;神经网络;k-最近邻模型;和/或其它类型的模型,包括线性模型和非线性模型二者。神经网络可包括深度神经网络、前馈神经网络、循环神经网络(例如,lstm网络)、卷积神经网络及其组合。在一些实现方式中,模型可包括某些参数,例如一个或更多个极限或阈值。例如,在一些实现方式中,诸如工程师的人可在模型内限定某些极限或阈值。例如,工程师可设定最大加速度、最大速度、最大停止持续时间或其它参数,其可被并入模型中。在一些实现方式中,模型可确定调节的车辆参数,使得调节的车辆参数在这些参数、极限和/或阈值内。这些机器学习模型利用在自主车辆进行的机动期间获得的训练数据1034以及基于用户输入1024给予机动的标签。使用主要计算能力在车内处理器1031上运行的模型更新模块1033来执行车内训练或机器学习调节和更新操作。
[0120]
在一些实现方式中,本文所描述的某些操作可由位于自主车辆远程并经由一个或更多个无线网络(例如,蜂窝数据网络、卫星通信网络、广域网等)与自主车辆通信的高级机器学习计算系统1063执行。作为示例,机器学习计算系统可使用包括在一个或更多个服务器计算装置中的训练数据1064。在使用多个服务器计算装置的情况下,可根据并行计算架构、顺序计算架构或其组合布置服务器处理器1061。在一些实现方式中,机器学习计算系统可提供控制、监测、管理和/或其它功能,例如从一队自主车辆的数据挖掘1065。例如,在一
些实现方式中,机器学习计算系统1060可为多个自主车辆确定调节的车辆参数,并且可经由网络向一队自主车辆提供调节的车辆多个。
[0121]
在一些实现方式中,车辆计算系统可调节本文所描述的一个或更多个车辆参数。在一些实现方式中,车辆计算系统可在自主车辆上。在其它实现方式中,不在自主车辆上的机器学习计算系统或其它计算系统可调节车辆参数,并且将调节的车辆参数提供给自主车辆。车辆计算系统可包括一个或更多个不同的物理计算装置。
[0122]
与机器学习系统关联的存储器1032/1062包含与识别驾驶者作为乘客的配置有关的信息。这包括但不限于学习算法的参数、驾驶者作为乘客的生物特征识别数据、相关目标以及学习所需的特征集等。这些信息通常被存储在存储器1050数据库、数据存储库或这里所描述的其它数据存储介质中。这些包括用于存储、访问和检索各种类型的数据的各种类型的机制,包括分层数据库、文件系统中的文件集合、专有格式的应用数据库、关系数据库管理系统(rdbms)等。各个这种数据存储通常包括在采用诸如上述那些之一的计算机操作系统的计算装置内,并且经由网络以各种方式中的任一个或更多个访问。文件系统可从计算机操作系统访问,并且可包括以各种格式存储的文件。
[0123]
图11示出包括采用一些实施方式的原理的自适应控制器1102的车辆1101的示意图。如本文所使用的,车辆1101可以是任何类型的轮式车辆,例如客车、公共汽车或漫游车。另外,车辆1101可以是自主或半自主车辆。例如,一些实施方式控制车辆1101的运动。运动的示例包括通过车辆1101的转向系统1103控制的车辆的横向运动。在一个实施方式中,转向系统1103由控制器1102控制。另外地或另选地,转向系统1103可由车辆1101的驾驶者控制。
[0124]
车辆还可包括发动机1106,其可由控制器1102或由车辆1101的其它组件控制。车辆还可包括一个或更多个传感器1104以感测周围环境。传感器1104的示例包括测距仪、雷达、激光雷达和相机。车辆1101还可包括一个或更多个传感器1105以感测其当前运动量和内部状态。传感器1105的示例包括全球定位系统(gps)、加速度计、惯性测量单元、陀螺仪、轴旋转传感器、扭矩传感器、偏转传感器、压力传感器和流量传感器。传感器向控制器1102提供信息。车辆可配备有收发器1106以用于允许控制器1102通过有线或无线通信信道的通信能力。
[0125]
图12示出根据一些实施方式的车辆1101的控制器1200和自适应控制器1102之间的交互的示意图。例如,在一些实施方式中,车辆1101的控制器1200是控制车辆1200的旋转和加速度的转向控制器1210和制动/油门控制器1220。在这种情况下,自适应控制器1102向控制器1210和1220输出控制输入以控制车辆的状态。控制器1200还可包括进一步处理预测控制器1102的控制输入的高级控制器,例如车道保持辅助控制器1230。在两种情况下,控制器1200映射使用预测控制器1102的输出以控制车辆的至少一个致动器,例如车辆的方向盘和/或制动器,以便控制车辆的运动。
[0126]
本发明的上述实施方式可按照众多方式中的任一种来实现。例如,实施方式可使用硬件、软件或其组合来实现。当以软件实现时,软件代码可在任何合适的处理器或处理器集合(无论设置在单个计算机中还是分布于多个计算机)上执行。这些处理器可被实现为集成电路,在集成电路组件中具有一个或更多个处理器。但是,处理器可使用任何合适格式的电路来实现。
[0127]
另外,本文中概述的各种方法或处理可被编码为可在采用各种操作系统或平台中的任一种的一个或更多个处理器上执行的软件。另外,这种软件可使用多种合适的编程语言和/或编程或脚本工具中的任一种来编写,并且也可被编译为在框架或虚拟机上执行的可执行机器语言代码或中间代码。通常,在各种实施方式中,程序模块的功能可根据需要组合或分布。
[0128]
另外,本发明的实施方式可被具体实现为一种方法,已提供其示例。作为该方法的一部分执行的动作可按照任何合适的方式排序。因此,可构造以与所示不同的次序执行动作的实施方式,其可包括同时执行一些动作,尽管在例示性实施方式中作为顺序动作示出。
[0129]
尽管通过优选实施方式的示例描述了本发明,但是将理解,在本发明的精神和范围内,可进行各种其它调整和修改。因此,所附权利要求的目的在于涵盖落在本发明的真实精神和范围内的所有这些变化和修改。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献