一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

车辆轨迹规划方法、装置、存储介质及电子设备与流程

2022-06-11 13:37:46 来源:中国专利 TAG:


1.本公开涉及自动驾驶领域,具体涉及一种车辆轨迹规划方法、车辆轨迹规划装置、存储介质及电子设备。


背景技术:

2.在自动驾驶技术领域中,智能驾驶系统应当给予驾驶员更多的决策自由度,如换道、超车、并线等,以应对实际驾驶场景下复杂多样的驾驶任务。
3.当共驾系统中同时存在人机两套决策系统时,对驾驶员决策的准确、提前估计成为共驾系统决策研究需要解决的首要问题。但在实际的共驾系统中,由于驾驶员转向力矩受到驾驶辅助系统干扰,当人机转向冲突较大时,驾驶员意图或目标轨迹难以通过定常期望横摆角速度模型准确预测。
4.需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:

5.本公开的目的在于提供一种车辆轨迹规划方法、车辆轨迹规划装置、存储介质及电子设备,旨在解决人机共驾系统在车辆轨迹规划中决策冲突条件下的人机目标轨迹快速同步问题。
6.本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
7.根据本公开实施例的一方面,提供了一种车辆轨迹规划方法,包括:将车辆的当前位置作为规划轨迹曲线的起点;基于所述起点进行时空网格采样得到多个规划轨迹曲线的终点,以根据所述起点和多个终点得到多条规划轨迹曲线;根据规划轨迹代价函数对所述多条规划轨迹曲线进行评估得到轨迹评估结果;其中,所述规划轨迹代价函数包括基于所述车辆的共驾系统中驾驶员目标轨迹的前向预测结果构建的第一代价函数和基于驾驶员目标轨迹的后向估计结果构建的第二代价函数;基于所述评估结果从所述多条规划轨迹曲线中确定一目标规划轨迹曲线。。
8.根据本公开的一些实施例,基于前述方案,所述基于所述起点进行时空网格采样得到多个规划轨迹曲线的终点,包括:基于所述车辆所处道路的形状构建第一坐标系;将所述起点沿第一坐标系的第一坐标轴等距采样p次,以得到np个里程点;其中,p为正整数;将各所述里程点分别沿第一坐标系的第二坐标轴等距采样q次,以得到np*nq个规划轨迹曲线的终点;其中,q为正整数。
9.根据本公开的一些实施例,基于前述方案,所述根据所述起点和多个终点得到多条规划轨迹曲线,包括:确定在第一坐标系下所述起点的网格起点状态向量,以及各所述终点的网格终点状态向量;基于所述网格起点状态向量和各所述网格终点状态向量采用多项式将起点和各所述终点分别进行拟合得到多条规划轨迹曲线。
10.根据本公开的一些实施例,基于前述方案,所述方法还包括:确定所述网格起点状态向量,所述确定所述网格起点状态向量包括:提取所述车辆所处位置的地图信息;基于所述地图信息进行测量得到测量数据;根据所述测量数据确定所述网格起点状态向量。根据本公开的一些实施例,基于前述方案,
11.根据本公开的一些实施例,基于前述方案,所述根据所述测量数据确定所述网格起点状态向量,包括:基于所述测量数据提取所述起点在第一坐标系下的横向里程和侧向位移;根据所述测量数据中所述起点在第二坐标系下航向角和车道中心线航向角确定所述车辆在第一坐标系下的航向角;根据所述测量数据中所述车辆的车辆速度、在第二坐标系下的横摆角速度和车道中心线曲率以及在第一坐标系下的侧向位移计算所述起点在第一坐标系下的横摆角速度;基于所述起点在第一坐标系下的横向里程、侧向位移、航向角以及横摆角速度确定所述网格起点状态向量。
12.根据本公开的一些实施例,基于前述方案,所述方法还包括:确定所述网格终点状态向量,所述确定所述网格终点状态向量包括:根据时空网格采样结果确定所述终点在第一坐标系下的横向里程和侧向位移;配置所述终点在第一坐标系下的航向角以及横摆角速度;基于所述终点在第一坐标系下的横向里程、侧向位移、航向角以及横摆角速度确定所述网格终点状态向量。
13.根据本公开的一些实施例,基于前述方案,所述方法还包括:构建所述规划轨迹代价函数,所述构建所述规划轨迹代价函数包括:基于规划轨迹曲线与所述共驾系统中驾驶员目标轨迹的前向预测结果之间的误差构建第一代价函数;基于规划轨迹曲线与所述共驾系统中驾驶员目标轨迹的后向估计结果之间的误差构建第二代价函数;分别配置所述第一代价函数的第一权重和所述第二代价函数的第二权重;根据所述第一代价函数、所述第二代价函数、所述第一权重和所述第二权重构建所述规划轨迹代价函数。
14.根据本公开的一些实施例,基于前述方案,所述分别配置所述第一代价函数的第一权重和所述第二代价函数的第二权重,包括:计算所述共驾系统中驾驶员转向功率和自动驾驶系统转向功率以得到人机转向功率差;基于所述人机转向功率差确定所述第一权重和所述第二权重。
15.根据本公开的一些实施例,基于前述方案,所述根据所述第一代价函数、所述第二代价函数、所述第一权重和所述第二权重构建所述规划轨迹代价函数,包括:基于规划轨迹曲线的车道保持性构建第三代价函数;基于规划轨迹曲线的侧向加速度构建第四代价函数;基于规划轨迹曲线的侧向加加速度构建第五代价函数;分别配置所述第三代价函数的第三权重、所述第四代价函数的第四权重和所述第五代价函数的第五权重;根据所述第一代价函数、所述第二代价函数、所述第三代价函数、所述第四代价函数、所述第五代价函数、所述第一权重、所述第二权重、所述第三权重、所述第四权重和所述第五权重构建所述规划轨迹代价函数。
16.根据本公开的一些实施例,基于前述方案,所述方法还包括:确定所述共驾系统中驾驶员目标轨迹的后向估计结果,所述确定所述共驾系统中驾驶员目标轨迹的后向估计结果包括:以规划轨迹曲线与驾驶员目标轨迹之间的误差最小构建驾驶员轨迹跟踪控制目标函数,以及以规划轨迹曲线与自动驾驶系统目标轨迹之间的误差最小构建系统轨迹跟踪控制目标函数;基于分布式模型预测控制的纳什均衡策略求解所述驾驶员轨迹跟踪控制目标
函数和所述自动驾驶系统轨迹跟踪控制目标函数得到所述驾驶员目标轨迹的后向估计结果。
17.根据本公开的一些实施例,基于前述方案,所述以规划轨迹曲线与驾驶员目标轨迹之间的误差最小构建驾驶员轨迹跟踪控制目标函数,以及以规划轨迹曲线与自动驾驶系统之间的误差最小构建系统轨迹跟踪控制目标函数,包括:计算所述车辆的预测侧向位移;确定驾驶员控制时域内预设预瞄距离处的驾驶员预瞄车辆侧向位移,并基于所述预测侧向位移和所述驾驶员预瞄车辆侧向位移构建所述驾驶员轨迹跟踪控制目标函数;以及确定自动驾驶系统控制时域内所述预设预瞄距离处的系统预瞄车辆侧向位移,并基于所述预测侧向位移和所述系统预瞄车辆侧向位移构建所述系统轨迹跟踪控制目标函数。
18.根据本公开的一些实施例,基于前述方案,所述基于分布式模型预测控制的纳什均衡策略求解所述驾驶员轨迹跟踪控制目标函数和所述自动驾驶系统轨迹跟踪控制目标函数得到所述驾驶员目标轨迹的后向估计结果,包括:基于所述驾驶员轨迹跟踪控制目标函数和所述自动驾驶系统轨迹跟踪控制目标函数得到驾驶员控制策略表达式和自动驾驶系统控制策略表达式;利用凸迭代算法求解所述驾驶员控制策略表达式和自动驾驶系统控制策略表达式得出解耦后的人机开环纳什均衡解;根据所述人机开环纳什均衡解得到驾驶员预瞄点处的侧向位移表达式;通过伪逆法求解所述侧向位移表达式的最小二乘解得到所述驾驶员目标轨迹的后向估计结果。
19.根据本公开实施例的第二方面,提供了一种车辆轨迹规划装置,包括:获取模块,用于将车辆的当前位置作为规划轨迹曲线的起点;采样模块,用于基于所述起点进行时空网格采样得到多个规划轨迹曲线的终点,以根据所述起点和多个终点得到多条规划轨迹曲线;评估模块,用于根据规划轨迹代价函数对所述多条规划轨迹曲线进行评估得到轨迹评估结果;其中,所述规划轨迹代价函数包括基于所述车辆的共驾系统中驾驶员目标轨迹的前向预测结果构建的第一代价函数和基于驾驶员目标轨迹的后向估计结果构建的第二代价函数;确定模块,用于基于所述评估结果从所述多条规划轨迹曲线中确定一目标规划轨迹曲线。
20.根据本公开实施例的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中的车辆轨迹规划方法。
21.根据本公开实施例的第四方面,提供了一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中的车辆轨迹规划方法。
22.本公开示例性实施例可以具有以下部分或全部有益效果:
23.在本公开的一些实施例所提供的技术方案中,基于时空网格法的人机协同式车辆轨迹规划方法得到多条规划轨迹曲线,并且将基于共驾系统中驾驶员目标轨迹的前向预测结果和后向估计结果同时加入规划轨迹代价函数用于共驾系统中规划轨迹曲线的评估,最终确定最优的目标规划轨迹曲线作为车辆轨迹规划的结果。基于上述方法,实现在轨迹规划时同时考虑驾驶员目标轨迹的前向预测结果和后向估计结果的人机决策融合,能够降低自动驾驶系统的规划轨迹与驾驶员目标轨迹的偏差,一方面提升了驾驶员的决策自由度,另一方面也降低了共驾系统中驾驶员与自动驾驶系统的决策分歧。
24.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不
能限制本公开。
附图说明
25.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
26.图1示意性示出本公开示例性实施例中一种车辆轨迹规划方法的流程示意图;
27.图2示意性示出本公开示例性实施例中两种坐标系的示意图;
28.图3示意性示出本公开示例性实施例中一种frenet坐标系下规划轨迹曲线的示意图;
29.图4示意性示出本公开示例性实施例中一种确定网格起点状态向量方法的流程示意图;
30.图5示意性示出本公开示例性实施例中一种确定网格终点状态向量方法的流程示意图;
31.图6示意性示出本公开示例性实施例中一种六次多项式拟合的规划轨迹曲线示意;
32.图7示意性示出本公开示例性实施例中一种构建所述规划轨迹代价函数方法的流程示意图;
33.图8示意性示出本公开示例性实施例中一种第一权重和第二权重的时空规律之间的关系曲线示意图;
34.图9示意性示出本公开示例性实施例中一种确定后向估计结果方法的流程示意图;
35.图10示意性示出本公开示例性实施例中一种车辆轨迹规划装置的组成示意图;
36.图11示意性示出本公开示例性实施例中一种计算机可读存储介质的示意图;
37.图12示意性示出本公开示例性实施例中一种电子设备的计算机系统的结构示意图。
具体实施方式
38.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
39.此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
40.附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现
这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
41.附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
42.由于人机共驾问题的研究不能局限于人机协同式车道保持这种单一驾驶模式,实际驾驶过程中智能驾驶系统应当给予驾驶员更多的决策自由度(如换道、超车、并线等),以应对实际驾驶场景下复杂多样的驾驶任务,要想使共驾系统适应更复杂的驾驶场景,必须针对人机决策交互问题展开研究。
43.当共驾系统中同时存在人机两套决策系统时,决策分歧也成为人机控制冲突的直接成因之一,有必要通过对人机协同决策的研究以进一步提升共驾系统的人机协调性。一方面,在共驾系统中,驾驶员的实时意图为自动驾驶系统预测驾驶员行为、评估车辆行驶风险、理解复杂驾驶场景提供了重要信息,而误判或忽略驾驶员的真实意图会导致严重的人机冲突,进而增加额外的驾驶负担并降低驾驶员对驾驶辅助系统的信赖度,甚至威胁汽车行驶安全;另一方面,驾驶员的决策并不透明,很难通过传感器直接测得,因此对驾驶员决策的准确、提前估计成为共驾系统决策研究需要解决的首要问题。
44.上述识别方法主要应用转向系统及整车状态信息对驾驶员行为进行定性分类,对于人机共驾系统而言,驾驶员意图的定量早期预测是自动驾驶系统轨迹规划的基础。同时转向系统及整车状态往往是人机交互耦合后的结果,给驾驶员意图识别带来困难。
45.因此,本技术重点针对共驾系统中驾驶员换道意图的准确、定量及早期识别展开研究。在现有技术中,加州大学加州大学san diego分校的mohan等人发现驾驶员的眼动及头动行为在其换道决策前也呈现显著特征,其行为特异性早于驾驶员的转向行为及整车运动状态出现,因而能实现对驾驶员决策的早期估计。同时,驾驶员的眼动、头动行为不与自动驾驶系统耦合,是共驾系统中估计驾驶员意图的重要方法。由于基于循环神经网络(recurrientneural network,rnn)的深度学习方法已被证明是解决自然语言处理(natural language processing,nlp)等时序问题的最有效手段,与上述经典模式识别方法相比,深度学习方法具备更强大的模型表达以及对信息的语义分割能力,并且证明了rnn模型相比于经典机器学习模型在驾驶员意图分类性能上的显著优势。除了rnn外,在图像识别领域大放异彩的卷积神经网络(convolutional neural network,cnn)也在处理时序问题中表现出良好性能,在某些情况下其识别效果甚至强于rnn模型。
46.通过驾驶员意图识别方法实现驾驶员决策的前向预测后,智能驾驶系统即可基于驾驶员决策进行安全评估和轨迹规划。当驾驶员意图位于行驶安全包络之内时,系统规划与驾驶员一致的路径协助驾驶员完成决策目标;而当驾驶员决策不满足安全包络时,智能驾驶系统通过运动学、动力学约束的轨迹规划以及控制权的动态分配以干预驾驶员的操纵,从而保证汽车安全行驶。
47.在共驾系统中,由于驾驶员转向力矩受到驾驶辅助系统干扰,当人机转向冲突较大时,驾驶员意图或目标轨迹难以通过定常期望横摆角速度模型准确预测,且上述轨迹规划的研究尚未触及人机决策分歧的消解问题。而在共驾系统的人机协同决策层中,轨迹规划算法除考虑驾驶员意图的前向预测结果外,通过人机决策冲突来评估和修正自动驾驶系统规划的轨迹也是避免人机决策分歧、实现人机决策同步的关键方法。
48.因此,现有技术中虽然驾驶员目标轨迹的前向预测结果对驾驶员的换道决策进行了早期、长时域的估计,但由于模型对驾驶员决策估计的准确率难以达到100%,还必须反馈矫正算法通过后向估计结果对驾驶员的目标轨迹的前向预测结果进行修正。
49.综上,针对现有技术中的缺陷,考虑到驾驶员目标轨迹前向预测误差会导致人机决策分歧,进而引发转向力矩冲突,本公开首先提出基于非合作型博弈理论的驾驶员目标轨迹后向估计算法,根据人机转向力矩冲突对人机决策分歧下的驾驶员目标轨迹的估计值进行修正,从而确保人机决策的快速同步。之后提出基于时空网格法的人机协同式轨迹规划方法,创新地将基于驾驶员眼动信息的目标轨迹前向预测结果、基于人机转向控制冲突的目标轨迹后向估计结果同时加入自动驾驶系统轨迹规划的代价函数,实现了同时考虑驾驶员眼动行为及人机转向冲突的人机决策融合方法。
50.以下对本公开实施例的技术方案的实现细节进行详细阐述。
51.图1示意性示出本公开示例性实施例中一种车辆轨迹规划方法的流程示意图。如图1所示,该车辆轨迹规划方法包括步骤s101至步骤s104:
52.步骤s101,将车辆的当前位置作为规划轨迹曲线的起点;
53.步骤s102,基于所述起点进行时空网格采样得到多个规划轨迹曲线的终点,以根据所述起点和多个终点得到多条规划轨迹曲线;
54.步骤s103,根据规划轨迹代价函数对所述多条规划轨迹曲线进行评估得到轨迹评估结果;其中,所述规划轨迹代价函数包括基于所述车辆的共驾系统中驾驶员目标轨迹的前向预测结果构建的第一代价函数和基于驾驶员目标轨迹的后向估计结果构建的第二代价函数;
55.步骤s104,基于所述评估结果从所述多条规划轨迹曲线中确定一目标规划轨迹曲线。
56.在本公开的一些实施例所提供的技术方案中,基于时空网格法的人机协同式车辆轨迹规划方法得到多条规划轨迹曲线,并且将基于共驾系统中驾驶员目标轨迹的前向预测结果和后向估计结果同时加入规划轨迹代价函数用于共驾系统中规划轨迹曲线的评估,最终确定最优的目标规划轨迹曲线作为车辆轨迹规划的结果。基于上述方法,实现在轨迹规划时同时考虑驾驶员目标轨迹的前向预测结果和后向估计结果的人机决策融合,能够降低自动驾驶系统的规划轨迹与驾驶员目标轨迹的偏差,一方面提升了驾驶员的决策自由度,另一方面也降低了共驾系统中驾驶员与自动驾驶系统的决策分歧。
57.下面,将结合附图及实施例对本示例实施方式中的车辆轨迹规划方法的各个步骤进行更详细的说明。
58.在步骤s101中,将车辆的当前位置作为规划轨迹曲线的起点。
59.在本公开的一个实施例中,采用时空网格法进行车辆轨迹规划。时空网格法属于基于采样的轨迹规划方法,该方法以车辆的当前位置为起点,根据道路形状进行时空网格采样得到网格中多个网格点作为终点,进而规划车辆轨迹。
60.需要说明的是,在描述车辆的当前位置可以参考两个坐标系。图2示意性示出本公开示例性实施例中两种坐标系的示意图,参考图2所示,包括第一坐标系和第二坐标系。
61.其中,第一坐标系即frenet(道路)坐标系,根据道路的形状进行构建。frenet坐标系由s轴和l轴构成,s轴沿道路中心线延伸,代表道路里程,l轴沿道路中心线的法线方向,
代表了车辆与车道中心线的侧向偏差。同时,多条等间距的s轴和l轴构成了时空网格,其中包括许多个网格点。
62.第二坐标系即全局坐标系,是在二维空间内车辆所在的坐标系,不以车辆所处的道路而改变。全局坐标系由x轴和y轴构成,x轴沿横向延伸,用于表示车辆的纵向位移,y轴沿纵向延伸,用于表示车辆的侧向位移。
63.在步骤s102中,基于所述起点进行时空网格采样得到多个规划轨迹曲线的终点,以根据所述起点和多个终点得到多条规划轨迹曲线。
64.在本公开的一个实施例中,首先基于起点进行时空网格采样,即将起点根据车辆所处道路的形状进行网格采样,得到一系列网格点作为规划轨迹曲线的终点。
65.之后连接起点与终点即可得到一条规划轨迹曲线,由于网格采样得到了多个终点,所以就可以得到与终点相同数量的规划轨迹曲线。
66.进一步地,在本公开的一个实施例中,步骤s102中基于所述起点进行时空网格采样得到多个规划轨迹曲线的终点,包括:
67.步骤一,基于所述车辆所处道路的形状构建第一坐标系;
68.步骤二,将所述起点沿第一坐标系的第一坐标轴等距采样p次,以得到np个里程点;其中,p为正整数;
69.步骤三,将各所述里程点分别沿第一坐标系的第二坐标轴等距采样q次,以得到np*nq个规划轨迹曲线的终点;其中,q为正整数。
70.具体地,在进行时空网格采样时,需要按照车辆所处道路的形状向行驶方向进行网格采样。所以在步骤一中,为了方便采样,首先需要根据道路的形状构建frenet坐标系,即以车辆所处道路的中心线为s轴,以道路中心线的法线方向为l轴。
71.在步骤二和步骤三中,构建frenet坐标系完成之后,分别沿frenet坐标系的两个坐标轴的方向以等间距采样点在道路上进行网格采样,便可得到一系列网格点作为规划轨迹曲线的终点。
72.例如,若以s轴为第一坐标轴,首先沿着s轴,即道路中心线方向等距采样p次得到n
p
里程点,然后再将每个里程点沿着l轴再向道路中心线的法线方向的侧向范围等距采样q次即可得到n
p
*nj网格点。
73.当然,也可以先沿着l轴等距采样之后,再沿着s轴等距采样,同样可以得到多个规划轨迹曲线的终点。
74.进一步地,在本公开的一个实施例中,步骤s102中根据所述起点和多个终点得到多条规划轨迹曲线,包括:
75.步骤四,确定在第一坐标系下所述起点的网格起点状态向量,以及各所述终点的网格终点状态向量;
76.步骤五,基于所述网格起点状态向量和各所述网格终点状态向量采用多项式将起点和各所述终点分别进行拟合得到多条规划轨迹曲线。
77.图3示意性示出本公开示例性实施例中一种frenet坐标系下规划轨迹曲线的示意图。参考图3所示,在frenet坐标系中,连接规划轨迹曲线的起点与每一个终点即可得到一条规划轨迹曲线,而每一个网格点的时空网格状态可以用网格状态向量来表示,所以确定起点和终点的网格状态向量即可得到规划轨迹曲线的表达式。
78.需要说明的是,在frenet坐标系中,网格状态向量可以由横向里程s
pl
、侧向位移l
pl
、航向角ψ
pl
、曲率ρ、沿轨迹切方向的前进车速v以及车辆行驶至该点的时间t共同决定的,因此各网格点的状态向量可以用xg=[s
pl
,l
pl

pl
,ρ,v,t]
t
表示。
[0079]
由于本技术重点研究人机转向交互,对于自车与周车动态交互相关的速度规划进行适当简化处理。在每个轨迹规划时域内的速度v,均保持为车辆当前速度,车辆到达每一个网格点的时间t也随之确定,另外,曲率ρ
pl
可以通过横摆角速度间接表示,因此轨迹网格点的状态向量变为
[0080]
对于规划轨迹曲线在起点处的网格起点状态向量,可以将其表示为而终点处的网格终点状态向量可以表示为
[0081]
在步骤四中,需要分别确定规划轨迹曲线的起点和终点的状态向量。
[0082]
图4示意性示出本公开示例性实施例中一种确定网格起点状态向量方法的流程示意图。参考图4所示,确定网格起点状态向量意图。参考图4所示,确定网格起点状态向量的方法包括以下步骤:
[0083]
步骤s401,提取所述车辆所处位置的地图信息;
[0084]
步骤s402,基于所述地图信息进行测量得到测量数据;
[0085]
步骤s403,根据所述测量数据确定所述网格起点状态向量。
[0086]
接下来,对步骤s401至步骤s403进行详细解释。
[0087]
在步骤s401中,首先获取车辆所处位置的地图信息。
[0088]
具体地,地图信息可以是高精度地图,高精度地图是用于无人驾驶路径规划常用的地图信息,也称自动驾驶地图、高分辨率地图,是面向自动驾驶汽车的一种新的地图数据范式。
[0089]
所谓高精度地图,实际上是和普通导航电子地图相对而言的服务于自动驾驶系统的专题地图。高精地图绝对位置精度接近1m相对位置精度在厘米级别,能够达到10-20cm。能够准确和全面地表征道路特征,并要求更高的实时性。此外,高精地图记录驾驶行为的具体细节,包括典型驾驶行为、最佳加速点及刹车点、路况复杂程度、以及对不同路段信号接收情况的标注等。
[0090]
在步骤s402中,基于所述地图信息进行测量得到测量数据。
[0091]
在本公开的一个实施例中,基于地图信息可以进行测量可以得到测量数据,包括车辆起点处在第一坐标(frenet坐标系)下的横向里程s
pl0
和侧向位移l
pl0
,同时还可以包括车辆起点处在第二坐标(全局坐标系)下的车道中心线横坐标x
ref0
、车道中心线纵坐标y
ref0
、车道中心线航向角ψ
ref0
、车道中心线曲率ρ0以及车辆的航向角ψ、车辆速度v
x
等。
[0092]
在步骤s403中,根据所述测量数据确定所述网格起点状态向量。
[0093]
进一步地,所述根据所述测量数据确定所述网格起点状态向量,包括:基于所述测量数据提取所述起点在第一坐标系下的横向里程和侧向位移;根据所述测量数据中所述起点在第二坐标系下航向角和车道中心线航向角确定所述车辆在第一坐标系下的航向角;根据所述测量数据中所述车辆的车辆速度、在第二坐标系下的横摆角速度和车道中心线曲率
以及在第一坐标系下的侧向位移计算所述起点在第一坐标系下的横摆角速度;基于所述起点在第一坐标系下的横向里程、侧向位移、航向角以及横摆角速度确定所述网格起点状态向量。
[0094]
具体而言,网格起点状态向量为其中frenet坐标系下的横向里程s
pl0
和侧向位移l
pl0
可以直接根据测量数据提取得到。
[0095]
对于第一坐标系下的航向角ψ
pl0
,可以根据第二坐标系下航向角ψ和车道中心线航向角ψ
ref0
来计算,参见公式(1)如下:
[0096]
ψ
pl0
=ψ-ψ
ref0
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0097]
对于第一坐标系下的横摆角速度可以根据车辆速度v
x
、在第二坐标系下的横摆角速度和车道中心线曲率ρ0以及在第一坐标系下的侧向位移l
pl0
来计算,参见公式(2)如下:
[0098][0099]
图5示意性示出本公开示例性实施例中一种确定网格终点状态向量方法的流程示意图。参考图5所示,确定网格终点状态向量意图。参考图5所示,确定网格终点状态向量的方法包括以下步骤:
[0100]
步骤s501,根据时空网格采样结果确定所述终点在第一坐标系下的横向里程和侧向位移;
[0101]
步骤s502,配置所述终点在第一坐标系下的航向角以及横摆角速度;
[0102]
步骤s503,基于所述终点在第一坐标系下的横向里程、侧向位移、航向角以及横摆角速度确定所述网格终点状态向量。
[0103]
具体来说,在步骤s501中,由于在进行时空网个采样时,是沿frenet坐标系的s轴和l轴分别进行等间距采样,因此可以根据起点的横向里程s
pl0
和侧向位移l
pl0
得到各终点的横向里程s
plt
和侧向位移l
plt

[0104]
在步骤s502中,需要设置终点的航向角以及横摆角速度满足的约束条件,即ψ
plt
=0以及
[0105]
最终在步骤s503中,得到各个终点的形成n
p
*nj个网格状态,即构成了k时刻网格状态张量:
[0106][0107]
在步骤五中,基于所述网格起点状态向量和各所述网格终点状态向量采用多项式将起点和各所述终点分别进行拟合得到多条规划轨迹曲线。
[0108]
具体而言,在frenet坐标系下连接起点和终点,并根据网格起点状态向量和网格终点状态向量从时空网格中搜索出最优的时空网格点序列,使点序列连成规划轨迹曲线。
[0109]
规划轨迹曲线可以通过多项式拟合获得,例如对时空网格点采用六次多项式进行拟合连接,参见公式(3)如下:
[0110][0111]
式中,bk包括b0=0,b1=ψ
pl0
,,其中,δs=s
plt-s
pl0
,δl=l
plt-l
pl0
,s
plt
∈[s
pl0
,s
plt
]。
[0112]
图6示意性示出本公开示例性实施例中一种六次多项式拟合的规划轨迹曲线示意图。参见图6所示,车辆当前处于起点p0的位置,时空网格采样得到p1~p8共8个终点,分别连接p0和各终点并搜索最优的时空网格点序列,可以拟合得到8条规划轨迹曲线如图6所示。
[0113]
在轨迹规划过程中,首先基于frenet坐标系运用公式(3)得到规划轨迹曲线,再根据公式(4)和公式(5)得到全局坐标系下的规划轨迹曲线,公式(4)和(5)如下:
[0114]
x
pl
=x
ref-l
pl
sin(ψ
ref
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0115]ypl
=y
ref-l
pl
cos(ψ
ref
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0116]
式中,x
ref
、y
ref
、ψ
ref
为全局坐标系下车道中心线的横纵坐标及切线方向角。
[0117]
在步骤s103中,根据规划轨迹代价函数对所述多条规划轨迹曲线进行评估得到轨迹评估结果;其中,所述规划轨迹代价函数包括基于所述车辆的共驾系统中驾驶员目标轨迹的前向预测结果构建的第一代价函数和基于驾驶员目标轨迹的后向估计结果构建的第二代价函数。
[0118]
在本公开的一个实施例中,需要对上述得到的多条规划轨迹曲线分别进行评估,进而从得到的网格状态张量上式中搜索出一条最优目标轨迹具有最小的代价函数值。因此,就需要对轨迹的品质进行评估,构建规划轨迹代价函数进行计算。
[0119]
由于共驾系统中驾驶员转向操控及整车状态均受到自动驾驶系统影响,这种双智能体冗余系统存在的人机决策混淆问题会导致传统的驾驶员意图预测方法的预测精度下降。所以,在本技术中以人为中心的自动驾驶系统设计原则下,需要在轨迹评估函数中需要引入驾驶员目标轨迹的前向预测及后向估计结果,以此评估自动驾驶系统规划的轨迹与驾驶员目标轨迹的一致程度,从而降低共驾系统决策层的人机冲突。
[0120]
图7示意性示出本公开示例性实施例中一种构建所述规划轨迹代价函数方法的流程示意图。参考图7所示,构建规划轨迹代价函数方法的步骤包括:
[0121]
步骤s701,基于规划轨迹曲线与所述共驾系统中驾驶员目标轨迹的前向预测结果之间的误差构建第一代价函数;
[0122]
步骤s702,基于规划轨迹曲线与所述共驾系统中驾驶员目标轨迹的后向估计结果之间的误差构建第二代价函数;
[0123]
步骤s703,分别配置所述第一代价函数的第一权重和所述第二代价函数的第二权
重;
[0124]
步骤s704,根据所述第一代价函数、所述第二代价函数、所述第一权重和所述第二权重构建所述规划轨迹代价函数。
[0125]
在步骤s701中,构建第一代价函数j
pl1
。j
pl1
为驾驶员目标轨迹的前向预测代价函数,代表了车辆规划轨迹与驾驶员目标轨迹前向预测结果之间的误差,具体如公式(6)所示:
[0126][0127]
式中,y
pli
为第i个预瞄点处的车辆规划轨迹(根据公式5计算),为第i个预瞄点处的驾驶员目标轨迹的前向预测结果。
[0128]
第一代价函数j
pl1
能够对驾驶员目标轨迹进行前向预测能够对驾驶员的换道决策进行早期估计以获得驾驶员未来较长时域内的目标轨迹,确保自动驾驶系统决策层可以规划出更加稳定、长时域的目标轨迹。
[0129]
在步骤s702中,构建第二代价函数j
pl2
。j
pl2
为驾驶员目标轨迹的后向估计代价函数,代表了规划轨迹与驾驶员目标轨迹后向估计结果之间的误差,具体如公式(7)所示:
[0130][0131]
式中,nu为预瞄点总个数,y
pli
为第i个预瞄点处的车辆规划轨迹,为第i个预瞄点处驾驶员目标轨迹的后向估计结果。
[0132]
第二代价函数j
pl2
能够对驾驶员目标轨迹进行后向估计能够用于前向预测存在误差的人机决策分歧条件下,自动驾驶系统的目标轨迹修正以及人机决策的重新同步。
[0133]
在步骤s703中,需要分别设置第一代价函数j
pl1
的第一权重w1,即车辆规划轨迹与驾驶员决策目标轨迹前向预测的误差权重,以及设置第二代价函数的第二权重w2,即规划轨迹与驾驶员决策目标轨迹后向估计的误差权重。
[0134]
进一步地,所述分别配置所述第一代价函数的第一权重和所述第二代价函数的第二权重,包括:计算所述共驾系统中驾驶员转向功率和自动驾驶系统转向功率以得到人机转向功率差;基于所述人机转向功率差确定所述第一权重和所述第二权重。
[0135]
具体而言,第一权重w1与第二权重w2由人机转向功率差的绝对值|p
h-pm|确定,具体如公式(8)和公式(9)所示:
[0136][0137][0138]
式中,为第一权重w1的权重系数,为第二权重w2的权重系数,h为驾驶员的转向角,d2为tan函数的调整参数,ph为驾驶员转向功率,pm为自动驾驶系统转向功率,p
the
为额定功率。
[0139]
图8示意性示出本公开示例性实施例中一种第一权重和第二权重的时空规律之间的关系曲线示意图。参考图8所示,横坐标表示人机转向功率差的绝对值|p
h-pm|,纵坐标表
示权重值,权重值处于[0,1]之间,实线表示先验权重,即第一权重w1,虚线表示后验权重,即第二权重w2。
[0140]
在步骤s704中,根据第一代价函数、第二代价函数、第一权重和第二权重构建规划轨迹代价函数j,如公式(10)所示:
[0141]
j=w1j
pl1
w2j
pl2
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0142]
在本公开的一个实施例中,除了引入驾驶员目标轨迹的前向预测及后向估计结果,还可以加入轨迹规划中通常所考虑的运动学及动力学安全性、舒适性、通过效率等因素。
[0143]
因此,进一步地,构建规划轨迹代价函数方法还包括:基于规划轨迹曲线的车道保持性构建第三代价函数;基于规划轨迹曲线的侧向加速度构建第四代价函数;基于规划轨迹曲线的侧向加加速度构建第五代价函数;分别配置所述第三代价函数的第三权重、所述第四代价函数的第四权重和所述第五代价函数的第五权重;根据所述第一代价函数、所述第二代价函数、所述第三代价函数、所述第四代价函数、所述第五代价函数、所述第一权重、所述第二权重、所述第三权重、所述第四权重和所述第五权重构建所述规划轨迹代价函数。
[0144]
具体而言,第三代价函数j
pl3
为车道保持性能代价函数,代表了轨迹的运动学安全性;第四代价函数j
pl4
为侧向加速度代价函数,代表了轨迹的动力学安全性;第五代价函数j
pl5
为侧向加加速度代价函数,代表了轨迹的表征舒适程度的行驶平顺性。j
pl3
、j
pl4
以及j
pl5
的函数表达式分别如公式(11)、(12)以及(13)所示:
[0145][0146][0147][0148]
式中,n
pl
代表一次规划过程的轨迹终点总数,y
refi
为参考轨迹在y轴的偏移量,r
id
为车辆转向角度。
[0149]
另外,还可以根据需求配置j
pl3
对应的第三权重w3,即车道保持权重;j
pl4
对应的第四权重w4,即侧向加速度惩罚权重;以及j
pl5
对应的第五权重w5,即侧向加加速度权重。
[0150]
最后,综合第一、二、三、四、五代价函数构建另一种规划轨迹代价函数j如公式(14)所示:
[0151]
j=w1j
pl1
w2j
pl2
w3j
pl3
w4j
pl4
w5j
pl5
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0152]
在构建完成规划轨迹代价函数之后,可以对上述步骤s2中得到多条规划轨迹曲线分别进行轨迹代价值的计算,得到各规划轨迹曲线的评估结果。
[0153]
在步骤s104中,基于所述评估结果从所述多条规划轨迹曲线中确定一目标规划轨迹曲线。
[0154]
具体地,规划轨迹曲线的评估结果中包括多条规划轨迹曲线的代价值,选取代价函数最小值对应的规划轨迹曲线作为目标规划轨迹曲线,使得车辆参照该目标规划轨迹曲线行驶。
[0155]
基于上述方法,在评估轨迹时,根据驾驶员目标轨迹的前向预测结果以及后向估计结果构建规划轨迹代价函数用于轨迹的评估,使得在轨迹评估时驾驶员目标轨迹的后向估计结果可以有效补偿驾驶员目标轨迹前向预测中的误差,达到人机决策融合的目的,以实现决策冲突条件下的人机目标轨迹快速同步。
[0156]
图9示意性示出本公开示例性实施例中一种确定后向估计结果方法的流程示意图。参考图9所示,确定共驾系统中驾驶员目标轨迹的后向估计结果具体包括以下步骤:
[0157]
步骤s901,以规划轨迹曲线与驾驶员目标轨迹之间的误差最小构建驾驶员轨迹跟踪控制目标函数,以及以规划轨迹曲线与自动驾驶系统目标轨迹之间的误差最小构建系统轨迹跟踪控制目标函数;
[0158]
步骤s902,基于分布式模型预测控制的纳什均衡策略求解所述驾驶员轨迹跟踪控制目标函数和所述自动驾驶系统轨迹跟踪控制目标函数得到所述驾驶员目标轨迹的后向估计结果。
[0159]
在本技术中,由于采用拟人化的自动驾驶系统转向控制策略,因此整个共驾系统呈现镜像型架构,镜像架构的系统适合采用纳什均衡型的对称式博弈理论以实现驾驶员目标轨迹的后向估计。
[0160]
由于在基于线性二次型调节器的反馈纳什均衡中,驾驶员与自动驾驶系统决策层的目标轨迹均位于增广系统中,且通过系统分析可知该系统不完全可观,给状态观测器的设计带来困难。而在基于分布式模型预测控制的纳什均衡算法中,人机目标轨迹均独立出现在各自目标函数中,且未与系统中的其他变量发生耦合,因此可以基于分布式模型预测控制的纳什均衡策略实现驾驶员,目标轨迹预测。
[0161]
接下来,对确定共驾系统中驾驶员目标轨迹的后向估计结果的步骤s901和步骤s902进行详细说明。
[0162]
在步骤s901中,以规划轨迹曲线与驾驶员目标轨迹之间的误差最小构建驾驶员轨迹跟踪控制目标函数,以及以规划轨迹曲线与自动驾驶系统目标轨迹之间的误差最小构建系统轨迹跟踪控制目标函数。
[0163]
具体而言,构建驾驶员轨迹跟踪控制目标函数和系统轨迹跟踪控制目标函数包括以下步骤:
[0164]
步骤一、计算所述车辆的预测侧向位移;
[0165]
步骤二、确定驾驶员控制时域内预设预瞄距离处的驾驶员预瞄车辆侧向位移,并基于所述预测侧向位移和所述驾驶员预瞄车辆侧向位移构建所述驾驶员轨迹跟踪控制目标函数;以及
[0166]
步骤三、确定自动驾驶系统控制时域内所述预设预瞄距离处的系统预瞄车辆侧向位移,并基于所述预测侧向位移和所述系统预瞄车辆侧向位移构建所述系统轨迹跟踪控制目标函数。
[0167]
针对步骤一,在本公开的一个实施例中,对于实际系统而言,由于传感器仅能获取车辆当前时刻的人机转向力矩,在驾驶员目标轨迹未知的情况下难以直接预测驾驶员与自动驾驶系统控制时域内的转向行为。
[0168]
因此,可基于最优预瞄理论将驾驶员与自动驾驶系统的转向控制力矩在控制时域内
视为常数,即控制时域内驾驶员的转向力矩(也称为驾驶员的控制策略)以及自动驾驶系统的转向力矩(也称为自动驾驶系统的控制策略)
[0169]
所以在k时刻,由于控制时域内驾驶员和自动驾驶系统的转向力矩分别为常数和那么车辆行驶轨迹的预测模型如公式(15)所示:
[0170][0171]
式中,xk为k时刻该点的状态向量,即k时刻时该点的xg;wk'为k时刻状态向量的权重;重;其中,cc为系统输出矩阵,cc=[0,0,0,0,1,0]
t

[0172]
由此得到车辆的预测侧向位移
[0173]
针对步骤二和步骤三,对于人机共驾系统中的驾驶员和自动驾驶系统而言,各自相应的轨迹跟踪控制的目标函数和分别如公式(16)和公式(17)所示:
[0174][0175][0176]
式中,为k时刻车辆规划轨迹的预测模型,与控制时域内驾驶员的转向力矩以及自动驾驶系统的转向力矩相关;和分别为驾驶员和自动驾驶系统控制时域的第nu个预瞄点,即预瞄距离最远处的车辆侧向位移;q
y1
和q
y2
分别为驾驶员和自动驾驶系统轨迹跟踪误差的加权系数;q
u1
和q
u2
分别为驾驶员和自动驾驶系统对于转向力矩的惩罚系数。
[0177]
在步骤s902中,基于分布式模型预测控制的纳什均衡策略求解所述驾驶员轨迹跟踪控制目标函数和所述自动驾驶系统轨迹跟踪控制目标函数得到所述驾驶员目标轨迹的后向估计结果。
[0178]
具体而言,求解驾驶员目标轨迹的后向估计结果可以分为以下步骤:
[0179]
步骤一、基于所述驾驶员轨迹跟踪控制目标函数和所述自动驾驶系统轨迹跟踪控制目标函数得到驾驶员控制策略表达式和自动驾驶系统控制策略表达式;
[0180]
步骤二、利用凸迭代算法求解所述驾驶员控制策略表达式和自动驾驶系统控制策略表达式得出解耦后的人机开环纳什均衡解;
[0181]
步骤三、根据所述人机开环纳什均衡解得到驾驶员预瞄点处的侧向位移表达式;
[0182]
步骤四、通过伪逆法求解所述侧向位移表达式的最小二乘解得到所述驾驶员目标轨迹的后向估计结果。
[0183]
在步骤一中,将公式(15)代入公式(16)和公式(17)可以得到驾驶员与自动驾驶系统的控制策略表达式分别如公式(18)和公式(19)所示:
[0184]
[0185][0186]
式中,
[0187]
公式(18)和公式(19)的方程表明驾驶员与自动驾驶系统的转向力矩控制相互耦合,而在开环纳什均衡的条件下,驾驶员与自动驾驶系统均不能通过单方面改变自身转向控制力矩而进一步减小各自的轨迹跟踪代价函数值,即满足公式(20)和公式(21):
[0188][0189][0190]
式中,和分别表示驾驶员与自动驾驶系统的控制策略的开环纳什均衡解。
[0191]
在步骤二中,基于凸迭代算法可以得出解耦后的人机开环纳什均衡策略,即人机开环纳什均衡解,如公式(22)所示:
[0192][0193]
式中,
[0194]
在步骤三中,将公式(22)展开,可以得到驾驶员第nu个预瞄点的侧向位移表达式如公式(23)所示:
[0195][0196]
由公式(23)可见,驾驶员预瞄点处的侧向位移可以通过驾驶员与自动驾驶系统的转向力矩交互以及自动驾驶系统的目标轨迹共同确定。
[0197]
在步骤四中,对侧向位移表达式进行求解。由于公式(23)为超定方程组,因此可以通过伪逆法求的最小二乘解,以表示,见公式(24):
[0198][0199]
式中,
[0200]
由于公式(24)是根据驾驶员与自动驾驶系统在k时刻的转向力矩和以及自动驾驶系统第nu个预瞄点处的侧向位移来估计驾驶员目标轨迹,因此将称为驾驶员目标轨迹的后向估计结果,该方法实现了驾驶员目标轨迹的后向估计。
[0201]
驾驶员k至k nu时域的驾驶员目标轨迹序列的后向估计结果可以根据公式(25)计算:
[0202][0203]
式中,为驾驶员目标轨迹后向估计序列,r
mk
为自动驾驶系统目标轨迹序列,为驾驶员与自动驾驶系统k-nu至k时刻的转向力矩交互序列,x
ck
为系统状态向量序列,wk为干扰k-nu至k时刻的序列,即:
[0204][0205][0206][0207]
在本公开的一个实施例中,驾驶员目标轨迹的前向预测结果可以基于驾驶员眼动信息进行预测,利用现有技术即可实现,本公开在此就不做过多赘述。
[0208]
综上,本技术基于非合作型动态博弈理论,综合传感器获得的人机转向力矩交互结果以及自动驾驶系统的实时目标轨迹来估计驾驶员的目标轨迹,主要的创新点在于:
[0209]
一方面,提出了基于非合作型博弈理论的驾驶员目标轨迹后向估计算法。根据人机共驾系统中力矩冲突的结果去回溯驾驶员的真实决策以及目标轨迹,因此又称为驾驶员轨迹的后向估计。驾驶员目标轨迹的后向估计能够有效解决共驾系统中驾驶员和自动驾驶系统这种双智能体冗余系统存在的人机决策混淆问题,可以有效补偿驾驶员目标轨迹前向预测中的误差,并实现决策冲突条件下的人机目标轨迹快速同步。
[0210]
另一方面,提出了基于时空网格法的人机协同式轨迹规划方法。创新地将基于驾驶员眼动信息的目标轨迹前向预测结果、基于人机转向控制冲突的目标轨迹后向估计结果同时加入自动驾驶系统轨迹规划的代价函数,并设计了前向预测及后向估计代价函数的权重的时变规则,能够最大程度降低自动驾驶系统的规划轨迹与驾驶员目标轨迹的偏差,实现了同时考虑驾驶员眼动行为及人机转向冲突的人机决策融合方法。
[0211]
因此,本公开提供的车辆轨迹规划方法不仅提升了驾驶员的决策自由度,同时还降低了共驾系统中驾驶员与自动驾驶系统的决策分歧。
[0212]
图10示意性示出本公开示例性实施例中一种车辆轨迹规划装置的组成示意图,如图10所示,该车辆轨迹规划装置1000可以包括获取模块1001、采样模块1002、评估模块1003以及确定模块1004。其中:
[0213]
获取模块1001,用于将车辆的当前位置作为规划轨迹曲线的起点;
[0214]
采样模块1002,用于基于所述起点进行时空网格采样得到多个规划轨迹曲线的终点,以根据所述起点和多个终点得到多条规划轨迹曲线;
[0215]
评估模块1003,用于根据规划轨迹代价函数对所述多条规划轨迹曲线进行评估得到轨迹评估结果;其中,所述规划轨迹代价函数包括基于所述车辆的共驾系统中驾驶员目标轨迹的前向预测结果构建的第一代价函数和基于驾驶员目标轨迹的后向估计结果构建的第二代价函数;
[0216]
确定模块1004,用于基于所述评估结果从所述多条规划轨迹曲线中确定一目标规划轨迹曲线。
[0217]
根据本公开的示例性实施例,所述采样模块1002用于基于所述车辆所处道路的形状构建第一坐标系;将所述起点沿第一坐标系的第一坐标轴等距采样p次,以得到np个里程点;其中,p为正整数;将各所述里程点分别沿第一坐标系的第二坐标轴等距采样q次,以得到np*nq个规划轨迹曲线的终点;其中,q为正整数。
[0218]
根据本公开的示例性实施例,所述采样模块1002还用于确定在第一坐标系下所述起点的网格起点状态向量,以及各所述终点的网格终点状态向量;基于所述网格起点状态向量和各所述网格终点状态向量采用多项式将起点和各所述终点分别进行拟合得到多条规划轨迹曲线。
[0219]
根据本公开的示例性实施例,所述采样模块1002还包括起点单元,用于提取所述车辆所处位置的地图信息;基于所述地图信息进行测量得到测量数据;根据所述测量数据确定所述网格起点状态向量。
[0220]
根据本公开的示例性实施例,所述起点单元用于基于所述测量数据提取所述起点在第一坐标系下的横向里程和侧向位移;根据所述测量数据中所述起点在第二坐标系下航向角和车道中心线航向角确定所述车辆在第一坐标系下的航向角;根据所述测量数据中所述车辆的车辆速度、在第二坐标系下的横摆角速度和车道中心线曲率以及在第一坐标系下的侧向位移计算所述起点在第一坐标系下的横摆角速度;基于所述起点在第一坐标系下的横向里程、侧向位移、航向角以及横摆角速度确定所述网格起点状态向量。
[0221]
根据本公开的示例性实施例,所述采样模块1002还包括终点单元,用于根据时空网格采样结果确定所述终点在第一坐标系下的横向里程和侧向位移;配置所述终点在第一坐标系下的航向角以及横摆角速度;基于所述终点在第一坐标系下的横向里程、侧向位移、航向角以及横摆角速度确定所述网格终点状态向量。
[0222]
根据本公开的示例性实施例,所述评估模块1003还包括函数单元,用于基于规划轨迹曲线与所述共驾系统中驾驶员目标轨迹的前向预测结果之间的误差构建第一代价函数;基于规划轨迹曲线与所述共驾系统中驾驶员目标轨迹的后向估计结果之间的误差构建第二代价函数;分别配置所述第一代价函数的第一权重和所述第二代价函数的第二权重;根据所述第一代价函数、所述第二代价函数、所述第一权重和所述第二权重构建所述规划轨迹代价函数。
[0223]
根据本公开的示例性实施例,所述函数单元还用于计算所述共驾系统中驾驶员转向功率和自动驾驶系统转向功率以得到人机转向功率差;基于所述人机转向功率差确定所述第一权重和所述第二权重。
[0224]
根据本公开的示例性实施例,所述函数单元还用于基于规划轨迹曲线的车道保持性构建第三代价函数;基于规划轨迹曲线的侧向加速度构建第四代价函数;基于规划轨迹曲线的侧向加加速度构建第五代价函数;分别配置所述第三代价函数的第三权重、所述第四代价函数的第四权重和所述第五代价函数的第五权重;根据所述第一代价函数、所述第二代价函数、所述第三代价函数、所述第四代价函数、所述第五代价函数、所述第一权重、所述第二权重、所述第三权重、所述第四权重和所述第五权重构建所述规划轨迹代价函数。
[0225]
根据本公开的示例性实施例,评估模块1003还包括后向估计单元,用于以规划轨迹曲线与驾驶员目标轨迹之间的误差最小构建驾驶员轨迹跟踪控制目标函数,以及以规划轨迹曲线与自动驾驶系统目标轨迹之间的误差最小构建系统轨迹跟踪控制目标函数;基于
分布式模型预测控制的纳什均衡策略求解所述驾驶员轨迹跟踪控制目标函数和所述自动驾驶系统轨迹跟踪控制目标函数得到所述驾驶员目标轨迹的后向估计结果。
[0226]
根据本公开的示例性实施例,所述后向估计单元还用于计算所述车辆的预测侧向位移;确定驾驶员控制时域内预设预瞄距离处的驾驶员预瞄车辆侧向位移,并基于所述预测侧向位移和所述驾驶员预瞄车辆侧向位移构建所述驾驶员轨迹跟踪控制目标函数;以及确定自动驾驶系统控制时域内所述预设预瞄距离处的系统预瞄车辆侧向位移,并基于所述预测侧向位移和所述系统预瞄车辆侧向位移构建所述系统轨迹跟踪控制目标函数。
[0227]
根据本公开的示例性实施例,所述后向估计单元还用于基于所述驾驶员轨迹跟踪控制目标函数和所述自动驾驶系统轨迹跟踪控制目标函数得到驾驶员控制策略表达式和自动驾驶系统控制策略表达式;利用凸迭代算法求解所述驾驶员控制策略表达式和自动驾驶系统控制策略表达式得出解耦后的人机开环纳什均衡解;根据所述人机开环纳什均衡解得到驾驶员预瞄点处的侧向位移表达式;通过伪逆法求解所述侧向位移表达式的最小二乘解得到所述驾驶员目标轨迹的后向估计结果。
[0228]
上述的车辆轨迹规划装置1000中各模块的具体细节已经在对应的车辆轨迹规划方法中进行了详细的描述,因此此处不再赘述。
[0229]
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0230]
在本公开的示例性实施例中,还提供了一种能够实现上述方法的存储介质。图11示意性示出本公开示例性实施例中一种计算机可读存储介质的示意图,如图11所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品1100,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如手机上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0231]
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。图12示意性示出本公开示例性实施例中一种电子设备的计算机系统的结构示意图。
[0232]
需要说明的是,图12示出的电子设备的计算机系统1200仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
[0233]
如图12所示,计算机系统1200包括中央处理单元(central processing unit,cpu)1201,其可以根据存储在只读存储器(read-only memory,rom)1202中的程序或者从存储部分1208加载到随机访问存储器(random access memory,ram)1203中的程序而执行各种适当的动作和处理。在ram 1203中,还存储有系统操作所需的各种程序和数据。cpu 1201、rom 1202以及ram 1203通过总线1204彼此相连。输入/输出(input/output,i/o)接口1205也连接至总线1204。
[0234]
以下部件连接至i/o接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(cathode ray tube,crt)、液晶显示器(liquid crystal display,lcd)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如lan(local area network,局域网)卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如
因特网的网络执行通信处理。驱动器1210也根据需要连接至i/o接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
[0235]
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被中央处理单元(cpu)1201执行时,执行本公开的系统中限定的各种功能。
[0236]
需要说明的是,本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(erasable programmable read only memory,eprom)、闪存、光纤、便携式紧凑磁盘只读存储器(compact disc read-only memory,cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
[0237]
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0238]
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
[0239]
作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设
备执行时,使得该电子设备实现上述实施例中所述的方法。
[0240]
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0241]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
[0242]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。
[0243]
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献