一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

自动驾驶汽车的集成式决控方法、装置及存储介质与流程

2021-11-10 03:03:00 来源:中国专利 TAG:


1.本公开属于自动驾驶汽车的自主决控技术领域,特别涉及自动驾驶汽车的集成式决控 方法、装置及存储介质。


背景技术:

2.汽车智能驾驶系统在提高安全性、降低油耗、提高交通效率等方面有巨大潜力。高水 平的智能驾驶依赖于决策和控制的实时性。
3.现有的车辆决策方法,主要进行运动预测、行为选择和轨迹规划等,分别运算后,最 终得到一条可行轨迹。然而,该方法在处理大规模动态避障任务时无法保证实时性。
4.现有的车辆控制方法,仅使用车辆决策阶段给出的光滑且符合动力学约束的轨迹进行 跟踪,以得到车辆期望方向盘转角和期望加速度,但该方法未能体现车辆智能性,即不具 有与周围交通参与者的交互避障能力以及对轨迹的选择能力。


技术实现要素:

5.本公开旨在解决上述问题之一。
6.为此,本公开的实施例提供的一种可扩展性强且在线计算效率高的自动驾驶汽车的集 成式决控方法,包括:
7.本公开第一方面实施例提到的自动驾驶汽车的集成式决控方法,包括:
8.根据交通驾驶场景的静态信息构造候选路径集合,对所述候选路径集合中每一条候选路 径考虑交通驾驶场景的动态信息构建路径跟踪模型,在此基础上进一步构造路径优选模型;
9.将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求解模型和评价函数 求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求解模型,得到最优 决控策略和最优评价函数;
10.从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数选择最优路径,然后 使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径终点。
11.本公开方法的特点及有益效果:
12.本公开实施例提供的自动驾驶汽车的集成式决控方法,区别于现有的自动驾驶分层式 决控方案,本公开方法集成了决策和控制两个功能模块,形成了静态路径规划和动态优选 跟踪两个设计阶段,从而避免了现有分层式决控方案计算效率低,可扩展性差的问题,具 体地:本公开第一个阶段仅考虑静态交通信息规划候选路径集合;本公开在第二个阶段则 考虑动态交通参与者构造带约束跟踪问题,并离线求解得到决控策略和评价函数,在线应 用时使用评价函数得到最优路径,然后使用决控策略跟踪所选路径。
13.由于静态路径规划时不考虑动态障碍物,因此该模块计算效率高,实时性好;动态优 选跟踪时将路径优选和跟踪带来的优化计算负担通过离线求解在线应用的手段消除。因此 本公开方法具有决控智能性好、在线计算效率高的优点。另外,对于不同的交通场景,
静 态路径规划模块可按道路拓扑规划出相应的候选路径集合,而动态优选跟踪模块则构建得 到形式相同的问题,因此本公开方法具备良好的可扩展性。
14.在一些实施例中,所述交通驾驶场景的静态信息包括道路结构、限速、路面标识和交 通法规;所述交通驾驶场景的动态信息包括自动驾驶汽车动力学、周围交通参与者和交通 信号灯信息。
15.在一些实施例中,所述候选路径集合为π,其表达式为:
[0016][0017]
其中,τ
i
为对将可通行车道l
i
的车道中心线作为的候选路径经过离散化后得到的离散候选 路径,i∈{1,n
lane
},n
lane
为自动驾驶汽车可通行的车道数量;为对候离散选路径τ
i
设定的期望速度。
[0018]
在一些实施例中,所述路径跟踪模型为:
[0019][0020]
x
ego,k 1
=f
ego
(x
ego,k
,u
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0021]
x
surr,k 1
=f
surr
(x
ego,k
,x
surr,k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0022]
x
road,k
=f
road
(x
ego,k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0023]
h(x
ego,k
,x
surr,k
)≥d
safe
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0024]
h(x
ego,k
,x
road,k
)≥d
safe
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0025]
其中:
[0026]
式(2)为第i条离散候选路径τ
i
对应的路径跟踪模型的目标函数;为第i条离散候选路 径τ
i
对应的路径跟踪模型的最优目标函数;j
i
为第i条离散候选路径τ
i
对应的路径跟踪模型 的目标函数;n
p
为预测总步数,取值范围为[1,∞);k∈{0,

,n
p

1};为第i条离散 候选路径τ
i
的状态,即x
ego,k
为第k步的自动驾驶汽车状态,其中包括 自动驾驶汽车的位置坐标、纵向速度、横向速度、方向角、横摆角速度,长度和宽度;x
surr,k
为第k步的周围交通参与者状态,包括周围机动车、周围非机动车和周围行人;x
road,k
为 第k步的道路与环境状态,包括自动驾驶汽车距车道边缘的距离和车道限速;u
k
为第k步的 自动驾驶汽车决控参数,包括自动驾驶汽车的期望加速度与方向盘转角或自动驾驶汽车的 期望轨迹;l为效用函数,包含自动驾驶汽车的位置跟踪误差、速度跟踪误差和控制能量损 耗,用于计算每一时间步下的代价;
[0027]
式(3)为自动驾驶汽车的动力学模型;f
ego
(
·
)为第一非线性映射,反映了自动驾驶汽车 从第k步状态到k 1步状态的转移关系;
[0028]
式(4)为周围交通参与者的运动学模型;f
surr
(
·
)为第二非线性映射,反映了周围交通 参与者从第k步状态到第k 1步状态的转移关系;
[0029]
式(5)为道路与环境模型;f
road
(
·
)为第三非线性映射,反映了第k步道路与环境信息 与第k步自动驾驶汽车状态的关联;
[0030]
式(6)为自动驾驶汽车与周围交通参与者的安全约束;h(
·
)为第四非线性映射;d
safe
为 设定的自动驾驶汽车与周围交通参与者间的安全距离;
[0031]
式(7)为自动驾驶汽车与道路的安全约束。
[0032]
在一些实施例中,设定所述路径优选模型的目标函数为:
[0033][0034]
在一些实施例中,所述决控策略求解模型为:
[0035][0036]
x
ego,k 1
=f
ego
(x
ego,k
,u
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0037]
x
surr,k 1
=f
surr
(x
ego,k
,x
surr,k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0038]
x
road,k
=f
road
(x
ego,k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0039]
u
k
=π
θ
(s
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0040]
h(x
ego,k
,x
surr,k
)≥d
safe
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0041]
h(x
ego,k
,x
road,k
)≥d
safe
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0042]
其中:
[0043]
式(9)为所述求解决控策略模型的目标函数;θ为策略参数;表示初始状态s0分布 下的期望性能,所述初始状态分布为不同离散候选路径、自动驾驶汽车状态、周围交通参 与者状态和道路状态的联合分布;u
k
为自动驾驶汽车决控参数;s
k
为第k步的自动驾驶汽 车决控策略状态的输入,
[0044]
式(10)、(11)和(12)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模 型和道路与环境模型;
[0045]
式(13)为使用决控策略π
θ
(
·
)得到的自动驾驶汽车决控参数u
k
;决控策略π
θ
(
·
)为使用 策略参数θ参数化的第五非线性映射,反映了第k步的自动驾驶汽车决控参数u
k
与自动驾驶 汽车状态x
ego,k
的关联;
[0046]
式(14)和(15)分别为自动驾驶汽车与周围交通参与者的安全约束和自动驾驶汽车与道 路的安全约束。
[0047]
在一些实施例中,所述评价函数求解模型为:
[0048][0049]
x
ego,k 1
=f
ego
(x
ego,k
,u
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)
[0050]
x
surr,k 1
=f
surr
(x
ego,k
,x
surr,k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(18)
[0051]
x
road,k
=f
road
(x
ego,k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(19)
[0052]
u
k
=π
θ
(s
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0053]
其中:
[0054]
式(16)为所述评价函数求解模型的目标函数,w为评价函数v
w
(
·
)参数,评价函数v
w
(
·
) 为使用w参数化的第六非线性映射,反映了从当前状态到目标函数的关联;式(17)、(18)、 (19)和(20)分别为自动驾驶汽车的动力学模型、周围交通参与者的运动学模型、道路与环 境模型和使用决控策略π
θ
(
·
)得到自动驾驶汽车决控参数u
k

[0055]
在一些实施例中,通过下式选择所述最优路径:
[0056][0057]
其中,i
opt
为所述最优路径;为所述最优评价函数;s
i
为离散候选路径对应的状态向 量,
[0058]
通过下式确定所述最优动作:
[0059][0060]
其中,u为所述最优动作;为所述最优决控策略;为最优路径i
opt
对应的状 态向量,为最优路径的状态。
[0061]
本公开第二方面实施例提供的自动驾驶汽车的集成式决控装置,包括:
[0062]
模型构建模块,用于根据交通驾驶场景静态信息构造候选路径集合,对所述候选路径 集合中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步 构造路径优选模型;
[0063]
离线求解模块,用于将所述路径跟踪模型和所述路径优选模型分别转化为决控策略求 解模型和评价函数求解模型,通过离线方式求解所述决控策略求解模型和所述评价函数求 解模型,得到最优决控策略和最优评价函数;和
[0064]
在线应用模块,用于从自动驾驶汽车出发时刻开始,每一时刻利用所述最优评价函数 选择最优路径,然后使用所述最优决控策略确定自动驾驶汽车的最优动作,直至到达全局 路径终点。
[0065]
本公开第三方面实施例提供的计算机可读存储介质,所述计算机可读存储介质存储计 算机指令,所述计算机指令用于使所述计算机执行上述自动驾驶汽车的集成式决控方法。
附图说明
[0066]
图1是本公开第一方面实施例提供的自动驾驶汽车的集成式决控方法的整体流程图;
[0067]
图2的(a)和(b)分别是本发明实施例方法生成的静态路径和期望速度;
[0068]
图3是本公开第二方面实施例提供的自动驾驶汽车的集成式决控装置的结构框图;
[0069]
图4是本公开第三方面实施例提供的电子设备的结构框图。
具体实施方式
[0070]
为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本 申请进行进一步详细描述。应当理解,此处所描述的具体实施例仅用于解释本技术,并不 用于限定本技术。
[0071]
相反,本技术涵盖任何由权利要定义的在本技术精髓和范围上做的替代、修改、等效 方法以及方案。进一步,为了使公众对本技术有更好的了解,在下文对本发明的细节描述 中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述
包括自动驾驶汽车的位置坐标、纵向速度、横向速度、方向角、横摆角速度,长度和宽度 等信息;x
surr,k
为第k步的周围交通参与者状态,包括周围机动车、周围非机动车和周围行 人等状态;x
road,k
为第k步的道路与环境状态,包括自动驾驶汽车距车道边缘的距离和车 道限速等信息;u
k
为第k步的自动驾驶汽车决控参数,是用于控制车辆动作的参数,自动 驾驶汽车决策参数包括自动驾驶汽车的期望加速度与方向盘转角或自动驾驶汽车的期望 轨迹等;l为效用函数,其中包含自动驾驶汽车的位置跟踪误差、速度跟踪误差和控制能量 损耗等,用于计算每一时间步下的代价。
[0089]
式(3)为自动驾驶汽车的动力学模型,其中f
ego
(
·
)为第一非线性映射,通常由自动驾驶 汽车的二自由度模型和轮胎模型共同决定,反映了自动驾驶汽车从第k步状态到k 1步状 态的转移关系。
[0090]
式(4)为周围交通参与者的运动学模型,其中f
surr
(
·
)为第二非线性映射,如使用深度 神经网络拟合得到的模型,反映了周围交通参与者从第k步状态到第k 1步状态的转移关 系。
[0091]
式(5)为道路与环境模型,其中f
road
(
·
)为第三非线性映射,如使用深度神经网络拟合 得到的模型,反映了第k步道路与环境信息与第k步自动驾驶汽车状态的关联。
[0092]
式(6)为自动驾驶汽车与周围交通参与者的安全约束,h(
·
)为第四非线性映射,通常为 自车与交通参与者的距离;d
safe
为设定的自动驾驶汽车与周围交通参与者间的安全距离。 安全距离计算方法主要有:(a)自动驾驶汽车形心与周围交通参与者形心的距离;(b)多 圆覆盖法,即使用多个圆分别将自动驾驶汽车与周围交通参与者覆盖,然后分别约束自动 驾驶汽车多个圆的圆心与周围交通参与者的圆心之间的距离。
[0093]
式(7)为自动驾驶汽车与道路的安全约束。
[0094]
在一些实施例中,路径优选模型通过以下步骤构建:
[0095]
根据构建的路径跟踪模型,设定路径优选模型的目标函数为:
[0096][0097]
路径优选模型的约束条件与路径跟踪模型的约束条件相同。路径优选模型考虑分别求 解minj1,minj2,

,然后对比最小的最优解,作为参考路径的选择结果。
[0098]
在一些实施例中,通过以下步骤将得到的路径跟踪模型转化为决控策略求解模型:
[0099]
引入决控策略π
θ
(
·
),为使用策略参数θ参数化的第五非线性映射,其通常为一深度神 经网络,θ为深度神经网络中的参数,反映了第k步的自动驾驶汽车决控参数u
k
与自动驾驶 汽车状态x
ego,k
的关联。构造第k步的自动驾驶汽车决控策略状态的输入为s
k
,其由i条候选 路径τ
i
的状态第k步的自动驾驶汽车状态x
ego,k
、周围交通参与者状 态x
surr,k
,道路与环境状态x
road,k
构造得到,具体地,转化后的决控策略求解模型如下:
[0100][0101]
x
ego,k 1
=f
ego
(x
ego,k
,u
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0102]
x
surr,k 1
=f
surr
(x
ego,k
,x
surr,k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0103]
x
road,k
=f
road
(x
ego,k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(12)
[0104]
u
k
=π
θ
(s
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0105]
h(x
ego,k
,x
surr,k
)≥d
safe
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0106]
h(x
ego,k
,x
road,k
)≥d
safe
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0107]
其中:
[0108]
式(9)为求解决控策略模型的目标函数,优化变量为策略参数θ。表示初始状态分 布下的期望性能,该初始状态分布为不同候选路径、自动驾驶汽车状态、周围交通参与者 状态和道路状态的联合分布,具体地,为不同初始状态s0下{
·
}的平均性能,即由初 始状态分布采样一定数量的初始状态s0,分别计算相应的{
·
},最后计算平均所得。
[0109]
式(10)(11)(12)同式(3)(4)(5)。
[0110]
式(13)为使用决控策略π
θ
(
·
)得到自动驾驶汽车决控参数u
k

[0111]
式(14)(15)同式(6)(7)。
[0112]
在一些实施例中,通过以下步骤将得到的路径优选模型转化为评价函数求解模型:
[0113]
引入评价函数v
w
(
·
),其为使用w参数化的第六非线性映射,其通常为一深度神经网络, w为深度神经网络中的参数,该深度神经网络的输入与决控策略输入相同,反映了从当前 状态到目标函数j
i
的关联。转化后的评价函数求解模型如下:
[0114][0115]
x
ego,k 1
=f
ego
(x
ego,k
,u
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)
[0116]
x
surr,k 1
=f
surr
(x
ego,k
,x
surr,k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(18)
[0117]
x
road,k
=f
road
(x
ego,k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(19)
[0118]
u
k
=π
θ
(s
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0119]
其中:
[0120]
式(16)为评价函数求解模型的目标函数,优化变量为评价函数参数w。
[0121]
式(17)(18)(19)(20)同式(3)(4)(5)(13)。
[0122]
在一些实施例中,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最 优决控策略和最优评价函数,具体包括以下步骤:
[0123]
求解上述公式(9)~公式(15)所示决控策略求解模型与公式(16)~公式(20)所 示评价函数求解模型,输出最优决控策略与最优评价函数
[0124]
在一些实施例中,从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评价函数 选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路径 终点,具体包括以下步骤:
[0125]
车辆出发时刻,给定自动驾驶汽车全局路径、自动驾驶汽车状态x
ego
、周围交通参与 者状态x
surr
和道路与环境状态x
road

[0126]3‑
1)最优路径选择:按照公式(21)构造各离散候选路径对应的状态向量s
i
,i= 1,

,n
lane

[0127][0128]
使用得到的最优评价函数按照公式(22)选择具有最小值的路径作为最优路径 i
opt

[0129][0130]3‑
2)最优路径跟踪:获取最优路径下的状态向量
[0131][0132]
其中,为最优路径的状态;
[0133]
使用得到的最优决控策略使用公式(24)计算自动驾驶汽车当前状态下的最优动 作u:
[0134][0135]
自动驾驶汽车执行最优动作u,计算得到的自动驾驶汽车控制量,通常包括自车期望 加速度与自车期望方向盘转角,获取下一时刻的自动驾驶汽车状态和周车状态。
[0136]3‑
3)不断执行步骤3

1)~3

2),直到自动驾驶汽车达到全局路径终点,本方法结束。
[0137]
本公开实施例提出的动驾驶汽车的集成式决控装置,参见图3,包括:
[0138]
模型构建模块,用于根据交通驾驶场景静态信息构造候选路径集合,对候选路径集合 中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步构造 路径优选模型;
[0139]
离线求解模块,用于将模型构建模块得到的路径跟踪模型和路径优选模型分别转化为 决控策略求解模型和评价函数求解模型,通过离线方式求解决控策略求解模型和评价函数 求解模型,得到最优决控策略和最优评价函数;和
[0140]
在线应用模块,用于从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评价函 数选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,直至到达全局路 径终点。
[0141]
为了实现上述实施例,本公开实施例还提出一种计算机可读存储介质,其上存储 有计算机程序,该程序被处理器执行,用于执行上述实施例的自动驾驶汽车静态路径规 划方法。
[0142]
下面参考图4,其示出了适于用来实现本公开实施例的电子设备100的结构示意 图。其中,需要说明的是,该电子设备100中包括自动驾驶汽车的集成式决控系统,其 中,本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字 广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放 器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字tv、台式计算机、 服务器等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例 的功能和使用范围带来任何限制。
[0143]
如图4所示,电子设备100可以包括处理装置(例如中央处理器、图形处理器等) 101,其可以根据存储在只读存储器(rom)102中的程序或者从存储装置108加载到 随机访
问存储器(ram)103中的程序而执行各种适当的动作和处理。在ram 103 中,还存储有电子设备100操作所需的各种程序和数据。处理装置101、rom 102以 及ram 103通过总线104彼此相连。输入/输出(i/o)接口105也连接至总线104。
[0144]
通常,以下装置可以连接至i/o接口105:包括例如触摸屏、触摸板、键盘、鼠标、 摄像头、麦克风等的输入装置106;包括例如液晶显示器(lcd)、扬声器、振动器 等的输出装置107;包括例如磁带、硬盘等的存储装置108;以及通信装置109。通信 装置109可以允许电子设备100与其他设备进行无线或有线通信以交换数据。虽然图 4示出了具有各种装置的电子设备100,但是应理解的是,并不要求实施或具备所有示 出的装置。可以替代地实施或具备更多或更少的装置。
[0145]
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机 软件程序。例如,本实施例包括一种计算机程序产品,其包括承载在计算机可读介质 上的计算机程序,该计算机程序包含用于执行流程图中所示方法的程序代码。在这样 的实施例中,该计算机程序可以通过通信装置109从网络上被下载和安装,或者从存 储装置108被安装,或者从rom 102被安装。在该计算机程序被处理装置101执行时, 执行本公开实施例的方法中限定的上述功能。
[0146]
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计 算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是—— 但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意 以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多 个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器 (rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只 读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在 本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以 被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读 信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机 可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、 光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质 以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由 指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含 的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等 等,或者上述的任意合适的组合。
[0147]
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未 装配入该电子设备中。
[0148]
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设 备执行时,使得该电子设备:根据交通驾驶场景静态信息构造候选路径集合,对候选路径 集合中每一条候选路径考虑交通驾驶场景动态信息构建路径跟踪模型,在此基础上进一步 构造路径优选模型;将得到的路径跟踪模型和路径优选模型分别转化为决控策略求解模型 和评价函数求解模型,通过离线方式求解决控策略求解模型和评价函数求解模型,得到最 优决控策略和最优评价函数;从自动驾驶汽车出发时刻开始,每一时刻利用得到的最优评 价函数选择最优路径,然后使用最优决控策略确定自动驾驶汽车的最优动作,
直至到达全 局路径终点。
[0149]
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机 程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、 c 、python,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计 语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为 一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在 远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意 种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者, 可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0150]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、
ꢀ“
具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、 结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上 述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、 结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外, 在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示 例以及不同实施例或示例的特征进行结合和组合。
[0151]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对 重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的 特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“多个”的含义 是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0152]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括 一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段 或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或 讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能, 这应被本技术的实施例所属技术领域的技术人员所理解。
[0153]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用 于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中, 以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以 从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系 统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、 存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系 统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包 括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置), 随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom 或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机 可读介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对 纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理 来以电子方式获得程序,然后将其存储在计算机存储器中。
[0154]
应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上 述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行 的软
件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本 领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑 功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可 编程门阵列(pga),现场可编程门阵列(fpga)等。
[0155]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤, 可以通过程序来指令相关的硬件完成,所开发的程序可以存储于一种计算机可读存储 介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0156]
此外,在本技术各个实施例中的各功能单元可以集成在一个处理模块中,也可以 是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成 的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模 块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一 个计算机可读取存储介质中。
[0157]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描 述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术 的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、 替换和变型。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献