一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种由数据驱动的采样搜索方法和系统与流程

2021-12-03 23:37:00 来源:中国专利 TAG:


1.本发明涉及无人驾驶领域,是一种由数据驱动的采样搜索方法和系统,用于复杂环境下的快速路径生成。
技术背景
2.移动路径规划是实现无人驾驶汽车自主导航功能的关键技术之一,其核心在于生成障碍物环境下从起始点到目标点的无碰撞安全轨迹。根据算法对环境信息的利用策略,现有的路径规划算法主要分为基于能量函数,基于图搜索和基于采样的规划算法。
3.其中,针对任务环境构建能量函数需要大量的先验知识,且规划结果容易陷入局部最优陷阱;而基于图搜索和采样的规划算法首先在环境先验中进行搜索或采样,然后基于探索的环境区域进行更新规划,并进行碰撞检测,最后迭代循环直至生成一条可行路径。这两类算法主要特点是由起始点向外扩散,直到扩展到目标点为止,该过程需要遍历计算大量的节点,对空间的探索效率非常低。虽然针对该问题存在众多启发式算法来优化,但这些算法中人工设置的启发式策略往往会在新的未知环境中失效,这对于现实环境中的无人驾驶汽车而言是非常危险的。另外,这类启发式算法生成路径的最优性也无法在理论上进行证明。随着深度学习的快速发展,深度强化学习逐渐成为一种流行的解决方案,但由于其试错成本高,训练效率低以及泛化能力差等问题,目前暂时无法替代传统算法。


技术实现要素:

4.本发明要克服现有技术的上述缺点,提出了一种由数据驱动的采样搜索方法和系统,来代替传统方法中对环境信息探索的复杂步骤,以快速生成可行路径。
5.本发明的目的可以通过以下技术方案来实现:
6.一种由数据驱动的采样搜索方法,用于生成无人驾驶汽车的避障安全路径,该方法包括以下步骤:
7.步骤s1、全局地图编码:
8.使用压缩自动编码器来编码全局地图提取全局地图中有关障碍物及其空间状态信息的特征,输出为编码后的全局地图
9.步骤s2、构建全局采样网络搜索预测模型:
10.构建全局采样网络预测模型,该模型由一层输入层,十层隐藏层和一层输出层构成,输入为编码后的全局地图汽车初始位置q
init
和目标位置q
goal
,输出可能包含最优路径解的下一步关键点q
t 1
;使用a*或rrt*等近似最优方法作为专家系统生成演示轨迹指导全局采样网络进行训练;
11.步骤s3、局部地图编码:
12.使用压缩自动编码器来编码以汽车为中心的局部地图提取局部地图中有关障
碍物信息的隐含特征,输出为编码后的局部地图
13.步骤s4、构建局部采样网络搜索预测模型:
14.局部采样网络预测模型基于与全局地图网络相同的网络框架,并采用相同的训练策略。输入编码后的局部地图汽车当前位置q
curr
以及局部目标位置q'
goal
,输出局部可行路径解
15.步骤s5、集成全局采样网络和局部采样网络:
16.将全局采样网络预测的下一步关键点q
t 1
作为局部视图采样搜索网络的局部目标位置输入,使用局部网络预测完整的局部可行路径解全局采样网络为局部采样网络提供全局信息视角下的指导,防止局部采样网络陷入贪婪陷阱(局部最优);而局部采样网络也可以改善全局网络输出关键点的稀疏性;通过迭代循环往复,最终生成更合理、鲁棒性更好的全局可行轨迹。
17.所述步骤s1包括以下步骤:
18.步骤s1.1、建立基于编码

解码架构的压缩自动编码器,该模型中的编码器f(
·
)包含四个卷积层和一个线性层,解码器g(
·
)包含一个线性层和四个反卷积层,输入为全局地图输出为压缩编码后的全局地图包含障碍物及其空间状态信息等;
19.步骤s1.2、压缩自动编码器的训练只需要利用编码

解码结构来实现无监督学习。首先生成全局地图对应的环境地图图像然后分成小批量集以优化网络的梯度下降。令θ
e
和θ
d
分别表示编码器和解码器参数,则可以使用结合正则化项的均方误差作为模型的损失函数
[0020][0021]
其中是正则项,g(f(x))表示编码

解码后的重构地图信息,是重构误差:
[0022]
所述步骤s2包括以下步骤:
[0023]
步骤s2.1、基于全局地图的采样搜索预测模型,包含一层输入层,十层隐藏层和一层输出层,其中输入层和每个隐藏层由一个线性层、线性整流relu模块和随机失活dropout模块组成,输出层不包含dropout模块;另外,利用了反馈机制加速网络的收敛;
[0024]
步骤s2.2、将编码后的全局地图初始位置q
init
和目标位置q
goal
作为全局地图网络的输入;在训练阶段,使用a*或rrt*作为专家系统生成的轨迹形成演示轨迹集,基于全局地图网络不断迭代和预测在训练集上找到使得规划路径误差最小的参数θ,并基于反向传播算法对网络参数进行估计,最终使得下列目标函数最小:
[0025][0026]
其中n
p
是演示轨迹中关键点的数量,n是演示路径的总数,为网络预测的采样搜索的关键点,q
*
为演示轨迹中的关键点。
[0027]
所述步骤s3包括以下步骤:
[0028]
步骤s3.1、局部地图编码采用与步骤s1相同的基于编码

解码架构的压缩自动编码器,模型中的编码器f(
·
)也包含四个卷积层和一个线性层,解码器g(
·
)包含一个线性层和四个反卷积层,输入为局部地图输出为压缩编码后的局部地图包含障碍物及其空间状态信息等;
[0029]
所述步骤s4包括以下步骤:
[0030]
步骤s4.1、基于局部地图的采样搜索预测模型在网络结构上与全局地图网络相同,训练策略也相同,但其网络输入的地图信息是以汽车为中心的局部地图编码
[0031]
步骤s4.2、对数据集中的全局地图信息进行下采样处理,只使用以汽车为中心的7
×
7,11
×
11,15
×
15的局部窗口地图作为压缩自动编码器的输入,并将编码后的局部地图汽车当前位置q
curr
以及局部目标位置q'
goal
作为网络输入来进行下一步采样搜索的预测。
[0032]
所述步骤s5包括以下步骤:
[0033]
步骤s5.1、将编码后的全局地图汽车初始位置q
init
和目标位置q
goal
输入全局采样网络,得到合理的关键点q
t 1

[0034]
步骤s5.2、将将编码后的局部地图汽车当前位置q
curr
以及全局地图网络预测得到的关键点q
t 1
一并输入局部采样网络,通过迭代更新的机制预测局部窗口内的合理轨迹;
[0035]
步骤s5.3、重复s5.1和s5.2的步骤,直到网络得到合理的全局可行轨迹。
[0036]
还包括实现本发明的一种由数据驱动的采样搜索方法的系统,包括包括存储器、处理器,以及存储在存储器上并可以在处理器上运行的计算机程序,处理器包括依次连接的全局地图编码模块、全局采样网络搜索预测模型构建模块、局部地图编码模块、局部采样网络搜索预测模型构建模块、全局采样网络和局部采样网络集成模块。
[0037]
本发明提供一种基于数据驱动的采样搜索方法,用来替换以往方法中复杂的空间探索步骤,以端到端预测的策略加快运动规划的收敛速度。通过结合全局地图信息与以车为中心的局部地图信息,使用逐步迭代更新的形式对下一步位置进行采样搜索,并预测生成安全的可行轨迹。
[0038]
首先,利用压缩自动编码器对任务空间进行编码,学习在不同环境下的避障知识以提高模型对未知环境的迁移能力;然后计算当前汽车位置,并与编码器输出的编码地图、目标点位置一起输入采样搜索网络,通过预测更新机制实现端到端的框架;其中需要利用专家系统在各种场景下计算出的可行最优路径进行端到端训练;针对基于全局地图和以车辆为中心的局部视图,设计了集成策略;本发明提出的方法比传统算法在复杂环境中生成轨迹的速度快几个数量级,规划路径的鲁棒性也更好。
[0039]
本发明的优点是:使用端到端预测的方式代替传统的采样搜索过程,可以应用于无人驾驶汽车的路径规划问题,大大缩短了路径生成所需的时间,并拥有对未知环境的强大泛化能力;其中,所述两个不同视图下的网络框架可以通过预测更新的融合进行优势互补,全局地图采样搜索网络可以为局部地图采样搜索网络提供全局信息视角下的指导,防
止局部地图网络陷入局部贪婪陷阱;而局部网络也可以改善全局网络输出关键点的稀疏性,使得采样搜索生成的移动轨迹更合理,鲁棒性更好。
附图说明:
[0040]
图1为本发明方法与传统采样搜索方法的比较框图;
[0041]
图2为本发明方法中全局采样搜索网络的流程图;
[0042]
图3为本发明方法整体流程图。
具体实施方式:
[0043]
下面结合附图对本发明作进一步描述:
[0044]
参照图1,本发明使用端到端预测的方式代替传统的采样搜索过程,可以应用于无人驾驶汽车的路径规划问题,其大大缩短了路径生成所需的时间,并拥有对未知环境的强大泛化能力。其中,所述两个不同视图下的网络框架可以通过预测更新的融合进行优势互补,全局地图采样搜索网络可以为局部地图采样搜索网络提供全局信息视角下的指导,防止局部地图网络陷入局部贪婪陷阱;而局部网络也可以改善全局网络输出关键点的稀疏性,使得采样搜索生成的移动轨迹更合理,鲁棒性更好。
[0045]
以路径规划问题的范式为例,给定汽车初始位置q
init
,目标位置q
goal
以及全局地图要求对空间进行合理的采样搜索以得到可行的安全轨迹t=1,2,

,t。
[0046]
参照图2和图3,一种基于数据驱动的采样搜索方法,包含以下步骤:
[0047]
步骤s1、全局地图编码:
[0048]
步骤s1.1、利用压缩自动编码器对全局地图进行编码提取地图中有关障碍物信息的隐含特征,另外,设置两条初始轨迹序列和
[0049]
步骤s2、全局采样搜索网络模型预测:
[0050]
步骤s2.1、将编码后的全局地图无人车初始位置q
init
与目标位置q
goal
输入进全局采样网络,输出预测的关键点q
t 1

[0051]
步骤s2.2、结合预测的关键点更新轨迹序列
[0052]
步骤s2.3、检查轨迹序列和的终点是否碰撞,若碰撞,则交换和序列中的元素,重复步骤s2.1,s2.2直至达到循环阈值;若无碰撞,则直接连接和得到输出可行轨迹
[0053]
步骤s3、局部地图编码:
[0054]
步骤s3.1、利用压缩自动编码器对以汽车为中心的局部地图进行编码步骤s3.1、利用压缩自动编码器对以汽车为中心的局部地图进行编码提取局部地图中的相关特征,
[0055]
步骤s4、局部采样搜索网络模型预测:
[0056]
步骤s4.1、将编码后的局部地图汽车当前位置q
curr
以及局部目标位置q'
goal
作为网络输入来进行下一步采样搜索的预测。
[0057]
步骤s5、集成全局采样网络和局部采样网络:
[0058]
步骤5.1、设置汽车当前状态为轨迹的终点并作为网络的起点输入,以便更新汽车状态,
[0059]
步骤5.2、使用全局采样搜索网络预测下一步关键点q
t 1

[0060]
步骤5.3、将全局网络的预测q
t 1
结合汽车当前状态q
curr
,局部编码地图一并作为局部采样搜索网络的目标输入,使用局部网络预测完整的局部轨迹
[0061]
步骤5.4、判断局部轨迹中是否存在碰撞。若存在,则返回步骤2.2重新进行预测;若不存在,则结合预测局部轨迹更新轨迹序列
[0062]
步骤5.5、判断轨迹序列和的终点是否碰撞,若碰撞,则交换和序列中的元素,返回步骤5.1直至达到循环阈值;若无碰撞,则直接连接和得到输出可行轨迹
[0063]
实现本发明的一种由数据驱动的采样搜索方法的系统,包括包括存储器、处理器,以及存储在存储器上并可以在处理器上运行的计算机程序,处理器包括依次连接的全局地图编码模块、全局采样网络搜索预测模型构建模块、局部地图编码模块、局部采样网络搜索预测模型构建模块、全局采样网络和局部采样网络集成模块。
[0064]
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献