一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种规划车辆行驶路线的方法以及智能汽车与流程

2022-02-21 03:56:08 来源:中国专利 TAG:


1.本技术涉及自动驾驶领域,尤其涉及一种规划车辆行驶路线的方法以及智能汽车。


背景技术:

2.人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人,自然语言处理,计算机视觉,决策与推理,人机交互,推荐与搜索,ai基础理论等。
3.自动驾驶是人工智能领域的一种主流应用,自动驾驶技术依靠计算机视觉、雷达、监控装置和全球定位系统等协同合作,让机动车辆可以在不需要人类主动操作下,实现自动驾驶。自动驾驶的车辆使用各种计算系统来帮助将乘客从一个位置运输到另一位置。一些自动驾驶车辆可能要求来自操作者(诸如,领航员、驾驶员、或者乘客)的一些初始输入或者连续输入。自动驾驶车辆准许操作者从手动模操作式切换到自动驾驶模式或者介于两者之间的模式。由于自动驾驶技术无需人类来驾驶机动车辆,所以理论上能够有效避免人类的驾驶失误,减少交通事故的发生,且能够提高公路的运输效率。因此,自动驾驶技术越来越受到重视。
4.在自动驾驶技术领域,自动驾驶汽车的路线规划能够实现自动驾驶汽车的路线选择和路线优化(所述路线也称路径或者轨迹),以及进一步实现更优的控制策略。但自动驾驶汽车实际驾驶的工况非常复杂,受天气、温湿度、特殊障碍物、道路形态等影响,会形成大量的长尾场景。长尾场景是指自动驾驶汽车面对的场景,有大量非典型又各不相同的场景,很难以一种统一的规则进行处理,因此如何针对大量长尾场景规划车辆的行驶路线亟待解决。


技术实现要素:

5.本技术提供了一种车辆行驶路线的方法以及相关设备,可以针对大量长尾场景,降低司机的接管率。
6.为解决上述技术问题,本技术提供以下技术方案:
7.本技术第一方面提供一种规划车辆行驶路线的方法,可用于人工智能领域的自动驾驶领域中。可以包括:获取第一信息,第一信息可以包括车辆的位置信息、车道信息,导航信息,障碍物信息中的一种或者多种。比如第一信息可以包括一种信息,比如第一信息包括车辆的位置信息。或者第一信息可以包括两种信息,比如第一信息包括车辆的位置信息和车道信息。或者第一信息可以包括三种信息,比如第一信息包括车辆的位置信息,车道信
息,以及导航信息。或者第一信息可以包括四种信息,比如第一信息包括车辆的位置信息,车道信息,导航信息以及障碍物信息。车道信息用于确定车辆与车道线的相对位置,导航信息用于预测车辆的行驶方向,障碍物信息用于确定车辆与障碍物的相对位置。可以通过获取的第一信息确定车辆周围的环境信息,车辆周围的环境信息可以用于确定车辆是否曾经进入过相同或者相似的场景。在一些路况简单的场景下,可以认为只要车辆的位置信息相一致,即可以确定是相同的场景。在一些路况复杂的场景下,可能需要车辆的位置信息,车道信息,导航信息以及障碍物信息都一致时,才可以确定是相同的场景。车辆处于自动驾驶模式时,第一信息是第一模型的输入数据,第一模型的输出数据用于为车辆规划行驶路线,第一模型是以人工驾驶模式下车辆的行车轨迹为训练目标,对人工驾驶模式下获取的第二信息进行训练得到的模型,第二信息可以包括的信息种类与第一信息可以包括的信息的种类相一致,第一信息和第二信息的相似度满足预设条件,第一信息和第二信息的相似度满足预设条件用于表示第一场景和第二场景相同或者相似,第一场景是车辆获取第一信息时车辆所处的场景,第二场景是车辆获取第二信息时车辆所处的场景。比如,以第一信息包括车辆的位置信息为例进行说明,其中位置信息可以包括车辆所在位置的经纬度信息。比如第一信息包括第一经纬度信息,第二信息包括第二经纬度信息,如果二者的差值小于预设阈值时,则可以认为第一信息和第二信息的相似度满足预设条件,如果二者的差值大于预设阈值,则可以认为第一信息和第二信息的相似度不满足预设条件。车辆处于人工驾驶模式时,第一信息用于训练第一模型,第一模型的输出数据用于为车辆规划行驶路线。由第一方面可知,本技术提供的方案实时获取车辆周围的环境信息,比如第一信息和第二信息。当车辆处于人工驾驶模式时,以车辆周围的环境信息作为训练数据,对模型进行训练,使该模型输出的轨迹可以接近人工驾驶模式下车辆的行驶轨迹。当车辆处于自动驾驶模式时,如果确定车辆的环境信息和模型训练使用的车辆的周围的环境信息的相似度满足预设条件,则以车辆周围的环境信息作为模型的输入数据,根据模型的输出数据为车辆规划行驶路线。通过本技术提供的方案可以降低司机接管的频率。
8.可选地,结合上述第一方面,在第一种可能的实施方式中,该方法还可以包括:评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型。车辆处于自动驾驶模式时,第一信息是第一模型的输入数据,可以包括:第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息是第一模型的输入数据。由第一方面第一种可能的实施方式可知,车辆处于自动驾驶模式时,可以通过评估第一信息与m组信息的相似度,评估车辆所处场景(周边环境信息)的相似度,若第一信息和m组信息的相似度满足预设条件,即认为车辆当前场景相似度与已有可用模型对应场景的相似度超过阈值,可以从m个模型中选择相似度最高的可用模型,以当前获取的周期环境信息(比如第一信息)作为该相似度最高的可用模型(比如第一模型)的输入,该相似度最高的可用模型的输出数据可以为车辆规划行驶路线。
9.可选地,结合上述第一方面,在第二种可能的实施方式中,该方法还可以包括:评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息
分别用于训练一个模型,m组信息中的第二信息用于训练第一模型,m为正整数。车辆处于人工驾驶模式时,第一信息用于训练第一模型,可以包括:第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息用于训练第一模型,以得到更新后的第一模型。由第一方面第二种可能的实施方式可知,若当前场景相似度与已有可用模型对应场景的相似度超过阈值,则选择相似度最高的可用模型,比如相似度最高的是第一模型,对利用第一信息对第一模型进行更新训练,更新针对该场景的可用模型,即更新第一模型。
10.可选地,结合上述第一方面,在第三种可能的实施方式中,该方法还可以包括:评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m为正整数。车辆处于人工驾驶模式时,第一信息用于训练第一模型,可以包括:第一信息和m组信息中的每一组信息的相似度都不满足预设条件时,第一信息用于对第一模型进行第一次训练。第一信息和m组信息中的每一组信息的相似度都不满足预设条件时,可以认为在历史人工驾驶模式下并没有与车辆目前所处的场景相同或者相似的场景。此时没有可用模型的输出数据可以为车辆规划行驶路线。则使用第一信息,构建临时模型进行训练,形成针对该场景的临时模型,即使用第一信息对第一模型进行第一次训练。此时的第一模型可能无法满足训练目标,即第一模型的输出的轨迹与人工驾驶模式下车辆的行车轨迹的分布不在预设的范围内。则经过第一次训练的第一模型是临时模型,非可用模型,当在人工驾驶模式下,获取了多次与第一信息的相似度的信息,对第一模型进行迭代训练,直至第一模型满足训练目标,则第一模型为可用模型,此时是可用模型的第一模型可以为车辆规划行驶路线。
11.可选地,结合上述第一方面或第一方面第一种至第一方面第三种可能的实施方式,在第四种可能的实施方式中,车辆处于自动驾驶模式时,该方法还可以包括:确定车辆当前的位置信息和人工驾驶模式下获取的车辆的位置信息一致时,发送提示消息,提示消息用于指示车辆根据第一模型的输出数据为车辆规划行驶路线,第一模型是对人工驾驶模式下获取的车辆的位置信息训练得到的模型。
12.可选地,结合上述第一方面或第一方面第一种至第一方面第三种可能的实施方式,在第五种可能的实施方式中,车辆处于人工驾驶模式时,该方法还可以包括:发送提示消息,提示消息用于指示根据车辆当前的位置信息训练第一模型。
13.可选地,结合上述第一方面或第一方面第一种至第一方面第五种可能的实施方式,在第六种可能的实施方式中,该方法还可以包括:确定第一信息和第二信息中相同种类信息的相似度,相同种类信息的相似度的线性加权和用于确定第一信息和第二信息的相似度。
14.可选地,结合上述第一方面或第一方面第一种至第一方面第六种可能的实施方式,在第七种可能的实施方式中,第一模型可以包括卷积神经网络cnn或循环神经网络rnn。由第一方面第七种可能的实施方式可知,给出了两种可能的第一模型,增加了方案的多样性。
15.本技术第二方面提供一种规划车辆行驶路线的装置,可以包括:获取模块,用于获取第一信息,第一信息可以包括车辆的位置信息、车道信息,导航信息,障碍物信息中的一
种或者多种,车道信息用于确定车辆与车道线的相对位置,导航信息用于预测车辆的行驶方向,障碍物信息用于确定车辆与障碍物的相对位置。规控模块,用于车辆处于自动驾驶模式时,根据第一模型的输出数据为车辆规划行驶路线,获取模块获取的第一信息是第一模型的输入数据,第一模型是以人工驾驶模式下车辆的行车轨迹为训练目标,对人工驾驶模式下获取的第二信息进行训练得到的模型,第二信息可以包括的信息种类与第一信息可以包括的信息的种类相一致,第一信息和第二信息的相似度满足预设条件。训练模块,用于车辆处于人工驾驶模式时,根据获取模块获取的第一信息训练第一模型。
16.可选地,结合上述第二方面,在第一种可能的实施方式中,还可以包括:评估模块,用于评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型。第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息是第一模型的输入数据。
17.可选地,结合上述第二方面,在第二种可能的实施方式中,还可以包括:评估模块,用于评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m组信息中的第二信息用于训练第一模型,m为正整数。第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息用于训练第一模型,以得到更新后的第一模型。
18.可选地,结合上述第二方面,在第三种可能的实施方式中,还可以包括:评估模块,用于评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m为正整数。第一信息和m组信息中的每一组信息的相似度都不满足预设条件时,第一信息用于对第一模型进行第一次训练。
19.可选地,结合上述第二方面或第二方面第一种至第二方面第三种可能的实施方式,在第四种可能的实施方式中,还可以包括:发送模块,用于评估模块确定车辆当前的位置信息和人工驾驶模式下获取的车辆的位置信息相一致时,发送提示消息,提示消息用于指示车辆根据第一模型的输出数据为车辆规划行驶路线,第一模型是对人工驾驶模式下获取的车辆的位置信息训练得到的模型。
20.可选地,结合上述第二方面或第二方面第一种至第二方面第三种可能的实施方式,在第五种可能的实施方式中,还可以包括:发送模块,用于发送提示消息,提示消息用于指示根据车辆当前的位置信息训练第一模型。
21.可选地,结合上述第二方面或第二方面第一种至第二方面第五种可能的实施方式,在第六种可能的实施方式中,还可以包括:处理模块,用于确定第一信息和第二信息中相同种类信息的相似度,相同种类信息的相似度的线性加权和用于确定第一信息和第二信息的相似度。
22.可选地,结合上述第二方面或第二方面第一种至第二方面第六种可能的实施方式,在第七种可能的实施方式中,第一模型可以包括卷积神经网络cnn或循环神经网络rnn。
23.本技术第三方面提供一种规划车辆行驶路线的系统,系统可以包括车辆和云侧设备,车辆,用于获取第一信息,第一信息可以包括车辆的位置信息、车道信息,导航信息,障
碍物信息中的一种或者多种,车道信息用于确定车辆与车道线的相对位置,导航信息用于预测车辆的行驶方向,障碍物信息用于确定车辆与障碍物的相对位置。车辆,还用于向云侧设备发送第一信息和车辆的驾驶模式。云侧设备,用于确定车辆处于自动驾驶模式时,根据第一模型的输出数据为车辆规划行驶路线,第一信息是第一模型的输入数据,第一模型是以人工驾驶模式下车辆的行车轨迹为训练目标,对人工驾驶模式下获取的第二信息进行训练得到的模型,第二信息可以包括的信息种类与第一信息可以包括的信息的种类相一致,第一信息和第二信息的相似度满足预设条件。云侧设备,还用于确定车辆处于人工驾驶模式时,根据第一信息训练第一模型。
24.可选地,结合上述第三方面,在第一种可能的实施方式中,云侧设备,还用于:评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型。第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息是第一模型的输入数据。
25.可选地,结合上述第三方面,在第一种可能的实施方式中,云侧设备,还用于:评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m组信息中的第二信息用于训练第一模型,m为正整数。第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息用于训练第一模型,以得到更新后的第一模型。
26.可选地,结合上述第三方面,在第三种可能的实施方式中,云侧设备,还用于评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m为正整数。第一信息和m组信息中的每一组信息的相似度都不满足预设条件时,第一信息用于对第一模型进行第一次训练。
27.可选地,结合上述第三方面或第三方面第一种至第三方面第三种可能的实施方式,在第四种可能的实施方式中,云侧设备,还用于确定车辆当前的位置信息和人工驾驶模式下获取的车辆的位置信息一致时,发送提示消息,提示消息用于指示车辆根据第一模型的输出数据为车辆规划行驶路线,第一模型是对人工驾驶模式下获取的车辆的位置信息训练得到的模型。
28.可选地,结合上述第三方面或第三方面第一种至第三方面第三种可能的实施方式,在第五种可能的实施方式中,云侧设备,还用于发送提示消息,提示消息用于指示根据车辆当前的位置信息训练第一模型。
29.可选地,结合上述第三方面或第三方面第一种至第三方面第五种可能的实施方式,在第六种可能的实施方式中,云侧设备,还用于确定第一信息和第二信息中相同种类信息的相似度,相同种类信息的相似度的线性加权和用于确定第一信息和第二信息的相似度。
30.可选地,结合上述第三方面或第三方面第一种至第三方面第六种可能的实施方式,在第七种可能的实施方式中,第一模型可以包括卷积神经网络(convolutional neuron network,cnn)或循环神经网络(recurrent neural network,rnn)。
31.本技术第四方面提供一种规划车辆行驶路线的装置,可以包括处理器,处理器和存储器耦合,存储器存储有程序指令,当存储器存储的程序指令被处理器执行时执行上述第一方面或第一方面任意一种可能的实施方式中所描述的规划车辆行驶路线的方法。
32.本技术第五方面提供一种计算机可读存储介质,可以包括程序,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面任意一种可能的实施方式中所描述的规划车辆行驶路线的方法。
33.本技术第六方面提供一种智能汽车,智能汽车可以包括处理电路和存储电路,处理电路和存储电路被配置为执行上述第一方面或第一方面任意一种可能的实施方式中所描述的规划车辆行驶路线的方法。
34.本技术第七方面提供一种电路系统,电路系统可以包括处理电路,处理电路配置为执行上述第一方面或第一方面任意一种可能的实施方式中所描述的规划车辆行驶路线的方法。
35.本技术第八方面提供了一种计算机程序,当其在计算机上行驶时,使得计算机执行上述第一方面或第一方面任意一种可能的实施方式中所描述的规划车辆行驶路线的方法。
36.本技术第九方面提供了一种芯片系统,该芯片系统可以包括处理器,用于支持云侧设备或规划车辆行驶路线的装置实现上述方面中所涉及的功能,例如,发送或处理上述方法中所涉及的数据和/或信息。在一种可能的设计中,芯片系统还可以包括存储器,存储器,用于保存服务器或通信设备必要的程序指令和数据。该芯片系统,可以由芯片构成,也可以可以包括芯片和其他分立器件。
37.对于本技术第二方面至第九方面以及各种可能实现方式的具体实现步骤,以及每种可能实现方式所带来的有益效果,均可以参考第一方面中各种可能的实现方式中的描述,此处不再一一赘述。
附图说明
38.图1a为本技术提供的一种规划车辆行驶路线的应用场景示意图;
39.图1b为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
40.图1c为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
41.图2a为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
42.图2b为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
43.图2c为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
44.图3为本技术实施例提供的自动驾驶车辆的一种结构示意图;
45.图4为本技术提供的一种规划车辆行驶路线的方法的流程示意图;
46.图5a为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
47.图5b为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
48.图5c为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
49.图5d为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
50.图6为本技术实施例提供的一种规划车辆行驶路线的方法的一种流程示意图;
51.图7为本技术实施例提供的另一种规划车辆行驶路线的方法的一种流程示意图;
52.图8a为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
53.图8b为本技术提供的另一种规划车辆行驶路线的应用场景示意图;
54.图9为本技术提供的另一种规划车辆行驶路线的方法的场景的示意图;
55.图10为本技术实施例提供的规划车辆行驶路线的装置的一种结构示意图;
56.图11为本技术实施例提供的自动驾驶车辆的一种结构示意图;
57.图12为本技术实施例提供的芯片的一种结构示意图。
具体实施方式
58.本技术实施例提供了一种规划车辆行驶路线的方法以及相关设备,以人工驾驶模式下车辆的行车轨迹为训练目标,对人工驾驶模式下获取的车辆的运动信息以及周边环境信息进行训练,得到第一模型,当车辆再次经过相同或相似的场景时,可以根据第一模型的输出数据为车辆规划行驶路线。
59.本技术的说明书和权利要求书及上述附图中的术语“第一”、第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本技术的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。
60.本技术实施例可以应用于对各种自动行驶的智能体进行路线规划的场景中,作为示例,例如本技术实施例可以应用于对自动驾驶车辆进行路线规划的场景中,具体的,在自动驾驶的场景中,很多复杂的工况并无显著的共同特征(如与特定路段、特定路况相关),很难以统一的规控方法应对这些特殊的工况。当行驶在此类场景时,往往导致接管率无法下降,即总是需要驾驶员接管车辆。此外,不同的场景,需要不同的策略,不同的用户,有不同的驾驶风格。目前的自动驾驶规控,很难针对特定场景、特定用户进行定制,提供个性化、定制化的规控策略。当自动驾驶车辆通过阻碍信息感知的障碍体较多的道路环境时,例如路边停放有大量车辆、交通拥挤、路过公交车站、修路时的路边护栏、遇到恶劣天气或其他存在大量阻碍信息感知的障碍体的道路环境时,自动驾驶车辆会需要驾驶员接管车辆。示例性的,如图1a至图1c所示,为本技术提供的一种规划车辆行驶路线的应用场景示意图。如图1a至图1c所示的场景为停车场场景,如图1a所示,车辆所在车位的右前方有障碍物,假设自动驾驶规划的自动泊车出车位的轨迹,只支持向右向前出车位的情况。在当前工况下,向右向前出车位没有足够的空间,如图1b所示,可能有多处发生碰撞,当前轨迹规划算法无法规划出合理轨迹。此时,驾驶员介入接管车辆,如图1c所示,可按照先向左向前的方式,待车辆与车位垂直后,再驶出停车场。如图2a至图2c所示,为本技术提供的另一种规划车辆行驶路线的应用场景示意图。如图2a至图2c所示的场景为车辆在道路上行驶的场景,自动驾驶汽车在一条同向双车道的道路上行驶,如图2a所示,其中左侧车道有连续井盖,自动驾驶规划模块规划的轨迹,为沿着左侧车道中心线行驶,导致行驶过程中乘客的舒适性较差。驾驶员手动接管车辆后,如图2b所示,可以按照左侧车道中心线略微偏右的方式行驶,车辆仍然保持在左侧车道内,但左侧车轮不会再连续压井盖。或者如图2c所示,当右侧车道没有其他车辆时,驾驶员也可以手动切换至右侧车道行驶。
61.当发生驾驶员接管之后,为了降低自动驾驶接管率,可以针对此场景的日志进行分析,分析的结论为,当前版本的规控模块(规控模块将在下文进行介绍),无法支持此类场景轨迹规划。比如在图1a至图1c所示的场景中,当前版本的规控模块无法支持此类场景的出车位的路线规划,如图2a至图2c所示的场景中,当前版本的规控模块无法支持此类场景的轨迹规划。于是,需要在当前规控模块中,重新分析设计,加入针对此场景的轨迹规划逻辑(如类似于驾驶员的驾驶轨迹)。则后续再经过此场景时,即可自动实现出车位的轨迹,或者可自动实现避让连续井盖的轨迹。此种方案每次被接管,均需要单独分析场景,并制定修改方案,方案繁琐,效率不高,且成本较大。此外,类似于上述示例,长尾场景很多,很难以统一的规控方法进行处理。如上述图1a至图1c的场景中,需要借用车位左侧的部分空间。在其他出车位场景中,如果也使用此场景新增的规划规则,则可能导致发生碰撞等不安全情况,发生危险,造成其他场景的人工接管,仍然无法降低自动驾驶的接管率。
62.因此,需要通过一种车辆行驶路线的规划方案来对自动驾驶车辆进行路线规划,以应对大量的长尾场景。作为另一示例,例如本技术实施例也可以应用于对各种类型的机器人进行路线规划的场景中,例如货运机器人、探测机器人、扫地机器人或其他类型的机器人,此处以货运机器人为例对应用场景作进一步描述,当多个货运机器人同时工作时,或者,货运机器人从货架之间穿梭时,其他货运机器人和货架都会成为阻碍货运机器人进行信息感知的障碍体,从而当货运机器人行驶于前述货运环境中时,为了减少货运机器人之间以及货运机器人与人之间的碰撞,可以通过本技术提供的方案来对货运机器人进行路线规划。应当理解,此处举例仅为方便对本技术实施例的应用场景进行理解,不对本技术实施例的应用场景进行穷举,本技术实施例中仅以应用于对自动驾驶车辆进行路线规划为例,进行详细介绍。
63.下面结合附图,对本技术的实施例进行描述。本领域普通技术人员可知,随着技术的发展和新场景的出现,本技术实施例提供的技术方案对于类似的技术问题,同样适用。
64.为了便于理解本方案,本技术实施例中首先结合图3对自动驾驶车辆的结构进行介绍,请先参阅图3,图3为本技术实施例提供的自动驾驶车辆的一种结构示意图,自动驾驶车辆100配置为完全或部分地自动驾驶模式,例如,自动驾驶车辆100可以在处于自动驾驶模式中的同时控制自身,并且可通过人为操作来确定车辆及其周边环境的当前状态,确定周边环境中的至少一个其他车辆的可能行为,并确定其他车辆执行可能行为的可能性相对应的置信水平,基于所确定的信息来控制自动驾驶车辆100。在自动驾驶车辆100处于自动驾驶模式中时,也可以将自动驾驶车辆100置为在没有和人交互的情况下操作。
65.自动驾驶车辆100可包括各种子系统,例如行进系统102、传感器系统104、控制系统106、一个或多个外围设备108以及电源110、计算机系统112和用户接口116。可选地,自动驾驶车辆100可包括更多或更少的子系统,并且每个子系统可包括多个部件。另外,自动驾驶车辆100的每个子系统和部件可以通过有线或者无线互连。
66.行进系统102可包括为自动驾驶车辆100提供动力运动的组件。在一个实施例中,行进系统102可包括引擎118、能量源119、传动装置120和车轮121。
67.其中,引擎118可以是内燃引擎、电动机、空气压缩引擎或其他类型的引擎组合,例如,汽油发动机和电动机组成的混动引擎,内燃引擎和空气压缩引擎组成的混动引擎。引擎118将能量源119转换成机械能量。能量源119的示例包括汽油、柴油、其他基于石油的燃料、
丙烷、其他基于压缩气体的燃料、乙醇、太阳能电池板、电池和其他电力来源。能量源119也可以为自动驾驶车辆100的其他系统提供能量。传动装置120可以将来自引擎118的机械动力传送到车轮121。传动装置120可包括变速箱、差速器和驱动轴。在一个实施例中,传动装置120还可以包括其他器件,比如离合器。其中,驱动轴可包括可耦合到一个或多个车轮121的一个或多个轴。
68.传感器系统104可包括感测关于自动驾驶车辆100周边的环境的信息的若干个传感器。例如,传感器系统104可包括全球定位系统122(定位系统可以是全球定位gps系统,也可以是北斗系统或者其他定位系统)、惯性测量单元(inertial measurement unit,imu)124、雷达126、激光测距仪128以及相机130。传感器系统104还可包括被监视自动驾驶车辆100的内部系统的传感器(例如,车内空气质量监测器、燃油量表、机油温度表等)。来自这些传感器中的一个或多个的传感数据可用于检测对象及其相应特性(位置、形状、方向、速度等)。这种检测和识别是自主自动驾驶车辆100的安全操作的关键功能。
69.其中,定位系统122可用于估计自动驾驶车辆100的地理位置。imu 124用于基于惯性加速度来感知自动驾驶车辆100的位置和朝向变化。在一个实施例中,imu 124可以是加速度计和陀螺仪的组合。雷达126可利用无线电信号来感知自动驾驶车辆100的周边环境内的物体,具体可以表现为毫米波雷达或激光雷达。在一些实施例中,除了感知物体以外,雷达126还可用于感知物体的速度和/或前进方向。激光测距仪128可利用激光来感知自动驾驶车辆100所位于的环境中的物体。在一些实施例中,激光测距仪128可包括一个或多个激光源、激光扫描器以及一个或多个检测器,以及其他系统组件。相机130可用于捕捉自动驾驶车辆100的周边环境的多个图像。相机130可以是静态相机或视频相机。
70.控制系统106为控制自动驾驶车辆100及其组件的操作。控制系统106可包括各种部件,其中包括转向系统132、油门134、制动单元136、计算机视觉系统140、线路控制系统142以及障碍避免系统144。
71.其中,转向系统132可操作来调整自动驾驶车辆100的前进方向。例如在一个实施例中可以为方向盘系统。油门134用于控制引擎118的操作速度并进而控制自动驾驶车辆100的速度。制动单元136用于控制自动驾驶车辆100减速。制动单元136可使用摩擦力来减慢车轮121。在其他实施例中,制动单元136可将车轮121的动能转换为电流。制动单元136也可采取其他形式来减慢车轮121转速从而控制自动驾驶车辆100的速度。计算机视觉系统140可以操作来处理和分析由相机130捕捉的图像以便识别自动驾驶车辆100周边环境中的物体和/或特征。所述物体和/或特征可包括交通信号、道路边界和障碍体。计算机视觉系统140可使用物体识别算法、运动中恢复结构(structure from motion,sfm)算法、视频跟踪和其他计算机视觉技术。在一些实施例中,计算机视觉系统140可以用于为环境绘制地图、跟踪物体、估计物体的速度等等。线路控制系统142用于确定自动驾驶车辆100的行驶路线以及行驶速度。在一些实施例中,线路控制系统142可以包括横向规划模块1421和纵向规划模块1422,横向规划模块1421和纵向规划模块1422分别用于结合来自障碍避免系统144、gps 122和一个或多个预定地图的数据为自动驾驶车辆100确定行驶路线和行驶速度。障碍避免系统144用于识别、评估和避免或者以其他方式越过自动驾驶车辆100的环境中的障碍体,前述障碍体具体可以表现为实际障碍体和可能与自动驾驶车辆100发生碰撞的虚拟移动体。在一个实例中,控制系统106可以增加或替换地包括除了所示出和描述的那些以外的
组件。或者也可以减少一部分上述示出的组件。
72.自动驾驶车辆100通过外围设备108与外部传感器、其他车辆、其他计算机系统或用户之间进行交互。外围设备108可包括无线通信系统146、车载电脑148、麦克风150和/或扬声器152。在一些实施例中,外围设备108为自动驾驶车辆100的用户提供与用户接口116交互的手段。例如,车载电脑148可向自动驾驶车辆100的用户提供信息。用户接口116还可操作车载电脑148来接收用户的输入。车载电脑148可以通过触摸屏进行操作。在其他情况中,外围设备108可提供用于自动驾驶车辆100与位于车内的其它设备通信的手段。例如,麦克风150可从自动驾驶车辆100的用户接收音频(例如,语音命令或其他音频输入)。类似地,扬声器152可向自动驾驶车辆100的用户输出音频。无线通信系统146可以直接地或者经由通信网络来与一个或多个设备无线通信。例如,无线通信系统146可使用3g蜂窝通信,例如例如码分多址(code division multipleaccess,cdma)、evd0、全球移动通信系统(global system for mobile communications,gsm),通用分组无线服务技术(general packet radio service,gprs),或者4g蜂窝通信,例如长期演进(long term evolution,lte)或者5g蜂窝通信。无线通信系统146可利用无线局域网(wireless localarea network,wlan)通信。在一些实施例中,无线通信系统146可利用红外链路、蓝牙或zigbee与设备直接通信。其他无线协议,例如各种车辆通信系统,例如,无线通信系统146可包括一个或多个专用短程通信(dedicated short range communications,dsrc)设备,这些设备可包括车辆和/或路边台站之间的公共和/或私有数据通信。
73.电源110可向自动驾驶车辆100的各种组件提供电力。在一个实施例中,电源110可以为可再充电锂离子或铅酸电池。这种电池的一个或多个电池组可被配置为电源为自动驾驶车辆100的各种组件提供电力。在一些实施例中,电源110和能量源119可一起实现,例如一些全电动车中那样。
74.自动驾驶车辆100的部分或所有功能受计算机系统112控制。计算机系统112可包括至少一个处理器113,处理器113执行存储在例如存储器114这样的非暂态计算机可读介质中的指令115。计算机系统112还可以是采用分布式方式控制自动驾驶车辆100的个体组件或子系统的多个计算设备。处理器113可以是任何常规的处理器,诸如商业可获得的中央处理器(central processing unit,cpu)。可选地,处理器113可以是诸如专用集成电路(application specific integrated circuit,asic)或其它基于硬件的处理器的专用设备。尽管图3功能性地图示了处理器、存储器、和在相同块中的计算机系统112的其它部件,但是本领域的普通技术人员应该理解该处理器、或存储器实际上可以包括不存储在相同的物理外壳内的多个处理器、或存储器。例如,存储器114可以是硬盘驱动器或位于不同于计算机系统112的外壳内的其它存储介质。因此,对处理器113或存储器114的引用将被理解为包括可以并行操作或者可以不并行操作的处理器或存储器的集合的引用。不同于使用单一的处理器来执行此处所描述的步骤,诸如转向组件和减速组件的一些组件每个都可以具有其自己的处理器,所述处理器只执行与特定于组件的功能相关的计算。在此处所描述的各个方面中,处理器113可以位于远离自动驾驶车辆100并且与自动驾驶车辆100进行无线通信。在其它方面中,此处所描述的过程中的一些在布置于自动驾驶车辆100内的处理器113上执行而其它则由远程处理器113执行,包括采取执行单一操纵的必要步骤。在一些实施例中,存储器114可包含指令115(例如,程序逻辑),指令115可被处理器113执行来执行自动驾
驶车辆100的各种功能,包括以上描述的那些功能。存储器114也可包含额外的指令,包括向行进系统102、传感器系统104、控制系统106和外围设备108中的一个或多个发送数据、从其接收数据、与其交互和/或对其进行控制的指令。例如,以向右换道为例,则对于人工驾驶员需要进行以下操作:第一步:考虑安全因素和交规因素,决定换道的时机;第二步:规划出一条行驶轨迹;第三步:控制油门、刹车和方向盘,让车辆沿着预定轨迹行驶。上述操作对应于自动驾驶车辆,可以分别由自动驾驶车辆的行为规划器(behavior planner,bp),运动规划器(motion planner,mop)和运动控制器(control)执行。其中,bp负责下发高层决策,mop负责规划预期轨迹和速度,control负责操作油门刹车方向盘,让自动驾驶车辆根据目标轨迹并达到目标速度。应理解,行为规划器、运动规划器和运动控制器执行的相关操作可以是如图3所示的处理器113执行存储器114中的指令115,该指令115可以用于指示线路控制系统142。本技术实施例有时也将行为规划器,运动规划器以及运动控制器统称为规控模块。
75.除了指令115以外,存储器114还可存储数据,例如道路地图、路线信息,车辆的位置、方向、速度以及其它这样的车辆数据,以及其他信息。这种信息可在自动驾驶车辆100在自主、半自主和/或手动模式中操作期间被自动驾驶车辆100和计算机系统112使用。用户接口116,用于向自动驾驶车辆100的用户提供信息或从其接收信息。可选地,用户接口116可包括在外围设备108的集合内的一个或多个输入/输出设备,例如无线通信系统146、车载电脑148、麦克风150和扬声器152。
76.计算机系统112可基于从各种子系统(例如,行进系统102、传感器系统104和控制系统106)以及从用户接口116接收的输入来控制自动驾驶车辆100的功能。例如,计算机系统112可利用来自控制系统106的输入以便控制转向系统132来避免由传感器系统104和障碍避免系统144检测到的障碍体。在一些实施例中,计算机系统112可操作来对自动驾驶车辆100及其子系统的许多方面提供控制。
77.可选地,上述这些组件中的一个或多个可与自动驾驶车辆100分开安装或关联。例如,存储器114可以部分或完全地与自动驾驶车辆100分开存在。上述组件可以按有线和/或无线方式来通信地耦合在一起。
78.可选地,上述组件只是一个示例,实际应用中,上述各个模块中的组件有可能根据实际需要增添或者删除,图3不应理解为对本技术实施例的限制。在道路行进的自动驾驶车辆,如上面的自动驾驶车辆100,可以识别其周围环境内的物体以确定对当前速度的调整。所述物体可以是其它车辆、交通控制设备、或者其它类型的物体。在一些示例中,可以独立地考虑每个识别的物体,并且基于物体的各自的特性,诸如它的当前速度、加速度、与车辆的间距等,可以用来确定自动驾驶车辆所要调整的速度。
79.可选地,自动驾驶车辆100或者与自动驾驶车辆100相关联的计算设备如图3的计算机系统112、计算机视觉系统140、存储器114可以基于所识别的物体的特性和周围环境的状态(例如,交通、雨、道路上的冰、等等)来预测所识别的物体的行为。可选地,每一个所识别的物体都依赖于彼此的行为,因此还可以将所识别的所有物体全部一起考虑来预测单个识别的物体的行为。自动驾驶车辆100能够基于预测的所识别的物体的行为来调整它的速度。换句话说,自动驾驶车辆100能够基于所预测的物体的行为来确定车辆将需要调整到(例如,加速、减速、或者停止)什么稳定状态。在这个过程中,也可以考虑其它因素来确定自动驾驶车辆100的速度,诸如,自动驾驶车辆100在行驶的道路中的横向位置、道路的曲率、
静态和动态物体的接近度等等。除了提供调整自动驾驶车辆的速度的指令之外,计算设备还可以提供修改自动驾驶车辆100的转向角的指令,以使得自动驾驶车辆100遵循给定的轨迹和/或维持与自动驾驶车辆100附近的物体(例如,道路上的相邻车道中的轿车)的安全横向和纵向距离。
80.上述自动驾驶车辆100可以为轿车、卡车、摩托车、公共汽车、船、飞机、直升飞机、割草机、娱乐车、游乐场车辆、施工设备、电车、高尔夫球车和火车等,本技术实施例不做特别的限定。
81.结合上述描述,本技术实施例提供了一种规划车辆行驶路线的方法,可应用于图3中示出的自动驾驶车辆100中。本技术提供的方案可以包括至少两种工作模式,一种模式是自动驾驶模式,一种模式是人工驾驶模式。以下将针对车辆处于这种工作模式,分别进行说明。
82.图4为本技术提供的一种规划车辆行驶路线的方法的流程示意图。
83.参阅图4,本技术实施例提供的一种规划车辆行驶路线的方法,可以包括以下步骤:
84.401、获取第一信息。
85.第一信息包括车辆的位置信息、车道信息,导航信息,障碍物信息中的一种或者多种,车道信息用于确定车辆与车道线的相对位置,导航信息用于预测车辆的行驶方向,障碍物信息用于确定车辆与障碍物的相对位置。
86.其中,车辆的位置信息可以通过全球定位系统(global position system,gps)、实时动态定位(real-time kinematic,rtk)、摄像头及激光雷达等方式来完成。在一个可能的实施方式中,可以综合预先存储的地图、gps位置信息及毫米波测量信息判断车辆可能存在的位置,并计算该车辆可能存在的位置出现概率,以此确定车辆所在的具体位置。需要说明的是,本技术提供的方案可以通过多种方式获取车辆的位置信息,相关技术中关于获取车辆的位置信息的方式,本技术实施例均可以采用。
87.可以通过对车辆上安装的图像采集设备采集的图像进行处理,以检测车道线。比如,可以以大量包括车道线的图片作为训练数据,对目标检测模型进行训练,训练完成后的目标检测模型,可以识别图像采集设备采集的图像中的车道线,并确定图像中车道线的位置。在一个可能的实施方式中,可以通过安装的毫米波雷达和图像采集设备进行路况检测,并将路况检测结果作为车道信息,确定车辆和车道线的相对位置。需要说明的是,本技术提供的方案可以通过多种方式获取车辆的车道线信息,相关技术中关于获取车辆的车道线信息的方式,本技术实施例均可以采用。
88.可以通过导航请求获取导航信息。导航请求可以包括车辆的起始地的位置信息以及目的地的位置信息。比如车辆可以通过用户点击或者触控车载导航的屏幕获取导航请求,也可以通过用户的语音指令获取导航请求。利用车载gps配合电子地图来进行路径规划,进而可以获得车辆的导航信息,并根据导航信息预测车辆的行驶方向。需要说明的是,本技术提供的方案可以通过多种方式获取车辆的导航信息,相关技术中关于获取车辆的导航信息的方式,本技术实施例均可以采用。
89.对于障碍物信息,在一种可能的实施方式中,车辆可以通过毫米波雷达对车辆前方的扇形区域进行障碍物扫描,并通过图像采集设备对车辆前方区域进行图像采集。根据
毫米波雷达和图像采集设备的视场角,将扇形区域进行栅格化,这样,毫米波雷达检测到的障碍物将处于栅格单元中。之后,将图像采集设备采集到的图像中检测到的障碍物转换到极坐标系下的栅格单元中,并将栅格单元中毫米波雷达检测到的障碍物和图像采集设备检测到的障碍物进行严格匹配,以此来得到最终的障碍物信息。需要说明的是,本技术提供的方案可以通过多种方式获取障碍物信息,相关技术中关于获取障碍物信息的方式,本技术实施例均可以采用。
90.第一信息可以包括车辆的位置信息、车道信息,导航信息,障碍物信息中的一种或者多种。比如第一信息可以包括一种信息,比如第一信息包括车辆的位置信息。或者第一信息可以包括两种信息,比如第一信息包括车辆的位置信息和车道信息。或者第一信息可以包括三种信息,比如第一信息包括车辆的位置信息,车道信息,以及导航信息。或者第一信息可以包括四种信息,比如第一信息包括车辆的位置信息,车道信息,导航信息以及障碍物信息。需要说明的是,上面列举的几种第一信息可能包括的种类只是为了举例说明,并不代表限定,比如第一信息可以包括位置信息和障碍物信息,或者第一信息还可以包括除上述提到的车辆的位置信息,车道信息,导航信息,障碍物信息之外的其他信息。
91.可以通过获取的第一信息确定车辆周围的环境信息,车辆周围的环境信息可以用于确定车辆是否曾经进入过相同或者相似的场景。在一些路况简单的场景下,可以认为只要车辆的位置信息一致,即可以确定是相同的场景。在一些路况复杂的场景下,可能需要车辆的位置信息,车道信息,导航信息以及障碍物信息都一致时,才可以确定是相同的场景。
92.一、车辆处于自动驾驶模式
93.402、车辆处于自动驾驶模式时,第一信息是第一模型的输入数据,第一模型的输出数据用于为车辆规划行驶路线,第一模型是以人工驾驶模式下车辆的行车轨迹为训练目标,对人工驾驶模式下获取的第二信息进行训练得到的模型,第二信息包括的信息种类与第一信息包括的信息的种类一致,第一信息和第二信息的相似度满足预设条件。
94.上述步骤401中提到第一信息可以包括车辆的位置信息、车道信息,导航信息,障碍物信息中的一种或者多种。第二信息包括的信息种类与第一信息包括的信息的种类一致,第二信息可以包括车辆的位置信息、车道信息,导航信息,障碍物信息中的一种或者多种。具体的,比如第一信息包括车辆的位置信息,则第二信息包括车辆的位置信息;第一信息包括车辆的位置信息和车道信息,则第二信息包括车辆的位置信息和车道信息;第一信息包括车辆的位置信息、车道信息以及导航信息,则第二信息包括车辆的位置信息、车道信息以及导航信息;第一信息包括车辆的位置信息,车道信息,导航信息以及障碍物信息,则第二信息包括车辆的位置信息,车道信息,导航信息以及障碍物信息。
95.第一信息和第二信息的相似度满足预设条件是为了确定车辆是否进入相同的场景。比如车辆经过第一路段获取的周边环境信息为第一信息,车辆经过第二路段获取的周边环境信息为第二信息,如果第一信息和第二信息的相似度满足预设条件,则认为第一路段和第二路段是相同或者相似的场景,比如第一路段和第二路段可能是同一个路段。
96.关于如何确定两个信息的相似度,相关技术可以采用的手段,本技术实施例均可以采用。比如,以第一信息包括车辆的位置信息为例进行说明,其中位置信息可以包括车辆所在位置的经纬度信息。比如第一信息包括第一经纬度信息,第二信息包括第二经纬度信息,如果二者的差值小于预设阈值时,则可以认为第一信息和第二信息的相似度满足预设
条件,如果二者的差值大于预设阈值,则可以认为第一信息和第二信息的相似度不满足预设条件。换句话说,可以通过两个信息的偏差是否小于预设阈值这种手段判断两个信息的相似度是否满足预设条件。再比如,第一信息包括车道信息,具体的,第一信息包括第一车道信息,第二信息包括第二车道信息。某路段一共包括2条左转车道,其中第一信息为2条左转车道中靠右的车道,第二信息为左转车道中的靠左的车道,如果预设条件为第一信息和第二信息完全一样,第一信息和第二信息的相似度满足预设条件,则认为第一信息和第二信息的相似度不满足预设条件,如果预设条件为车辆处于左转车道,第一信息和第二信息的相似度满足预设条件,则可以认为第一信息和第二信息的相似度满足预设条件。再比如,第一信息包括导航信息,具体的,第一信息包括第一导航信息,第二信息包括第二导航信息。其中,第一信息为车辆下一步的行驶方向为直行,第二信息为车辆下一步的行驶方向为左转,则可以认为第一信息和第二信息的相似度不满足预设条件,第一信息为车辆下一步的行驶方向为直行,第二信息为车辆下一步的行驶方向为直行,则可以认为第一信息和第二信息的相似度满足预设条件。再比如,第一信息包括障碍物信息,其中障碍物信息可以包括静态障碍物信息和动态障碍物信息,第一信息可以只包括静态障碍物信息,或者只包括动态障碍物信息,或者可以既包括静态障碍物信息也包括动态障碍物信息。其中关于障碍物的信息可以包括障碍物和车辆之间的相对位置关系,关于动态障碍物,障碍物信息还可包括动态障碍物的速度,动态障碍物是其他车辆时,动态障碍物信息还可以包括其他车辆的车头的方向。假设第一信息包括第一障碍物信息,第二信息包括第二障碍物信息。其中,第一障碍物信息包括障碍物和车辆之间的第一相对位置信息,障碍物的第一速度,以及障碍物的第一车头方向,第二障碍物信息包括障碍物和车辆之间的第二相对位置信息,障碍物的第二速度,以障碍物的第二车头方向。预设条件可以为第一相对位置信息和第二相对位置信息之间的偏差小于第一阈值,且第一速度和第二速度之间的偏差小于第二阈值,且第一车头方向和第三车头方向之间的偏差小于第三阈值,则认为第一信息和第二信息的相似度满足预设条件。或者,预设条件可以为第一相对位置信息和第二相对位置信息之间的偏差小于第一阈值,且第一速度和第二速度之间的偏差小于第二阈值,则认为第一信息和第二信息的相似度满足预设条件。需要说明的是,在实际应用的过程中,可以根据场景按照需求设定预设条件。
97.在一个可能的实施方式中,确定第一信息和第二信息中相同种类信息的相似度,相同种类信息的相似度的线性加权和用于确定第一信息和第二信息的相似度。举例说明,比如第一信息包括车辆的第一位置信息、第一车道信息,第一导航信息以及第一障碍物信息,第二信息包括车辆的第二位置信息、第二车道信息,第二导航信息以及第二障碍物信息。假设位置信息的相似度的权值为3/8,车道信息的相似度权值为3/8,导航信息的相似度的权值为1/8,障碍物信息的相似度的权值为1/8。假设两个信息的相似度满足预设条件,则设相似度为1,两个信息的相似度不满足预设条件,则设相似度为0,如果第一位置信息和第二位置信息的相似度满足第一预设条件,第一车道信息和第二车道信息的相似度不满足第二预设条件,第一导航信息和第二导航信息的相似度不满足第三预设条件,第一障碍物信息和第二障碍物信息的相似度满足第四预设条件,则(3/8*1 3/8*0 1/8*0 1/8*1)为相同种类信息的相似度的线性加权和,即线性加权和为1/2,如果预设条件设定相似度不小于1/2,则可以认为第一信息和第二信息的相似度满足预设条件,如果预设条件设定相似度为大
于1/2,则可以认为第一信息和第二信息的相似度不满足预设条件。需要说明的是,上述列举的不同信息的相似度的权值的取值,以及满足相似度条件设为1,不满足相似度条件设为0,均为举例说明,不代表对本技术对取值的限定,在实际应用场景中,可以根据场景需求选定不同类型的信息的权值,并确定相同种类信息的相似度的线性加权和。
98.在一个可能的实施方式中,还可以通过其他方式确定第一信息和第二信息的相似度。比如,第一信息和第二信息一共包括4种信息,可以设定其中3种信息满足预设条件,则可以认为第一信息和第二信息的相似度满足预设条件。需要说明的是,这里的3种信息满足预设条件,是指3种信息分别满足各自的预设条件,本文对此不再重复说明。此外,关于如何确定每一种信息是否满足预设条件已经在上文对此进行了说明。
99.如果第一信息和第二信息的相似度满足预设条件,则可以认为车辆进入了两个相似的驾驶场景,车辆处于自动驾驶模式时,第一信息是第一模型的输入数据,第一模型的输出数据用于为车辆规划行驶路线,第一模型是以人工驾驶模式下车辆的行车轨迹为训练目标,对人工驾驶模式下获取的第二信息进行训练得到的模型。为了更好的理解本技术提供的方案,下面结合图5a至图5c分别对自动驾驶模式,人工驾驶模式,以及进入相同场景后的自动驾驶模式对应的场景进行介绍。
100.如图5a所示,为车辆处于自动驾驶模式时的流程示意图。传感器系统将感知的周边环境信息(比如第一信息)发送给行为规划器,行为规划器根据传感器系统获取的周边环境为下发高层决策,运动规划器根据行为规划器下发的高层决策规划预期轨迹和速度,运动控制器负责操作油门刹车方向盘,让自动驾驶车辆根据目标轨迹并达到目标速度。在自动驾驶模式时,驾驶员不介入,如图5a中用虚线表示驾驶员操控的流程。
101.如图5b所示,当车辆再次进入类似场景时,具体表现在第一信息和第二信息的相似度满足预设条件,第二信息是第一模型的训练数据。如果车辆处于自动驾驶模式,则可以根据将第一信息作为第一模型的输入数据,根据第一模型的输出数据为车辆规划行驶路线。
102.二、车辆处于人工驾驶模式
103.403、车辆处于人工驾驶模式时,第一信息用于训练第一模型。
104.如图5c所示,当车辆可能发生危险,或未按照驾驶员预期行驶时(需要说明的是,本方案中涉及驾驶员的描述均指人类驾驶员),驾驶员可以通过操作方向盘或踩下制动踏板的方式介入车辆的驾驶。驾驶员接管时,保持传感器系统的正常运行,输出周边环境信息。驾驶员接管时,行为规划器、运动规划器以及运动控制器不介入车辆的控制。对人工驾驶模式下传感器系统获取的数据(即周边环境信息)作为训练数据,对第一模型进行训练。其中,人工驾驶模式下传感器获取的数据可以理解为:获取到驾驶员驾驶车辆行驶到获取到重新切换回自动驾驶模式期间传感器获取的数据,或者也可以将驾驶员驾驶车辆行驶到预设的距离或者预设时长期间传感器获取的数据。第一模型的训练目标是人工驾驶模式下车辆的行驶轨迹,即训练目标是让第一模型的输出数据更接近驾驶员驾驶的行驶轨迹。换句话说,训练的目标是使训练完成的第一模型输出的轨迹分布和人工驾驶模式下车辆的轨迹分布相匹配,或者偏差在预设范围内。需要说明的是,相关技术中的模仿学习算法本技术实施例均可以采用。
105.由图4对应的实施例可知,本技术提供的方案实时获取车辆周围的环境信息,比如
第一信息和第二信息。当车辆处于人工驾驶模式时,以车辆周围的环境信息作为训练数据,对模型进行训练,使该模型输出的轨迹可以接近人工驾驶模式下车辆的行驶轨迹。当车辆处于自动驾驶模式时,如果确定车辆的环境信息和模型训练使用的车辆的周围的环境信息的相似度满足预设条件,则以车辆周围的环境信息作为模型的输入数据,根据模型的输出数据为车辆规划行驶路线。通过本技术提供的方案可以降低人工接管的频率,比如在一个典型的场景中,图2a至图2c所示的场景中,经过该路段时,不需要每次都由驾驶员接管,车辆可以根据模型输出的数据为车辆规划行驶路线,躲避开连续的井盖。此外,本技术提供的方案可以大量减少训练所需的数据。现有技术中,不考虑大量长尾场景,以解决最常见场景中的规划问题为目标,重点优化自动驾驶过程中更为常见的场景,这些场景中自动驾驶的数据也更易收集、更有共性,如换道、车道保持、高速巡航等场景。由于需要考虑更常见的场景,使其解决方案更具有泛化性,现有技术往往需要大量的驾驶数据,一般的厂家或研究单位无法满足此需求。本技术提供的方案主要针对特定的场景进行优化,不考虑模型的泛化性,因此仅需收集针对该场景的数据即可,所需的数据量较现有技术要小很多。
106.此外,针对大量的长尾场景,现有技术通常需要研究人员必须对场景逐一进行分析,分析过程较为复杂,解决方案常常需要特殊处理,往往还会影响其他已有的场景的逻辑,无法进行自动的增量优化。本技术还可以解决这一问题,下面对此问题进行具体的说明。
107.如图5d所示,车辆处于自动驾驶模式时,可以通过评估第一信息与m组信息的相似度,评估车辆所处场景(周边环境信息)的相似度,若第一信息和m组信息的相似度满足预设条件,即认为车辆当前场景相似度与已有可用模型对应场景的相似度超过阈值,可以从m个模型中选择相似度最高的可用模型,以当前获取的周期环境信息(比如第一信息)作为该相似度最高的可用模型(比如第一模型)的输入,该相似度最高的可用模型的输出数据可以为车辆规划行驶路线。以下对此种场景进行具体介绍。
108.请参阅图6,图6为本技术实施例提供的一种规划车辆行驶路线的方法的一种流程示意图,本技术实施例提供的车辆行驶一种规划车辆行驶路线的方法可以包括:
109.601、获取第一信息。
110.步骤601可以参照图4对应的实施例中的步骤401进行理解,这里不再重复赘述。
111.602、评估第一信息与m组信息的相似度。
112.m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型。m组信息中的任意两组信息的相似度不满足预设条件,使得m组信息中的每一种信息可以分别对应一种不同的场景,不同的场景对应不同的模型。举例说明,比如m为2,m组信息分别是m1组信息和m2组信息。m1组信息和m2组信息均为人工驾驶模式时获取的信息,比如m1组信息是图1c场景下获取的信息,m2组信息是图2b场景下获取的信息。比如m组信息包括的信息种类为车辆的位置信息,图1c和图2b所示的场景中,车辆的地理位置偏差较大,可以认为m1组信息和m2组信息的相似度不满足预设条件。当然,上面列举的m组信息包括2组信息仅为举例说明,在实际场景中,m组信息可以包括两组以上的信息。比如,如果m组信息包括的种类信息为车辆的位置信息时,m组信息中的每一组信息可能分别对应一个不同路段。关于如何评估两个信息的相似度,已经在上文进行了介绍,具体可以参照图4对应的实施例中的步
骤402中关于如何确定两个信息的相似度进行理解,这里不再重复赘述。
113.一、车辆处于自动驾驶模式
114.603、第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息是第一模型的输入数据。
115.举例说明,假设m组信息分别是m1组信息和m2组信息,m1组信息是图1c场景下获取的信息,m2组信息是图2b场景下获取的信息。假设m1组信息对应的模型是a模型,m2组信息对应的模型是b模型。以a模型为例进行说明,如果车辆在图1c所示的场景中,处于人工驾驶模式,则获取车辆的行车轨迹,并获取图1c场景中的周边环境信息作为训练数据,对a模型进行训练,当a模型的输出的轨迹与车辆在图1c场景中人工驾驶模式下的车辆轨迹的分布在预设范围内时,则认为a模型完成训练,a模型的输出数据可以用来为车辆规划行驶路线。如果第一信息和m1组信息的相似度满足预设条件,并且第一信息和m1组信息的相似度大于第一信息和m2组信息的相似度,则可以将第一信息作为a模型的输入数据,此时a模型的输出数据可以用来为车辆规划行驶路线,此时规划的行驶路线与人工驾驶模式下车辆的行车轨迹相似,不会碰撞到出车位口处的障碍物。需要说明的是,本技术有时也将模型输出的轨迹称为模型输出的数据,在不强调二者的区别之时,二者表示相同的意思。以b模型为例进行说明,如果车辆在图2b所示的场景中,处于人工驾驶模式,则获取车辆的行车轨迹,并获取图2b场景中的周边环境信息作为训练数据,对b模型进行训练,当b模型的输出的轨迹与车辆在图2b场景中人工驾驶模式下的车辆轨迹的分布在预设范围内时,则认为b模型完成训练,b模型的输出数据可以用来为车辆规划行驶路线。如果第一信息和m2组信息的相似度满足预设条件,并且第一信息和m1组信息的相似度小于第一信息和m2组信息的相似度,则可以将第一信息作为b模型的输入数据,此时b模型的输出数据可以用来为车辆规划行驶路线,此时规划的行驶路线与人工驾驶模式下车辆的行车轨迹相似,可以躲避马路上连续的井盖。
116.可以通过评估第一信息与m组信息的相似度,评估车辆所处场景(周边环境信息)的相似度,若第一信息和m组信息的相似度满足预设条件,即认为车辆当前场景相似度与已有可用模型对应场景的相似度超过阈值,可以选择相似度最高的可用模型,以当前获取的周期环境信息(比如第一信息)作为该相似度最高的可用模型(比如第一模型)的输入,该相似度最高的可用模型的输出数据可以为车辆规划行驶路线。其中,可以认为人工驾驶模式下的车辆轨迹的分布在预设范围内时,该模型是可用模型。关于可用模型将在下文进一步展开介绍。
117.二、车辆处于人工驾驶模式
118.604、第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息用于训练第一模型,以得到更新后的第一模型。
119.关于如何确定第一信息和m组信息中的每一组信息的相似度是否满足相似条件,可以参照上文关于如何确定两个信息的相似度进行理解,此处不再重复赘述。
120.如果第一信息和m组信息中的某一组信息的相似度满足预设条件,比如第一信息和m组中的第二信息的相似度满足预设条件,则可以认为车辆目前所处的场景,与历史人工驾驶模式下的某个场景是相同或者相似场景。
121.若当前场景相似度与已有可用模型对应场景的相似度超过阈值,则选择相似度最
高的可用模型,比如相似度最高的是第一模型,对利用第一信息对第一模型进行更新训练,更新针对该场景的可用模型,即更新第一模型。
122.605、第一信息和m组信息中的每一组信息的相似度都不满足预设条件时,第一信息用于对第一模型进行第一次训练。
123.第一信息和m组信息中的每一组信息的相似度都不满足预设条件时,可以认为在历史人工驾驶模式下并没有与车辆目前所处的场景相同或者相似的场景。此时没有可用模型的输出数据可以为车辆规划行驶路线。则使用第一信息,构建临时模型进行训练,形成针对该场景的临时模型,即使用第一信息对第一模型进行第一次训练。此时的第一模型可能无法满足训练目标,即第一模型的输出的轨迹与人工驾驶模式下车辆的行车轨迹的分布不在预设的范围内。则经过第一次训练的第一模型是临时模型,非可用模型,当在人工驾驶模式下,获取了多次与第一信息的相似度的信息,对第一模型进行迭代训练,直至第一模型满足训练目标,则第一模型为可用模型,此时是可用模型的第一模型可以为车辆规划行驶路线。下面举例说明,假设第一信息和m组信息中的每一组信息的相似度都不满足预设条件,则利用第一信息对第一模型进行第一次训练。在之后的人工驾驶模式中,如果获取到的周边环境信息,比如获取的第三信息,该第三信息的相似度与第一信息的相似度满足预设条件,并且在目前所有已经存储的周边环境信息中,第三信息与第一信息的相似度最大,则通过第三信息对第一模型进行第二次训练,依次类推,不断的对第一模型进行迭代训练,直到第一模型的输出轨迹与人工驾驶模式下车辆的行车轨迹的分布在预设的范围内,则认为第一模型是可用模型。在一个可能的实施方式中,在第一模型是可用模型之前,如果车辆处于自动驾驶模式,即使获取的第四信息与第一信息的相似度满足预设条件,也不以第四信息作为第一模型的输入,不以此时第一模型的输出为车辆规划行驶路线。因为此时第一模型的输出轨迹与人工驾驶模式下车辆的行车轨迹的分布还不在预设的范围内,如果以第一模型的输出为车辆规划行驶路线,可能发生危险。
124.为了更好的理解本技术提供的技术方案,下面结合一个具体的流程对本技术提供的方案进行介绍,并对临时模型和可用模型进行介绍。
125.如图7所示,为本技术实施例提供的一种规划车辆行驶路线的方法的另一种流程示意图。如图7所示,车辆获取周边环境信息(比如车辆获取第一消息)。判断车辆是否被司机(驾驶员)接管,比如可以通过判断驾驶员是否以通过操作方向盘或踩下制动踏板的方式介入车辆的驾驶。如果确定车辆没有被司机接管,则车辆处于自动驾驶模式,评估场景的相似度,比如按照图6对应的实施例中的步骤602进行理解。判断是否存在类似场景的可用模型,如果存在类似场景的可用模型,可以参照图6对应的实施例中的603进行理解,使用该场景对应的输出数据为车辆规划行驶路线。如果不存在类似场景的可用模型,则按照正常自动驾驶模式控制车辆行驶,即按照既定的自动驾驶策略控制车辆行驶。其中不存在类似场景的可用模型可以理解有类似场景的模型,但是该场景的模型还没有达到训练目标,或者也可以理解为没有类似场景的模型。如果确定车辆被司机接管,则车辆处于人工驾驶模式,获取人工驾驶模式下车辆轨迹,或者说车辆的行驶轨迹,评估场景的相似度。如果有类似的场景对应的模型,且该模型已经是可用模型,则通过当前获取的周边环境信息对模型进行训练,得到更新后的模型。如果没有类似的场景对应的模型,则通过当前获取的周边环境信息对该模型进行训练,此时的模型本技术称之为临时模型,用来与可用模型进行区分。临时
模型表示模型还没有达到训练目标,即模型输出的轨迹与人工驾驶模式下车辆的行驶轨迹的分布不在预设范围内,无法模拟人工驾驶模式下车辆的行驶轨迹。可以通过评估模型是否安全与稳定确定模型是可用模型还是临时模型。关于评估模型是否安全与稳定,除了上述提到的判断模型的输出数据是否与人工驾驶模式下车辆的行驶轨迹的分布在预设范围内这种方式之外,还可以有其他的方式。比如,可以基于已有场景增加扰动,构建更多场景验证,确保在可行驶范围内无碰撞,则确认模型满足安全性与稳定性的需要。
126.下面结合几个典型的应用场景,对本技术实施例提供的方案进行介绍。如图8a所示,为本技术提供的一种规划车辆行驶路线的方法的场景的示意图。如图8a所示,可以获取车辆的得地理位置,静态障碍物信息(比如图8a中所示的道路两边的路灯),动态障碍物信息(比如马路上其他的车辆,图中未展示)。当车辆处于人工驾驶模式时,获取车辆的行驶轨迹,并可以发出提示消息,用于提示用户车辆正在对当前的驾驶方式进行学习。其中提示的方式可以包括文字提示或者语音提示,本技术实施例对此并不进行限定。需要说明的是,关于周边环境的信息可以有不同的体现方式,比如在一个可能的实施方式中,周边环境信息可以只包括地理位置,则车辆处于人工驾驶模式时,发送提示消息,提示消息用于指示车辆根据车辆当前的位置信息训练第一模型。如图8b所示,为本技术提供的一种规划车辆行驶路线的方法的场景的示意图。如图8b所示,可以获取车辆的的地理位置,静态障碍物信息(比如图8b中所示的道路两边的路灯),动态障碍物信息(比如马路上其他的车辆,图中未展示)。当车辆处于自动驾驶模式时,如果确定车辆的周边环境信息和人工驾驶模式下车辆周边的环境信息相似度满足预设条件时,比如图8b所示的车辆的周边的环境信息和图8a所示的车辆的周边的环境信息的相似度满足预设条件,则发送提示消息,提示按照模型输出的数据为车辆规划行驶路线。比如可以提示场景匹配成功,正在按照模型输出数据为车辆规划行驶路线。
127.需要说明的是,本技术提供的方案可以通过多个设备共同完成。比如如图9所示,为本技术提供的另一种规划车辆行驶路线的方法的场景的示意图。在这种场景中,车辆a,车辆b和车辆c在相同路段都进入了人工驾驶模式,车辆a,车辆b和车辆c可以将各自获得的周边环境信息(比如第一信息)以及各自车辆的行驶轨迹向云侧设备发送,由云侧设备根据获取到的多个车辆发送的第一信息对第一模型进行训练,并将训练完成的第一模型向车辆a,车辆b以及车辆c发送。在一个可能的实施方式中,云侧设备还可以将第一模型向未参与发送第一信息的车辆发送,比如向除车辆a,车辆b以及车辆c之外的其他车辆发送。使其他车辆在经过该路段时,可以根据第一模型的输出数据为车辆规划行驶路线,躲避开连续的井盖。
128.在一个可能的实施方式中,车辆,用于获取第一信息,第一信息可以包括车辆的位置信息、车道信息,导航信息,障碍物信息中的一种或者多种,车道信息用于确定车辆与车道线的相对位置,导航信息用于预测车辆的行驶方向,障碍物信息用于确定车辆与障碍物的相对位置。车辆,还用于向云侧设备发送第一信息和车辆的驾驶模式。云侧设备,用于确定车辆处于自动驾驶模式时,根据第一模型的输出数据为车辆规划行驶路线,第一信息是第一模型的输入数据,第一模型是以人工驾驶模式下车辆的行车轨迹为训练目标,对人工驾驶模式下获取的第二信息进行训练得到的模型,第二信息可以包括的信息种类与第一信息可以包括的信息的种类一致,第一信息和第二信息的相似度满足预设条件。云侧设备,还
用于确定车辆处于人工驾驶模式时,根据第一信息训练第一模型。
129.在一个可能的实施方式中,云侧设备,还用于:评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型。第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息是第一模型的输入数据。
130.在一个可能的实施方式中,云侧设备,还用于:评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m组信息中的第二信息用于训练第一模型,m为正整数。第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息用于训练第一模型,以得到更新后的第一模型。
131.在一个可能的实施方式中,云侧设备,还用于评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m为正整数。第一信息和m组信息中的每一组信息的相似度都不满足预设条件时,第一信息用于对第一模型进行第一次训练。
132.在一个可能的实施方式中,云侧设备,还用于确定车辆当前的位置信息和人工驾驶模式下获取的车辆的位置信息一致时,发送提示消息,提示消息用于指示车辆根据第一模型的输出数据为车辆规划行驶路线,第一模型是对人工驾驶模式下获取的车辆的位置信息训练得到的模型。
133.在一个可能的实施方式中,云侧设备,还用于发送提示消息,提示消息用于指示根据车辆当前的位置信息训练第一模型。
134.在一个可能的实施方式中,云侧设备,还用于确定第一信息和第二信息中相同种类信息的相似度,相同种类信息的相似度的线性加权和用于确定第一信息和第二信息的相似度。
135.在一个可能的实施方式中,第一模型可以包括卷积神经网络cnn或循环神经网络rnn。
136.在图4至图9所对应的实施例的基础上,为了更好的实施本技术实施例的上述方案,下面还提供用于实施上述方案的相关设备。具体参阅图10,图10为本技术实施例提供的规划车辆行驶路线的装置的一种结构示意图。规划车辆行驶路线的装置包括可以包括获取模块1001,规控模块1002,训练模块1003,还可以包括评估模块1004,发送模块1006以及处理模块1005。
137.在一个可能的实施方式中,可以包括:获取模块1001,用于获取第一信息,第一信息可以包括车辆的位置信息、车道信息,导航信息,障碍物信息中的一种或者多种,车道信息用于确定车辆与车道线的相对位置,导航信息用于预测车辆的行驶方向,障碍物信息用于确定车辆与障碍物的相对位置。规控模块1002,用于车辆处于自动驾驶模式时,根据第一模型的输出数据为车辆规划行驶路线,获取模块1001获取的第一信息是第一模型的输入数据,第一模型是以人工驾驶模式下车辆的行车轨迹为训练目标,对人工驾驶模式下获取的
第二信息进行训练得到的模型,第二信息可以包括的信息种类与第一信息可以包括的信息的种类一致,第一信息和第二信息的相似度满足预设条件。训练模块1003,用于车辆处于人工驾驶模式时,根据获取模块1001获取的第一信息训练第一模型。
138.在一个可能的实施方式中,还可以包括:评估模块1004,用于评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型。第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息是第一模型的输入数据。
139.在一个可能的实施方式中,还可以包括:评估模块1004,用于评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m组信息中的第二信息用于训练第一模型,m为正整数。第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息用于训练第一模型,以得到更新后的第一模型。
140.在一个可能的实施方式中,还可以包括:评估模块1004,用于评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m为正整数。第一信息和m组信息中的每一组信息的相似度都不满足预设条件时,第一信息用于对第一模型进行第一次训练。
141.在一个可能的实施方式中,还可以包括:发送模块1006,用于评估模块1004确定车辆当前的位置信息和人工驾驶模式下获取的车辆的位置信息一致时,发送提示消息,提示消息用于指示车辆根据第一模型的输出数据为车辆规划行驶路线,第一模型是对人工驾驶模式下获取的车辆的位置信息训练得到的模型。
142.在一个可能的实施方式中,还可以包括:发送模块1006,用于发送提示消息,提示消息用于指示根据车辆当前的位置信息训练第一模型。
143.在一个可能的实施方式中,处理模块1005,用于确定第一信息和第二信息中相同种类信息的相似度,相同种类信息的相似度的线性加权和用于确定第一信息和第二信息的相似度。
144.在一个可能的实施方式中,第一模型可以包括卷积神经网络cnn或循环神经网络rnn。
145.需要说明的是,规划车辆行驶路线的装置1000中各模块之间的信息交互、执行过程等内容,与本技术中图4至图9对应的各个方法实施例基于同一构思,具体内容可参见本技术前述所示的方法实施例中的叙述,此处不再赘述。
146.本技术实施例还提供了一种自动驾驶车辆,结合上述对图3的描述,请参阅图11,图11为本技术实施例提供的自动驾驶车辆的一种结构示意图,其中,自动驾驶车辆100上可以部署有图10对应实施例中所描述的规划车辆行驶路线的装置,用于实现图4至图9对应实施例中自动驾驶车辆的功能。由于在部分实施例中,自动驾驶车辆100还可以包括通信功能,则自动驾驶车辆100除了包括图3中所示的组件,还可以包括:接收器1201和发射器1202,其中,处理器113可以包括应用处理器1131和通信处理器1132。在本技术的一些实施
例中,接收器1201、发射器1202、处理器113和存储器114可通过总线或其它方式连接。
147.处理器113控制自动驾驶车辆的操作。具体的应用中,自动驾驶车辆100的各个组件通过总线系统耦合在一起,其中总线系统除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图中将各种总线都称为总线系统。
148.接收器1201可用于接收输入的数字或字符信息,以及产生与自动驾驶车辆的相关设置以及功能控制有关的信号输入。发射器1202可用于通过第一接口输出数字或字符信息;发射器1202还可用于通过第一接口向磁盘组发送指令,以修改磁盘组中的数据;发射器1202还可以包括显示屏等显示设备。
149.本技术实施例中,应用处理器1131,用于执行图2对应实施例中的自动驾驶车辆执行的规划车辆行驶路线的方法。具体的,应用处理器1131用于执行如下步骤:
150.车辆处于自动驾驶模式时,根据第一模型的输出数据为车辆规划行驶路线,传感器系统获取的第一信息是第一模型的输入数据,第一模型是以人工驾驶模式下车辆的行车轨迹为训练目标,对人工驾驶模式下获取的第二信息进行训练得到的模型,第二信息可以包括的信息种类与第一信息可以包括的信息的种类一致,第一信息和第二信息的相似度满足预设条件。车辆处于人工驾驶模式时,根据传感器系统获取的第一信息训练第一模型。
151.在一个可能的实施方式中,评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型。第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息是第一模型的输入数据。
152.在一个可能的实施方式中,评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m组信息中的第二信息用于训练第一模型,m为正整数。第一信息和m组信息中第二信息的相似度满足预设条件,且m组信息中第二信息与第一信息的相似度最大时,第一信息用于训练第一模型,以得到更新后的第一模型。
153.在一个可能的实施方式中,评估第一信息与m组信息的相似度,m组信息中的每一组信息均为车辆处于人工驾驶模式时获取的信息,m组信息中的任意两组信息的相似度不满足预设条件,m组信息中的每一组信息分别用于训练一个模型,m为正整数。第一信息和m组信息中的每一组信息的相似度都不满足预设条件时,第一信息用于对第一模型进行第一次训练。
154.在一个可能的实施方式中,发射器用于向云侧设备发送第一消息。
155.在一个可能的实施方式中,接收器用于接收云侧设备发送的第一模型。
156.需要说明的是,对于应用处理器1131执行规划车辆行驶路线的方法的具体实现方式以及带来的有益效果,均可以参考图4至图9对应的各个方法实施例中的叙述,此处不再一一赘述。
157.本技术实施例中还提供一种计算机可读存储介质,该计算机可读存储介质中存储有用于规划车辆行驶路线的程序,当其在计算机上行驶时,使得计算机执行如前述图4至图9所示实施例描述的方法中自动驾驶车辆(或者规划车辆行驶路线的装置)所执行的步骤。
158.本技术实施例中还提供一种包括计算机程序产品,当其在计算机上行驶时,使得计算机执行如前述图4至图9所示实施例描述的方法中自动驾驶车辆所执行的步骤。
159.本技术实施例中还提供一种电路系统,所述电路系统包括处理电路,所述处理电路配置为执行如前述图4至图9所示实施例描述的方法中自动驾驶车辆所执行的步骤。
160.本技术实施例提供的规划车辆行驶路线的装置或自动驾驶车辆具体可以为芯片,芯片包括:处理单元和通信单元,所述处理单元例如可以是处理器,所述通信单元例如可以是输入/输出接口、管脚或电路等。该处理单元可执行存储单元存储的计算机执行指令,以使服务器内的芯片执行上述图2至图9所示实施例描述的规划车辆行驶路线的方法。可选地,所述存储单元为所述芯片内的存储单元,如寄存器、缓存等,所述存储单元还可以是所述无线接入设备端内的位于所述芯片外部的存储单元,如只读存储器(read-only memory,rom)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,ram)等。
161.具体的,请参阅图12,图12为本技术实施例提供的芯片的一种结构示意图,所述芯片可以表现为神经网络处理器npu 130,npu 130作为协处理器挂载到主cpu(host cpu)上,由host cpu分配任务。npu的核心部分为运算电路1303,通过控制器1304控制运算电路1303提取存储器中的矩阵数据并进行乘法运算。
162.在一些实现中,运算电路1303内部包括多个处理单元(process engine,pe)。在一些实现中,运算电路1303是二维脉动阵列。运算电路1303还可以是一维脉动阵列或者能够执行例如乘法和加法这样的数学运算的其它电子线路。在一些实现中,运算电路1303是通用的矩阵处理器。
163.举例来说,假设有输入矩阵a,权重矩阵b,输出矩阵c。运算电路从权重存储器1302中取矩阵b相应的数据,并缓存在运算电路中每一个pe上。运算电路从输入存储器1301中取矩阵a数据与矩阵b进行矩阵运算,得到的矩阵的部分结果或最终结果,保存在累加器(accumulator)1308中。
164.统一存储器1306用于存放输入数据以及输出数据。权重数据直接通过存储单元访问控制器(direct memory access controller,dmac)1305,dmac被搬运到权重存储器1302中。输入数据也通过dmac被搬运到统一存储器1306中。
165.总线接口单元(bus interface unit,biu)1310,用于axi总线与dmac和取指存储器(instruction fetch buffer,ifb)1309的交互。
166.biu1310,用于取指存储器1309从外部存储器获取指令,还用于存储单元访问控制器1305从外部存储器获取输入矩阵a或者权重矩阵b的原数据。
167.dmac主要用于将外部存储器ddr中的输入数据搬运到统一存储器1306或将权重数据搬运到权重存储器1302中或将输入数据数据搬运到输入存储器1301中。
168.向量计算单元1307包括多个运算处理单元,在需要的情况下,对运算电路的输出做进一步处理,如向量乘,向量加,指数运算,对数运算,大小比较等等。主要用于神经网络中非卷积/全连接层网络计算,如批归一化(batch normalization),像素级求和,对特征平面进行上采样等。
169.在一些实现中,向量计算单元1307能将经处理的输出的向量存储到统一存储器1306。例如,向量计算单元1307可以将线性函数和/或非线性函数应用到运算电路1303的输
出,例如对卷积层提取的特征平面进行线性插值,再例如累加值的向量,用以生成激活值。在一些实现中,向量计算单元1307生成归一化的值、像素级求和的值,或二者均有。在一些实现中,处理过的输出的向量能够用作到运算电路1303的激活输入,例如用于在神经网络中的后续层中的使用。
170.控制器1304连接的取指存储器(instruction fetch buffer)1309,用于存储控制器1304使用的指令。
171.统一存储器1306,输入存储器1301,权重存储器1302以及取指存储器1309均为on-chip存储器。外部存储器私有于该npu硬件架构。
172.其中,循环神经网络中各层的运算可以由运算电路1303或向量计算单元1307执行。
173.其中,上述任一处提到的处理器,可以是一个通用中央处理器,微处理器,asic,或一个或多个用于控制上述第一方面方法的程序执行的集成电路。
174.另外需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本技术提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。
175.通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本技术可借助软件加必需的通用硬件的方式来实现,当然也可以通过专用硬件包括专用集成电路、专用clu、专用存储器、专用元器件等来实现。一般情况下,凡由计算机程序完成的功能都可以很容易地用相应的硬件来实现,而且,用来实现同一功能的具体硬件结构也可以是多种多样的,例如模拟电路、数字电路或专用电路等。但是,对本技术而言更多情况下软件程序实现是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘、u盘、移动硬盘、rom、ram、磁碟或者光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
176.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。
177.所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体
介质(例如固态硬盘(solid state disk,ssd))等。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献