一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于操作交通工具上的LiDAR传感器的方法和系统与流程

2022-02-22 02:07:00 来源:中国专利 TAG:

用于操作交通工具上的lidar传感器的方法和系统


背景技术:

1.交通工具(包括采用高级驾驶员辅助系统(adas)和自主系统的那些交通工具)可利用来自交通工具上的lidar传感器的信息,以通知操作员和/或指导交通工具的一个或多个系统的操作控制。adas和自主系统可使用来自lidar传感器的信息,用于控制一个或多个系统,例如,制动、转弯和加速。
2.通过示例的方式,lidar传感器可包括机械旋转装置或固态装置(其包括mems(微机电系统)装置)。lidar传感器被设置成按固定默认设置操作,而不管例如天气、交通工具速度等情况。默认设置在理想条件下导致可接受的性能,但是在其它条件下(例如,在恶劣天气下)可次优地执行。与在非恶劣天气条件下收集的lidar点云相比,在例如雨、雪、雾等恶劣天气下收集的lidar点云可经历低的信号噪声比,例如,更多噪声的数据、更少点数、减小的观察范围、反射率方面异常以及其它感知伪像诱发的现象。在某些情况下,这可用于降低lidar传感器的有效性,这可导致减少或停用交通工具adas或自主系统。期望的是,在广泛范围的条件下具有完全操作的lidar传感器,以维持lidar传感器的有效性。


技术实现要素:

3.描述了用于交通工具的空间监测系统,所述空间监测系统包括:lidar传感器;第一多个传感器,被布置成监测周围环境状态;第二多个传感器,被布置成监测交通工具操作状况;以及控制器。控制器与第一多个传感器和第二多个传感器通信,并且操作性地连接到lidar传感器。控制器包括指令集,所述指令集可执行,以经由第一多个传感器监测周围环境状态,并且经由第二多个传感器监测交通工具操作状况。lidar传感器捕获点云,并且指令集可执行,以确定点云指标。基于周围环境状况、交通工具操作状况和点云指标而确定对于lidar传感器的期望控制参数,并且基于期望控制参数而控制lidar传感器。基于期望控制参数而控制lidar传感器,以捕获交通工具的近侧的视场的图像。
4.本公开的方面包括:lidar传感器是机械旋转lidar传感器,其中,期望控制参数包括旋转速率和激光功率水平。指令集可执行,以基于周围环境状况、交通工具操作状况和点云指标而确定对于lidar传感器的旋转速率和/或激光功率水平的期望控制参数。
5.本公开的另一方面包括:lidar传感器是固态lidar传感器,其中,期望控制参数包括对于lidar传感器的扫描式样、横跨视场的扫描密度、帧速率和激光功率。指令集可执行,以基于周围环境状况、交通工具操作状况和点云指标而确定对于lidar传感器的扫描式样、横跨视场的扫描密度、帧速率和激光功率中的一个的期望控制参数。
6.本公开的另一方面包括:被布置成监测周围环境状态的第一多个传感器包括被配置成监测周围压力和温度的多个传感器。
7.本公开的另一方面包括:被布置成监测交通工具操作状况的第二多个传感器包括被配置成监测交通工具轮速度和转向角的多个传感器。
8.本公开的另一方面包括:指令集可执行,以确定具有零范围或反射率值的点的量、对于非零测量结果的范围和反射率的平均值、中位数、标准偏差和最小/最大间隔,用于
lidar传感器的点云。
9.本公开的另一方面包括:指令集可执行,以按模拟预训练模式采用强化学习例程,以基于周围环境状况和交通工具操作状况而确定最大化lidar传感器的点云指标的对于lidar传感器的期望控制参数。
10.本公开的另一方面包括:指令集可执行,以在使用中采用强化学习例程,以基于周围环境状况和交通工具操作状况而确定最大化lidar传感器的点云指标的对于lidar传感器的期望控制参数。
11.本公开的另一方面包括交通工具,所述交通工具包括高级驾驶员辅助系统(adas)和空间监测系统。空间监测系统包括:lidar传感器,包括多个期望控制参数;第一多个传感器,被布置成监测周围环境状态;第二多个传感器,被布置成监测交通工具操作状况;以及控制器。控制器与第一多个传感器和第二多个传感器通信,并且操作性地连接到lidar传感器,控制器包括指令集。指令集可执行,以经由第一多个传感器监测周围环境状态,经由第二多个传感器监测交通工具操作状况,并且经由lidar传感器捕获点云。指令集确定对于点云的指标,基于周围环境状况、交通工具操作状况和点云指标而确定对于lidar传感器的期望控制参数,并且基于期望控制参数而控制lidar传感器,以捕获交通工具的近侧的视场的图像。adas基于交通工具的近侧的视场的图像而控制交通工具的操作。
12.本公开的另一方面包括用于监测对于交通工具的空间环境的方法,所述方法包括:监测多个周围环境状态;监测交通工具操作状况;经由lidar传感器捕获点云;确定对于点云的指标;以及基于周围环境状况、交通工具操作状况和点云指标而确定对于lidar传感器的期望控制参数。基于期望控制参数而控制lidar传感器的操作,以捕获交通工具的近侧的视场的图像。
13.本公开还提出了以下技术方案。
14.1. 用于交通工具的空间监测系统,所述空间监测系统包括:lidar传感器;第一多个传感器,被布置成监测周围环境状态;第二多个传感器,被布置成监测交通工具操作状况;控制器,与所述第一多个传感器和所述第二多个传感器通信,并且操作性地连接到所述lidar传感器,所述控制器包括指令集,所述指令集可执行,用于:经由所述第一多个传感器监测所述周围环境状态,经由所述第二多个传感器监测所述交通工具操作状况,经由所述lidar传感器捕获点云,确定对于所述点云的点云指标,以及基于所述周围环境状况、所述交通工具操作状况和所述点云指标而确定对于所述lidar传感器的期望控制参数,以及基于所述期望控制参数而控制所述lidar传感器,以捕获所述交通工具的近侧的视场的图像。
15.2. 根据技术方案1所述的空间监测系统,其中,所述lidar传感器包括机械旋转lidar传感器,其中,所述期望控制参数包括旋转速率和激光功率水平;以及其中,可执行用于基于所述周围环境状况、所述交通工具操作状况和所述点云指
标而确定对于所述lidar传感器的所述期望控制参数的所述指令集包括以下指令集,所述指令集可执行,用于基于所述周围环境状况、所述交通工具操作状况和所述点云指标而确定对于所述lidar传感器的所述旋转速率和所述激光功率水平中的一个的所述期望控制参数。
16.3. 根据技术方案1所述的空间监测系统,其中,所述lidar传感器包括固态lidar传感器,其中,所述期望控制参数包括对于所述lidar传感器的扫描式样、横跨所述视场的扫描密度、帧速率和激光功率,以及其中,可执行用于基于所述周围环境状况、所述交通工具操作状况和所述点云指标而确定对于所述lidar传感器的所述期望控制参数的所述指令集包括以下指令集,所述指令集可执行,用于基于所述周围环境状况、所述交通工具操作状况和所述点云指标而确定对于所述lidar传感器的所述扫描式样、横跨所述视场的所述扫描密度、所述帧速率和所述激光功率中的一个的所述期望控制参数。
17.4. 根据技术方案1所述的空间监测系统,其中,被布置成监测周围环境状态的所述第一多个传感器包括被配置成监测周围压力和温度的多个传感器。
18.5. 根据技术方案1所述的空间监测系统,其中,被布置成监测交通工具操作状况的所述第二多个传感器包括被配置成监测交通工具轮速度和转向角的多个传感器。
19.6. 根据技术方案1所述的空间监测系统,其中,可执行用于确定所述lidar传感器的点云指标的所述指令集包括以下指令集,所述指令集可执行,用于确定具有零范围或反射率值的点的量、对于非零测量结果的范围和反射率的平均值、中位数、标准偏差和最小/最大间隔,用于所述lidar传感器的所述点云。
20.7. 根据技术方案1所述的空间监测系统,其中,可执行用于基于所述周围环境状况、所述交通工具操作状况和所述lidar传感器的所述点云指标而确定对于所述lidar传感器的所述期望控制参数的所述指令集包括以下指令集,所述指令集可执行,用于按模拟预训练模式采用强化学习例程,以基于所述周围环境状况和所述交通工具操作状况而确定最大化所述lidar传感器的所述点云指标的对于所述lidar传感器的所述期望控制参数。
21.8. 根据技术方案1所述的空间监测系统,其中,可执行用于基于所述周围环境状况、所述交通工具操作状况和所述lidar传感器的所述点云指标而确定对于所述lidar传感器的所述期望控制参数的所述指令集包括以下指令集,所述指令集可执行,用于在使用中采用强化学习例程,以基于所述周围环境状况和所述交通工具操作状况而确定最大化所述lidar传感器的所述点云指标的对于所述lidar传感器的所述期望控制参数。
22.9. 交通工具,包括:高级驾驶员辅助系统(adas)和空间监测系统;其中,所述空间监测系统包括:lidar传感器;第一多个传感器,被布置成监测周围环境状态;第二多个传感器,被布置成监测交通工具操作状况;以及控制器,与所述第一多个传感器和所述第二多个传感器通信,并且操作性地连接到所述lidar传感器,所述控制器包括指令集,所述指令集可执行,用于:经由所述第一多个传感器监测所述周围环境状态,
经由所述第二多个传感器监测所述交通工具操作状况,经由所述lidar传感器捕获点云,确定对于所述点云的指标,以及基于所述周围环境状况、所述交通工具操作状况和所述点云指标而确定对于所述lidar传感器的期望控制参数,以及基于所述期望控制参数而控制所述lidar传感器,以捕获所述交通工具的近侧的视场的图像;其中,所述adas基于所述交通工具的近侧的视场的所述图像而控制所述交通工具的操作。
23.10. 根据技术方案9所述的交通工具,其中,所述lidar传感器包括机械旋转lidar传感器,其中,所述期望控制参数包括旋转速率和激光功率水平;以及其中,可执行用于基于所述周围环境状况、所述交通工具操作状况和所述点云指标而确定对于所述lidar传感器的所述期望控制参数的所述指令集包括以下指令集,所述指令集可执行,用于基于所述周围环境状况、所述交通工具操作状况和所述点云指标而确定对于所述lidar传感器的所述旋转速率和所述激光功率水平中的一个的所述期望控制参数。
24.11. 根据技术方案9所述的交通工具,其中,所述lidar传感器包括固态lidar传感器,其中,所述期望控制参数包括对于所述lidar传感器的扫描式样、横跨所述视场的扫描密度、帧速率和激光功率,以及其中,可执行用于基于所述周围环境状况、所述交通工具操作状况和所述点云指标而确定对于所述lidar传感器的所述期望控制参数的所述指令集包括以下指令集,所述指令集可执行,用于基于所述周围环境状况、所述交通工具操作状况和所述点云指标而确定对于所述lidar传感器的所述扫描式样、横跨所述视场的所述扫描密度、所述帧速率和所述激光功率中的一个的所述期望控制参数。
25.12. 根据技术方案9所述的交通工具,其中,被布置成监测周围环境状态的所述第一多个传感器包括被配置成监测周围压力和温度的多个传感器。
26.13. 根据技术方案9所述的交通工具,其中,被布置成监测交通工具操作状况的所述第二多个传感器包括被配置成监测交通工具轮速度和转向角的多个传感器。
27.14. 根据技术方案9所述的交通工具,其中,可执行用于确定所述lidar传感器的点云指标的所述指令集包括以下指令集,所述指令集可执行,用于确定具有零范围或反射率值的点的量、对于非零测量结果的范围和反射率的平均值、中位数、标准偏差和最小/最大间隔,用于所述lidar传感器的所述点云。
28.15. 根据技术方案9所述的交通工具,其中,可执行用于基于所述周围环境状况、所述交通工具操作状况和所述lidar传感器的所述点云指标而确定对于所述lidar传感器的所述期望控制参数的所述指令集包括以下指令集,所述指令集可执行,以按模拟预训练模式采用强化学习例程,以基于所述周围环境状况和所述交通工具操作状况而确定最大化所述lidar传感器的所述点云指标的对于所述lidar传感器的所述期望控制参数。
29.16. 根据技术方案9所述的交通工具,其中,可执行用于基于所述周围环境状况、所述交通工具操作状况和所述lidar传感器的所述点云指标而确定对于所述lidar传感器
的所述期望控制参数的所述指令集包括以下指令集,所述指令集可执行,用于在使用中采用强化学习例程,以基于所述周围环境状况和所述交通工具操作状况而确定最大化所述lidar传感器的所述点云指标的对于所述lidar传感器的所述期望控制参数。
30.17. 用于监测对于交通工具的空间环境的方法,所述方法包括:监测多个周围环境状态;监测交通工具操作状况;经由lidar传感器捕获点云,确定对于所述点云的指标,以及基于所述周围环境状况、所述交通工具操作状况和所述点云指标而确定对于所述lidar传感器的期望控制参数,以及基于所述期望控制参数而控制所述lidar传感器,以捕获所述交通工具的近侧的视场的图像。
31.18. 根据技术方案17所述的方法,其中,监测交通工具操作状况包括监测周围压力和周围温度;其中,监测交通工具操作状况包括监测交通工具轮速度和转向角;以及其中,确定对于所述点云的指标包括确定具有零范围或反射率值的点的量以及对于非零测量结果的范围和反射率的平均值、中位数、标准偏差和最小/最大间隔,用于所述lidar传感器的所述点云。
32.19. 根据技术方案17所述的方法,其中,基于所述周围环境状况、所述交通工具操作状况和所述lidar传感器的所述点云指标而确定对于所述lidar传感器的所述期望控制参数包括按模拟预训练模式执行强化学习例程,以基于所述周围环境状况和所述交通工具操作状况而确定最大化所述lidar传感器的所述点云指标的对于所述lidar传感器的所述期望控制参数。
33.20. 根据技术方案17所述的方法,基于所述周围环境状况、所述交通工具操作状况和所述lidar传感器的所述点云指标而确定对于所述lidar传感器的所述期望控制参数包括在使用中执行强化学习例程,以基于所述周围环境状况和所述交通工具操作状况而确定最大化所述lidar传感器的所述点云指标的对于所述lidar传感器的所述期望控制参数。
34.当结合所附附图时,根据用于执行本教导的一些最佳模式和其它实施例的以下详细描述,如在所附权利要求中限定的,本教导的上文的特征和优点以及其它特征和优点容易地显而易见。
附图说明
35.现在将参考所附附图通过示例的方式描述一个或多个实施例,其中:图1示意性地示出了根据本公开的包括空间监测系统的交通工具的侧视图,其中,交通工具被设置在行进表面上;图2绘图性地显示了根据本公开的与被布置成监测视场的lidar传感器的实施例的操作相关联的光发射和反射;图3示意性地显示了根据本公开的涉及强化学习例程的细节,按模拟预训练模式采用所述强化学习例程,以确定对于lidar传感器的期望控制参数;
图4示意性地显示了根据本公开的涉及强化学习例程的使用中部署的细节,以改进对于lidar传感器的期望控制参数;图5图形性地显示了根据本公开的对于lidar传感器的实施例的对于多个期望控制参数的三维可行搜索空间;图6绘图性地显示了根据本公开的被布置在行进表面上的包括lidar传感器的交通工具的侧视图,并且进一步图形性地描绘了对于lidar传感器的相关联激光扫描式样,包括在yz平面中的第一绘示以及在xy平面中的对应第二绘示。
36.应理解的是,所附附图不一定是按比例的,并且呈现了本公开的各种特征的稍微简化表示,如本文公开的,包括例如具体尺寸、定向、位置和形状。与此类特征相关联的细节将部分由特定预期应用和使用环境确定。
具体实施方式
37.如本文描述和示出的,所公开实施例的部件可按各种不同配置而被布置和设计。因此,以下详细描述不旨在限制所要求保护的本公开的范围,而是仅代表其可能实施例。此外,虽然在以下描述中阐述了许多具体细节,以便提供本文公开的实施例的透彻理解,但是可在没有一些这些细节的情况下实践一些实施例。此外,为了清楚的目的,没有详细描述在相关领域中被理解的某些技术材料,以便避免不必要地模糊本公开。此外,附图呈简化形式,并且不是精确按比例的。为了方便和清楚的目的,可相对于附图使用方向性术语,例如,顶部、底部、左、右、上、之上、上方、下方、之下、后方和前方。这些和类似的方向性术语不应被解释为限制本公开的范围。此外,可在缺少本文未具体公开的元素的情况下实践本公开,如本文示出和描述的。如本文使用的,术语“系统”可指机械和电气硬件、传感器、控制器、专用集成电路(asic)、组合逻辑电路、软件、固件和/或被布置成提供所描述功能的其它部件中的一个或组合。
38.参考附图,其中,贯穿于若干附图,相似的附图标记对应于相似或类似的部件,图1(与本文公开的实施例一致)示意性地示出了被设置在行进表面10上的交通工具100,其中,交通工具100包括推进系统15、转向系统16、交通工具轮制动系统17、高级驾驶员辅助系统(adas) 20、空间监测系统30、导航系统40、被布置成监测交通工具操作状况的第一多个传感器50以及被布置成监测周围环境状况的第二多个传感器54。显示了交通工具100的侧视图。交通工具100和行进表面10限定包括纵向轴线或y轴线11、横向轴线或x轴线12以及竖轴线或z轴线13的三维坐标系。空间监测系统30包括lidar传感器32。如本文描述的,来自被布置成监测交通工具操作状况的第一多个传感器50和被布置成监测周围环境状况的第二多个传感器54的信息可由经由远程信息处理系统60使用v2x通信从交通工具外的来源获得的信息补充或增补。本文描述的构思提供了系统和方法,用于采用强化学习方法基于周围环境状况、交通工具操作状况和lidar点云指标而确定对于lidar传感器32的期望控制参数,并且基于期望控制参数而动态控制lidar传感器32。用于控制lidar传感器32的期望控制参数限定动作空间,参考图5而描述了所述动作空间的示例。
39.通过非限制性示例的方式,其它交通工具上的系统可包括计算机可读存储装置或介质(存储器)(其包括数字化道路地图)、远程信息处理系统60、全球导航卫星系统(gnss)传感器52以及人/机接口(hmi)装置55。本文描述的构思可按本文描述的方式用于可受益于
从空间监测系统30的实施例确定的信息的各种系统上。交通工具100可包括但不限于呈商用交通工具、工业交通工具、农用交通工具、客运交通工具、飞机、船只、火车、全地形交通工具、个人移动设备、机器人和类似等形式的移动平台,以实现本公开的目的。
40.在一个实施例中,并且如本文描述的,空间监测系统30包括光探测和雷达(lidar)传感器32,所述光探测和雷达(lidar)传感器32具有包括交通工具100的近侧和前方的行进表面的可视区域34的视场(fov),并且与空间监测控制器35通信。可选地或此外,lidar传感器32具有包括交通工具100旁边和/或后方的行进表面10的可视区域34的fov。lidar传感器32具有可被表征的交通工具上的位置和定向,例如,包括相对于竖轴线13限定的高度h
cam
和角度θ
cam
。可采用一个或多个lidar传感器32。
41.空间监测系统30可包括被布置成监测交通工具100的前方的可视区域34的其它空间传感器和系统,例如,包括环视摄像头或雷达传感器,其可用于增补或补充由lidar传感器32生成的空间信息。空间传感器中的每个(包括lidar传感器32)被设置在交通工具上,以监测可视区域34,以探测邻近远程对象,例如,道路特征、行道标记、建筑物、行人、路标、交通控制灯和标志、其它交通工具以及交通工具100的近侧的地理特征。空间监测控制器35可评估来自空间传感器的输入,以鉴于每个邻近远程对象而确定交通工具100的线性范围、相对速度和轨迹。如本文采用的,术语“邻近”、“近侧”和相关术语是指在交通工具100附近的静止和移动对象,使得其可由连接到空间监测控制器35(包括空间监测系统30)的空间传感器中的一个或多个辨别。
42.第一多个传感器50包括被布置成监测交通工具操作状况(例如,包括交通工具速度、加速度、制动、转向角、偏航率等等)的传感器。第二多个传感器54包括被布置成监测周围环境状况(例如,包括当日时间、海拔、周围压力、周围温度、湿度(露点)、降水等等)的传感器。可选地或此外,可经由远程信息处理系统60采用使用v2x通信通过连接到附近的气象站或其它交通工具而获得周围环境状况的部分。
43.远程信息处理系统60提供交通工具外通信,包括与可包括无线和有线通信能力的通信网络通信。远程信息处理系统60包括能够进行交通工具外通信(其包括交通工具对于外界(v2x)通信)的远程信息处理控制器。v2x通信包括短程交通工具对于交通工具(v2v)通信以及与一个或多个路边单元的通信,因此有助于多个类似定位的交通工具之间的局部通信。可选地或此外,远程信息处理系统60能够进行到手持式装置(例如,蜂窝电话、卫星电话或另一电话装置)的短程无线通信。在一个实施例中,手持式装置被加载有软件应用,所述软件应用包括无线协议,以与远程信息处理控制器通信,并且手持式装置执行交通工具外通信,包括经由通信网络与机外控制器通信。
44.可选地或此外,远程信息处理系统60通过经由通信网络与机外控制器通信而直接执行交通工具外通信。
45.adas 20被布置成通过控制推进系统15、转向系统16、轮制动系统17中的一个或多个而在很少或没有交通工具操作员的直接交互的情况下提供操作员辅助特征。adas 20包括控制器以及提供操作员辅助特征的一个或多个子系统,所述一个或多个子系统包括自适应巡航控制(acc)系统、行道保持控制(lky)系统、行道变更控制(lcc)系统、自主制动/防碰撞系统和/或被配置成独立于或结合操作员请求而命令和控制自主交通工具操作的其它系统中的一个或多个。adas 20可与机载地图数据库交互,并且从机载地图数据库存取信息,
用于路线规划,并且经由行道保持系统、行道定中心系统和/或被配置成命令和控制自主交通工具操作的其它系统而控制交通工具100的操作。可生成自主操作命令,以控制acc系统、lky系统、lcc系统、自主制动/防碰撞系统和/或其它系统。交通工具操作包括响应于期望命令按推进模式操作,所述期望命令可包括操作员请求和/或自主交通工具请求。交通工具操作(包括自主交通工具操作)包括加速、制动、转向、稳态行驶、滑行和空转。可基于到加速器踏板、制动踏板、方向盘、变速器范围选择器、acc系统等等的操作员输入而生成操作员请求。如本文采用的,adas 20基于来自lidar传感器32的输入并且基于来自空间监测系统30的其它输入而控制交通工具100的操作。
46.术语“控制器”和相关术语(例如,微控制器、控制单元、处理器和类似术语)是指(多个)专用集成电路(asic)、现场可编程门阵列(fpga)、(多个)电子电路、(多个)中央处理单元(例如,(多个)微处理器)以及呈存储器和存储装置形式的(多个)相关联非暂时性存储器部件(只读、可编程只读、随机存取、硬盘驱动器等等)的一种或多种组合。非暂时性存储器部件能够按以下形式存储机器可读指令:一个或多个软件或固件程序或例程、(多个)组合逻辑电路、(多个)输入/输出电路和装置、信号调节器、缓冲器以及可由一个或多个处理器存取和执行以提供所描述功能的其它部件。(多个)输入/输出电路和装置包括模拟/数字转换器和监测来自传感器的输入的相关装置,其中,以预定采样频率或响应于触发事件而监测此类输入。软件、固件、程序、指令、控制例程、代码、算法和类似术语意指控制器可执行的指令集,包括校准和查找表。每个控制器执行(多个)控制例程,以提供期望功能。例程可按规律间隔执行,例如,在进行操作期间每100微秒一次。可选地,可响应于触发事件的发生而执行例程。控制器、致动器和/或传感器之间的通信可使用直接有线点对点链路、联网通信总线链路、无线链路或另一合适的通信链路而实现。通信包括按合适形式交换数据信号,例如,包括经由传导介质的电信号、经由空气的电磁信号、经由光学波导的光学信号和类似等。数据信号可包括表示来自传感器的输入、致动器命令以及控制器之间的通信的离散、模拟或数字化模拟信号。术语“信号”是指传达信息的物理可辨别指示器,并且可为能够行进通过介质的合适波形(例如,电、光学、磁、机械或电磁),例如,dc、ac、正弦波、三角波、方波、振动和类似等。参数被限定为表示可使用一个或多个传感器和/或物理模型而辨别的装置或其它元素的物理性质的可测量的量。参数可具有离散值(例如,“1”或“0”),或者在值上可无限变化。
47.lidar传感器32是感测装置和相关联信号处理系统,其通过利用光学脉冲经由激光照亮目标并且测量反射光束的特征而探测对象并且测绘其距离。lidar传感器32可为机械lidar传感器、固态lidar传感器或另一配置。
48.当lidar传感器32是机械lidar传感器时,其采用高级光学器件和旋转组件,以产生宽视场(fov),在一个实施例中,其可为360度旋转。机械配置在宽fov下提供高信号噪声比(snr)。当lidar传感器32是固态lidar装置时,不存在有旋转机械部件,而导致窄fov。在交通工具100的前方、后方和侧部可存在有多个通道,其信号处理包括数据融合,以产生宽fov。
49.固态lidar传感器具有多种实施方法。mems(微机电系统)lidar传感器使用微小反射镜,当施加刺激(例如,电压)时,所述微小反射镜的倾斜角度变化。实际上,mems lidar系统利用机电等同物而替代机械扫描硬件。接收器光收集孔口确定对于mems lidar传感器的
接收snr,其可为小的,例如,几毫米。为了在多个维度上移动激光束,要求级联多个反射镜。
50.闪光灯lidar传感器按类似于使用光学闪光灯的数字摄像头的方式操作。在闪光灯lidar中,采用单个大面积激光脉冲,以照亮其前方的环境,并且紧密邻近激光放置光电探测器的焦平面阵列,以捕获反向散射的光。光电探测器捕获图像距离、位置和反射强度。
51.光学相位阵列(opa)传感器按类似于相位阵列雷达的方式操作。在opa系统中,光学相位调制器控制穿过透镜的光速。控制光速实现了光学波前形状的控制。顶部光束不延迟,而中间和底部光束通过增加量而延迟。此现象有效地使激光光束转向,以指向不同方向。
52.调频连续波(fmcw) lidar传感器采用相干方法,以产生调频激光的短暂线性调频脉冲。测量返回线性调频脉冲的相位和频率使得fmcw lidar传感器能够测量距离和速度两者。
53.当lidar传感器32是机械旋转lidar传感器时,通过非限制性示例的方式,期望控制参数包括旋转速率(例如,300-1200 rpm)、激光功率、噪声水平(对于固件侧的初始滤波)、激光返回模式(最后/最强/双重)以及对于所有激光通道的固有校准参数。
54.当lidar传感器32是固态lidar传感器时,期望控制参数包括扫描式样(扫描线的定向、横跨视场的扫描密度、线的幅度/交错)、帧速率、激光功率、噪声水平、激光返回模式(最后/最强/双重)以及对于激光的固有校准参数。
55.本文描述的构思提供了交通工具、用于交通工具的相关联空间监测系统以及通过根据交通工具和周围环境状况(例如,交通工具速度、降水等等)改变lidar传感器的可控参数(例如,激光功率、帧速率等等)而最佳地操作lidar传感器的方法。与不采用此类技术的系统相比,通过收集在模拟和现实世界环境中的经验,并且通过强化学习而进行学习,这可导致改进的点云测量结果质量,包括更好的信号噪声比、更多测量点、更少噪声、更少降水粒子干扰、更宽反射率和范围测量分布等等。lidar传感器32可通过根据交通工具和周围环境状况改变可控参数(例如,激光功率、帧速率等等)而操作,而不使其保持固定处于规定默认值。结果是改进的点云测量结果质量。
56.可基于专家先验知识基于规则而自适应地改变lidar可控参数中的一些。在此类情况下,那些具体可控参数可从动作空间排除(其与强化学习相关联),或者可与深度神经网络的负责生成动作空间的那些维度的部分一起保持在动作空间中(其被单独训练)。此单独训练可按纯监督非强化方式完成,以重现专家规则,其中,此后冻结具体权重,因此迭代强化训练不影响那些权重。
57.图2绘图性地显示了与被布置成监测fov 200的参考图1描述的lidar传感器32的实施例的操作相关联的光发射和反射。通过非限制性示例的方式,fov 200可包括:行进表面;固定装置(例如,路标、导轨、灯柱等等);建筑物;其它交通工具;以及行人。这些元素由元素210指示。fov 200还可包括降水220,其可呈雨、冰雹、雪、雨夹雪、雾、雾霾、烟雾等等的形式。从lidar传感器32发出的光发射包括由元素202指示的未反射传送激光光束以及由元素204指示的反射传送激光光束。未反射传送激光202和反射传送激光光束204形成点云205。点云可经受统计分析,以确定点云指标,例如,所述点云指标包括:具有相关联零范围或反射率值的激光光束的量和百分比;以及对于具有非零测量结果的激光光束的范围和反射率直方图的平均值、中位数、标准偏差、最小/最大间隔。
58.再次参考图1,交通工具100包括:lidar传感器32,具有相关联多个期望控制参数;第一多个传感器50,被布置成监测周围环境状态;第二多个传感器54,被布置成监测交通工具操作状况;以及控制器,例如,空间监测控制器35。空间监测控制器35与第一多个传感器50和第二多个传感器54通信,并且操作性地连接到lidar传感器32,以根据控制器可执行指令集而控制期望控制参数。参考图3和图4描述了指令集,并且所述指令集包括:经由第一多个传感器50监测周围环境状态;经由第二多个传感器54监测交通工具操作状况;以及经由lidar传感器32捕获包括发射和反射激光光束的点云。参考图2描述了点云205的一个实施例。控制器确定对于点云的指标,并且基于周围环境状况、交通工具操作状况和点云指标而确定对于lidar传感器32的期望控制参数。采用期望控制参数而控制和操作lidar传感器32。
59.按模拟预训练模式采用强化学习例程而确定对于lidar传感器32的期望控制参数,并且而后在使用中采用强化学习例程,以基于周围环境状况和交通工具操作状况而确定最大化或以其它方式优化lidar传感器32的点云指标的对于lidar传感器32的期望控制参数。
60.强化学习处理某一任意实物(即,行为主体)在给定环境中应该如何行动和表现。其完成方式是通过基于其在不同场景下执行的动作而给予行为主体奖励或惩罚。强化学习任务是关于训练行为主体与其环境交互。行为主体通过执行动作而在环境的不同场景(被称为状态)之间过渡。动作转而产生奖励,所述奖励可为正向、负向或零。行为主体的唯一目的是最大化其在一段情节内收集的总奖励,所述情节是在初始状态与最终状态之间发生的所有情况。因此,行为主体被强化,以通过向其提供正向奖励而执行某些动作,并且通过提供负向奖励而阻止其参与其它动作。这是行为主体学习开发对策或策略的方式。行为主体通过学习将奖励与真正导致奖励的动作联系而学习如何处理推迟的奖励。
61.图3示意性地显示了涉及强化学习例程的细节,按模拟预训练模式300采用所述强化学习例程,用于参考图1描述的交通工具100的实施例,以基于周围环境状况和交通工具操作状况而确定最大化lidar传感器32的点云指标的对于lidar传感器32的期望控制参数。模拟预训练模式300可作为空间监测系统30的部分在空间监测控制器35中被实施为算法代码和相关联校准。模拟预训练模式300包括多个天气和行进表面场景310,所述多个天气和行进表面场景310由选择器函数314单独地选择,并且作为输入被提供到基于物理的模拟器320。模拟器320按周围环境状况和交通工具操作状况的形式生成多个可观察状态322。模拟器320还生成点云指标324,所述点云指标324作为输入被提供到奖励函数330,所述奖励函数330生成累积折扣回报332。累积折扣回报332和可观察状态322被输入到强化学习行为主体340,所述强化学习行为主体340确定动作空间342(其包括对于lidar传感器32的期望控制参数的更新),并且多个权重w1,
ꢀ…
, w6是与强化学习行为主体340相关联的可校准参数。动作空间342(其包括对于lidar传感器32的期望控制参数的更新)作为输入被提供到模拟器320,并且整个操作迭代地执行,直到在对于选定天气和行进表面场景310最大化lidar传感器32的点云指标的对于lidar传感器32的期望控制参数之间存在有收敛。采用呈对于lidar传感器32的期望控制参数的状态的形式的动作空间342的内容,作为参考图4描述的对于多个天气和行进表面场景410中的每个的多个场景特定权重w1,
ꢀ…
, w6。
62.再次参考图3,天气和行进表面场景310中的每个可包括公路类型,例如,双向街
道、多线街道、多行道有限出入高速公路等等。天气和行进表面场景310中的每个可包括交通密度的描述。天气和行进表面场景310中的每个可包括当日时间。天气和行进表面场景310中的每个可包括降水(如果存在)的类型和量级的指示。天气和行进表面场景310中的每个可包括道路表面的描述,例如,干净、湿润、被雪覆盖等等。为了描述构思的目的,通过非限制性示例的方式,天气和行进表面场景310包括第一场景311、第二场景312和第三场景313。第一场景311可包括晴朗天气,其中,在城市公路环境中具有常规交通。第二场景312可包括下雨天气,其中,在城市环境中具有拥挤交通。第三场景313可包括下雪天气,其中,在有限出入高速公路环境中具有常规交通。此场景列表被提供用于说明的目的。可按模拟预训练模式300开发、模拟和评估其它天气、交通、道路、当日时间等等设置。
63.对于状态s
t
中的每个动作a
t
设计良好的奖励函数r(s
t
, a
t
)和累积折扣回报r
t
对于成功的rl实施方案至关重要。在一个实施例中,对于状态s
t
中的每个动作a
t
的累积折扣回报r
t
可被实施和限定如下:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
[1]其中:
ꢀꢀꢀ
[2]其中:γ是折扣因子;权重w1,
ꢀ…
, w6,斜率m1,
ꢀ…
, m6和截距b1,

,b6是可校准参数;对于截距的一个推荐校准集特别是:b
1 = b
6 = 0;对于i =2,

,5,b
i = tanh(miα
iu
)
‑ꢀ
tanh(miα
il
);α1,
ꢀ…
, α5、df、dc、ih和i
l
是可训练参数;应注意的是,α2,
ꢀ…
, α5是间隔,使得其每个构成两个标量可训练参数(上限和下限);%nzr是非零回报与总回报的比率,并且是指既没有零范围也没有反射率(强度)值的点的百分比。如此,如果%nzr》 α1,则w1项施加正向奖励,否则施加负向奖励(如果b1=0);%fp是误报对象与总对象的比率。误报比率(%fp)在模拟中(即,在参考图3描述的系统的执行期间)是可用的。当在参考图4描述的部署阶段中不可用时,权重w6可设置为零。当不存在有来自感知系统的明确限定的反馈或地面实况时,在部署阶段中可停用权重w6,使得系统不能够将对象识别为幻影/叠影对象或误报;%cr表示近距离回报,对于小于α
3u
并且大于α
3l
%的总非零回报为正向奖励;当%cr的值超出期望间隔[α
3l
, α
3u
]时,奖励减少,并且可变成负向的,这取决于到由行为主体学
习的期望间隔的距离;以及%li表示低强度回报,对于小于α
5u
并且大于α
5l
%的总非零回报为正向奖励,并且以其它方式是更少正向或者甚至负向奖励。
[0064]
其它项2到5类似地应用正向或减少并且甚至可能负向奖励,这取决于百分比项与相应α-间隔(即,[α
il
, α
iu
])之间的距离,包括如下:是具有大于df的范围(距离)的非零点云远距离点的百分比;是由d《dc限定的近距离点的百分比;是具有大于ih的强度的高强度(反射率)值的百分比;以及是由i《i
l
表征的低强度点的百分比。
[0065]
w6项对于由于噪声点云而在感知系统中产生的误报伪像的百分比应用负向奖励。由于在模拟期间已知了幻影或误报对象的总数量与场景中的真实对象的数量的比,因此此项可在模拟运行期间被激活,并且在需要时,在现实世界部署期间停用w6=0。
[0066]
图4示意性地显示了涉及强化学习例程400在参考图1描述的交通工具100的实施例上的使用中部署的细节,以基于周围环境状况和交通工具操作状况而更新和改进对于lidar传感器32的期望控制参数,以最大化lidar传感器32的点云指标。模拟强化学习例程400可作为空间监测系统30的部分在空间监测控制器35中被实施为算法代码和相关联校准。强化学习例程400的使用中部署包括所感测的现实世界环境420、奖励函数330和强化学习行为主体440。基于来自被布置成监测交通工具操作状况的第一多个传感器50和被布置成监测周围环境状况的第二多个传感器54的输入以及经由v2x通信被通信到交通工具100的输入而确定所感测的现实世界环境420。
[0067]
强化学习例程400的使用中部署包括多个天气和行进表面场景410,其对于多个天气和行进表面场景中的每个具有相关联场景特定权重w1,
ꢀ…
, w6,所述多个天气和行进表面场景类似于参考图3描述的多个天气和行进表面场景310。可在参考图3描述的模拟预训练模式300的执行期间确定对于场景特定权重w1,
ꢀ…
, w6的初始值。如所显示的,分别存在有第一、第二和第三组权重411、412、413,其中,第一组权重411与第一场景311相关联,第二组权重412与第二场景312相关联,并且第三组权重413与第三场景313相关联。此权重和相关联场景列表被提供用于说明的目的。可开发和评估对于其它天气、交通、道路、当日时间等等场景的权重。
[0068]
强化学习例程400经由选择器414选择多个场景特定场景410中的一个和相关联权重w1,
ꢀ…
, w6,其由元素415指示。基于来自被布置成监测交通工具操作状况的第一多个传感器50和被布置成监测周围环境状况的第二多个传感器54的输入以及经由v2x通信被通信到交通工具100的输入而选择选定场景特定权重415。
[0069]
选定场景特定权重w1,
ꢀ…
, w
6 415作为输入被提供到强化学习行为主体440,所述强化学习行为主体440类似于参考图3描述的强化学习行为主体340。
[0070]
所感测的现实世界环境420按周围环境状况和交通工具操作状况的形式生成多个可观察状态422。所感测的现实世界环境420还生成点云指标424,所述点云指标424作为输入被提供到奖励函数430,所述奖励函数430生成累积折扣回报432。累积折扣回报432和可观察状态422被输入到强化学习行为主体440,所述强化学习行为主体440确定动作空间442
(其包括对于lidar传感器32的期望控制参数的更新)。将动作空间442(其包括对于lidar传感器32的期望控制参数的更新)作为输入被提供到所感测的现实世界环境420,并且整个操作迭代地执行,而更新对于现实世界天气和行进表面场景410最大化lidar传感器32的点云指标的对于lidar传感器32的期望控制参数。采用动作空间442的内容(其呈对于lidar传感器32的期望控制参数的状态的形式),以基于期望控制参数而控制lidar传感器32的实施例,以捕获交通工具100的近侧的视场的图像。
[0071]
通过非限制性示例的方式,天气和行进表面场景410包括第一场景411、第二场景412和第三场景413。天气和行进表面场景410中的每个可包括公路类型,例如,双向街道、多线街道、多行道有限出入高速公路等等。天气和行进表面场景410中的每个可包括交通密度的描述。天气和行进表面场景410中的每个可包括当日时间。天气和行进表面场景410中的每个可包括降水(如果存在)的类型和量级的指示。天气和行进表面场景410中的每个可包括道路表面的描述,例如,干净、湿润、被雪覆盖等等。天气和行进表面场景410中的每个可包括周围温度。通过示例的方式,第一场景411可包括晴朗天气,其中,在城市公路环境中具有常规交通。第二场景412可包括下雨天气,其中,在城市环境中具有拥挤交通。第三场景413可包括下雪天气,其中,在有限出入高速公路环境中具有常规交通。此场景列表被提供用于说明的目的。可开发其它天气、交通、道路、当日时间等等设置,用于由强化学习行为主体440使用。
[0072]
图5图形性地显示了对于lidar传感器32的实施例的对于多个期望控制参数的三维可行搜索空间500。如所显示的,期望控制参数包括旋转速率502、激光功率504和可接受噪声水平506。可行搜索空间500限定搜索参数的边界和界限,其可由参考图3描述的模拟预训练模式300评估,以按权重和用于操作参考图1描述的lidar传感器32的期望控制参数的形式确定可校准参数。如所显示的,显示了包括初始搜索点511和最终搜索点512的搜索路径510。搜索路径510辅助行为主体学习良好策略,所述良好策略导致根据在该特定时间下的独特情况和操作状况(其可不提前已知)而获得高效搜索路径。在通过模拟进行学习的阶段期间,行为主体在不同场景中探索数百万条搜索路径(如搜索路径510),并且根据情况而对于每个搜索路径和沿着其的每个点不同地获得奖励。因此,其学习某些良好策略,所述良好策略在不同情况下实现更高累积奖励。在现实场景中的部署阶段期间,行为主体利用那些所学习策略,以生成导致对于lidar传感器32的最佳操作设置(即,动作空间中的最佳点)的高效搜索路径510。这些设置基于在特定时间下的操作状况(其可不提前已知)而自适应和动态地改变。模拟期间的此非策略搜索以及部署期间的策略搜索在探索与利用之间达到高效平衡,用于使强化学习行为主体正确地完成其任务。
[0073]
对于期望控制参数可存在有某些约束。根据其性质,约束可必须作为负向奖励惩罚项被添加在奖励函数等式中(即,软约束),或者其需要通过从n维搜索空间去除某些超曲面或超体积而明确地强加在搜索空间上(即,硬约束)。对于软约束的示例在于,在持续时间周期下,在功耗或lidar健康的方面上,即使按增加信号噪声比的形式导致增加点云质量,增加激光功率也可为不期望的。这可作为惩罚项被添加到奖励函数,例如,将项-w7*p添加到等式2,其中,p是惩罚项。硬约束的示例可包括保留护眼规定协议。通过示例的方式,机械旋转lidar包括旋转速率和激光功率两个期望控制参数。对于此lidar的动作空间在旋转速率-激光功率平面中为矩形,例如,旋转速率作为水平方向,并且激光功率在竖直方向上。根
据所利用的激光的波长,处于低旋转速率和高激光功率的某些区域是不允许。在此情况下,可在模拟和部署阶段两者中消除动作空间矩形的左上部。
[0074]
图6绘图性地显示了被布置在行进表面610上的示例性交通工具600的侧视图。交通工具600包括空间监测系统630,所述空间监测系统630包括lidar传感器632。在此实施例中,lidar传感器632被布置为mems扫描装置。采用期望控制参数而控制和操作lidar传感器632,可采用参考图4描述的强化学习例程400和参考图3描述的模拟预训练模式300而开发所述期望控制参数。交通工具600和行进表面610限定包括纵向轴线或y轴线611、横向轴线或x轴线612以及竖轴线或z轴线613的三维坐标系。如所显示的,交通工具600被绘示在yz平面中。还图形性地描绘了激光扫描式样620,其包括yz平面中的第一绘示621以及xy平面中的对应第二绘示622。激光扫描式样620包括上层级623、中间层级624和下层级625。上层级623被布置成捕获固定对象等等(例如,停放标志),并且在某些情况下可被控制处于低密度扫描式样。中间层级624被布置成捕获行进表面610上的目标(例如,行人和其它交通工具),并且在某些情况下被控制处于高密度扫描式样。下层级625被布置成捕获地面对象(例如,建筑物和导轨),在某些情况下被控制处于中等密度扫描式样。
[0075]
可基于任务/操作状况而在各种操作参数下命令激光扫描式样620,包括但不限于扫描线的自适应定向控制以及xz平面中横跨视场的动态调整的密度。这可包括竖直密度调整和水平扫描速度调整,以有效和动态地将所关注区域调零。这还可包括幅度/交错量的动态调整。此操作有助于期望控制参数(例如,对于lidar传感器的横跨视场的扫描密度、帧速率以及激光功率)的动态控制,以基于期望控制参数而控制lidar传感器捕获交通工具的近侧的视场的图像。
[0076]
可使用先验专家知识,以决定性地设置一些校准参数,包括基于周围湿度、温度和压力对于激光传播和反射的影响的基于物理的理解以及空气动力学流型对于激光传播和反射的影响的理解而调整扫描式样校准。通过示例的方式,周围湿度可使光折射改变决定性的量,并且可被考虑,而无需测试。可调整扫描式样,以最小化与降水粒子(例如,雪、雨、水滴或冰雹)以及可与空气动力学流一起移动的其它空气传播的元素(例如,沙子、灰尘、昆虫群和气溶胶)的干扰。前述降水粒子和其它空气传播的元素中的任何可通过折射、反射和半透明度而影响激光传播。虽然对于面向前方的lidar,默认水平式样可为可接受的,即,几乎垂直于颗粒流线;但对于面向拐角和侧部的lidar,所述式样不是最佳的。可使用空气动力学模拟,以预先确定对于面向不同方向的lidar的合理扫描式样,而非使用强化学习而搜索所有可能性。强化学习仍可用于在更低维空间中的合成扫描式样的更小微调。
[0077]
详细描述以及附图或图示对于本教导是支持和描述性的,但是本教导的范围仅由权利要求限定。虽然已经详细描述了用于执行本教导的一些最佳模式和其它实施例,但是存在有各种可选设计和实施例,用于实践在所附权利要求中限定的本教导。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献