场景自适应雷达的制作方法

2023-02-19 02:30:23 来源：中国专利 TAG：

1.本公开总体上涉及一种电子系统和方法，并且在特定实施例中涉及一种场景自适应雷达。

背景技术：

2.近年来，由于诸如硅锗(sige)和精细几何互补金属氧化物半导体(cmos)等低成本半导体技术的迅速发展，在毫米波频段的应用引起了人们的极大兴趣。高速双极和金属氧化物半导体(mos)晶体管的出现导致了对用于毫米波应用的集成电路的日益增长的需求，例如24ghz、60ghz、77ghz、80ghz以及100ghz以上的毫米波应用。此类应用包括，例如，汽车雷达系统和多千兆位通信系统。
3.在一些雷达系统中，通过发射调频信号、接收调频信号的反射(也称为回波)和基于调频信号的发射和接收之间的时间延迟和/或频率差确定距离来确定雷达和目标之间的距离。因此，一些雷达系统包括用于发射射频(rf)信号的发射天线和用于接收反射rf信号的接收天线，以及用于产生发射信号和接收rf信号的相关rf电路。在某些雷达系统中，可以使用多个天线来实现使用相控阵技术的定向波束。具有多个芯片组的多输入多输出(mimo)配置可用于执行相干和非相干信号处理。

技术实现要素：

4.根据一个实施例，一种方法包括：从毫米波雷达传感器接收第一雷达数据；用雷达处理链接收超参数集合；基于第一雷达数据和超参数集合，使用雷达处理链生成第一雷达处理输出；使用超参数选择神经网络基于第一雷达处理输出更新超参数集合；从毫米波雷达传感器接收第二雷达数据；以及基于第二雷达数据和所更新的超参数集合使用雷达处理链生成第二雷达处理输出。
5.根据一个实施例，一种方法包括：从毫米波雷达传感器接收第一雷达数据；用包括跟踪器的雷达处理链接收超参数集合；基于第一雷达数据和超参数集合，使用雷达处理链生成第一雷达图像；使用跟踪器基于第一雷达图像和超参数集合跟踪目标；使用超参数选择神经网络基于第一雷达图像更新超参数集合；从毫米波雷达传感器接收第二雷达数据；以及基于第二雷达数据和所更新的超参数集合使用雷达处理链生成第二雷达图像。
6.根据一个实施例，一种毫米波雷达系统包括：毫米波雷达传感器，被配置为发射雷达信号和接收反射雷达信号，并基于反射雷达信号生成雷达数据；以及处理系统，包括：雷达处理链，被配置为基于雷达数据和超参数集合生成第一雷达处理输出；以及超参数选择神经网络，被配置为基于第一雷达处理输出更新超参数集合，其中雷达处理链被配置为基于雷达数据和所更新的超参数集合生成第二雷达处理输出。
附图说明
7.为了更完整地理解本发明及其优点，现在结合附图参考以下描述，其中：
8.图1示出了根据本发明实施例的雷达处理系统的框图；
9.图2a示出了根据本发明实施例的图1的雷达处理系统的可能实现的框图；
10.图2b示出了根据本发明实施例的可由图2a的协处理器用于更新提供给图2a的雷达预处理模块和/或跟踪模块的超参数的雷达图像；
11.图3a示出了根据本发明实施例的图1的雷达处理系统的可能实现的框图；
12.图3b示出了根据本发明实施例的热图；
13.图4示出了根据本发明实施例的图1的雷达处理系统的可能实现的框图；
14.图5至图8示出了根据本发明实施例的图2a的雷达处理系统的可能实现；
15.图9a和图9b分别示出了根据本发明实施例的用于训练超参数选择神经网络的实施例方法的框图和流程图；
16.图9c示出了根据本发明实施例的用于训练超参数选择神经网络的实施例方法的框图；
17.图10示出了根据本发明实施例的用于训练超参数选择神经网络的方法的实施例的流程图；
18.图11a和图11b示出了根据本发明实施例的使用图10的方法与基线方法训练超参数选择神经网络之间的比较；
19.图12示出了根据本发明实施例的毫米波雷达系统的示意图；以及
20.图13示出了根据本发明实施例的由图12的发射天线发射的啁啾序列。
21.不同图中对应的数字和符号，除非另有说明，一般指对应的部分。绘制这些图是为了清楚地说明优选实施例的相关方面，并且不必按比例绘制。
具体实施方式
22.下面将详细讨论所公开的实施例的制作和使用。然而，应当理解的是，本发明提供了许多可应用的发明构思，其可体现在广泛的各种特定上下文中。所讨论的特定实施例仅仅是说明制造和使用本发明的特定方式，并且不限制本发明的范围。
23.下面的描述示出了各种特定细节，以提供对根据描述的几个示例实施例的深入理解。可以在没有一个或多个具体细节的情况下，或者利用其他方法、组件、材料等来获得实施例。在其他情况下，未详细示出或描述已知结构、材料或操作，以便不模糊实施例的不同方面。在本说明书中对“实施例”的引用指示在至少一个实施例中包括关于该实施例描述的特定配置、结构或特征。因此，可能出现在本说明书的不同点的诸如“在一个实施例中”的短语不一定完全指代相同的实施例。此外，在一个或多个实施例中，可以以任何适当的方式组合特定的构造、结构或特征。
24.本发明的实施例将在使用场景自适应超参数跟踪目标(例如，诸如人类目标)的毫米波雷达系统的特定上下文中描述。一些实施例可以实现不执行目标跟踪的雷达处理链。一些实施例可以在不同于毫米波的机制中实现。
25.在本发明的实施例中，场景自适应雷达系统基于雷达处理链感测到的场景动态更新雷达处理链的一个或多个超参数。包括超参数选择神经网络的协处理器向雷达处理链提供更新的超参数。通过动态更新雷达处理链的超参数，一些实施例有利地能够在任何给定场景下适应和获得最佳(或更好)雷达性能(例如，跟踪性能、定位精度等)。
26.雷达应用通常包括接收几个(例如，强烈地)影响雷达性能的超参数的雷达处理链。超参数可以理解为影响雷达系统的雷达性能的配置变量。
27.传统上，雷达系统的超参数是基于人工整定或通过采用离线优化方法(如网格搜索、贝叶斯搜索的随机搜索)选择的，并在超参数值选定后进行固定。因此，传统上，一旦雷达系统部署，雷达系统的超参数是恒定的。
28.应用于雷达处理链的几个超参数可能对部署雷达传感器的场景(例如，由雷达传感器感测的环境)敏感。例如，一些超参数可能对目标相对于雷达传感器的角度、距离和方位、存在于雷达传感器视场中的目标的数量、存在于雷达传感器视场中的杂波、目标的特性(例如，大小、运动速度等)等敏感。例如，当目标离雷达传感器更近(较低距离)时，可以使用比当目标离雷达传感器更远(较高距离)时更高的检测阈值。因此，所选择的(固定的)超参数通常针对与将要部署雷达传感器的环境(例如，小房间中的一个或两个目标)相关联的场景的子集进行优化。
29.在本发明的实施例中，雷达处理链包括产生雷达预处理输出(例如，雷达图像)的雷达预处理模块，基于雷达预处理输出跟踪一个或多个目标的跟踪模块，以及向雷达预处理模块和跟踪模块提供超参数集合的协处理器。协处理器基于雷达处理链的雷达处理输出(例如，来自雷达预处理模块的输出和/或来自跟踪模块的输出)动态更新超参数集合中的一个或多个超参数。
30.图1示出了根据本发明的实施例的雷达处理系统100的框图。雷达处理系统100包括雷达处理链102和协处理器104。雷达处理链包括雷达预处理模块106和跟踪模块108。协处理器105包括超参数选择神经网络105。
31.在正常操作期间，雷达预处理模块106例如从毫米波雷达传感器(例如1202)接收雷达数据，并处理该雷达数据以产生雷达预处理输出s(例如，雷达图像、雷达时间序列)。当雷达预处理模块106接收雷达数据时，雷达预处理模块106产生相应的雷达预处理输出s。跟踪模块108接收雷达预处理输出并基于雷达预处理输出跟踪一个或多个目标。
32.协处理器104接收雷达处理输出(例如，来自雷达预处理模块106的输出和/或来自跟踪模块108的输出)，并基于雷达处理输出向雷达预处理模块106和/或跟踪模块108提供更新的超参数，例如，以使雷达性能适应(例如，优化)与雷达数据相关联的场景。在一些实施例中，雷达预处理模块106有利地使用更新的超参数来生成更精确的雷达预处理输出(例如，实现更少的噪声、实现更精确的目标检测等)。在一些实施例中，跟踪模块108有利地使用更新的超参数来改善跟踪性能(例如，减少假警报、减少误检测等)。
33.一些实施例的雷达处理输出的示例包括热图和/或雷达图像，诸如距离角图像和距离多普勒图像，例如，在顺序统计(os)恒虚警率(cfar)(os-cfar)检测器之前和/或之后(例如，来自雷达数据的最后一帧和/或来自雷达数据的先前帧的聚合)。
34.在一些实施例中，协处理器104向雷达预处理模块106提供更新的超参数，而不更新跟踪模块108的超参数。在一些实施例中，协处理器104向跟踪模块108提供更新的超参数，而不更新雷达预处理模块106的超参数。在一些实施例中，协处理器104向雷达预处理模块106和跟踪模块108提供更新的超参数。
35.在一些实施例中，协处理器104提供给雷达处理链102的超参数的总数可以在5到15之间，例如14。在一些实施例中，协处理器104提供给雷达处理链102的超参数的数目可以
低于5，例如4、3、2或1，或者高于15，例如16或更高。
36.在一些实施例中，协处理器104在每次产生新的雷达处理输出(例如，雷达数据的每一帧)时更新一个或多个超参数。在一些实施例中，协处理器104更新跟踪模块108的每个时间步长的一个或多个超参数。在一些实施例中，协处理器104可以以不同的间隔更新一个或多个超参数，例如跟踪模块108的每n个帧或每n个时间步长，其中n是例如大于或等于1的整数，例如8、12、16或更多。
37.在一些实施例中，协处理器104包括超参数选择神经网络(105)，用于基于雷达处理输出动态地选择超参数的值。在一些实施例中，超参数选择神经网络105可以使用强化学习(rl)、模仿学习和/或课程学习来训练。
38.在一些实施例中，雷达处理链102可以实现为传统雷达处理链。
39.在一些实施例中，雷达预处理模块106可以执行例如信号调理、低通滤波和背景去除，以及距离fft、多普勒fft、波束成形、相干积分、目标检测、目标聚类、运动检测和/或定位估计中的一个或多个。
40.在一些实施例中，跟踪模块108可以用卡尔曼滤波器来实现，例如无迹卡尔曼滤波器。其他实现也是可能的。
41.在一些实施例中，跟踪模块108生成跟踪数据。在一些实施例中，由跟踪模块108生成的跟踪数据包括目标跟踪历史、目标预测(例如，位置预测)和/或目标数量。
42.在一些实施例中，跟踪数据可以流式传输到外部电路，例如处理器。在一些实施例中，跟踪数据可以存储在协处理器104内，并且可以根据需要由外部电路(例如，处理器)访问。其他实现也是可能的。
43.在一些实施例中，雷达数据包括由毫米波雷达的模数转换器(adc)生成的数字数据。
44.在一些实施例中，雷达数据包括来自雷达传感器的多个天线的分离基带雷达数据。例如，在一些实施例中，雷达数据包括按毫米波雷达的接收天线数目按慢时间样本按快时间样本的数据立方体(datacube)。在一些实施例中，雷达数据被组织在帧中。
45.在一些实施例中，每个雷达数据包括单个帧。在一些实施例中，每个雷达数据包括多个帧(例如，16个帧)。其他实现也是可能的。
46.在一些实施例中，雷达处理链102使用通用处理器、控制器或数字信号处理器(dsp)来实现，通用处理器、控制器或数字信号处理器(dsp)包括例如耦合到存储器的组合电路。在一些实施例中，雷达处理链102可以用作专用集成电路(asic)来实现。在一些实施例中，雷达处理链102可以使用例如arm、risc或x86架构来实现。在一些实施例中，雷达处理链102可以使用人工智能(ai)加速器来实现。一些实施例可以使用在dsp或通用微控制器上运行的硬件加速器和软件的组合来实现雷达处理链102。其他实现也是可能的。
47.在一些实施例中，协处理器106可以使用通用处理器、控制器或数字信号处理器(dsp)来实现，通用处理器、控制器或数字信号处理器(dsp)包括例如耦合到存储器的组合电路。在一些实施例中，协处理器106可实现为专用集成电路(asic)。在一些实施例中，协处理器106可以例如用arm、risc或x86体系结构来实现。在一些实施例中，协处理器106可以包括人工智能(ai)加速器。其他实现也是可能的。
48.图2a示出了根据本发明实施例的雷达处理系统200的框图。雷达处理系统200包括
雷达处理链202和协处理器204。雷达处理链202包括雷达预处理模块206和跟踪模块108。雷达处理系统100可以实现为雷达处理系统200。雷达处理链102可以实现为雷达处理链202。雷达预处理模块106可以实现为雷达预处理模块206。协处理器104可以实现为协处理器204。超参数选择神经网络105可以实现为超参数选择神经网络205。
49.如图2a所示，雷达预处理模块206基于雷达数据生成雷达图像。协处理器204基于由雷达预处理模块206(例如，使用超参数选择神经网络205)生成的雷达图像(例如，使用超参数选择神经网络205)向雷达预处理模块206和/或跟踪模块108提供(例如，使用超参数选择神经网络205)更新的超参数。
50.在一些实施例中，雷达图像可以是来自一个或多个帧(例如，来自多个帧的图像的聚合)的距离角图像(rai)或距离多普勒图像(rdi)。在一些实施例中，可以例如基于顺序统计(os)恒虚警率(cfar)(os-cfar)检测器的输出来掩码雷达图像。也可以使用其他类型的雷达图像。
51.在一些实施例中，雷达预处理模块206生成多个雷达图像，协处理器204使用这些图像来更新提供给雷达预处理模块206和/或跟踪模块108的超参数。例如，在一些实施例中，雷达预处理模块206向协处理器204提供基于当前帧的无掩码rai、基于当前帧的掩码rai、基于最后32帧的聚合的无掩码rai、以及基于最后32帧的聚合的掩码rai。也可以使用雷达图像的其他类型和组合。
52.图2b示出了根据本发明实施例的雷达图像。如图所示，雷达图像212和216对应于1帧数据。雷达图像214和218对应于32帧数据。雷达图像212和214对应于未掩码的rai。雷达图像216和218对应于基于os-cfar检测器的输出被掩码的rai。
53.在一些实施例中，雷达预处理206向协处理器204提供1帧和32帧掩码和未掩码的rai。协处理器204然后使用这样的雷达图像来更新提供给雷达预处理模块206和/或跟踪模块108的超参数。在一些实施例中，可以使用雷达图像的其他组合。例如，在一些实施例中，协处理器204可以仅使用掩码雷达图像来更新所提供的超参数。
54.图3a示出了根据本发明实施例的雷达处理系统300的框图。雷达处理系统300包括雷达处理链302和协处理器304。雷达处理链302包括雷达预处理模块106和跟踪模块308。雷达处理系统100可以实现为雷达处理系统300。雷达处理链102可以实现为雷达处理链302。跟踪模块108可以实现为跟踪模块308。协处理器104可以实现为协处理器304。超参数选择神经网络105可以实现为超参数选择神经网络305。
55.如图3a所示，跟踪模块308基于雷达预处理输出(例如，基于雷达图像，如图2b所示)生成热图。热图可以被理解为包括例如来自跟踪模块308的预测(例如，目标的位置)及其相关的不确定性(例如，协方差)的图像。协处理器304基于由跟踪模块308生成的热图向雷达预处理模块106和/或跟踪模块308提供(例如，使用超参数选择神经网络305)更新的超参数。
56.图3b示出了根据本发明实施例的热图312。热图312对应于基于从雷达预处理模块106接收的雷达图像的跟踪模块308的预测。
57.在一些实施例中，跟踪模块308向协处理器304提供热图(例如，如图3b所示)，协处理器304又使用这种热图来更新提供给雷达预处理模块106和/或跟踪模块308的超参数。在一些实施例中，协处理器可以接收输入的其他组合以生成所提供的超参数。例如，图4示出
了根据本发明实施例的雷达处理系统400的框图。雷达处理系统400包括雷达处理链402和协处理器404。雷达处理链402包括雷达预处理模块206和跟踪模块308。雷达处理系统100可以实现为雷达处理系统400。雷达处理链102可以实现为雷达处理链402。协处理器104可以实现为协处理器404。超参数选择神经网络105可以实现为超参数选择神经网络405。
58.如图4所示，协处理器404可基于雷达预处理模块(例如，206)的输出，例如雷达图像(例如，如图2b所示)并且基于来自跟踪模块(例如，308)的输出，例如热图(例如，如图3b所示)，将(例如，使用超参数选择神经网络405)更新的超参数提供给雷达预处理模块206和/或跟踪模块308。
59.在一些实施例中，协处理器(例如104、204、304、404)从具有相同大小的雷达预处理模块(例如106、206)和/或跟踪模块(例如108、308)接收图像。例如，在一些实施例中，诸如212、214、216、218和312的图像都具有相同的大小，例如64
×
64像素。
60.图5示出了根据本发明实施例的雷达处理系统500的框图。雷达处理系统500包括雷达处理链502和协处理器504。雷达处理链502包括雷达预处理模块506和跟踪模块508。雷达处理系统100可以实现为雷达处理系统500。雷达处理链102可以实现为雷达处理链502。协处理器104可以实现为协处理器504。超参数选择神经网络105和205可以实现为超参数选择神经网络505。
61.如图5所示，雷达处理系统500被配置为检测和跟踪人类目标。例如，在预形成距离和多普勒fft之后，通过生成距离-多普勒图(514，516)、应用2d mti滤波(518，520)、执行数字波束成形(522)和执行相干积分(524)，基于雷达数据生成(510)rai(也称为距离交叉距离图像)。通过使用os-cfar检测器(528)执行目标检测(526)。cfar检测器(528)基于例如距离图像的功率电平(例如，rai)，生成检测图像，其中例如“1”表示目标，而“0”表示非目标。检测图像作为掩码操作，并与rai相乘以获得其中仅检测目标的细节是非零的掩码图像。使用基于密度的噪声应用空间聚类(dbscan)算法(532)聚类(530)存在于掩码图像中的目标。在聚类(530)之后，基于掩码rai执行对每个聚类目标的参数(534)的估计，例如对目标质心(536)和到达角(538)的估计，并且将每个检测到的目标的估计参数提供给跟踪模块508。
62.如图5所示，跟踪模块508使用概率数据关联滤波器(pdaf)(542)将检测到的目标关联(540)到各个轨迹。使用无迹卡尔曼滤波器(546)对轨迹执行跟踪滤波(544)。例如，跟踪模块508的每个时间步长管理(548)轨迹，并且基于由无迹卡尔曼滤波器(546)产生的滤波轨迹来初始化、终止、重新初始化轨迹，并且执行(550)多径反射抑制。
63.在一些实施例中，参数估计可以由跟踪模块508执行，而不是由雷达预处理模块506执行。在一些实施例中，在参数估计步骤(534)期间，可以对每个目标执行其他参数，而不是或除了目标的质心(536)和到达角(538)之外。
64.雷达预处理模块506和跟踪模块508的性能可能受到诸如虚警概率(p
fa
)、参考神经元数(n
ref
)和保护神经元数(n
guard
)等超参数的影响，这些超参数由os-cfar检测器528使用；用于确定由dbscan算法(532)使用的簇(minpts)和邻域(ε)的期望最小簇大小；以及处理和测量协方差矩阵q和r(由无迹卡尔曼滤波器546使用)、跟踪开始计数和跟踪终止计数(由任务管理模块(548)使用)以及门控阈值(由pdaf算法使用以确定有效测量，例如，当将检测到的目标分配给轨迹时，将实际测量与预测测量进行比较时)。
65.如图5所示，协处理器504(例如，使用超参数选择神经网络505)分别基于由模块
510和526生成的rai和/或掩码rai动态更新提供给雷达预处理模块506(p
fa
,n
ref
,n
guard
,minpts,ε)和/或跟踪模块508(q、r、跟踪开始计数、跟踪终止计数、门控阈值)的超参数中的一个或多个。在一些实施例中，还可以使用基于来自多个帧的图像的聚合的rai和掩码rai。在一些实施例中，协处理器504使用雷达图像的不同组合，例如仅使用掩码雷达图像，或仅使用基于来自多个帧的图像的聚合的雷达图像。
66.在一些实施例中，协处理器504生成范围数据的每个帧的更新的超参数。在一些实施例中，协处理器504在跟踪模块508的每个时间步长生成更新的超参数。也可以使用其他参数生成间隔，例如每n帧或每n个时间步长，其中n大于1。
67.雷达处理系统500可以被修改为与其他类型的雷达图像一起操作。例如，图6示出了根据本发明实施例的雷达处理系统600的框图。雷达处理系统600包括雷达处理链602和协处理器604。雷达处理链602包括雷达预处理模块606和跟踪模块508。雷达处理系统100可以实现为雷达处理系统600。雷达处理链102可以实现为雷达处理链602。协处理器104可以实现为协处理器604。超参数选择神经网络105和205可以实现为超参数选择神经网络605。
68.雷达处理系统600以与雷达处理系统500类似的方式操作。然而，雷达处理系统600使用距离多普勒图像而不是rai操作。
69.图7示出了根据本发明实施例的雷达处理系统700的框图。雷达处理系统700包括雷达处理链702和协处理器704。雷达处理链702包括雷达预处理模块706和跟踪模块708。雷达处理系统100可以实现为雷达处理系统700。雷达处理链102可以实现为雷达处理链702。协处理器104可以实现为协处理器704。超参数选择神经网络105和205可以实现为超参数选择神经网络705。
70.如图7所示，雷达处理系统700被配置为检测和跟踪人类目标。雷达预处理模块706用于检测由跟踪模块708跟踪的一个或多个目标。
71.雷达预处理模块706包括宏多普勒处理链722和微多普勒处理链724。在一些实施例中，宏多普勒处理链722和微多普勒处理链724可分别以与雷达预处理模块506或606相似的方式实现，但以不同的帧速率操作。例如，在一些实施例中，宏多普勒处理链722以等于雷达数据的帧速率的帧速率处理雷达数据，而微多普勒检测处理链724以低于雷达数据的帧速率的帧速率(例如，每32帧雷达数据)处理雷达数据。在一些实施例中，通过对来自距离数据帧的啁啾进行采样或对来自距离数据帧的啁啾进行积分来构造(726)微帧，使得微帧具有较慢的帧速率(例如，比距离数据帧慢32倍)。
72.宏多普勒检测处理链722基于雷达数据检测和识别运动目标和高信噪比静态目标。例如，在一些实施例中，宏检测处理链722产生包括与相应检测目标相关联的目标参数集合的输出，其中每个目标参数包括与相应目标的距离、多普勒速度和角度相关联的数据。
73.在一些实施例中，在宏检测处理链722中的mti滤波之后，仅保留具有高运动的目标，因为它们的能量在多普勒图像中变化。因此，在一些实施例中，目标参数组不包括与低运动相关联的目标参数，例如墙，因为这样的目标可以例如通过由宏检测处理链722执行的mti滤波而被移除(例如，因为即使墙可以被认为是高信噪比对象，墙的运动波动(如果有的话)太低，不会在mti滤波之后将墙保留为目标)。
74.微检测处理链724基于雷达数据检测和识别静态目标。例如，在一些实施例中，微检测处理链724产生包括与相应检测目标相关联的目标参数集合的输出，其中每个目标参
数包括与相应目标的范围和角度相关联的数据。在一些实施例中，由微检测处理链724生成的目标参数不包括多普勒速度，因为可以假定其为0m/s(因为由微检测处理链724检测的目标是静态目标)。在一些实施例中，微多普勒处理链724包括微多普勒滤波器，其在生成距离-多普勒图(514，516)之前，用对应于人类生命体征的通带(例如，在0.5hz和5hz之间)对距离fft进行滤波。
75.由检测处理链722和724检测到的目标被组合(718)，然后由单个跟踪器708跟踪。在一些实施例中，跟踪模块708可以实现为交互式多模型(imm)跟踪器。也可以使用其他跟踪器。
76.如图7所示，协处理器704从检测处理链722和724接收(例如，使用超参数选择神经网络705)雷达图像(例如，os-cfar之前或之后的rai和/或rdi)，并基于所接收的雷达图像更新一个或多个超参数。在一些实施例中，协处理器704提供给宏多普勒处理链722的超参数包括由os-cfar检测器使用的虚警概率(p
fa_macro
)、参考神经元数(n
ref_macro
)和保护神经元数(n
guard_macro
)；以及dbscan算法所使用的期望最小簇大小(minpts
macro
)和邻域(ε
macro
)。在一些实施例中，协处理器704提供给微多普勒处理链724的超参数包括由os-cfar检测器使用的虚警概率(p
fa_micro
)、参考神经元数(n
ref_micro
)和保护神经元数(n
guard_micro
)；dbscan算法所使用的期望最小簇大小(minpts
micro
)和邻域(ε
micro
)；以及f
l
(较低截止频率)和fh(较高截止频率)，用于配置微多普勒滤波器的带宽。
77.在一些实施例中，协处理器704提供给跟踪模块708的超参数包括处理和测量协方差矩阵q和r、跟踪开始计数和跟踪终止计数以及门控阈值。
78.图8示出了根据本发明的实施例的雷达处理系统800的框图。雷达处理系统800包括雷达处理链802和协处理器804。雷达处理链802包括雷达预处理模块806和跟踪模块808。雷达处理系统100可以实现为雷达处理系统800。雷达处理链102可以实现为雷达处理链802。协处理器104可以实现为协处理器804。超参数选择神经网络105和205可以实现为超参数选择神经网络805。
79.如图8所示，雷达处理系统800被配置为检测和跟踪人类目标的心跳速率。雷达预处理模块806用于产生检测到的人体目标的位移信号。位移信号由跟踪模块708进一步处理，跟踪模块708使用卡尔曼滤波器基于处理的位移信号来跟踪人的心跳速率。
80.雷达预处理模块806包括雷达图像生成810，其基于雷达数据生成雷达图像(例如，rdi、rai)。在目标检测(528)和目标聚类(532)之后，例如，基于在检测到的目标范围处的复距离数据的标准偏差，来执行目标移动检测(822)。对于非运动目标，将椭圆拟合算法(824)应用于与所检测目标相关联的(复距离数据的)i-q轨迹，以补偿偏移、幅度和增益误差。补偿后的数据(补偿后的i-q信号)被提供给分类器(826)，分类器估计补偿后的数据的质量，并基于补偿后的数据显示的随机身体运动(rbm)和/或互调积(imp)，将补偿后的数据分类为“高质量”或“低质量”。计算(828)补偿目标数据的角度(例如，通过对来自所选范围仓(range bin)的i-q信号进行反正切解调)，并且所得到的相位值在用于“高质量”补偿数据的两个连续数据点之间被解包(830)，，以产生位移信号。
81.跟踪模块808接收位移信号并使用带通(例如，fir)滤波器832对其进行滤波。基于滤波的位移信号估计(834)心跳速率z
k 1
，其中k 1表示卡尔曼滤波器的下一个时间步长。
82.卡尔曼滤波可以理解为递归贝叶斯过程，当测量值包含不可预测或随机误差、不
确定性或变化时，可以应用该过程。关于图8，卡尔曼滤波的处理包括步骤836、838、840和848。
83.对于每个时间步长k，卡尔曼滤波器基于与人类目标的心跳速率相关联的轨迹进行状态预测(836)。椭球门控函数检查(838)估计的心跳速率z
k 1
是否在门控窗口内。当心跳速率估计值z
k 1
在门控区域内时(例如，当门控函数低于门控阈值时)，基于第一速率z
k 1
更新(848)卡尔曼滤波器的状态，并且基于更新的状态更新(852)带通滤波器设置(例如，通过缩小通带)。当心跳速率估计值z
k 1
在门控区域之外时(例如，当门控函数高于门控阈值时)，不更新卡尔曼滤波器的状态(840)。如果连续m个周期没有更新卡尔曼滤波器的状态，则更新(846)带通滤波器设置(例如，通过增加通带)。
84.如图8所示，协处理器804从雷达预处理模块806接收(例如，使用超参数选择神经网络805)雷达图像(例如，os-cfar之前或之后的rai和/或rdi)，并基于所接收的雷达图像更新一个或多个超参数。在一些实施例中，协处理器804提供给m个雷达预处理模块806的超参数包括虚警概率(p
fa
)、参考神经元数(n
ref
)和保护神经元数(n
guard
)，它们由os-cfar检测器(528)使用；dbscan算法所使用的期望最小聚类大小(minpts)和邻域(ε)；和quality_thres，分类器826使用quality_thres来区分高质量数据和低质量数据。在一些实施例中，协处理器804提供给跟踪模块808的超参数包括处理和测量协方差矩阵q和r、阈值m和门控阈值。
85.在一些实施例中，例如，雷达图像生成模块810可以实现为模块510或610。
86.在一些实施例中，超参数选择神经网络(例如105、205、305、405、505、605、705、805)可以用输入层(例如32x29x16)，接着是三个卷积层，接着是三个密集层来实现。其他实现，例如包括一个或多个完全连接的层，也是可能的。
87.在一些实施例中，超参数选择神经网络(例如105、205、305、405、505、605、705、805)可以使用模仿学习、强化学习和累积学习中的一种或其组合来训练。也可以使用其他训练方法。
88.一些实施例的优点包括动态地适配雷达处理链的一个或多个超参数以优化雷达性能的能力，例如，在逐个场景的基础上。例如，当与以固定超参数工作的雷达处理链相比时，基于场景调整雷达处理链的超参数可有利地导致更好的雷达性能。
89.图9a示出了根据本发明实施例的用于训练超参数选择神经网络(例如105、205、305、405、505、605、705、805)的实施例方法900的框图。如图9a所示，可以使用强化学习来实现方法900。
90.在训练期间，主超参数选择神经网络904根据主超参数选择神经网络904的当前策略μ()，基于当前雷达处理输出s(例如，从雷达处理链如102、202、302、402、502、602、702、802)接收的超参数概率分布的集合h。
91.主评判神经网络906基于当前雷达处理输出s和由主超参数选择神经网络904产生的超参数集合h产生q值q(s,h)，其中q值q(s,h)指示集合h相对于当前雷达处理输出s有多好。
92.基于q值q(s,h)使用策略梯度算法908来寻找主超参数选择神经网络904的系数的变化方向和幅度。基于由策略梯度算法908确定的梯度来更新主超参数选择神经网络904的系数。
93.在一些实施例中，策略梯度算法908可以以本领域中已知的任何方式实现。
94.可以基于q值来更新主评判神经网络906，该q值是基于下一雷达处理输出s'生成的。例如，在一些实施例中，由主评判神经网络906生成的q(s,h)可以通过下式给出
95.q(s,h)＝ε[r γε[q(s',h')]]
ꢀꢀ
(1)1
[0096]
其中ε[]表示期望值函数，r表示奖励，γ表示折扣因子(可以在0和1之间)，q值q(s’,h’)是基于下一个雷达处理输出s'的q值。然而，在等式1中使用的估计值ε[q(s',h')]基于由人评判神经网络906生成的估计。
[0097]
目标评判神经网络916可以基于由目标超参数选择神经网络914基于下一雷达处理输出s'生成的超参数概率分布的集合h'来生成q(s’,h’)。可以基于时间差(td)损耗函数(918)来更新主评判神经网络906的系数，该时间差(td)损耗函数可以由下式给出
[0098]
l＝ε[r γq(s',h')-q(s,hi)]
ꢀꢀ
(2)2
[0099]
其中hi是特定超参数的集合，其对应于例如从集合h的超参数的概率分布中选择的最佳特定超参数。在一些实施例中，超参数集合hi的每个超参数对应于它们各自的概率分布的峰值。
[0100]
在一些实施例中，在每个训练批期间更新主神经网络(904和906)，而在主网络904和906的每m次更新中更新目标网络(914和916)(例如，通过分别从网络904和906复制系数到914和916)。在一些实施例中，m是1000。也可以使用其他值，例如低于1000(例如900或更少)或高于1000(例如(2000)或更多)。
[0101]
在一些实施例中，神经网络904、906、914和914中的每一个可以用输入层(例如，32x29x16)，后接三个卷积层，后接三个密集层来实现。其他实现，例如包括一个或多个完全连接的层，也是可能的。
[0102]
图9b示出了根据本发明实施例的用于训练超参数选择神经网络的实施例方法900的流程图。可以根据图9a来理解图9b。
[0103]
在步骤922期间，初始化主神经网络(904和906)和目标神经网络(914和916)。例如，在一些实施例中，主超参数选择神经网络904和目标超参数选择神经网络914被初始化为相同的网络，主评判神经网络906和目标评判神经网络916被初始化为相同的网络。在一些实施例中，神经网络904、906、914和916被随机初始化。在一些实施例中，主超参数选择神经网络904和目标超参数选择神经网络914可以用预先训练的超参数选择神经网络(例如，使用模仿学习训练)来初始化。一些实施例可以以其他方式初始化主和目标超参数选择神经网络和/或主和目标评判网络。
[0104]
在步骤924期间，重放存储器902被初始化。在一些实施例中，重放存储器902被配置为存储经验e，其中每个经验e包括当前和下一个雷达处理输出s和s'、由主超参数选择神经网络904基于s生成的超参数集合h、以及奖励值r。
[0105]
在步骤926期间，由神经网络904、906、914和916生成经验，并将结果存储在重放存储器902中。例如，在一些实施例中，使用雷达处理链(例如102、202、302、402、502、602、702、802)处理例如从毫米波雷达接收的雷达数据，以产生雷达处理输出。由雷达处理链产生的输出被馈送到主神经网络和目标神经网络(904、906、914和916)，并且来自神经网络(904、906、914和916)的输出连同其他相关数据(例如r)一起被存储在重放缓冲器中。
[0106]
在步骤928期间，(例如，随机地)对来自重放缓冲器的经验进行采样。在步骤930期
间，使用例如等式2，使用采样的经验来计算td损耗l(918)。
[0107]
在步骤932期间，基于td损耗l的梯度更新主评判神经网络906。在一些实施例中，更新主评判神经网络906有利地允许使主评判神经网络906更好地预测超参数的集合h对雷达处理输出s的影响。
[0108]
在步骤934期间，使用策略梯度算法(908)更新主超参数选择神经网络904。
[0109]
如步骤936和938所示，在一些实施例中，步骤928、930、932和934重复t次，其中t大于1，例如100、1000或更多。如步骤940和942所示，每t个迭代步骤将主神经网络(904、906)复制到相应的目标网络(914、916)。因此，在一些实施例中，每t次更新主神经网络(904、906)，就更新一次目标神经网络(914、916)。
[0110]
如步骤944和946所示，当训练结束时，目标超参数选择神经网络914被复制到协处理器中(例如，成为超参数选择神经网络105、205、305、405、505、605、705、805)，以便在推理模式中使用。在一些实施例中，复制的超参数选择神经网络去激活输出超参数概率分布的集合h的特征，而代之以提供特定超参数的集合hi。因此，在推理模式期间，超参数选择神经网络(例如105、205、305、405、505、605、705、805)基于雷达处理链(例如102、202、302、402、502、602、702、802)接收的雷达处理输入来输出特定超参数的集合hi。
[0111]
在一些实施例中，例如，用于例如使用等式2计算td损耗函数(918)的奖励r可以通过下式给出
[0112][0113]
其中tn表示雷达处理数据s中存在的目标数，errdisti表示跟踪器的预测(例如，108、208、308、408、508、608、708、808)与最接近的所检测到的目标之间的距离，factorval表示因子，因子可以是实数，例如1到5之间，例如2，而errdet表示目标检测误差，并且可以通过下式给出
[0114]
errdet＝misdets falsealarms (4)4其中，misdets表示错误检测的数量(例如，存在于雷达处理输出s中但未被跟踪器检测到的目标(例如，108、208、308、408、508、608、708、808))，而falsealarms表示假警报的数量(例如，不存在于雷达处理输出s中但被跟踪器检测到的目标(例如，108、208、308、408、508、608、708、808))。
[0115]
在一些实施例中，可以使用其他奖励r公式。例如，在一些实施例中，奖励r可以通过下式给出
[0116][0117]
其中maxcondppres表示跟踪器预测矩阵中的最高条件数。当应用等式5时，当条件数低于阈值(在等式5中设置为1000)时，奖励r最大。
[0118]
在一些实施例中，距离errdisti是跟踪器的预测和最近检测到的目标之间的欧几里得距离。在一些实施例中，使用马氏距离可有利地考虑跟踪器预测的分布，其可有利地提供比欧几里得距离更好的距离度量。可以使用其他距离函数，例如马氏距离。
[0119]
在一些实施例中，距离errdisti基于与雷达处理输出s相关联的标签。例如，在一
些实施例中，距离errdisti是跟踪器预测与根据标签数据的目标位置之间的距离(例如，欧几里得、马氏)。
[0120]
在一些实施例中，标签数据是通过用场景的雷达传感器捕获帧以及同时例如用摄像机和/或其他传感器捕获相同场景的数据来生成的。还可以使用用于生成标记数据的其他方法。
[0121]
在一些实施例中，由评判神经网络(例如，906，916)生成的q值函数q(s,h)可以通过下式给出
[0122]
q(s,h|θq)＝a(s,h|θa) v(s|θv)
ꢀꢀ
(6)6
[0123]
其中v()表示指示雷达处理输出s的值的值函数，a()表示指示相对于可选择的可能超参数的平均质量的h的相对质量的优势函数，θq、θa、和θv分别使函数q()、a()和v()参数化，从而θq＝θa∪θv。
[0124]
在一些实施例中，优势函数可以通过以下方式给出
[0125][0126]
其中，μ()表示超参数选择神经网络904的策略，u是超参数探测函数，可以由
[0127]
u＝μ(s|θ
μ
) n
ꢀꢀ
(8)8
[0128]
其中n表示探测噪声，并且p(s|θ
p
)是状态相关方阵，可以由
[0129]
p(s|θ
p
)＝l(s|θ
l
)l(s|θ
l
)
t
ꢀꢀ
(9)9
[0130]
其中l(s|θ
l
)是下三角矩阵，其中θ
μ
表示超参数选择神经网络904的参数，其中θ
l
表示产生下三角矩阵l(s|θ
l
)的值的下三角神经网络的参数，其中θ
p
＝θ
l
∪θ
lt
。
[0131]
图9c示出了根据本发明实施例的用于训练超参数选择神经网络(例如105、205、305、405、505、605、705、805)的实施例方法950的框图。根据等式6至9可以理解图9c。
[0132]
如图9c所示，主超参数选择神经网络904实现策略函数μ()(用于生成超参数的集合h)，下三角神经网络952提供下三角函数矩阵l(s|θ
l
)的元素，值神经网络954和956实现值函数。神经网络952、954和956可以被称为评判神经网络。
[0133]
如图9c所示，在训练期间，使用主超参数选择神经网络904、下三角神经网络952和主值神经网络954，基于等式6至9生成q值项。目标值神经网络956实现值函数v()，并基于下一雷达处理输出s'进行操作。
[0134]
在一些实施例中，可以基于td损耗函数(958)的梯度来更新主超参数选择神经网络904、下三角神经网络952和主值神经网络954的系数，该梯度可以由下式给出
[0135]
l＝ε[(q(s,h)-(r γv(s')))2]
ꢀꢀ
(10)10
[0136]
其中，等式10的td损耗函数的梯度可以通过下式计算
[0137]
在一些实施例中，通过复制来自主值神经网络954的系数，以时间延迟的方式更新目标值神经网络956。
[0138]
在一些实施例中，神经网络904、952和954在每个训练批期间被更新，而神经网络956在神经网络904、952和954的每m次更新中被更新。
[0139]
在一些实施例中，神经网络904、952、954和956中的每一个可以用输入层(例如，
32x29x16)，后接三个卷积层，后接三个密集层来实现。其他实现，例如包括一个或多个完全连接的层，也是可能的。
[0140]
在一些实施例中，可以使用课程学习来实现方法900和950。例如，在一些实施例中，提供给神经网络(例如，904、906、914和916；或904、952和956)的雷达处理输出s是以增加复杂性的序列提供的。例如，在实现方法900的一些实施例中，包括步骤928、930、932、934、936、938、940和942的循环的第一迭代仅包括对应于0个目标的雷达处理输出s；循环的下一个迭代可以只包括对应于0和1个目标的雷达处理输出s；循环的以下迭代可以只包括对应于0、1和2个目标的雷达处理输出；类似地，在一些实施例中，实现方法950，在训练期间首先馈送复杂度较低的小批(例如，雷达处理输出s对应于0个目标)，接着馈送复杂度增加的小批(例如，0和1个目标；0、1和2个目标等)。
[0141]
在一些实施例中，可以以其他方式增加复杂性，例如通过增加环境中的杂波、增加视场的大小等。
[0142]
通过使用课程学习，与以随机方式呈现雷达处理输出相比，一些实施例有利地实现了更快的学习时间/收敛。
[0143]
在一些实施例中，超参数选择神经网络(例如105、205、305、405、505、605、705、805)在多个阶段中训练。例如，图10示出了根据本发明的实施例的用于训练超参数选择神经网络的实施例方法1000的流程图。
[0144]
在阶段i(1002)期间，训练超参数选择神经网络(例如，904)。例如，在一些实施例中，使用模仿学习来训练超参数选择神经网络。例如，在一些实施例中，手动选择的超参数与雷达处理输出s配对。损耗函数可以定义为手动选择的超参数和由超参数选择神经网络904产生的超参数之间的差。基于损耗函数迭代调整超参数选择神经网络的系数(例如，使人工选择的超参数与由超参数选择神经网络904产生的超参数之间的差最小化)。
[0145]
在一些实施例中，在执行阶段ii(1004)和阶段iii(1006)训练之前使用模仿学习有利地训练提供良好的超参数初始集合h的超参数神经网络，这可导致更快的训练/收敛时间。
[0146]
一旦在阶段i(1002)期间训练超参数选择神经网络，在阶段ii(1004)期间训练评判神经网络。例如，在实现方法900的一些实施例中，在阶段ii(1004)期间，固定超参数选择神经网络904和914(例如，等于在阶段i之后训练的超参数选择神经网络)，并且训练评判神经网络(906和916)。例如，在一些实施例中，执行方法900以训练评判神经网络(906和916)，同时保持超参数选择神经网络恒定(例如，在步骤934和940期间)。作为另一示例，在实现方法950的一些实施例中，在阶段ii(1004)期间，固定超参数选择神经网络904(例如，等于在阶段i之后训练的超参数选择神经网络)，并且训练神经网络952、954和956。
[0147]
一旦在阶段i(1002)和阶段ii(1004)期间分别训练了超参数选择神经网络和评判神经网络，则在阶段iii(1006)期间联合训练超参数选择神经网络和评判神经网络。例如，在一些实施例中，通过执行方法900或950，在阶段iii(1006)期间联合训练超参数选择神经网络和评判神经网络。在一些实施例中，可以使用课程学习来执行方法900或950(例如，随着训练的进行，通过增加雷达处理输出s的复杂性)。
[0148]
在一些实施例中，可以省略一个或多个训练阶段。例如，在一些实施例中，可以省略阶段iii(1006)。在一些实施例中，可以省略阶段i(1002)。在一些实施例中，可以省略阶
段i(1002)和ii(1004)。其他实现也是可能的。
[0149]
图11a和图11b示出了根据本发明实施例的基于场景的雷达(如图8所示实现的)与基线雷达之间的比较。基于场景的雷达包括雷达处理链和使用方法1000训练的超参数选择神经网络，以动态地向雷达处理链提供超参数。基线雷达以固定的超参数工作。
[0150]
如图11a和图11b所示，在一些实施例中，与使用固定超参数相比，动态调整雷达处理链的超参数有利地导致优越的雷达性能，如与基线雷达相比，基于场景的雷达表现出的更高的平均奖励r(这里用作评估性能的度量)和更低的errordet。
[0151]
图12示出了根据本发明实施例的毫米波雷达系统1200的示意图。毫米波雷达系统1200包括毫米波雷达传感器1202和处理系统1204。在一些实施例中，毫米波雷达传感器1202可用于生成雷达数据(x
out_dig
(n))，并且处理系统1204可实现雷达处理链(例如102、202、302、402、502、602、702、802)和协处理器(例如104、204、304、404、504、604、704、804)。
[0152]
在正常操作期间，毫米波雷达传感器1202作为调频连续波(fmcw)雷达传感器操作，并使用一个或多个发射机(tx)天线1214向场景1220发射诸如啁啾的多个tx雷达信号1206。使用rf和模拟电路1230生成雷达信号1206。雷达信号1206可以例如在20ghz到122ghz范围内。也可以使用其他频率。
[0153]
场景1220中的对象可以包括一个或多个静态或移动对象，例如汽车、摩托车、自行车、卡车和其他车辆、空闲和移动的人和动物、家具、机械、机械结构、墙和其他类型的结构。场景1220中也可以存在其他对象。
[0154]
雷达信号1206被场景920中的物体反射。反射雷达信号1208，也称为回波信号，由一个或多个接收(rx)天线916接收。rf和模拟电路1230以本领域已知的方式使用例如带通滤波器(bpf)、低通滤波器(lpf)、混频器、低噪声放大器(lna)和/或中频(if)放大器处理接收的反射雷达信号1208，以产生模拟信号x
out
(t)。
[0155]
使用adc1212将模拟信号x
out
(t)转换为原始数字数据x
out_dig
(n)(也称为雷达数据)。原始数字数据x
out_dig
(n)由处理系统1204处理以例如检测和跟踪目标。在一些实施例中，处理系统1204可用于识别和分类目标。
[0156]
控制器1210控制毫米波雷达传感器1202的一个或多个电路，例如rf和模拟电路1230和/或adc 1212。例如，控制器1210可以被实现为定制数字或混合信号电路。控制器1210也可以以其他方式实现，例如使用通用处理器或控制器。在一些实施例中，处理系统104实现控制器1210的一部分或全部。
[0157]
处理系统1204可以用通用处理器、控制器或数字信号处理器(dsp)来实现，通用处理器、控制器或数字信号处理器(dsp)包括例如耦合到存储器的组合电路。在一些实施例中，处理系统1204可以实现为专用集成电路(asic)。在一些实施例中，处理系统904可以例如用arm、risc或x86体系结构来实现。在一些实施例中，处理系统1204可以包括人工智能(ai)加速器。一些实施例可以使用在dsp或通用微控制器上运行的硬件加速器和软件的组合。在一些实施例中，处理系统1204可以用多个处理器和/或控制器来实现。其他实现也是可能的。
[0158]
作为非限制性示例，在实施例中，处理系统1204在dsp或微控制器中实现雷达处理链(例如102、202、302、402、502、602、702、802)，并在ai加速器中实现协处理器(例如104、204、304、404、504、604、704、804)。其他实现也是可能的。
[0159]
在一些实施例中，毫米波雷达传感器1202和处理系统1204的一部分或全部可以在同一集成电路(ic)内实现。例如，在一些实施例中，毫米波雷达传感器1202和处理系统1204的一部分或全部可以在集成在相同封装中的相应半导体衬底中实现。在其他实施例中，毫米波雷达传感器1202和处理系统1204的一部分或全部可以在同一单片半导体衬底中实现。在一些实施例中，毫米波雷达传感器1202和处理系统1204在各自的集成电路中实现。在一些实施例中，使用多个集成电路来实现毫米波雷达传感器1202。在一些实施例中，多个集成电路用于实现处理系统1204。其他实现也是可能的。
[0160]
作为非限制性示例，例如，如图12所示，可以实现rf和模拟电路1230。在正常操作期间，压控振荡器(vco)1236产生雷达信号，例如线性频率啁啾(例如，从57ghz到64ghz或从76ghz到77ghz)，其是由发射天线1214发射的。vco 1236由pll 1234控制，pll 1234从参考振荡器1232接收参考时钟信号(例如，80mhz)。pll1234由包括分频器1238和放大器1240的环路控制。放大器1237可用于驱动发射天线1214。
[0161]
由发射天线1214发射的tx雷达信号1206被场景1220中的物体反射并由接收天线1216接收。使用混频器1246将由接收天线1216接收的回波与由发射天线1214发射的信号的复制品混合，以产生中频(if)信号x
if
(t)(也称为差拍信号)。在一些实施例中，差拍信号x
if
(t)具有10khz和1mhz之间的带宽。带宽低于10khz或高于1mhz的差拍信号也是可能的。放大器1245可用于接收来自天线1216的反射雷达信号。
[0162]
差拍信号x
if
(t)用低通滤波器(lpf)1248滤波，然后由adc 1212采样。有利地，adc 1212能够以比接收天线1216接收的信号的频率小得多的采样频率对滤波差拍信号x
out
(t)进行采样。因此，在一些实施例中，使用fmcw雷达有利地允许adc 1212的紧凑和低成本实现。
[0163]
在一些实施例中包括滤波差拍信号x
out
(t)的数字化版本的原始数字数据x
out_dig
(n)被(例如，临时)存储在例如每个接收天线1216的n
c x ns的矩阵中，其中nc是在帧中考虑的啁啾的数目，而ns是每个啁啾的发射样本的数目，以供处理系统1204进一步处理。
[0164]
图13示出了根据本发明实施例的由tx天线1214发射的啁啾1206序列。如图13所示，啁啾1206被组织在多个帧中，并且可以被实现为上行啁啾。一些实施例可以使用下行啁啾或上行啁啾和下行啁啾的组合，例如上行啁啾和下行啁啾。也可以使用其他波形形状。
[0165]
如图13所示，每个帧可以包括多个啁啾1206。例如，在一些实施例中，帧中的啁啾数为16。一些实施例可包括每帧多于16个啁啾，例如20个啁啾、32个啁啾或更多，或每帧少于16个啁啾，例如10个啁啾、8个啁啾或更少。在一些实施例中，每个帧仅包括单个啁啾。
[0166]
在一些实施例中，每ft时间重复帧。在一些实施例中，ft时间为50ms。还可以使用不同的ft时间，例如大于50ms，例如60ms、100ms、200ms或更多，或小于50ms，例如45ms、40ms或更少。
[0167]
在一些实施例中，选择ft时间使得在帧n的最后一个啁啾的开始和帧n 1的第一个啁啾的开始之间的时间等于prt。其他实施例可以使用或导致不同的定时。
[0168]
帧的啁啾之间的时间通常称为脉冲重复时间(prt)。在一些实施例中，prt是5ms。还可以使用不同的prt，例如小于5ms，例如4ms、2ms或更少，或大于5ms，例如6ms或更多。
[0169]
啁啾的持续时间(从开始到结束)通常称为啁啾时间(ct)。在一些实施例中，线性调频时间可以是例如64μs。也可以使用更高的啁啾时间，如128μs或更高。也可以使用较低
的啁啾次数。
[0170]
在一些实施例中，线性调频带宽可以是例如4ghz。更高的带宽(如6ghz或更高)或更低的带宽(如2ghz、1ghz或更低)也是可能的。
[0171]
在一些实施例中，毫米波雷达传感器902的采样频率可以是例如1mhz。更高的采样频率，如2mhz或更高，或更低的采样频率，如500khz或更低，也是可能的。
[0172]
在一些实施例中，用于生成啁啾的样本的数量可以是例如64个样本。也可以使用更高数量的样本，例如128个样本，或更高数量的样本，或更低数量的样本，例如32个样本或更低数量的样本。
[0173]
这里概述本发明的示例实施例。还可以从这里提交的说明书和权利要求书的全部内容理解其他实施例。
[0174]
示例1.一种方法，包括：从毫米波雷达传感器接收第一雷达数据；用雷达处理链接收超参数集合；基于第一雷达数据和超参数集合，使用雷达处理链生成第一雷达处理输出；使用超参数选择神经网络基于第一雷达处理输出更新超参数集合；从毫米波雷达传感器接收第二雷达数据；以及基于第二雷达数据和所更新的超参数集合使用雷达处理链生成第二雷达处理输出。
[0175]
示例2.根据示例1的方法，其中第一雷达处理输出包括第一雷达图像。
[0176]
示例3.根据示例1或2之一的方法，还包括基于第一雷达数据的最后m帧的聚合使用雷达处理链生成第一雷达图像，其中m是大于1且小于或等于32的正整数。
[0177]
示例4.根据示例1至3之一的方法，还包括通过基于顺序统计(os)恒虚警率(cfar)(os-cfar)检测器的输出来掩码距离角图像(rai)或距离多普勒图像(rdi)来生成第一雷达图像。
[0178]
示例5.根据示例1至4之一的方法，其中超参数集合包括虚警概率超参数、多个参考神经元超参数和多个保护神经元超参数，其中接收超参数集合包括用os-cfar检测器接收虚警概率超参数、参考神经元超参数的数目和保护神经元超参数的数目。
[0179]
示例6.根据示例1至5之一的方法，还包括用雷达处理链的跟踪器生成热图，其中第一雷达处理输出包括热图。
[0180]
示例7.根据示例1至6之一的方法，其中雷达处理链包括跟踪器，其中超参数集合包括门控阈值超参数，并且其中接收超参数集合包括用跟踪器接收门控阈值超参数。
[0181]
示例8.根据示例1至7之一的方法，其中跟踪器包括无迹卡尔曼滤波器。
[0182]
示例9.根据示例1至8之一的方法，还包括训练超参数选择神经网络。
[0183]
示例10.根据示例1至9之一的方法，其中训练超参数选择神经网络包括使用模仿学习训练超参数选择神经网络。
[0184]
示例11.根据示例1至10之一的方法，其中训练超参数选择神经网络还包括：在使用模仿学习训练超参数选择神经网络之后，使用强化学习训练超参数选择神经网络。
[0185]
示例12.根据示例1至11之一的方法，其中使用强化学习训练超参数选择神经网络包括使用用于提供值函数的值神经网络和用于提供下三角矩阵的下三角神经网络，其中q函数基于值函数和下三角矩阵。
[0186]
示例13.根据示例1至12之一的方法，其中训练超参数选择神经网络还包括在强化学习期间使用课程学习。
[0187]
示例14.根据示例1至13之一所述的方法，还包括在强化学习期间使用基于错过检测、假警报和预测与实际目标位置之间的误差距离的奖励函数。
[0188]
示例15.根据示例1至14之一的方法，还包括使用预测目标位置和实际目标位置之间的马氏距离来确定误差距离。
[0189]
示例16.根据示例1至15之一的方法，还包括使用预测目标位置和实际目标位置之间的欧几里得距离来确定误差距离。
[0190]
示例17.一种方法，包括：从毫米波雷达传感器接收第一雷达数据；用包括跟踪器的雷达处理链接收超参数集合；基于第一雷达数据和超参数集合，使用雷达处理链生成第一雷达图像；使用跟踪器基于第一雷达图像和超参数集合来跟踪目标；使用超参数选择神经网络，基于第一雷达图像更新超参数集合；从毫米波雷达传感器接收第二雷达数据；以及基于第二雷达数据和所更新的超参数集合使用雷达处理链生成第二雷达图像。
[0191]
示例18.根据示例17的方法，其中目标是人类目标。
[0192]
示例19.根据示例17或18之一的方法，其中目标是人的心跳速率。
[0193]
示例20.根据示例17至19之一的方法，其中跟踪器包括卡尔曼滤波器。
[0194]
示例21.一种毫米波雷达系统，包括：毫米波雷达传感器，被配置为发射雷达信号和接收反射雷达信号，并基于反射雷达信号生成雷达数据；以及处理系统，包括：雷达处理链，被配置为基于雷达数据和超参数集合生成第一雷达处理输出；以及超参数选择神经网络，被配置为基于第一雷达处理输出更新超参数集合，其中雷达处理链被配置为基于雷达数据和所更新的超参数集合生成第二雷达处理输出。
[0195]
示例22.根据示例21的毫米波雷达系统，其中雷达处理链被配置为基于雷达数据来跟踪目标。
[0196]
示例23.根据示例21或22之一的毫米波雷达系统，其中雷达数据包括多个连续帧，其中超参数选择神经网络被配置为每n个雷达数据帧更新超参数集合，其中n是大于或等于1的正整数。
[0197]
示例24.根据示例21至23之一的毫米波雷达系统，其中超参数选择神经网络包括初始层、多个卷积层和多个密集层。
[0198]
示例25.根据示例21至24之一的毫米波雷达系统，其中第一雷达处理输出包括雷达图像和掩码雷达图像。
[0199]
虽然已经参考说明性实施例描述了本发明，但本描述不打算在限制意义上解释。参考描述，本领域技术人员对本发明的说明性实施例以及其他实施例的各种修改和组合将是显而易见的。因此，所附权利要求包括任何这样的修改或实施例。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

场景自适应雷达的制作方法

相关文献

最热文献