一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

用于乘客约束装置的参数自动标定的方法和设备与流程

2023-02-10 17:05:14 来源:中国专利 TAG:


1.本发明涉及一种用于乘客约束装置的参数自动标定的方法、一种用于乘客约束装置的参数自动标定的设备和一种计算机程序产品。


背景技术:

2.在车辆碰撞期间,为了防止车辆乘客受到过度冲击,在车辆中配备有各种类型的乘客约束装置。当碰撞发生时,乘客约束装置必须在恰当时机完全展开或处于预紧态,由此才能有效降低人体在碰撞下的受伤风险。
3.然而在有些情况下,可能会发生乘客约束装置的误作用。一方面,乘客约束装置会在并不涉及碰撞的干扰路况时频繁触发,从而使得必须经常更换失效配件。另一方面,乘客约束装置可能在发生严重事故时没有触发或延迟触发,从而没有及时为乘客提供合理防护或给乘客造成二次伤害。大多数车型平台都存在很多不同车型,其整车整备质量变化会导致其碰撞加速度曲线存在较大差异。因此,随着新车型的不断开发,对乘客约束装置进行一系列标定试验具有重要意义,这些标定试验需要尽可能地涵盖典型事故并且能够区分出触发工况和非触发工况。
4.目前已知的常规标定流程是利用收集的碰撞信号对不同触发算法下的参数组进行仿真试验,然后由资深工程专家根据试验结果手动调参或给出参数取值方面的建议。然而,这种完全依赖人工经验的标定过程不仅耗时巨大,而且人工读取和调参过程可能会引入一定误差。
5.在这种背景下,期待提供一种能够实现乘客约束装置的参数自动标定的方案,以在加快标定进程的同时提高参数选择的可靠性。


技术实现要素:

6.本发明的目的在于提供一种用于乘客约束装置的参数自动标定的方法、一种用于乘客约束装置的参数自动标定的设备和一种计算机程序产品,以至少解决现有技术中的部分问题。
7.根据本发明的第一方面,提供一种用于乘客约束装置的参数自动标定的方法,所述方法包括以下步骤:
8.s1:针对所使用的触发响应算法,提供潜在影响乘客约束装置的触发有效性的待标定参数组的推荐取值;
9.s2:在使用待标定参数组的推荐取值的情况下对乘客约束装置进行仿真碰撞测试;
10.s3:借助评估指标在触发有效性方面评估仿真结果;以及
11.s4:根据评估结果预测待标定参数组的能够使触发有效性最大化的新推荐取值。
12.本发明尤其包括以下技术构思:通过根据评估结果自动预测待标定参数组的新推荐取值,可以加速传统标定过程中的迭代循环,仅在少量观测数据可用的情况下充分利用
现有的评估规律,智能地向人类提供目标参数的取值建议,显著减少了搜索合适取值的工作量。此外,传统调参过程只能根据评估结果确定初始调节方向并逐步缩小搜索窗口,此处提出的取值预测过程能够将之前的迭代循环的评估结果作为先验信息并直接定位到全局最优解,由此进一步节省了需要遍历的样本点数量并因此简化了标定过程。
13.可选地,所述待标定参数组包括:用于仿真碰撞测试的碰撞信号的信号处理参数、触发响应算法的启动时刻、触发阈值函数。
14.可选地,所述评估指标包括:乘客约束装置的期望触发时刻、信号区分度指标和信号鲁棒性指标。
15.可选地,所述步骤s3包括:将仿真结果输入到预训练的排序模型中,借助预训练的排序模型按照评估指标为仿真结果对应的推荐取值提供分数。
16.在此,尤其实现以下技术优点:当需要考虑的评估指标不多时,由人工进行排序拟合是可行的,然而当期望在考虑多种影响因素的情况下得出推荐取值的综合排序,引入基于机器学习的搜索引擎则能够在很大程度上完善人工打分机制的不足,并由此返回更加可靠的评估结果。
17.可选地,所述方法还包括以下步骤:
18.借助标注工具对待标定参数组的推荐取值的分数进行调整;以及
19.将待标定参数组的具有调整的分数的推荐取值作为训练数据对排序模型进行再训练。
20.在此,尤其实现以下技术优点:用于训练排序模型的初始样本规模往往比较有限,通过在标定期间不断扩充训练样本,可以以最小化损失函数为目标定期优化模型性能并提升模型泛化能力。
21.可选地,所述排序模型是l2r模型、尤其lambdamart模型。
22.可选地,所述排序模型按照如下步骤进行预训练:
23.提供乘客约束装置的触发响应算法作为查询项,提供借助待标定参数组的不同推荐取值的仿真结果作为文档;
24.对查询项下的各个文档的触发有效性进行标注;以及
25.将带有标注信息的“查询项-文档对”作为训练数据对排序模型进行训练。
26.可选地,所述步骤s4包括:借助机器学习算法、尤其贝叶斯优化算法基于待标定参数组的推荐取值的得分情况估计出待标定参数组的能够使分数满足预设条件的新推荐取值。
27.在此,尤其实现以下技术优点:相比于传统的随机搜索算法和网格搜索法,借助贝叶斯优化调参无须广泛查找参数空间内的所有点才确定局部最大值或最小值,而是能够在样本较有限的情况下通过对先验分布的学习来找到使结果向全局最大值提升的参数取值,从而加快了标定进程并减小了计算资源。
28.可选地,所述步骤s4包括:
29.将待标定参数组的推荐取值以及从所述推荐取值到评估指标的映射作为已知观测数据;
30.基于已知观测数据拟合出推荐取值与评估指标之间的目标函数的置信分布;以及
31.借助目标函数的置信分布搜索全局最优解作为待标定参数组的新推荐取值。
32.在此,尤其实现以下技术优点:在此,不旨在通过收集大量仿真结果来精确推算目标函数的完整表达式,而是只需要搜索令目标函数取极大值的推荐取值,因此显著缩小了搜索窗口和观测范围,进一步加快了参数迭代过程。
33.可选地,在所述方法中:
34.针对不同的触发响应算法、尤其点火算法分别提供待标定参数组的不同的推荐取值,所述触发响应算法包括前碰算法、后碰算法和侧碰算法;
35.针对所述触发响应算法中的主触发响应算法和辅助触发响应算法提供级联的推荐取值;和/或
36.针对不同的触发响应算法选择用于仿真碰撞测试的不同碰撞信号和/或不同的评估指标。
37.在此,尤其实现以下技术优点:由于碰撞的随机性,很难确定待标定参数组的基于一种触发响应算法标定出的推荐取值在其他碰撞情况下也能允许乘客约束装置的准确触发,同时为了保证算法可靠性,需要分别针对每个算法单独规定评估指标和选择适用的碰撞信号。此外,车辆中的不同乘客约束装置之间可能存在相互制约关系,通过提供级联的推荐取值,能够将实际环境中由其他约束装置带来的干扰因素考虑在内,从而使标定结果更加准确。
38.可选地,所述方法还包括以下步骤:
39.判断是否满足标定终止条件,在满足标定终止条件的情况下输出待标定参数组的当前的推荐取值,其中,所述终止条件包括达到预设的标定循环步数。
40.在此,尤其实现以下技术优点:通过适当选择循环步数,能够可控地影响自动标定过程的结果精度和时间开销,从而提高了整个方案的灵活性。
41.可选地,所述乘客约束装置包括安全气囊、安全带预紧装置和可充气座椅靠背装置。
42.根据本发明的第二方面,提供一种用于乘客约束装置的自动标定的设备,所述设备用于执行根据本发明的第一方面所述的方法,所述设备包括:
43.提供模块,其配置成能够针对所使用的触发响应算法,提供潜在影响乘客约束装置的触发有效性的待标定参数组的推荐取值;
44.仿真模块,其配置成能够在使用待标定参数组的推荐取值的情况下对乘客约束装置进行仿真碰撞测试;
45.评估模块,其配置成能够借助评估指标在触发有效性方面评估仿真结果;以及
46.预测模块,其配置成能够根据评估结果预测待标定参数组的能够使触发有效性最大化的新推荐取值。
47.根据本发明的第三方面,提供一种计算机程序产品,其中,所述计算机程序产品包括计算机程序,所述计算机程序用于在被计算机执行时实施根据本发明的第一方面所述的方法。
附图说明
48.下面,通过参看附图更详细地描述本发明,可以更好地理解本发明的原理、特点和优点。附图包括:
49.图1示出了根据本发明的一个示例性实施例的用于乘客约束装置的参数自动标定的方法的流程图;
50.图2示出了根据本发明的用于乘客约束装置的参数自动标定的方法的两个步骤的流程图;
51.图3示出了用于训练根据本发明的排序模型的方法的流程图;
52.图4a-4b示出了根据本发明的示例性实施例的在使用待标定参数组的不同推荐取值情况下的仿真碰撞测试的结果;
53.图5a-5b示出了根据本发明的示例性实施例的利用贝叶斯优化算法预测待标定参数组的推荐取值的示意图;以及
54.图6示出了根据本发明的一个示例性实施例的用于乘客约束装置的参数自动标定的设备的框图。
具体实施方式
55.为了使本发明所要解决的技术问题、技术方案以及有益的技术效果更加清楚明白,以下将结合附图以及多个示例性实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,而不是用于限定本发明的保护范围。
56.图1示出了根据本发明的一个示例性实施例的用于乘客约束装置的参数自动标定的方法的流程图。
57.在步骤s1中,针对所使用的触发响应算法,提供潜在影响乘客约束装置的触发有效性的待标定参数组的推荐取值。在本发明的意义上,乘客约束装置理解为车辆客舱内的用于抑制乘客躯体(例如由于碰撞或突然改变速度而)猛然移动的装置的总称,其例如包括安全气囊、安全带预紧装置以及可充气座椅靠背装置。乘客约束装置的触发都是以不同的触发响应算法为基础,由于碰撞工况的随机性,很难使一种触发响应算法适用于所有碰撞类型和速度类型,因此为了确保在任何场景下的触发准确性,需要针对不同的触发响应算法分别进行参数组的标定。作为示例,触发响应算法可以包括前碰算法、后碰算法和侧碰算法。在此有意义的是,将其中一种算法作为主触发响应算法,而将其余算法作为辅助响应算法,由此可以对待标定参数组的级联的推荐取值进行标定。
58.在本发明的意义上,所述待标定参数组例如包括:用于仿真碰撞测试的碰撞信号的信号处理参数、触发响应算法的启动时刻、触发阈值函数。此外也可能的是,待标定参数组还包括用于影响安全气囊的触发性能的其他类型的参数,本发明在此不对其进行限制。在此,信号处理参数尤其可以是对碰撞信号的滤波方式的选择和具体的滤波参数(例如高通/低通滤波)。触发响应算法的启动时刻例如表示从碰撞发生开始计时,经过多长时间启用触发算法是合理的。触发阈值函数也称为“点火阈值线”,其用于表征能够引起乘客约束装置触发的阈值加速度与阈值速度的关系。在本方法的开始阶段,待标定参数组的推荐取值例如由专业人员基于安全气囊的类型、车辆型号等根据经验得出,此外该推荐取值也可由经训练的机器学习模型输出,本发明在此不对其进行限制。在本发明的意义上,推荐取值可以表示待标定参数组中包含的各个参数的固定取值、取值范围、满足的函数关系等。
59.在步骤s2中,在使用待标定参数组的所述推荐取值的情况下对乘客约束装置的触发有效性进行仿真碰撞测试。在此,例如将由车辆不同位置处的传感器收集的碰撞信号输
入到仿真环境中,然后借助推荐取值来模拟乘客约束装置的触发。
60.在步骤s3中,借助评估指标在触发有效性方面评估仿真结果。在此,评估指标例如包括:乘客约束装置的期望触发时刻、信号区分度指标和信号鲁棒性指标。作为示例,对于安全气囊而言,期望触发时刻可以是由各整车厂要求的或者按照欧标或国标的要求点火时刻(rttf:required time to fire),这尤其理解为满足如下要求的点火时刻:在碰撞发生后,车内乘客在达到最大允许位移之前,安全气囊必须完全展开,且当气囊完全展开时,乘客头部恰好与气囊接触。信号区分度指标理解为:在借助待标定参数组的推荐取值进行处理之后,碰撞加速度曲线是否足够平滑,以使得能够区分出不同时间或速度下对应的加速度。信号鲁棒性信号用于表征碰撞信号对于不同环境因素的抗干扰性,即信号是否足够稳定。在此,由于不同的触发响应算法往往适用于不同的碰撞类型或驾驶工况,因此还有意义的是,针对不同的触发响应算法选择不同的评估指标。
61.在步骤s4中,根据评估结果预测待标定参数组的能够使触发有效性最大化的新推荐取值。在此,例如可以将对待标定参数组的推荐取值的评估情况作为先验信息,并由此建立推荐取值与触发有效性之间的目标函数的置信分布,从而有针对性地估算出全局最优解、即新推荐取值出现的位置。
62.在可选的步骤s5中,判断是否满足标定终止条件,在满足标定终止条件的情况下输出当前的推荐取值。在此,终止条件例如包括:达到预设的标定循环步数和/或目前推荐取值的评估结果达到输出标准。
63.如果判断出满足终止条件,则可以在步骤s7中将当前的(最新的)推荐取值作为最终标定结果进行输出。
64.如果尚未满足终止条件,则可以在步骤s6中用最新的推荐取值替换上次迭代中使用的(旧的)推荐取值,然后继续利用当前的推荐取值来对乘客约束装置进行仿真碰撞测试,从而重复根据本发明的迭代调参步骤s2-s4。
65.图2示出了根据本发明的用于乘客约束装置的参数自动标定的方法的两个步骤的流程图。如图2所示,图1中的方法步骤s3示例性地包括子步骤s31-s32,方法步骤s4示例性地包括子步骤s41-s43。
66.在步骤s31中,从仿真结果中提取信号的不同特性参数,这些特性参数例如包括:仿真得到的乘客约束装置的实际触发时刻,经处理的碰撞信号与坐标轴所围城的面积大小以及经处理的碰撞信号的信噪比等。
67.在步骤s32中,将仿真结果(即所提取的不同特性参数)输入到预训练的排序模型中,以便借助该排序模型按照评估指标为仿真结果对应的推荐取值提供分数。在此,这种排序模型例如可以是l2r模型、尤其lambdamart模型。受益于梯度下降算法的使用,借助该排序打分机制可以量化待标定参数组在下一次迭代时应该调整的方向和强度。
68.在接下来的步骤s41-s43中,可以借助机器学习算法、尤其贝叶斯优化算法基于待标定参数组的现有推荐取值的得分情况估计出能够使分数满足预设条件(例如分数最高)的新推荐取值。
69.作为示例,在步骤s41中可以将待标定参数组的现有的推荐取值以及从现有的推荐取值到评估指标的映射(即得分情况)作为已知观测数据。
70.在步骤s42中,可以基于已知观测数据拟合出待标定参数组的推荐取值与各评估
指标之间的目标函数的置信分布。取决于待标定参数组中包含的参数数量,这种目标函数的置信分布可以是一维的,也可以是多维的。最初,对目标函数形状的学习过程可能是不够准确的,然而随着样本的不断丰富,可以陆续将每组推荐取值对应的分数反馈给贝叶斯优化算法,从而贝叶斯优化算法可以利用这些推荐取值与触发有效性的实际关系来更新目标函数的先验分布,以实现自学习。
71.在步骤s43中,将估计出的目标函数的置信分布当作贝叶斯优化算法中的采集函数,并借助采集函数来搜索全局最优解作为待标定参数组的新推荐取值。作为示例,可以选出待标定参数组的令结果向目标函数的全局最大值提升的推荐取值作为新推荐取值。
72.图3示出了用于训练根据本发明的排序模型的方法的流程图。
73.在步骤s301中,提供乘客约束装置的触发响应算法作为查询项,提供借助待标定参数组的不同推荐取值在使用该触发响应算法情况下的仿真碰撞测试结果作为该查询项下的文档。作为示例,一个查询项q1是车辆的前碰算法,在应用前碰算法的情况下,例如已知待标定参数组的三组不同的推荐取值。当分别利用这三组推荐取值对乘客约束装置进行仿真碰撞测试时,会分别得到三组对应的仿真结果,在此,将这三组仿真结果定义为给定查询项q1下的文档集合doc(doc1,doc2,doc3)。
74.在步骤s302中,对查询项下的各个文档的触发有效性进行标注。在此,例如将包含文档集合doc(doc1,doc2,doc3)的查询项q1作为问卷调查分派给人类工程专家,并要求人类工程专家根据其经验评估各文档doc1、doc2、doc3反映出的触发有效性。附加地或替代地,还可以要求人类工程专家对每个查询项q1下的文档doc1、doc2、doc3按照反映出的触发有效性进行排序和打分。
75.在步骤s303中,以带有标注信息的“查询项-文档对”作为训练数据对排序模型进行训练。在本发明的意义上,“查询项-文档对(query document pair)”即表示由查询项q1及其对应的文档集合doc(doc1,doc2,doc3)构成的结构体f(q1,doc)。在此,例如将查询项q1及其文档集合doc(doc1、doc2、doc3)作为排序模型的输入,并且将针对每个文档doc1、doc2、doc3的人工标注信息(即每个文档的触发有效性分数和/或所有文档按照触发有效性的排序列表)作为排序模型的输出,由建立输入-输出关系并使待训练模型学习这种关系。
76.在步骤s304中,借助预训练的排序模型对无标注数据(即待标定参数组的不同推荐取值对应的仿真结果)进行打分。
77.在步骤s305中,可以借助(例如人工或自动的)标注工具重新对推荐取值的分数进行调整,由此得到针对推荐取值更新的标注信息。
78.接下来,可以返回到步骤s303中并以具有调整的分数的推荐取值为训练数据对排序模型进行再训练。在这种情况下,确保了排序模型的打分机制的定期更新,提高了整个标定过程的可靠性。
79.图4a-4b示出了根据本发明的示例性实施例的在使用不同推荐取值情况下的仿真碰撞测试的结果。
80.在图4a和图4b中,针对两个碰撞分别示出碰撞加速度a与速度变化量dv的关系曲线401、402,在下文中为清楚起见将它们分别称为第一碰撞信号401和第二碰撞信号402。在此,还示出用于表征乘客约束装置的触发条件的阈值线400。
81.可以看出,在速度变化量较小的区间内,阈值线400基本上包络第二碰撞信号402
并且与第一碰撞信号401存在交点。在速度变化量较大的区间内,阈值线400与第二碰撞信号402产生交点。在此,交点位置分别表示在相应碰撞场景下,乘客约束装置的实际触发点。
82.在图4a所示实施例中,示出借助待标定参数组的预设的第一推荐取值对乘客约束装置的触发进行仿真的结果。在此,可以看出在应用第一推荐取值的情况下,第一碰撞信号401没有被良好地滤波,因此存在较大噪声,在这种情况下,乘客约束装置的实际触发点无法被清晰地分辨出。对于第二碰撞信号402而言,整体波形十分不稳定,存在较多干扰振荡并因此沿着原本走势上下漂移,这也为实际触发位置的确定造成困难。
83.在图4b所示实施例中,示出待标定参数组的借助根据本发明的方法预测的第二推荐取值对乘客约束装置的触发进行仿真的结果。在应用第二推荐取值的情况下,第一和第二碰撞信号401'、402'的区分度及稳定性均优于图4a中的试验结果。因此,可以清晰地分辨出阈值线400'与加速度曲线的交点,从而能够准确地确定实际触发点。在这种情况下,可以基于后续的与期望点火时刻的比较来简便地调整(例如平移)阈值线400'。
84.图5a-5b示出了根据本发明的示例性实施例的利用贝叶斯优化算法预测待标定参数组的推荐取值的示意图。
85.在图5a中示出基于贝叶斯优化算法拟合一维目标函数的过程。在此,横坐标表示参数空间(即待标定参数组的不同推荐取值),纵坐标表示目标函数(即借助评估指标对推荐取值的打分)。该坐标系中所示的各个实心点501表示借助预训练的排序模型对现有的各个推荐取值的打分情况,这些因此也被视为初始观测数据。在此,虚线503表示推荐取值x与分数f(x)之间实际满足的目标函数关系,然而这种实际目标函数是未知的,因此高斯回归根据已知采样点501处的函数值预测出该区间内任意点处的函数值f(x)的概率分布,图中灰色区域504表示高斯过程预测出的目标函数的置信区间,实线500表示预测出的目标函数的均值。根据均值和方差可以构造出采集函数,其反映了每个预测点是函数极值的可能性估计,即反映了每个点的搜索价值。图中空心点502表示采集函数的极大值点,因此也是待标定参数组的预测出的新推荐取值。
86.在图5b中示出基于贝叶斯优化算法拟合出多维目标函数的过程。与图5a的区别在于,此处的打分机制f(p1,p2)不再针对单个待标定参数组的推荐取值逐一进行,而是综合表示两个待标定参数组p1、p2共同反映的触发有效性,这两个待标定参数组例如可以表示不同的参数标定类别(例如算法启动时刻以及滤波参数)。在此,已知的观测数据是图5b中示出的实心点505,类似于图5a中介绍的那样,由此能够得到整体的目标函数的采集函数,因此可以相应地估计出全局极值点506、507。
87.图6示出了根据本发明的一个示例性实施例的用于乘客约束装置的参数自动标定的设备的框图。
88.设备1包括提供模块10、仿真模块20、评估模块30和预测模块40。
89.提供模块10例如用于针对所使用的触发响应算法提供待标定参数组的预设的推荐取值,该待标定参数组能够潜在影响乘客约束装置的触发有效性。作为示例,提供模块10可以从共享数据平台或本地存储器接收历史记录数据(历史成功率较高的或较常用的参数组),并将其作为初始的推荐取值。
90.提供模块10连接到仿真模块20,以便将待标定参数组的推荐取值输入到仿真模块20提供的仿真环境中。该仿真模块例如可以借助通信接口(未示出)从整车厂(例如真实测
试车辆的碰撞传感器或模拟碰撞传感器)收集碰撞信号,这些碰撞信号尤其以碰撞加速度曲线的形式存在并用于在使用乘客约束装置的不同触发算法下模拟真实传感器的作用,从而对乘客约束装置的触发进行仿真。
91.在完成仿真碰撞测试之后,仿真结果被传输给评估模块30,在那里,借助评估指标在触发有效性方面评估仿真结果。作为示例,评估模块30包括特征提取单元31以及预训练的排序模型32,该特征提取单元31用于从仿真测试信号中提取出用于评价有效性的信号特征(例如信号分离度、信号信噪比、实际触发(点火)时刻等),然后这些信号特征被发送给排序模型32,以便借助排序模型32对仿真结果进行打分。
92.然后,打分结果从排序模型32被进一步传输给预测模块40,从而实现对待标定参数组的新推荐取值的预测,在该预测模块40中,充分利用待标定参数组的现有推荐取值的得分情况作为先验信息,并基于此估计出待标定参数组的能够使触发有效性最大化(例如使得分最高)的新推荐取值。于是,这种新推荐取值可以被继续提供给仿真模块20,以用于进一步的迭代优化。
93.在本实施例中,预测模块40虽然作为提供模块10的一部分示出,然而也可能的是,提供模块10仅用于提供待标定参数组的初始的推荐取值并因此并不实际参与到迭代循环中,在这种情况下预测模块40与提供模块10完全独立地构造。
94.尽管这里详细描述了本发明的特定实施方式,但它们仅仅是为了解释的目的而给出的,而不应认为它们对本发明的范围构成限制。在不脱离本发明精神和范围的前提下,各种替换、变更和改造可被构想出来。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献