一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种分层式实时能量管理方法和系统与流程

2021-12-14 22:32:00 来源:中国专利 TAG:


1.本发明涉及能量管理领域,特别是涉及一种分层式实时能量管理方法和系统。


背景技术:

2.在基于模型预测控制(mpc)的插电式混合动力车辆能量管理技术中,预测步长的选取是一项重点难题。通常,选取较小的预测步长,能够通过提高速度预测精度从而改善基于mpc的能量管理策略效果,然而并非预测步长越小越好,过小的预测步长,将使得模型预测控制失去其“预测”的优势,在很大程度上将影响到mpc的控制效果,从而导致策略效果下降;而过大的预测步长又将导致速度预测误差较大,使得模型预测上层规划的状态参考曲线质量降低,从而降低能量管理策略的整体效果,同时其计算量将呈指数倍增加。因此,速度预测精度和模型预测控制效果之间存在着此消彼长的权衡关系,如何达到二者之间的权衡最优,一直是亟待解决的关键难题之一。
3.当前,研究者更多的只着眼于单一粒度的mpc,如单一的鲁棒模型预测控制器(r

mpc)或者单一的随机模型预测控制器(s

mpc),导致上述预测精度和控制效果间的权衡问题无法得到很好的解决。具体而言,通常在较短的预测域内,速度预测器能够更加准确的预测未来速度分布,然而随着步长的提高,在更长的预测域速度预测精度将显著降低。若使用r

mpc将会导致,由于长时域内速度预测精度较低,r

mpc的解会非常保守,导致求解的最优性差;若使用s

mpc,在长时域内其能够通过自身的随机特性抵消预测精度较低带来的损害,然而其在预测精度较高的短时域内的求解最优性却难以保证,并且其求解计算量较大。


技术实现要素:

4.为解决现有技术存在的上述问题,本发明提供了一种分层式实时能量管理方法和系统。
5.为实现上述目的,本发明提供了如下方案:一种分层式实时能量管理方法,包括:采用速度数据样本集训练速度预测网络模型;将待管理车辆的速度实时输入至训练好的所述速度预测网络模型得到预测速度序列;将所述预测速度序列分为第一预测速度子序列和第二预测速度子序列;以所述第一预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第一控制动作变量序列;所述控制map为采用插电式混合动力车辆能量管理模型,根据状态变量soc、控制动作变量以及不同类型工况对应的概率转移矩阵得到的控制模型;以所述第二预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第二控制动作变量序列;将所述第一控制动作变量序列和所述第二控制动作变量序列输入插电式混合动力车辆能量管理模型得到soc参考序列;所述soc参考序列包括第一soc参考序列和第二soc
参考序列;采用下层mpc控制器基于所述soc参考序列实现车辆的能量管理。
6.优选地,所述采用速度数据样本集训练速度预测网络模型,之前还包括:从驾驶工况中提取预设长度的片段得到驾驶样本;所述驾驶样本包括车辆速度和车辆加速度;根据所述驾驶样本得到速度预测数据;基于所述驾驶样本中的车辆速度数据和与所述速度预测数据构建速度数据样本集。
7.优选地,所述将所述预测速度序列分为第一预测速度子序列和第二预测速度子序列,具体包括:以预设速度为分界点,将所述预测速度序列分为第一预测速度子序列和第二预测速度子序列。
8.优选地,所述预设速度为1.8m/s。
9.优选地,所述采用下层mpc控制器基于所述soc参考序列实现车辆的能量管理,具体包括:将所述soc参考序列作为鲁棒模型预测控制器的控制参考,采用序列二次规划算法得到最优控制动作变量;采用下层mpc控制器基于所述最优控制动作变量完成对车辆状态变量soc的实时更新。
10.根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的分层式实时能量管理方法,在采用速度预测网络进行速度预测获取未来速度序列之后,将预测速度序列、当前车辆soc状态、以及工况信息作为输入索引在控制map上插值得到控制动作量,然后将控制动作量作为输入量输入插电式混合动力车辆能量管理模型,经过模型的状态更新输出对应的soc参考序列,这个soc参考序列就是下层mpc控制器需要的控制参考,进而以寻求速度预测精度和模型预测控制效果之间的权衡最优的方式,实现最优的实时能量管理。
11.此外,对应于上述提供的分层式实时能量管理方法,本发明还提供了两种分层式实时能量管理系统,其中,一种分层式实时能量管理系统包括:训练模块,用于采用速度数据样本集训练速度预测网络模型;预测速度序列确定模块,用于将待管理车辆的速度实时输入至训练好的所述速度预测网络模型得到预测速度序列;序列划分模块,用于将所述预测速度序列分为第一预测速度子序列和第二预测速度子序列;第一控制动作变量序列确定模块,用于以所述第一预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第一控制动作变量序列;所述控制map为采用插电式混合动力车辆能量管理模型,根据状态变量soc、控制动作变量以及不同类型工况对应的概率转移矩阵得到的控制模型;第二控制动作变量序列确定模块,用于以所述第二预测速度子序列与车辆当前状
态信息为索引,在控制map中进行插值得到第二控制动作变量序列;soc参考序列确定模块,用于将所述第一控制动作变量序列和所述第二控制动作变量序列输入插电式混合动力车辆能量管理模型得到soc参考序列;所述soc参考序列包括第一soc参考序列和第二soc参考序列;能量管理模块,用于采用下层mpc控制器基于所述soc参考序列实现车辆的能量管理。
12.优选地,还包括:驾驶样本确定模块,用于从驾驶工况中提取预设长度的片段得到驾驶样本;所述驾驶样本包括车辆速度和车辆加速度;速度预测数据确定模块,用于根据所述驾驶样本得到速度预测数据;速度数据样本集构建模块,用于基于所述驾驶样本中的车辆速度数据和与所述速度预测数据构建速度数据样本集。
13.优选地,所述序列划分模块包括:序列划分单元,用于以预设速度为分界点,将所述预测速度序列分为第一预测速度子序列和第二预测速度子序列。
14.优选地,所述能量管理模块包括:最优控制动作变量确定单元,用于将所述soc参考序列作为鲁棒模型预测控制器的控制参考,采用序列二次规划算法得到最优控制动作变量;soc实施更新单元,用于采用下层mpc控制器基于所述最优控制动作变量完成对车辆状态变量soc的实时更新。
15.另一种分层式实时能量管理系统,包括:分段式速度预测器,用于将待管理车辆的速度实时输入至训练好的所述速度预测网络模型得到预测速度序列,并用于将所述预测速度序列分为第一预测速度子序列和第二预测速度子序列;智能状态规划器,与所述分段式速度预测器连接,用于以所述第一预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第一控制动作变量序列,用于以所述第二预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第二控制动作变量序列,并用于将所述第一控制动作变量序列和所述第二控制动作变量序列输入插电式混合动力车辆能量管理模型得到soc参考序列;所述控制map为采用插电式混合动力车辆能量管理模型,根据状态变量soc、控制动作变量以及不同类型工况对应的概率转移矩阵得到的控制模型;分段式鲁棒

随机模型预测控制器,与所述智能状态规划器连接,用于基于所述soc参考序列实现车辆的能量管理。
16.因本发明提供的分层式实时能量管理系统实现的技术效果与上述提供的分层式实时能量管理方法实现的技术效果相同,故在此不再进行赘述。
附图说明
17.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施
例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
18.图1为本发明提供的分层式实时能量管理方法的流程图;图2为本发明实施例提供的最优控制map图;图3为本发明实施例提供的rs

mpc模型预测控制示意图;图4为本发明实施例提供的能量管理策略控制整体框架图;图5为本发明提供的分层式实时能量管理系统的结构示意图。
具体实施方式
19.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.本发明的目的是提供一种分层式实时能量管理方法和系统,以寻求速度预测精度和模型预测控制效果之间的权衡最优,实现最优的实时能量管理。
21.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
22.如图1所示,本发明提供的分层式实时能量管理方法,包括:步骤100:采用速度数据样本集训练速度预测网络模型。其中,速度数据样本集的构建过程为:将总长度为n
total
的行驶工况提取为长度n
p
的片段,得到驾驶样本[v
n
,v
n 1
,...,v
n np
‑1]和[a
n
,a
n 1
,...,a
n np
‑1],其中n=1,2,

, n
total
。n
p
代表预测域。v
n
、a
n
分别代表第n个时刻的车辆速度与加速度。
[0023]
基于这一速度数据样本集,速度预测网络模型的训练过程为:将数据片段[v
n
,v
n 1
,...,v
n np
‑1]片段作为网络输入,将作为网络输出,进行速度预测网络训练,其中i=1,2,

,n
p
。即局部时域内的历史速度片段作为网络输入,未来相应时域速度片段输入作为输出,因此,输入与输出的映射关系可以表示如下:其中,φ(.)是rbf

nn的输入与输出的非线性映射关系,是t时刻的预测速度,n
p
是预测域长度。此外,根均方误差(rmse)用于进行各网络预测精度的评价:是预测域长度。此外,根均方误差(rmse)用于进行各网络预测精度的评价:其中,err
n
是第n个预测瞬时车辆实际速度与预测速度间的平均误差,t0为第一时
刻,t
f
为第二时刻。
[0024]
步骤101:将待管理车辆的速度实时输入至训练好的速度预测网络模型得到预测速度序列。
[0025]
步骤102:将预测速度序列分为第一预测速度子序列和第二预测速度子序列。值得注意的是,当使用神经网络进行预测时,随着预测步长的增加,预测误差逐渐增大。此外,在加减速剧烈的工况下,预测误差相较于平缓工况也显著增大。而预测误差的大小将直接影响到后续能量管理框架中的soc规划与实时控制模块,因此本发明引入分段法,实现速度预测序列的分段。由于rbf

nn对于不同类型工况的预测能力各不相同,当所训练的rbf

nn都选取相同固定预测步长t时(以预测步长15s为例),针对不同类型工况的网络预测误差结果各不相同。例如,在进行某些类型工况预测时,随着预测步长的增加,预测误差的变化率相较于其他工况显著增大,而某些工况随着预测步长增加,预测误差的变化率增大效果不明显,因此本发明在网络训练时引入1.8 m/s作为分段阈值将获取的速度预测序列截取为两段,将其长度分别设为n1和n2,实现预测速度的分段处理。设前步对应的片段为a段,后步对应的片段为b段。从上述描述中可知,在n1阶段,由于预测步长较小,随着预测步长的增加,预测误差的变化率增大效果不显著,且速度预测网络能够实现较为准确的预测。在n2阶段,随着预测步长的增加,预测误差明显增大,预测误差变化率增加显著,这种情况通常发生在剧烈加减速、启停等紧急工况下。
[0026]
并且,速度预测域的长度与混动车能量管理策略中mpc的控制效果紧密相关,本发明中,mpc的控制域和预测域与速度预测的预测步长相同,如果速度预测域长度较短,虽然会很大程度上提高速度预测精度,但是会降低mpc的控制效果。相反,若预测域长度过大,则速度预测精度将显著下降,同时导致mpc解算效率大幅降低,影响能量管理的在线实时应用,因此误差阈值也不能设置过大。例如表1所示,选取两种不同类型的工况进行速度预测,工况1为较为剧烈的工况(存在频繁加减速和启停),工况2为较为平缓的工况。从结果可以看出,相同预测步长下,网络对于工况1的预测能力明显更差,且在n
p
=10 s的步长之后,预测误差越来越大,在此情况下,预测速度序列可分为两段,n1=10,n2=5。相反,对于较为平缓的工况2,预测网络的预测精度显著提高,在此情况下,预测速度序列分为n1=14,n2=1,这就实现了预测速度的分段。
[0027]
步骤103:以第一预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第一控制动作变量序列。控制map为采用插电式混合动力车辆能量管理模型,根据状态变量soc、控制动作变量以及不同类型工况对应的概率转移矩阵得到的控制模型。
[0028]
根据上述内容可知,采用相同的驾驶样本作为训练集训练预测网络从而实现工况预测。同理,在进行q学习算法训练时,采用与训练神经网络相同的训练集作为训练工况,利用工况的马尔可夫特性计算不同类型工况对应的概率转移矩阵(tpm),简单来说就是训练工况作为输入,概率转移矩阵作为输出。
[0029]
确定状态变量、动作变量、反馈奖励,将tpm、状态变量以及控制动作变量作为q学习算法输入量,建立基于q学习的插电式混合动力车辆能量管理模型。而后通过q学习算法对该插电式混合动力车辆能量管理模型进行训练,得到系统的策略控制map,简单来说就是将tpm、状态变量soc、动作变量i
bat
(相当于控制系统的控制变量,这里选取电流作为控制量)作为q学习算法输入量,通过算法的训练、学习,最终获得了(输出)控制map,如图2所示。其中,插电式混合动力车辆能量管理模型包括:纵向运动学模型、功率分配关系、电机效率、油耗、行星轮内部关系和电池模型。因本发明所采用的插电式混合动力车辆能量管理模型的构建过程属于常规技术,故在此不再进行赘述。
[0030]
步骤104:以第二预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第二控制动作变量序列。
[0031]
步骤105:将第一控制动作变量序列和第二控制动作变量序列输入插电式混合动力车辆能量管理模型得到soc参考序列。soc参考序列包括第一soc参考序列和第二soc参考序列。
[0032]
在应用阶段:首先,速度预测器将车辆当前驾驶状态提取为一定时域长度(为方便描述,假设长度为n
p
)的驾驶样本作为模块输入,输出预测速度。以所获取的预测速度序列
与车辆当前状态信息为索引,在控制map中进行插值,获得最优控制变量序列。最后将最优控制变量序列输入q学习算法中的插电式混合动力车辆能量管理模型进行状态迭代更新,从而获取未来局部时域内长为n
p
的最优状态参考轨迹,该参考轨迹同样分为n1和n2两段。
[0033]
基于此,本发明明实施的总结流程为:当前车辆驾驶状态片段

>通过预测网络进行速度预测获取未来速度序列

>将预测速度、当前车辆soc状态、以及工况信息作为输入索引在控制map上插值

>输出最优控制量i
bat

>将这个i
bat
作为输入,输入插电式混合动力车辆能量管理模型,经过模型的状态更新

>输出对应的soc参考序列,这个soc参考序列就是下层mpc控制器需要的控制参考。
[0034]
步骤106:采用下层mpc控制器基于soc参考序列实现车辆的能量管理。
[0035]
设计鲁棒

随机模型预测控制器rs

mpc,其中前n1的优化控制使用鲁棒模型预测控制r

mpc实现,后n2步使用随机模型预测控制s

mpc实现,应用示意如图3所示。将上一步骤获取的长度为n1和n2的a、b段soc参考序列分别作为r

mpc和s

mpc的控制参考,通过序列二次规划算法进行求解,完成底层最优控制量的求解与模型状态更新,更新的状态反馈至上层,作为初始状态值进行下一滚动时域的规划,如此反复实现在线rs

mpc能量管理策略。总结就是:a、b段的soc参考、a、b段的预测速度序列、当前车辆速度作为rs

mpc输入,最优控制量i
bat
作为输出,然后把最优控制量输入车辆进行实时的soc更新,前n1步的a段使用的是r

mpc求解,后n2步的b段使用的是s

mpc求解。基于此,本发明提供的分层式实时能量管理方法的整体实施框架如图4所示。
[0036]
此外,对应于上述提供的分层式实时能量管理方法,本发明还提供了两种分层式实时能量管理系统,其中:一种分层式实时能量管理系统,如图5所示,包括:训练模块500、预测速度序列确定模块501、序列划分模块502、第一控制动作变量序列确定模块503、第二控制动作变量序列确定模块504、soc参考序列确定模块505和能量管理模块506。
[0037]
训练模块500用于采用速度数据样本集训练速度预测网络模型。
[0038]
预测速度序列确定模块501用于将待管理车辆的速度实时输入至训练好的速度预测网络模型得到预测速度序列。
[0039]
序列划分模块502用于将预测速度序列分为第一预测速度子序列和第二预测速度子序列。
[0040]
第一控制动作变量序列确定模块503用于以第一预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第一控制动作变量序列。控制map为采用插电式混合动力车辆能量管理模型,根据状态变量soc、控制动作变量以及不同类型工况对应的概率转移矩阵得到的控制模型。
[0041]
第二控制动作变量序列确定模块504用于以第二预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第二控制动作变量序列。
[0042]
soc参考序列确定模块505用于将第一控制动作变量序列和第二控制动作变量序列输入插电式混合动力车辆能量管理模型得到soc参考序列。soc参考序列包括第一soc参考序列和第二soc参考序列。
[0043]
能量管理模块506用于采用下层mpc控制器基于soc参考序列实现车辆的能量管理。
[0044]
为了进一步提供能量控制的精确度,本发明提供的上述分层式实时能量管理系统还可以包括:驾驶样本确定模块、速度预测数据确定模块和速度数据样本集构建模块。
[0045]
驾驶样本确定模块用于从驾驶工况中提取预设长度的片段得到驾驶样本。驾驶样本包括车辆速度和车辆加速度。
[0046]
速度预测数据确定模块用于根据驾驶样本得到速度预测数据。
[0047]
速度数据样本集构建模块用于基于驾驶样本中的车辆速度数据和与速度预测数据构建速度数据样本集。
[0048]
进一步,上述采用的序列划分模块包括:序列划分单元。
[0049]
序列划分单元用于以预设速度为分界点,将预测速度序列分为第一预测速度子序列和第二预测速度子序列。
[0050]
上述采用的能量管理模块包括:最优控制动作变量确定单元和soc实施更新单元。
[0051]
最优控制动作变量确定单元用于将soc参考序列作为鲁棒模型预测控制器的控制参考,采用序列二次规划算法得到最优控制动作变量。
[0052]
soc实施更新单元用于采用下层mpc控制器基于最优控制动作变量完成对车辆状态变量soc的实时更新。
[0053]
另一种分层式实时能量管理系统,包括:分段式速度预测器、智能状态规划器和分段式鲁棒

随机模型预测控制器。
[0054]
分段式速度预测器用于将待管理车辆的速度实时输入至训练好的速度预测网络模型得到预测速度序列,并用于将预测速度序列分为第一预测速度子序列和第二预测速度子序列。
[0055]
智能状态规划器与分段式速度预测器连接,用于以第一预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第一控制动作变量序列,用于以第二预测速度子序列与车辆当前状态信息为索引,在控制map中进行插值得到第二控制动作变量序列,并用于将第一控制动作变量序列和第二控制动作变量序列输入插电式混合动力车辆能量管理模型得到soc参考序列。控制map为采用插电式混合动力车辆能量管理模型,根据状态变量soc、控制动作变量以及不同类型工况对应的概率转移矩阵得到的控制模型。
[0056]
分段式鲁棒

随机模型预测控制器与智能状态规划器连接,用于基于soc参考序列实现车辆的能量管理。
[0057]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0058]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献