一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

考虑动力电池衰退抑制的电动汽车能量管理方法及系统与流程

2022-08-02 22:49:31 来源:中国专利 TAG:

技术特征:
1.一种考虑动力电池衰退抑制的电动汽车能量管理方法,其特征在于,包括:确定动作空间;所述动作空间包括:离合器状态和相应的动作变量值;所述动作变量值包括:发动机功率变化量、发动机输出转矩、启动/发电一体电机的输出转矩以及机械制动转矩占需求转矩的比例;所述离合器状态包括:离合器分离和离合器闭合;根据电动汽车的状态数据确定状态空间;所述状态数据包括:当前行驶车速、历史车速、整车加速度、车辆需求转矩、车辆需求功率、发动机状态、动力电池荷电状态以及动力电池功率;根据动力电池荷电状态的实时误差和动力电池的衰退程度构建奖赏函数;根据所述动作空间和所述状态空间以及奖赏函数确定训练好的深度q网络;所述训练好的深度q网络包括:actor动作网络和critic评价网络;所述actor动作网络以所述状态空间中的状态数据为输入,以所述动作变量值为输出;所述critic评价网络以所述状态空间中的状态数据和动作变量值为输入,以离合器状态为输出;根据状态空间中的实时状态数据,采用训练好的深度q网络确定实时动作变量值,进而根据所述实时动作变量值进行电动汽车的功率分配控制。2.根据权利要求1所述的一种考虑动力电池衰退抑制的电动汽车能量管理方法,其特征在于,所述确定动作空间,具体包括以下公式:w={0,{δp
engine
,i
brake
}}∪{1,{t
engine
,t
isg
,i
brake
}};其中,w为动作空间,0为离合器分离,1为离合器闭合,δp
engine
为发动机功率变化量,i
brake
为机械制动转矩占需求转矩的比例,t
engine
为发动机输出转矩,t
isg
为启动/发电一体电机的输出转矩。3.根据权利要求1所述的一种考虑动力电池衰退抑制的电动汽车能量管理方法,其特征在于,所述根据电动汽车的状态数据确定状态空间,之后还包括:利用公式对状态空间中的状态数据进行标准化处理;其中,为标准化后的单个状态数据,s为单个状态数据,s表示状态空间,u为各状态数据的平均值,σ为各状态数据的标准差。4.根据权利要求1所述的一种考虑动力电池衰退抑制的电动汽车能量管理方法,其特征在于,所述根据动力电池荷电状态的实时误差和动力电池的衰退程度构建奖赏函数,具体包括:利用公式r=-α
·
(p1·
δsoc
ref
p2·
m
fuel
p3·
loss
battery
)确定奖赏函数;其中,soc
ref
(t)为t时刻的动力电池荷电状态参考轨迹,soc
ref
(t)=soc
0-λ
·
d(t),soc0为初始时刻的车载传感器直接测得动力电池荷电状态的初始值,soc
f
为最后时刻基于动态规划的全局寻优方法确定的动力电池荷电状态的最终值,d(t)和d
total
分别为整车的当前行驶距离和行驶总里程数,δsoc
ref
为动力电池荷电状态的实时误差,δsoc
ref
(t)=soc(t)-soc
ref
(t),soc(t)为t时刻的车载传感器直接测得动力电池荷电状态的当前值,m
fuel
为发动机油耗,m
fuel
=map
power
(δp
engine
,n
engine
)=map
torque
(t
engine
,n
engine
),map
power
(δp
engine
,n
engine
)为由发动机功率变化量δp
engine
及发动机转速n
engine
查燃油消耗map图确定的m
fuel
与δp
engine
和n
engine
之间的关系,map
torque
(t
engine
,n
engine
)为由发动机功率t
engine
及发动机转速
n
engine
查燃油消耗map图确定的m
fuel
与t
engine
和n
engine
之间的关系,q
loss
为动力电池的归一化容量损失,a为前系数因子,为常量;t
battery
为动力电池温度,基于车载动力电池管理系统中的温度传感器测得;c
rate
为动力电池的充/放电倍率,q0为动力电池额定容量,对于确定的电动汽车为定值,为正常量;i
battery
为动力电池的充/放电电流,为动力电池功率p
battery
与输出电压u
battery
的比值,动力电池的输出电压u
battery
基于车载动力电池管理系统中的电压传感器测得;b为补偿因子,为常数;e
a
为动力电池的激活能量,对于确定种类的动力电池,取值为定值,且为正常量;r为气体常数,为确定的正常量;a
h
为动力电池的安时吞吐量,z为指数因子,e为自然对数,loss
battery
为动力电池的衰退程度,α为缩放系数,p1,p2,p3分别为权重系数,r为奖赏函数。5.根据权利要求1所述的一种考虑动力电池衰退抑制的电动汽车能量管理方法,其特征在于,所述根据所述动作空间和所述状态空间以及奖赏函数确定训练好的深度q网络,具体包括:分别构建actor动作网络和critic评价网络,并分别获取actor动作网络的参数集和critic评价网络的参数集;根据actor动作网络和critic评价网络确定深度q网络;将所述深度q网络分别作为目标神经网络和评估神经网络;采用adam梯度下降法和奖赏函数,分别进行目标神经网络和评估神经网络中参数集的训练,确定训练好的深度q网络。6.一种考虑动力电池衰退抑制的电动汽车能量管理系统,其特征在于,包括:动作空间确定模块,用于确定动作空间;所述动作空间包括:离合器状态和相应的动作变量值;所述动作变量值包括:发动机功率变化量、发动机输出转矩、启动/发电一体电机的输出转矩以及机械制动转矩占需求转矩的比例;所述离合器状态包括:离合器分离和离合器闭合;状态空间确定模块,用于根据电动汽车的状态数据确定状态空间;所述状态数据包括:当前行驶车速、历史车速、整车加速度、车辆需求转矩、车辆需求功率、发动机状态、动力电池荷电状态以及动力电池功率;奖赏函数构建模块,用于根据动力电池荷电状态的实时误差和动力电池的衰退程度构建奖赏函数;训练好的深度q网络确定模块,用于根据所述动作空间和所述状态空间以及奖赏函数确定训练好的深度q网络;所述训练好的深度q网络包括:actor动作网络和critic评价网络;所述actor动作网络以所述状态空间中的状态数据为输入,以所述动作变量值为输出;所述critic评价网络以所述状态空间中的状态数据和动作变量值为输入,以离合器状态为输出;功率分配控制模块,用于根据状态空间中的实时状态数据,采用训练好的深度q网络确
定实时动作变量值,进而根据所述实时动作变量值进行电动汽车的功率分配控制。7.根据权利要求6所述的一种考虑动力电池衰退抑制的电动汽车能量管理系统,其特征在于,所述动作空间确定模块具体包括以下公式:w={0,{δp
engine
,i
brake
}}∪{1,{t
engine
,t
isg
,i
brake
}};其中,w为动作空间,0为离合器分离,1为离合器闭合,δp
engine
为发动机功率变化量,i
brake
为机械制动转矩占需求转矩的比例,t
engine
为发动机输出转矩,t
isg
为启动/发电一体电机的输出转矩。8.根据权利要求6所述的一种考虑动力电池衰退抑制的电动汽车能量管理系统,其特征在于,还包括:标准化处理模块,用于利用公式对状态空间中的状态数据进行标准化处理;其中,为标准化后的单个状态数据,s为单个状态数据,s表示状态空间,u为各状态数据的平均值,σ为各状态数据的标准差。9.根据权利要求6所述的一种考虑动力电池衰退抑制的电动汽车能量管理系统,其特征在于,所述奖赏函数构建模块具体包括:奖赏函数构建单元,用于利用公式r=-α
·
(p1·
δsoc
ref
p2·
m
fuel
p3·
loss
battery
)确定奖赏函数;其中,soc
ref
(t)为t时刻的动力电池荷电状态参考轨迹,soc
ref
(t)=soc
0-λ
·
d(t),soc0为初始时刻的车载传感器直接测得动力电池荷电状态的初始值,soc
f
为最后时刻基于动态规划的全局寻优方法确定的动力电池荷电状态的最终值,d(t)和d
total
分别为整车的当前行驶距离和行驶总里程数,δsoc
ref
为动力电池荷电状态的实时误差,δsoc
ref
(t)=soc(t)-soc
ref
(t),soc(t)为t时刻的车载传感器直接测得动力电池荷电状态的当前值,m
fuel
为发动机油耗,m
fuel
=map
power
(δp
engine
,n
engine
)=map
torque
(t
engine
,n
engine
),map
power
(δp
engine
,n
engine
)为由发动机功率变化量δp
engine
及发动机转速n
engine
查燃油消耗map图确定的m
fuel
与δp
engine
和n
engine
之间的关系,map
torque
(t
engine
,n
engine
)为由发动机功率t
engine
及发动机转速n
engine
查燃油消耗map图确定的m
fuel
与t
engine
和n
engine
之间的关系,q
loss
为动力电池的归一化容量损失,a为前系数因子,为常量;t
battery
为动力电池温度,基于车载动力电池管理系统中的温度传感器测得,c
rate
为动力电池的充/放电倍率,q0为动力电池额定容量,对于确定的电动汽车为定值,为正常量,i
battery
为动力电池的充/放电电流,为动力电池功率p
battery
与输出电压u
battery
的比值,动力电池的输出电压u
battery
基于车载动力电池管理系统中的电压传感器测得;b为补偿因子,为常数;e
a
为动力电池的激活能量,对于确定种类的动力电池,取值为定值,且为正常量;r为气体常数,为确定的正常量;a
h
为动力电池的安时吞吐量,z为指数
因子,e为自然对数,loss
battery
为动力电池的衰退程度,α为缩放系数,p1,p2,p3分别为权重系数,r为奖赏函数。10.根据权利要求6所述的一种考虑动力电池衰退抑制的电动汽车能量管理系统,其特征在于,所述训练好的深度q网络确定模块具体包括:参数集获取单元,用于分别构建actor动作网络和critic评价网络,并分别获取actor动作网络的参数集和critic评价网络的参数集;深度q网络确定单元,用于根据actor动作网络和critic评价网络确定深度q网络;目标神经网络和评估神经网络确定单元,用于将所述深度q网络分别作为目标神经网络和评估神经网络;训练好的深度q网络确定单元,用于采用adam梯度下降法和奖赏函数,分别进行目标神经网络和评估神经网络中参数集的训练,确定训练好的深度q网络。

技术总结
本发明涉及一种考虑动力电池衰退抑制的电动汽车能量管理方法及系统。该方法包括确定动作空间;根据电动汽车的状态数据确定状态空间;根据动力电池荷电状态的实时误差和动力电池的衰退程度构建奖赏函数;根据所述动作空间和所述状态空间以及奖赏函数确定训练好的深度Q网络;所述训练好的深度Q网络包括:Actor动作网络和Critic评价网络;根据状态空间中的实时状态数据,采用训练好的深度Q网络确定实时动作变量值,进而根据所述实时动作变量值进行电动汽车的功率分配控制。本发明能够解决混合动作空间的同轴混联式混合动力车型的能量管理问题,综合提升电动汽车的等效经济性。综合提升电动汽车的等效经济性。综合提升电动汽车的等效经济性。


技术研发人员:朱晋 王薛超 李建威 路畅 常亚男 许书军 鲍欢欢 冯浩然
受保护的技术使用者:车百中汽科技(北京)有限公司
技术研发日:2022.04.14
技术公布日:2022/8/1
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献