一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于充电片段数据和无监督算法的电芯一致性评估方法与流程

2022-11-23 17:53:42 来源:中国专利 TAG:


1.本发明涉及电池数据驱动无监督学习方法、电芯一致性评估领域、电池安全管理评估技术领域,尤其是一种基于充电片段数据的无监督标致电芯一致性故障检测方法。


背景技术:

2.电动汽车的核心-动力电池,正越来越多地受到人们的关注。近些年动力电池的发展也是日新月异,人们对动力电池的要求也在不断提高,尤其是在功率、能量、安全、稳定以及使用寿命等方面。动力电池是由许多数量的单体电池经过并联和串联组成。而电池组的性能取决于单体容量、内阻等方面一致性。一致性好的单体成组后的电池能保持较高的放电效率和循环寿命,而一致性较差的单体成组后的电池则受个别性能不一致单体拖累,放电时间短、放电容量低而且容易过充或过放以致整个电池寿命衰减加快。电池组中某个电芯或电芯间的不一致会形成“短板”单体,由于该类“短板”单体的存在,它会率先充满电并放空电,从而影响电池组中性能好且容量满的电池的充放电过程,因此单体电芯不一致性会导致电池组甚至电池系统的可实用整体容量下降,其性能也会显著衰减。目前针对“短板”的单体,只有及时发现其不一致性故障,并及时替换更新掉故障单体电芯,才能有效避免电池组及系统的潜在故障,从而尽可能降低故障带来的生产损失。
3.为及时发现电池组中单体电芯不一致性故障,准确实时探查到潜在故障单体,进而有效提升有效工作时间内的电池组性能及使用寿命,有学者与研究发明提出均衡控制策略来有效改善电池组不一致性故障,但用于检测单体电芯一致性和“短板”电芯的方法较少。由于实际运行工况下的新能源汽车电池组及其内部单体电芯的充放电过程并非连续,也很少能够达到全周期充电(即从0到100%的完整充电周期),因此经实车数据采集与探查过程得到的数据多为充电片段数据包括电压等,并非完整的等间隔时间序列数据,因此初始数据集会出现间隔。有学者根据电池充放电能量效率和电压差值筛选异常电池;有学者根据充电电压曲线的距离分析检测方法诊断不一致单体;有学者根据放电过程中阻抗变化的趋势信息区分不一致性单体电池。
4.但在实际的电池使用与一致性故障检测中需根据过往的一致性故障发生情况来进行故障判断,不同电池系统的电池组间故障表现不同,其内部的单体电芯不一致性也因电池实况各异,因此电池系统的一致性好坏并非绝对概念,而是相对比较才可进行判断的。不同电芯的实际不一致性故障判断往往基于经验值,但实际工况或参数变化王阿旺会导致判定结果出现主观错误,因此如何找到可准确有效预测出单体电芯不一致性故障的方法至关重要。


技术实现要素:

5.本发明融合数据驱动与统计学相关算法,利用单体电芯充放电的特征数据构建故障预测模型,基于无监督聚类算法探索离群点,进行异常检测,并采用距离 箱线图的统计学方法,并根据可优化的系数来对问题的紧急程度进行排序。可有效准确且实时地对数据
中的异常值或离群点进行检测,从而进行一致性故障预测。
6.本发明解决其技术问题所采用的技术方案是:基于充电片段数据的无监督标致电芯一致性故障检测方法,包括如下步骤:s1数据准备及探索:针对三类电池,探索分析单体电芯中最大压差的数据分布情况跟,并根据三类电池实际的数据分布进行后续的数据驱动算法的实践。
7.s11数据准备:针对三类电池类型的数据,记录1210个电池数据,分为:r83 phev fwd、p84 phev awd和ep24 bev三类电池。
8.s12数据探索:针对三类电池,考虑单体电芯不一致性故障,探索分析单体电芯中最大压差的数据分布情况跟,并根据三类电池实际的数据分布进行后续的数据驱动算法的实践。
9.本发明对电芯一致性的分析主要取以上三类电池为研究对象。其中每个电池的电芯参数不同,测温点个数不同,其标称容量与标称能量也有数值层面的差异。
10.s2特征工程:进过数据进行预处理,通过特征提取与主成分分析降维方法筛选有效特征并进行后续建模,包括数据预处理、特征提取、pca主成分分析降维。
11.s21数据预处理:对单体电芯的充放电数据进行异常值筛选与剔除,并提取删除重复值。
12.s22特征提取:所述特征提取需预先确定特征提取的数据范围,额定选取的数据范围为每个电池最近1000公里的数据,在这部分数据范围内进行特征提取,并选择最近的数据。
13.所述特征提取中选择就近的数据是由于电池在不断充放电的过程中,其单体电芯的一致性问题可能是渐变发生的,但也可能在短时间内发生突变,但是一般不存在故障反弹的情况,即当单体电芯已经存在一致性问题后,一般不会自行恢复正常,只会越来越严重。
14.因此,在最近的数据范围内选择,能够保证近期内的电池数据不存在一致性问题;所述选择1000公里内的数据,其原因是在1000公里内的电池充放电过程约为3-5次,其所产生的充电片段数据也是近1000公里内的充过放电片段,而3-5次最近的充电足以说明电池电芯一致性问题是否存在。
15.所述特征提取过程需对所有实验电芯数据进行特征识别与提取,具体的特征如下:1)充电过程电芯的最大差值的均值;2)充电过程电芯的标准差的均值;3)充电过程电芯熵的均值;4)放电过程电芯的最大差值的均值;5)放电过程电芯的标准差的均值;6)放电过程电芯熵的均值;其中熵值代表一系列数据的混乱程度。
16.s23pca主成分分析降维:对提取过后的多维特征进行筛选,方便后续进行可视化结果展示。
17.由于提取后的特征是多维的,在后续的模型建立环节会降低训练速度,同时不方
便进行可视化结果展示;同时,并非全部特征都是有效特征,故需针对多维特征进行pca降维,降低特征属性集的总体维度,可显著提高模型训练速度,同时更有效地可视化呈现每次建模结果。
18.s3 模型构建:采用多种无监督学习算法,并针对充放电特征合并建模,对比不同算法的有效性,具体包括如下算法:基于密度聚类的dbsacan算法;基于异常检测isolationforest、localoutlierfactor,基于分类的oneclasssvm;基于距离 统计学的knn算法。
19.所述模型构建过程需事先确立模型的训练特征及对应样本,由于提取特征需对充电和放电过程中的数据进行提取,但由于过往实验表明,基于充电特征和放电特征分别进行建模的效果不佳,因此尝试进行充放电特征合并进行建模。
20.本发明有益效果是:实验证明本发明所采用的方法可有效对标致电芯一致性故障进行检测与预测结果的可视化,并可准确有效实时地对故障进行预测,从而为新能源汽车充电片段数据来源下的故障检测提供更为有效的理论支撑与实际应用,有效避免并实时监控电芯一致性故障,降低由于一致性故障所衍生出的其余灾害的可能性。
附图说明
21.图1是本发明的具体实施流程。
22.图2是三类电池充放电特征分开建模的结果。
23.图3是孤立森林算法示意图。
24.图4是孤立森林算法的建模结果。
25.图5是localoutlierfactor算法的预测结果。
26.图6是oneclasssvm算法示意。
27.图7是oneclasssvm算法的预测结果。
28.图8是dbscan算法的预测结果。
29.图9是knn算法的预测结果。
30.图10是距离 箱线图算法示意。
31.图11是距离 箱线图算法的预测结果。
32.图12是r83类型电池三维特征图。
33.图13是p84类型电池三维特征图。
34.图14是ep24类型电池三维特征图。
35.图15是r83电池检测出的单体一致性异常数据可视化。
36.图16是p84电池检测出的单体一致性异常数据可视化。
37.图17是ep24电池检测出的单体一致性异常数据可视化。
具体实施方式
38.本发明提供的一种基于充电片段数据的无监督标致电芯一致性故障检测方法,采用多种无监督学习算法对实际的充电片段数据进行三类车型电池一致性的故障预测。在三类实际运行车辆电池的充放电过程中,提取电芯相关的特征如电芯最大差值均值、标准差
均值、熵均值等特征,并采用主成分分析降维的方法进行有效特征的提取,并记录信息保存量。
39.随后进行无监督学习算法的模型建立,分别基于聚类的dbsacan算法;基于异常检测的isolationforest、localoutlierfactor,基于分类的oneclasssvm;基于距离 统计学的knn算法,来对电芯一致性故障进行异常检测。
40.并对充放电特征分开建模与合并建模的预测效果进行对比,确定选取充放电特征合并建模的方式,并对故障检测进行多维数据可视化。
41.本发明在不连续的充电片段数据基础上,有效处理数据并建立无监督学习方法来预测电芯的一致性故障,从而实时有效地预测并避免一致性造成的其余故障;以充电片段的数据作为一致性故障的预测数据源,经过充放电数据的异常值筛选和重复值提出等步骤对提取到的数据进行预处理;通过特征提取与主成分分析降维方法筛选有效特征并进行后续建模;建模方法采用多种无监督学习算法,并针对充放电特征合并建模,对比不同算法的有效性;为便于有效对比多种算法间的预测效果差异,进行多维预测可视化。
42.下面结合图1,详细描述本发明实施过程:s1数据准备及探索:s11数据准备,即针对三类电池类型的数据,记录1210个电池数据,分为:r83 phev fwd、p84 phev awd和ep24 bev三类电池。
43.s12数据探索,即针对三类电池,考虑单体电芯不一致性故障,探索分析单体电芯中最大压差的数据分布情况跟,并根据三类电池实际的数据分布进行后续的数据驱动算法的实践。
44.本发明对电芯一致性的分析主要取以上三类电池为研究对象。其中每个电池的电芯参数不同,测温点个数不同,其标称容量与标称能量也有数值层面的差异。
45.s2特征工程:包括s21数据预处理:对单体电芯的充放电数据进行异常值筛选与剔除,并提取删除重复值;所述数据预处理中的异常值筛选及剔除,为对后续特征提取相关的特征数据的异常值筛选与剔除,如电压、soc、续航里程等数据,其中soc的正常取值范围为0-100,其中电压的正常取值范围为0-4.4v,其中续航里程在一定的连续时间段内,不会出现突然大幅增长互殴大幅降低的情况。根据以上正常数值范围进行特征的异常值筛选及剔除。
46.s22特征提取:所述特征提取需预先确定特征提取的数据范围,额定选取的数据范围为每个电池最近1000公里的数据,在这部分数据范围内进行特征提取,并选择最近的数据,所述特征提取中选择就近的数据是由于电池在不断充放电的过程中,其单体电芯的一致性问题可能是渐变发生的,但也可能在短时间内发生突变,但是一般不存在故障反弹的情况,即当单体电芯已经存在一致性问题后,一般不会自行恢复正常,只会越来越严重。因此,在最近的数据范围内选择,能够保证近期内的电池数据不存在一致性问题;所述选择1000公里内的数据,其原因是在1000公里内的电池充放电过程约为3-5次,其所产生的
充电片段数据也是近1000公里内的充过放电片段,而3-5次最近的充电足以说明电池电芯一致性问题是否存在。
47.所述特征提取过程需对所有实验电芯数据进行特征识别与提取。具体的特征如下:1)充电过程电芯的最大差值的均值2)充电过程电芯的标准差的均值3)充电过程电芯熵的均值4)放电过程电芯的最大差值的均值5)放电过程电芯的标准差的均值6)放电过程电芯熵的均值其中熵值代表一系列数据的混乱程度s23pca主成分分析降维:对提取过后的特征进行筛选。由于提取后的特征是多维的,在后续的模型建立环节会降低训练速度,同时不方便进行可视化结果展示;同时,并非全部特征都是有效特征,故需针对多维特征进行pca降维,降低特征属性集的总体维度,可显著提高模型训练速度,同时更有效地可视化呈现每次建模结果。
48.针对三类电池类型的新能源汽车所采集的特征,进行pca降维处理,可以得到每类车型对应的信息报存量如表1所示,其中可以得到降维后的信息损失量极小,相比于模型速度与可视化的角度而言影响也很小。
49.表1 降维后不同车型的信息保存量车型降维后的信息保存量r83phevfwd99.33%p84phevawd98.42%ep24bev99.91%所述数据预处理与特征选择过程涉及到的数据范围均来自充放电过程,其中充电过程本发明选择soc》70的充电片段数据;对于放电过程选择soc《30的放电片段数据。进行以上soc范围内的充电片段选取的原因基于对电芯一致性故障发生条件的考虑:电芯一致性问题一般的表现是在充电末端和放电末端表现的最为明显。即在充电过程中,随着soc的增大而越来越明显;在放电过程中,随着soc的降低而越来越明显。
50.s003 模型构建所述模型构建包括三部分:基于密度聚类的dbsacan算法;基于异常检测的isolationforest、localoutlierfactor,基于分类的oneclasssvm;基于距离 统计学的knn算法。
51.所述模型构建过程需事先确立模型的训练特征及对应样本,由于提取特征需对充电和放电过程中的数据进行提取,但由于过往实验表明,基于充电特征和放电特征分别进行建模的效果不佳,因此尝试进行充放电特征合并进行建模,如图2所示是采用dbscan基于距离的聚类算法对三类电池的充放电特征建模的结果。
52.由于使用聚类算法对充放电特征进行分开建模后,其表现不佳,因此未对其余几类算法进行分开的特征建模。以下步骤为采用多类算法对充放电特征合并建模的过程。
53.所述isolationforest算法是用于异常检测的算法,其异常离群点的检测在于分
applications with noise),为基于密度的聚类算法,对于无法形成聚类簇的孤立点,确定其为异常点或噪声点。其算法的输入数据集为邻域半径eps(对于给定对象半径eps在内的邻域称为该对象的eps邻域),邻域中数据对象数目阈值minpts(表示点p的eps半径内的点的集合),输出为一个密度连通簇。其算法的流程如下:1)从数据集中任意选取一个数据对象点p;2) 如果对于参数eps和minpts,所选取的数据对象点p为核心点,则找出所有从p密度可达的数据对象点,形成一个簇;3) 如果选取的数据对象点 p 是边缘点,选取另一个数据对象点;4)重复以上2、3步,直到所有点均被处理。
63.其异常预测结果如图8所示,其中每个点代表一个电池,红色点代表正常点,绿色点代表异常的检测点。
64.所述模型建立步骤中的knn(k-nearest neighbors)算法为最临近算法,其基本思想为:某样本与数据集中的k个样本最相似,如果这k个样本中的大多数属于某一个类别,则该样本也属于这个类别。其算法流程为:依次计算每个样本点与它最近的k个样本的平均距离,再利用计算的距离与阈值进行比较,如果大于阈值,则认为是异常点。优点是不需要假设数据的分布,缺点是仅可以找出全局异常点,无法找到局部异常点。其异常预测结果如图9所示,其中每个点代表一个电池,红色点代表正常点,绿色点代表异常的检测点。
65.所述模型建立步骤中包含统计学相关算法中距离 箱线图算法的环节,距离算法采用欧氏距离计算每个点和其他点之间的距离;箱线图算法是基于四分位距(iqr)来进行异常点的检索,其异常点的探查示意如图10所示,采用距离 箱线图算法预测异常离群点如图11所示,其中每个点表示一个单体电芯,红色点表示异常点,黄色点表示潜在异常的点,绿色点表示正常点。
66.具体实施方式包括模型建立环节以及结论部分。经实验研究及建模过程所得结果分析,在异常点的检测与分类效果层面,dbscan算法和“距离 箱线图”算法的异常检测分类效果最佳。由于在实际建模与算法训练过程中,dbscan算法中人为设定的训练参数较多且复杂,参数值的微微扰动对分类结果的影响较大,同时“距离 箱线图”的算法实现过程简单高效,同时可以实现完全自动化,并输出多级异常(即潜在异常与实际异常)的各种分类点,故在同等分类效果的考虑下,本发明选择“距离 箱线图”算法进行单体电芯一致性故障的检测。
67.经以上多种算法实验,对选择出的“距离 箱线图”算法建模得到的包含异常数据分布的结果展示为三维图的形式,其中r83类型的电池数据表现如图12所示,p84类型的电池数据表现如图13所示,ep84类型电池的数据表现如图14所示。对于检测出的电芯一致性异常表现,本发明对每种电池类型选择一个电池数据进行展示,其中r83类型的电池数据表现如图15所示,p84类型的电池数据表现如图16所示,ep84类型电池的数据表现如图17所示。观察图15-17可得,检测出的存在电芯一致性异常的电池充放电电芯均存在或多或少的问题,且每一类别的电芯一致性问题的表现类型各异,本发明所采用的算法能够有效检测出这些异常。
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献