一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于LSTM的锂电池寿命预测方法与流程

2021-10-24 07:09:00 来源:中国专利 TAG:预测 锂电池 寿命 方法 故障

一种基于lstm的锂电池寿命预测方法
技术领域
1.本发明涉及高端设备的故障测试和预测技术领域,具体而言,涉及一种基于lstm的 锂电池寿命预测方法。


背景技术:

2.近年来,随着工业化程度的提高,群体产品逐渐由单一化和简单化向智能化和复杂化 发展,在很多领域有着越来越重要的应用价值,这也对群体产品的可靠性提出了一定的要 求。故障预测和健康管理((prognostics and health management,phm))的出现为提高群体 产品的可靠性提供了一种可行的解决办法,故障预测和健康管理技术运用数据挖掘和信息 融合等技术,研究分析产品的实时状态数据,能够减少产品维护成本,提高产品的可靠性。
3.在故障诊断和预测领域采用人工智能技术挑战与机遇并存,如何利用人工智能技术快 速诊断故障并精准给出预测结果成了研究热点。群体产品存在多种类型,每种类型的群体 产品的故障模式也复杂多样,针对所有可能的故障模式开发诊断和预测模型不切实际,而 且采集产品全寿命周期的所有状态数据耗费成本巨大。在群体产品上采集到的产品运行状 态数据相似性有限,直接整合数据不利于预测结果的准确度,在联合建模时出现较大困难,
ꢀ“
数据孤岛”的困局和近几年发布的关于数据隐私保护问题的相关法案更是进一步限制了企 业间交换数据的自由,“数据孤岛”的困局和隐私保护的问题严重地阻碍了人工智能技术 的进一步发展。
4.开展故障预测与健康管理相关技术的研究对群体产品的意义巨大。一方面,避免了维 修时间的浪费,同时减少了维修的经济成本。另一方面,相较于传统的定期保养和故障后 维修,对产品开展phm可以有效提高产品的可靠性与安全性,减少灾难性事故的发生。但 是在实际应用中,数据的隐私需要保护,同时可供充分采集的数据不够多且采集数据的成 本巨大,再加上不同企业的产品处于不同工况环境,直接整合建模效果不佳。
5.寿命预测包含了终止寿命(end of life,eol)预测和剩余使用寿命(remaining usefullife,rul)预测,可以用rul=eol

t表示二者间关系,其中t是给定的时间。基于解 析模型的rul预测方法是通过研究产品失效的物理机理构建描述产品退化过程的数学模 型,该过程需要根据产品的状态数据不断更新模型参数,最终实现利用历史数据预测产品 剩余寿命的目标。该方法通过先进的数据挖掘技术研究分析产品失效背后蕴含的信息从而 实现寿命的预测,利用概率统计方法或机器学习方法构建预测模型,在保证预测结果准确 度较高的前提下降低了对研究人员的物理和数学能力要求。人工神经网络在基于机器学习 的寿命预测方法中使用是最频繁的。循环神经网络等深度学习模型具有强大的特征自学习 能力,如何将其应用在寿命预测方面也是研究热点。综合来说基于数据驱动的寿命预测技 术不需要研究产品失效背后的物理机理,降低了对模型设计者的要求,已经广泛应用于各 种产品的剩余寿命预测领域。
6.综上所述,由于群体产品复杂多样,其背后隐含的失效机理也复杂多变,使用基于
解 析模型的剩余寿命预测方法需要针对每种失效模式研究对应的失效机理并建立合适的模 型,这种方法不太适合。基于此,本发明选择基于数据驱动的lstm(长短时记忆网络) 剩余寿命预测方法进行预测,克服基于概率统计方法存在严重依赖大量数据这一不足,准 确地预测群体产品的剩余寿命,有效地指导产品的维修,提供产品的可靠性。


技术实现要素:

7.为了解决现有技术所存在的问题,本发明提出一种基于lstm的剩余寿命预测方法。
8.根据本发明的一个方面,所述方法包括:一种基于lstm的锂电池寿命预测方法,包括:
9.获取锂电池的容量退化数据集;将所述容量退化数据集进行预处理,所述预处理包括: 数据归一化处理,所述数据归一化方法为min

max标准化:数据集划分,以在模型训练前, 将数据集划分为训练集和测试集;构建基于lstm的剩余寿命预测模型;所述剩余寿命预测 模型是基于处理时间序列数据的神经网络rnn和长短期记忆(lstm)网络的,所述lstm用 来消除rnn网络中存在的梯度爆炸和梯度消失问题;在构建基于lstm的剩余寿命预测模型 后,进一步构建三个锂电池本地寿命预测模型和一个中央服务器端全局寿命预测模型,并 且其中;所述lstm为网络结构,其中的任一个lstm单元里面包括遗忘门、输入门和输出 门;所述三个锂电池本地寿命预测模型结构相同,其模型结构包括两个lstm层,两个 dropout层防止过拟合和一个顶层的预测输出层;最后,将所述训练集送入已构建的锂电 池本地寿命预测模型和中央服务器端全局寿命预测模型,并进行模型训练,输出锂电池预 测剩余寿命。
10.根据本发明的实施例,所述两个lstm层的激活函数为双曲正切tanh函数,最后输出 层dense层的激活函数为线性linear函数,dropout rate设定为0.3。
11.进一步,在所述遗忘门中,进行如下操作:
12.将前一时刻的信息在传入下一时刻之前经过选择性的抛弃:将h
t
‑1和x
t
带入如下的公式 计算得出一个属于[0,1]之间的向量,向量的值表示细胞状态c
t
‑1中有多少信息被保留或抛 弃;0表示没有保留,1表示所有都保留;
[0013]
f
t
=σ(w
f
·
[h
t
‑1,x
t
] b
f
)。
[0014]
进一步,进一步决定向单元状态添加何种新信息:i
t
是更新信息的权重系数,将h
t
‑1和 x
t
代入下述公式可以得到所述i
t
,然后通过激活函数tanh,使用h
t
‑1和x
t
生成新的候选状态 向量其中有:
[0015]
i
t
=σ(w
i
·
[h
t
‑1,x
t
] b
i
)
[0016][0017]
进一步,通过如下公式可以更新状态信息,其中:
[0018][0019]
细胞的输出也需要根据h
t
‑1和x
t
来判断,首先将h
t
‑1和x
t
带入 得到判断条件,然后将ct带入tanh激活函数计算出一 个属于[

1,1]之间的向量,再乘以判断条件便得到最终输出,其中:
[0020]
o
t
=σ(w
o
[h
t
‑1,x
t
] b
o
)
[0021]
h
t
=o
t
*tanh(c
t
)。
[0022]
进一步,在模型训练过程中,批训练样本batch_size=32,单个样本数据长度为50,模 型训练选择优化器adam,学习率为0.001,训练次数epochs为20。
[0023]
进一步,在模型训练后,所述锂电池本地寿命预测模型要向中央服务器端全局寿命预 测模型发送权重系数和损失值,所述中央服务器获取到锂电池产品端传输的权重需要做进 一步处理,以对权重值进行加权处理。
[0024]
进一步,所述权重值由下式确定:
[0025][0026]
w
i
代表第i个产品端预测模型的权重,loss
i
代表第i个产品端预测模型的损失值,w则 代表着中央服务器预测模型的权重,中央服务器计算得出的w之后会下发给单体产品端用 以更新权重,其中,将单体设备端和中央服务器端的通信次数设定为20。
[0027]
进一步,在模型训练后,确定锂电池本地寿命预测模型下一轮迭代的本地预测模型初 始化参数;所述初始化参数由下述方法确定:直接采用前一轮本地寿命预测模型的结构, 保证模型结构不变,冻结前四层的权重参数和结构参数,之后将其余层的权重随机化,进 行下一轮训练,输入前50个时刻的状态数据,输出下一时刻的状态数据。
[0028]
进一步,采用所述初始化参数确定方法,预测结果平均准确度为95.48%。
附图说明
[0029]
本公开的各种实施例或样例(“示例”)在以下的具体实施方式和附图中得以公开。没 必要将附图按比例绘制。一般而言,除非在权利要求中另有规定,否则可以任意顺序执行 本发明所公开方法的操作。附图中:
[0030]
图1示出了本发明的针对群体产品剩余寿命预测的总体框架;
[0031]
图2示出了本发明的群体产品寿命预测的联邦迁移学习流程;
[0032]
图3为单体产品端本地寿命预测模型和中央服务器端全局寿命预测模型的设计;
[0033]
图4为lstm网络结构示意图;
[0034]
图4a为lstm遗忘门单元;
[0035]
图4b为lstm输入门单元;
[0036]
图4c为lstm的更新操作;
[0037]
图4d为判断输出细胞的状态特征;
[0038]
图5为lstm寿命预测模型;
[0039]
图6为25℃锂电池原始数据;
[0040][0041]
图7为25℃锂电池数据归一化结果图;
[0042]
图8为锂电池数据平滑前后对比图;
[0043]
图9为基于lstm的锂电池单体产品端寿命预测模型结构;
[0044]
图10为单体产品端本地预测结果绘图示例;
[0045]
图11为基于lstm的学习策略;
[0046]
图12为方案一预测结果绘图示例;
[0047]
图13为方案二预测结果绘图示例;
[0048]
图14为方案三预测结果绘图示例。
具体实施方式
[0049]
在详细解释本公开的一个或多个实施例之前,应当理解,实施例不限于它们具体应用 中的构造细节,以及下文实施方式或附图所提出步骤或方法。
[0050]
研究群体产品剩余寿命预测,首先要设计针对群体产品剩余寿命预测的总体框架。客 户

服务器架构是最常用的一种架构,它的架构比较简单。在这个框架中,多个拥有本地数 据的参与方(也可以称为用户或客户),在中央服务器(也称为参数服务器或聚合服务器) 的帮助下,协作共同训练一个适用于所有参与者的机器学习模型。该框架下的具体工作流 程是这样的:(1)多个参与方在本地训练模型,得到模型的权重等参数,之后将这些参数 发送给中央服务器等待进一步处理。(2)中央服务器得到参与方上传的参数后进行加权平 均处理。(3)中央服务器将加权平均处理后的结果下发给各个参与方。(4)各参与方用 中央服务器下发的参数更新本地模型。上述步骤会持续进行,直到达到给定的迭代次数, 就得到了最终的模型。
[0051]
具体来说,本发明设计的针对群体产品剩余寿命预测的总体框架如图1所示。如图1 所示,本发明的群体产品剩余寿命预测的总体框架包括多个单体产品端和一个中央服务器 端,示例性地给出了三个单体产品。每个单体产品端通过例如是传感器的手段获得群体产 品(例如锂电池)的原始数据,首先对原始数据进行预处理,预处理包含数据归一化、数 据平滑处理、数据集划分等方式,然后在本地单体产品端进行训练,将得到的权重参数上 传给中央服务器端。图1所示的单体产品

服务器架构,其示例性的三个单体产品端彼此之 间没有任何交互,只需要将在单体产品端训练好的剩余寿命预测模型的权重参数上传给服 务器端,随后服务器端对这些权重参数进行加权平均处理并将处理后的权重参数下发给三 个单体产品端,三个单体产品端处采用迁移学习的思路选择部分参数用以更新模型,重复 上述操作直到服务器端的剩余寿命预测全局模型收敛。
[0052]
图2为根据本发明设计的群体产品剩余寿命预测的联邦迁移学习流程图。如图2所示, 学习流程图包括:开始时,获取群体产品的原始数据;将原始数据送入单体产品端的剩余 寿命预测模型,并进行训练,训练后得到单体产品端的剩余寿命预测模型的权重参数;单 体产品端将各自训练好的权重参数送到服务器端;服务器器端汇总所有本地寿命预测模型 的权重和损失值,经过加权处理后将权重下发给各个单体产品端;接收到服务器下发的权 重参数后,各个单体产品端选择合适的迁移学习策略来更新本地寿命预测模型;单体产品 端在更新后的本地寿命预测模型的基础上,再次接收原始数据,对模型进行训练,而后上 传本地单体产品端的剩余寿命预测模型的权重参数。上述过程为一个完整的循环,然后判 断循环次数是否已经达到提前设定的迭代次数,若没有达到,则继续从单体产品本地寿命 预测模型的训练开始,否则任意选择一个产品端的模型继承所有的权重参数即为最终的全 局模型。
[0053]
设计好针对群体产品剩余寿命预测的总体框架后,下面按照框架内容完成任务。首先 是单体本地寿命预测模型设计,主要包含了以下两个部分:数据分析及预处理、单体
本地 寿命预测模型构建,然后是中央服务器端全局寿命预测模型的搭建。具体的流程如图3所 示。由传感器采集到的产品运行状态数据往往需要经过预处理,才能用于后续寿命预测模 型的训练和测试中。本技术选择使用基于机器学习的方法来建立产品端本地寿命预测模型。
[0054]
下面将参照图3对本发明的示例性模块进行详细说明。
[0055]
步骤1:单体产品端数据分析及预处理
[0056]
由于产品运行过程中的非平稳状态的影响或者传感器采集数据时的异常状况,传感器 采集到的产品运行状态数据往往存在较大的波动值或数据异常,直接将采集到的这些数据 用于模型的训练得到的模型预测效果大都不好,因此在利用这些数据进行寿命预测前往往 需要进行预处理。数据预处理主要包括以下三个部分的内容:数据归一化处理、数据平滑 处理、数据集划分。
[0057]
步骤1.1:数据归一化处理
[0058]
每次采集到的数据范围尺度不同,如果存在一个尺度范围非常大的数据,小尺度范围 的数据对模型训练的影响可以忽略不计,因此需要进行归一化。调研发现常用的数据归一 化方法主要有两种:0均值标准化(z

score standardization)、min

max标准化(min

maxnormalization)。
[0059]
0均值标准化是对每一个数据利用下式进行处理,经过处理后数据的分布符合标准正 态分布,即均值为0,标准差为1。下式中代表采集到的样本数据,μ表示的是所有样本 数据的均值,则是所有样本数据的标准差。
[0060][0061]
min

max标准化是指经过变换使样本值映射到[0,1],样本数据x(x1,x2,...的标准 化方式如下式。
[0062][0063]
上述两种数据归一化方法各有优劣。0均值标准化的处理过程相对复杂,需要事先利 用样本进行一些计算,相对来说比较复杂。而对于min

max标准化来说,它的处理过程相 对简单,本质上是把样本数据变成[0,1]之间的小数,在不涉及距离度量的时候使用min

max 标准化方法更为简便。实际在应用时要根据具体情况选择合适的方法。
[0064]
步骤1.2:数据平滑处理
[0065]
采集到的数据往往存在毛刺和噪声,直接将其用于预测分析效果不好,需要对原始样 本数据进行平滑预处理。局部加权回归(locally weightedregression,lwr)算法在数据平滑 处理中经常被用到,它的工作流程如下:首先是把样本划分成多个区间,对局部样本进行 多项式拟合,然后用最小二乘法估计拟合值,最后便可以完成对原始样本的平滑处理。局 部加权回归算法主要的思想就是根据其他点离观测样本点的距离远近计算出不同的权重系 数,将样本点乘以对应的拟合权重相加得到观测点的拟合值,所有的样本点经过这样的处 理便可以得到去掉噪声的平滑数据。具体的数学原理如下:
[0066]
提前设定一个范围尺度为2k,对于样本集q={q1,q2,...,q
n
}中的任意一个样本点 q
i
(i=1,2,

,n),用以下式子得到其加权拟合值。
[0067][0068]
其中权重系数w
i
(q
k
)的值由下式决定,从公式可以看出对于距离观测点q
k
越远的样本 点q
i
,对应权重系数w
i
(q
k
)的值也越小,而对于距离观测点q
k
越近的样本点q
i
,对应权重系 数w
i
(q
k
)的值则越大,这样便可以较好的去除原始数据集中异常的噪声点。
[0069][0070]
局部加权回归算法可以有效地将原始数据集中的噪声去除,使原始数据绘图曲线变得 平滑,有利于避免过拟合或欠拟合的情况发生。
[0071]
步骤1.3:数据集划分
[0072]
经过数据归一化处理和数据平滑处理后,在进行模型训练前,还需要将数据集划分为 训练集和测试集。k折交叉验证是一种划分数据集的方法,它是通过每次不重复的抽取数 据集中的一定数据作为测试集其余作为训练集来完成的,这样可以充分利用数据,适合在 分类任务中使用。留出法也是划分数据集时常用到的一种方法,这种方法操作起来比较简 便,适合在样本数据量比较充足时使用。具体在应用时,要结合任务需求和数据量的大小 来选择合适的方法。
[0073]
步骤2:构建基于lstm的剩余寿命预测模型
[0074]
随着传感器技术的发展,通过传感器获得的产品运行状态数据越来越多,传统的浅层 机器学习算法在处理海量数据显得力不从心。而深度学习强大的非线性映射能力和高维特 征提取能力使其非常适合应对这种情况。rnn是处理时间序列数据的神经网络,而本文研 究的是群体产品,其运行状态数据是随时间慢慢衰减的,属于时间序列数据,因此适合应 用rnn来解决。但单纯的rnn存在梯度爆炸和梯度消失的问题,长短期记忆(lstm) 通过选择性的遗忘解决了这一问题。因此本文选用lstm来进行群体产品剩余寿命的预测, 图4是根据本发明的lstm网络结构示意图。
[0075]
如图4所示。一个lstm单元里面包含三个门来控制细胞状态,这三个门分别称为遗 忘门、输入门和输出门。
[0076]
前一时刻的信息在传入下一时刻之前往往要经过选择性的抛弃,遗忘门可以完成这一 操作。将h
t
‑1和x
t
带入如下图所示的公式计算得出一个属于[0,1]之间的向量,向量的值表示 细胞状态c
t
‑1中有多少信息被保留或抛弃。0表示没有保留,1表示所有都保留。遗忘门如 图4a所示,其中有:
[0077]
f
t
=σ(wf
·
[h
t
‑1,x
t
] b
f
)
[0078]
下一步是决定向单元状态添加哪些新信息。i
t
是更新信息的权重系数,将h
t
‑1和x
t
带入 如下图所示的第一个公式可以得到,然后通过激活函数tanh使用h
t
‑1和x
t
生成新的候选状 态向量这两步描述如图4b所示,其中有:
[0079]
i
t
=σ(w
i
·
[h
t
‑1,x
t
] b
i
)
[0080][0081]
通过下图所示的公式可以更新状态信息,根据公式来看更新既涵盖上一时刻部分状态 信息同时也包括此时状态信息的一部分。更新操作如图4c所示,其中:
[0082][0083]
细胞的输出也需要根据h
t
‑1和x
t
来判断,首先将h
t
‑1和x
t
带入 得到判断条件,然后将c
t
带入tanh激活函数计算出一个 属于[

1,1]之间的向量,再乘以判断条件便得到最终输出。这个步骤如图4d所示,其中:
[0084]
o
t
=σ(w
o
[h
t
‑1,x
t
] b
o
)
[0085]
h
t
=o
t
*tanh(c
t
)
[0086]
步骤3:构建单体产品端本地寿命预测模型和中央服务器端全局寿命预测模型的搭建
[0087]
在构建基于lstm的剩余寿命预测模型后,进一步构建单体产品端本地寿命预测模型 和中央服务器端全局寿命预测模型。
[0088]
本地和全局寿命预测模型的搭建是用lstm层、dropout层以及dense层来完成的, 一般在搭建过程中,可以先根据经验设计一个原始的模型,然后输入样本根据预测结果的 准确度与预测时间的长短来决定增加或减少lstm的层数,一般来说1至3层的lstm层 即可满足预测结果的准确度要求。图5是根据本发明的一个示例性的lstm寿命预测模型 示例,如图5所示,模型中含有2个lstm层,2个dense层。输入是产品的状态数据, 示例输出是预测的产品的寿命。
[0089]
在本发明中,为了方便中央服务器端和单体产品端的参数的交互更新,中央服务器端 的寿命预测模型结构应与单体产品端的寿命预测模型结构相同,这样同时也可以保证全局 模型的收敛,因此在构建模型时,中央服务器端的寿命预测模型结构与单体产品端的寿命 预测模型在一个构建过程中完成。
[0090]
本发明的的lstm寿命预测模型是需要固定单体产品端寿命预测模型的模型结构,把 汇总处理后的单体产品端权重参数部分作为其初始化参数。因此关建是要汇总处理单体产 品端权重参数,同时要考虑选择哪一部分作为下一轮迭代的单体产品端预测模型初始化参 数。
[0091]
首先是单体产品端本地寿命预测模型的参数汇总处理。现有的处理方式是根据每个产 品端样本的数目对模型的权重进行加权,样本数越多的产品其权重的加权系数越大,但这 忽略了模型的损失值对加权系数的影响,造成全局模型的预测精度不够高。本发明是根据 loss值和样本数目综合对权重值进行加权处理,如式(1.1)所示。w
i
代表第i个产品端预 测模型的权重,loss
i
代表第i个产品端预测模型的均方误差值,综合考虑了样本数和模型损 失值对加权系数的影响。w则代表着中央服务器预测模型的权重,k代表单体产品端的个数。 这样做的思想是认为loss值大的单体产品端模型在全局模型的占比更大,其本地数据对全 局模型的影响也大。经过中央服务器计算得出的w之后会下发给单体产品端用以更新权重。
[0092][0093]
上述过程是单体产品端和中央服务器端信息交互的一次完整迭代,为了使全局模型达 到令人满意的预测效果,这一过程需要重复进行多次。一般要预先设定一个固定的迭代次 数m,当上述过程重复达到m次便停止。
[0094]
其次介绍选择哪一部分作为下一轮迭代的本地预测模型初始化参数。由于本文的全局 寿命预测模型是基于lstm的,因此需要掌握lstm与基于模型的迁移学习结合起来的实 现方法。将lstm与基于模型的迁移学习结合起来的实现方法是逐层将lstm层的结构参 数和权重参数固定,然后重新输入数据训练其他的层数获得新的权重参数,并根据模型的 预测结果的准确度来选择最优的冻结层数和最优的结构参数。其中结构参数是指模型的学 习率、激活函数、优化器等参数,而权重参数是指模型的偏置及权重值。这其中的原理是 已经训练好的模型的前几层具有良好的捕捉输入数据特征关系的功能,直接迁移这几层就 可以免去再次重新训练模型使其获得捕捉输入特征的过程,实际在具体应用时迁移几层还 需要根据输出预测结果的准确度来决定。因此本发明可以通过冻结中央服务器端全局寿命 预测模型的部分或整体来完成迁移学习。
[0095]
【示例性实施例:锂电池剩余寿命的预测】
[0096]
不同型号的锂电池既有一定程度的相似性同时又存在一定的差异性,可以看作是一种 群体产品,而且不同型号的锂电池退化趋势差异性较大,再加上采集锂电池容量数据的成 本花费较高且不同企业间由于竞争的原因一般不愿意共享数据,因此这里适合基于lstm对 锂电池的寿命进行预测。
[0097]
本发明用到的数据集是通过循环寿命实验采集的,锂离子电池循环寿命试验台为电池 研发企业提供,该数据集采集的温度条件是25℃,利用的是限压恒流充放电方式,实验的 停止条件是锂电池容量退化到初始值的82%。
[0098]
该数据集包括了10种不同型号的锂离子电池容量退化数据,本文用到了其中的3种 (a,b,c组)。共计13组数据,每组数据平均包含1000个容量锂电池数据。不同组间的 阴极材料相同,但阳极有差异。本发明选用的25℃温度条件下不同型号的电池退化数据如 表1所示。
[0099]
表1 25℃电池分组情况
[0100][0101]
将上述a、b、c组的锂电池组合起来,作为模型训练的数据集使用,具体的组合如表 2所示,共计35种组合方式。
[0102]
表2数据集分组情况
[0103][0104]
由于选用了多组不同型号的锂离子电池,不同组别之间的失效过程趋势差异较大,不 同型号锂离子电池的原始退化数据(剩余容量)如图6所示。从图中可以看出未经处理前 的原始数据失效过程趋势不尽相同,这不利于后续中央服务器端全局寿命预测模型的收敛。
[0105]
在锂电池循环寿命测试过程中,由于不同电池型号的材料存在差异,需要归一化处理 锂电池容量数据。由于此处不涉及距离度量和协方差计算,因此采用更为简便的min

max 标准化的方法。将失效阈值设定为锂电池初始容量的82%,记其初始容量为1,失效阈值 记为0,样本数据x(x1,x2,...,x
n
)的标准化方式如式(1)所示,对25℃温度条件下的锂电 池样本数据的归一化结果如图7所示。可以看出,归一化使样本有相同分布,有利于提升 寿命预测结果精度。
[0106][0107]
由图7可以看出,经过归一化处理的数据绘制曲线仍存在毛刺状波动,因此需要对原 始电池数据进行平滑预处理,选用局部加权回归算法进行处理。如图8是一个锂电池样本 数据平滑前后的对比。图中黑色曲线是由原始退化数据绘制而成,蓝色曲线则是由经过平 滑处理后的数据绘制而成。从图中可以看出,原始数据退化黑色曲线存在毛刺状波动,
经 过局部加权回归平滑处理,平滑数据蓝色曲线在保持与原始数据黑色曲线的曲线走势相近 的前提下,消除了噪声的干扰,这有利于提升预测结果的准确性。
[0108]
经过归一化处理和平滑处理后,还需要划分数据集,由于每组的样本数据量比较充足, 直接使用留出法。此处把数据集的60%划分为训练集,剩余数据划为测试集。
[0109]
单体产品端本地预测是各个单体产品在本地利用自身的数据训练出一个本地的寿命预 测模型,之后将模型的权重参数上传给中央服务器端。本发明的单体产品端本地预测模型 利用lstm模型,三个单体产品端均采用相同的模型结构。其模型结构包括两个lstm层, 两个dropout层防止过拟合和一个顶层的预测输出层。前两个lstm层的激活函数为tanh (双曲正切),最后输出层dense层的激活函数为linear(线性),dropout rate设定为0.3。 其中dropout rate的设定要经过多次尝试,当模型过拟合时要增大dropout rate,当模型出 现欠拟合时要减小dropout rate,最终确定当dropout rate为0.3时模型的拟合效果较好,模 型结构具体见图9所示。模型训练过程中,批训练样本batch_size=32,单个样本输入数据 长度为50,输出数据长度为1,即用前50个数据预测第51个数据,模型训练选择优化器 rmsprop,学习率为0.001,训练次数epochs为20。
[0110]
利用上述模型分别对25℃温度条件下采集到的a、b、c三种型号的锂电池数据进行 寿命预测并记录预测结果准确度,每次输入一种型号电池的一个样本的退化数据,得到的 部分结果如图10所示。根据两条曲线的重合程度可以看出预测效果,根据图像来看预测效 果整体上可以接受,但是也存在少数预测结果误差较大的情况,如b_2006、c_3006。
[0111]
中央服务器端的模型便是最终的全局预测模型,为了使全局模型对每个单体产品的数 据均有较好的预测效果,全局寿命预测模型依然利用lstm网络进行搭建。
[0112]
为了便于全局模型最后的收敛以及处理单体设备传输的权重等参数,全局模型采用与 单体设备端预测模型相似的模型结构,包括两个lstm层,两个dropout层防止过拟合和 一个顶层的预测输出层。模型训练过程中,批训练样本batch_size=32,单个样本数据长度 为50,模型训练选择优化器adam,学习率为0.001,训练次数epochs为20。
[0113]
按照之前本发明所公开的内容,首先要汇总处理单体产品端权重参数,之后要考虑选 择哪一部分作为下一轮迭代的单体产品端预测模型初始化参数。
[0114]
首先介绍单体产品端权重参数的汇总处理过程,中央服务器获取到单体产品传输的权 重需要做进一步处理,按照前述内容是利用loss值对权重值进行加权处理。如式(2)所示, w
i
代表第i个产品端预测模型的权重,loss
i
代表第i个产品端预测模型的损失值,w则代表 着中央服务器预测模型的权重。中央服务器计算得出的w之后会下发给单体产品端用以更 新权重,在进行实际操作中,发现将单体设备端和中央服务器端的通信次数设定为20便可 以达到较好的预测效果。
[0115][0116]
将a型号1个样本和b型号7个样本以及c型号5个样本的锂电池数据搭配组合,共 计有35种组合方式,每个组合的3个样本作为单体设备数据在单体产品端本地预测模型处 训练,获得权重参数w
i
和损失参数loss
i
,经过加权平均处理后获得处理后的的权重w,随 后将这些权重参数下发给各个单体产品用于更新模型。
[0117]
之后介绍选择哪一部分作为下一轮迭代的本地预测模型初始化参数,共计以下三
种方 案,具体如图11所示。第一种方法是直接采用前一轮本地寿命预测模型的结构,保证模型 结构不变,冻结前四层的权重参数和结构参数,之后将其余层的权重随机化,进行下一轮 训练,输入前50个时刻的状态数据,输出下一时刻的状态数据。第二种是采用前一轮本地 寿命预测模型的结构,保证模型结构不变,冻结第三层和第四层的权重参数和结构参数, 之后将其余层的权重随机化,得到新的模型。第三种方法是采用前一轮本地寿命预测模型 的结构,保证模型结构不变,冻结前两层的权重参数和结构参数,并将其余层的权重随机 化,得到新的模型。
[0118]
按照第一种方案的思想,直接采用前一轮本地寿命预测模型的结构,保证模型结构不 变,冻结前四层的权重参数和结构参数,之后将其余层的权重随机化,进行下一轮训练, 经过统计其预测结果平均准确度为95.48%,预测结果部分绘图如12所示。
[0119]
按照第二种方案的思想,采用前一轮本地寿命预测模型的结构,保证模型结构不变, 冻结第三层和第四层的权重参数和结构参数,之后将其余层的权重随机化,得到新的模型。 预测结果平均准确度为95.55%,相比第一种方案,准确度略有提升,预测结果部分绘图如 图13所示。
[0120]
采用第三种方案的思想,保持前一轮本地寿命预测模型的结构不变,冻结前两层的权 重参数和结构参数,并将其余层的权重随机化,得到新的模型。得到的预测结果平均准确 度为95.72%,准确度相较于方案二又有了一些提高。预测结果部分绘图如图14所示。
[0121]
统计中央服务器端全局模型预测结果和单体产品端本地模型预测结果的准确度如下表 所示。根据下表可以计算得出,单体产品端本地模型预测结果平均准确度为95.17%,而中 央服务器端全局模型预测结果平均准确度分别为95.48%、95.55%、95.72%,可以看出相较 于本地预测模型的准确度,中央服务器端全局模型的预测结果准确度有了一定的提升,最 后根据准确度选择方案三作为迁移学习策略。
[0122]
表5.3预测结果准确度统计
[0123][0124]
在本实施例中,按照本发明所公开的lstm模型及构建方法对锂电池样本的剩余寿命 进行了预测,根据预测结果的图像和准确度记录来看,显然,使用基于lstm的预测模型 对锂电池样本的剩余寿命进行预测,可以有效提高预测结果的准确度。
[0125]
本发明针对群体产品寿命预测的lstm方法进行了研究。针对群体产品剩余寿命预测的 问题,本发明提出了一种具体实现方法。首先在各单体产品端进行本地寿命预测模型的预 测,之后处理本地模型的参数,然后在单体产品端迁移部分处理过的参数进行下一轮
迭代, 最终得到一个全局寿命预测模型,该方法可以在保证数据不泄露的前提下,最大化利用已 有的数据,有利于提升寿命预测结果的准确度。
[0126]
在中央服务器端全局寿命预测模型处对现有的fedavg算法进行了改进,不是根据产品 端数据量的多少分配权重系数,而是按照产品端寿命预测模型的损失值分配权重系数,损 失值较大的寿命预测模型的权重系数也相应较大,这样有助于提升全局寿命预测模型的准 确度。
[0127]
综上所述,尽管已经参考附图所示的实施例描述了本发明,但是可在不脱离权利要求 范围的情况下使用等同或替代手段。本发明所描述和图示的组件仅仅是可以用于实现本公 开的实施例的系统/设备和方法的示例,并且可以在不脱离权利要求范围的情况下用其他设 备和组件进行替换。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献

  • 日榜
  • 周榜
  • 月榜