继前分享的锂电池数据
精品数据分享 | 锂电池数据集(一)新能源汽车大规模锂离子电池数据集
精品数据分享 | 锂电池数据集(二)Nature子刊论文公开锂离子电池数据
精品数据分享 | 锂电池数据集(三)西安交通大学(XJTU)电池数据集
本期继续分享一篇 Nature communication 论文:物理信息神经网络在锂离子电池退化稳定建模和预测中的应用,划重点-数据集开源, 代码开源!!!

论文题目:《Physics-informed neural network for lithium-ion battery degradation stable modeling and prognosis》
论文链接:
https://www.nature.com/articles/s41467-024-48779-z
数据集链接:
https://zenodo.org/records/10963339
论文代码:
https://github.com/wang-fujin/PINN4SOH
注意:如果下载不了,,后台回复"pinn",可获取我们已经打包好的论文、数据集和代码!

1 摘要
准确的健康状态(SOH)估计是锂离子电池可靠、安全运行的关键。然而,由于不同的电池类型和运行条件,可靠和稳定的电池SOH估计仍然具有挑战性。本文提出了一种物理信息神经网络(PINN),用于准确、稳定地估计电池SOH。具体地说,我们从经验退化和状态空间方程的角度对影响电池退化的属性进行建模,并利用神经网络来捕捉电池退化动力学。设计了一种通用的特征提取方法,从电池充满电前的短时间数据中提取统计特征,使该方法适用于不同的电池类型和充放电协议。此外,我们生成了一个由55个锂镍钴锰氧化物(NCM)电池组成的全面数据集。结合其他三个不同制造商的数据集,我们使用了总共387块电池和310,705个样本来验证我们的方法。平均绝对百分比误差(MAPE)为0.87%。与其他神经网络相比,我们提出的Pinn在常规实验、小样本实验和迁移实验中都表现出了显著的性能。这项研究强调了物理知识机器学习在电池退化建模和SOH估计中的前景。
2 前言
近年来,锂离子电池在全社会以惊人的速度增长,这对可再生能源设备的普及是前所未有的推动。锂离子电池具有能量密度高、自放电率低、使用寿命长等优点,已成为便携式电子设备、电动汽车、航空航天等诸多领域的主要储能设备。2019年,仅用于新能源汽车的锂离子电池全球出货量就达到了116.6 GW9。预计到2025年,全球锂离子电池装机容量将达到800GWh,市场价值将达到918亿美元。锂离子电池的爆炸性增长在给人们的生活带来便利的同时,其老化和健康管理也引起了人们的关注和关注。锂离子电池的老化是一个重要问题,它们的性能会随着时间的推移而下降,直到失效。为了确保长期、安全和持续的运行,锂离子电池必须得到适当的维护和控制,其中包括健康状态(SOH)评估。电池的SOH定义为当前可用容量与初始容量的比率,可用作衡量电池退化的指标。当SOH降至80%时,电池将达到其第一个使用寿命。已经达到第一个使用寿命的电池仍然可以在能源等领域使用二次利用的储能发电站。因此,准确估计电池的SOH就显得尤为重要。
近年来,各种锂离子电池SOH估算方法的提出,极大地推动了该领域的发展。然而,准确估计SOH仍然是一个具有挑战性的问题。通常,通过安时积分,从高截止电压到低截止电压的完整放电曲线可以获得容量,从而获得SOH。在实际应用中,由于电池极少完全放电,很难得到完整的充放电曲线。一些学者通过建立电池老化模型来估计SOH。巴格达迪等人在达金的退化方法的基础上提出了一种基于物理的方法来模拟电池的线性退化过程。考虑到时变温度条件对锂离子电池的放电容量和老化规律有重要影响,Xu等人提出了基于Arrhenius温度模型的随机退化速率模型,并建立了基于Wiener过程的锂离子电池时变温度条件下的老化模型。董等人提出了一个基于物理的模型,该模型结合了化学和机械降解机制,通过模拟固体电解质界面(SEI)的形成和生长来预测容量衰减。Lui等人提出了一种基于物理的方法来预测锂离子电池的容量,方法是通过模拟退化机制,如正负极活性物质的损失和锂库存的损失。
考虑到建立物理模型和获得完整放电容量的困难,许多研究使用数据驱动方法来根据充放电过程中的电流和电压曲线来估计SOH。常用的数据挖掘方法包括线性回归、支持向量机、高斯过程回归、深度神经网络。Wang等人从电化学阻抗谱(EIS)中提取了有价值的健康指标作为高斯过程回归的输入,以估计SOH。数据驱动方法不需要物理知识,只关注输入和输出之间的关系,因此退化特征的提取是数据驱动方法的关键部分,它在很大程度上决定了SOH估计的性能。
然而,开发可靠、准确和通用的SOH估计方法仍然面临挑战。基于物理的模型稳定和准确,但不同化学成分的电池需要不同的模型参数,并且模型的计算成本较高。数据驱动模型具有较高的精度和效率,但其泛化能力依赖于提取的特征,稳定性较差。例如,由于使用的可变性很大,现有的方法需要针对不同的数据集或不同的工作条件提取特定的特征,导致模型是特定于数据集的,造成计算资源的浪费。物理信息神经网络(PINN)的前景在于融合了基于物理的方法和数据驱动的方法的优点,潜在地解决了上述挑战。由于考虑了物理信息,Pinn可以使用相对较少的数据来训练模型,模型更加稳定。这是一种在电池预测和诊断领域很有前途的方法。Aykol等人将结合物理知识和机器学习的电池建模方法分类为五类,包括三种顺序积分方法A1-A3和两种混合方法B1-B2。其中,序贯集成法的一个明显特点是物理模型和机器学习模型是独立的,而混合方法则将两者融合在一起。在这一框架内,出版了一些作品。Nascimento等人通过递归神经网络直接实现了基于原理的控制方程的数值积分,以模拟电池的动态响应。Wang等人提出了一种基于等效电路模型(ECM)的电池神经网络(BattNN)用于放电电压预测。Hofmann等人使用伪二维(P2D)Newman模型生成不同健康状态点的数据,并将其与实验数据和现场数据相结合来训练神经网络模型,该模型利用了内部状态和可测量的SOH之间的相关性。根据Aykol等人提出的类别,这些方法属于A2和A3类别。
事实上,顺序积分法的实现相对简单,因为物理模型和机器学习模型是独立的,这使其成为电池建模的一种实用的短期策略。从本质上讲,序贯积分法中的机器学习模型不受物理约束。另一方面,混合方法更基本,因为它们真正将电池建模的主要控制方程与数据驱动方法相结合。然而,由于复杂的物理方程参数众多,求解困难,目前采用混合方法进行SOH估计的文献很少。最近的综述38指出,从长远来看,混合方法将成为主导方法,但它仍然是一个开放的研究问题。
在这项工作中,我们提出了一种用于电池SOH估计的PINN,它属于B2体系结构。这种方法实现了控制方程和神经网络的真正集成,从而实现了稳定和准确的SOH估计。与现有的Pinn方法不同,我们还验证了它在小样本学习和不同化学成分和充放电曲线的电池之间转移学习方面的进步。具体地说,首先,考虑到电化学方程的复杂性,阻碍了B2型PINN的发展。因此,我们从经验退化和状态空间方程的角度对电池退化动力学进行建模,并利用神经网络来捕捉电池退化动力学。其次,为了使模型更具通用性,我们提出了一种新的特征提取方法。电池的放电过程是特定于用户的,电池很少完全放电。相比之下,一旦充电开始,充满的概率很高,而且更固定和规则。因此,我们从电池充满电之前的短周期数据中提取特征。第三,为了验证我们的方法,我们进行了电池退化实验,并发布了一个包含55块电池从运行到故障的数据集。此外,我们还在其他三个具有不同化学组成和充放电协议的大规模数据集上验证了我们的方法,证明了我们方法的优越性和通用性。我们还通过将退化知识从一个数据集转移到另一个数据集来执行估计SOH的进一步任务。这些用于执行转移任务的数据集包含具有不同化学成分和充放电协议的电池。仿真结果表明了PINN算法在SOH估计中的有效性和通用性。
3 结果
3.1 框架概述和流程图
我们开发了一种用于锂离子电池SOH估计的Pinn方法,其流程图如图1所示。我们的方法考虑了电池退化的动态行为以及退化趋势,旨在更全面、可靠、稳定和高精度地估计SOH。
在数据预处理阶段(如图1B所示),从电池充满电前的短时间段数据中提取统计特征作为模型的输入,保证了这段时间的数据存在于大多数电池数据集中,解决了现有研究中特征不通用的问题。因此,我们的方法适用于不同化学成分和充放电方案的电池。

图1
在SOH估计阶段,由于电化学方程的复杂性,目前还没有很好的方法将其与神经网络相结合。在这项工作中,我们从经验退化和状态空间方程的角度对影响电池退化的属性进行建模,并利用神经网络对建立的退化模型进行逼近,有效地实现了控制方程和神经网络的集成。提出的PINN由两部分组成:将特征映射到SOH的解函数f(⋅)和模拟电池退化动态行为的非线性函数g(⋅),如图1C所示。对特征和SOH之间的关系进行建模的解f(⋅)被表示为ui=f(ti,xi),其中ti表示时间,xi表示提取的特征向量,ui表示循环i的SOH。非线性函数g(⋅)模拟电池的SOH衰减率。由于f(⋅)和g(⋅)在现实中受到许多因素的影响,并且它们的显式表达式是未知的,因此它们被小型全连接神经网络所取代,表示为fðÞ和gðò。在训练过程中,我们考虑了由偏微分方程描述的退化方程约束的数据项损失Ldata、单调性损失Lmono和损失LPDE。它们使预测值和真实值之间的误差最小化,同时使模型遵循退化轨迹的单调性,并满足所建立的退化模型的约束。
接下来,我们通过提取EIS中与退化相关的显著特征来理解该模型:图1C显示了EIS-Capacity GPR模型的自动相关性确定(ARD)重要性权重。有趣的是,该模型发现,在0.02赫兹-20千赫范围内的120种可能性中,只有两种显著频率足以估计容量;在补充图3中,我们显示在25°C的循环数上,选定的EIS特征与奈奎斯特曲线图中的循环号有很强的线性变化。选定的17.80和2.16赫兹的频率位于低频区域,这表明是界面属性的变化导致了这些电池的退化;这与以前的工作35中获得的结果是一致的,但我们演示了机器学习框架如何帮助解释高维光谱。当在电池管理系统中实施时,我们基于EIS的方法有可能使最终用户在没有充分充放电的情况下知道电池的容量。
为了验证所提出的PINN的优越性,我们进行了小样本实验和转移实验。在转移实验过程中,wefrozeGðÞ和微调dFð在具有不同化学成分的数据集上。实验结果表明,所提出的PINN框架可以有效地捕捉电池退化的动态。我们的研究将电池退化的知识与神经网络相结合,取得了有前景的结果。本研究强调了基于物理信息的神经网络在电池退化建模和SOH估计中的前景(更多方法细节可以在"方法"部分找到)。
3.2 数据生成
为了涵盖不同的电池类型和化学成分,我们使用了来自4个不同大规模数据集的310,705个电池样本进行验证。第一个数据集来自我们为本研究进行的电池退化实验,其他三个数据集是来自朱等人4、Yeet等人和Severson等人的众所周知的公开数据集。为方便起见,我们将这四个数据集称为XJTU电池数据集、TJU数据集、HUST数据集和MIT数据集。表1给出了这四个数据集的基本信息。
表1

我们在这项研究中开发了一个电池退化实验,如图S1所示。在室温下,在6种充电/放电协议下,共有55个利申制造的电池(LiNi0.5Co0.2Mn0.3O2,标称容量2000 mAh,标称电压3.6 V,充电和放电的截止电压分别为4.2 V和2.5 V)循环至故障。这些协议包括固定充电和放电、不同周期固定电流的随机放电、随机行走以及地球同步轨道(GEO)卫星的充电和放电策略。我们使用批次1到批次6分别表示6种充电/放电方案。退化轨迹如图2所示。有关我们的数据集的更多细节可在补充说明1中找到。

图2
TJU数据集包含三种类型的电池:NCA电池(标称容量为3500mAH,截止电压为2.65-4.2V)、NCM电池(标称容量为3500mAH,截止电压为2.5-4.2V)和NCM+NCA电池(标称容量为2500mAH,截止电压为2.5-4.2V)。这些电池在不同温度和不同充电电流速率的温控室中循环。候选温度设置包括25、35和45°C。当前的温度范围为0.25摄氏度到4摄氏度。我们使用批次1、批次2和批次3分别表示NCA、NCM和NCM+NCA电池。
HUST数据集包含77个不同多级放电方案下的77个LFP/石墨电池的数据。这些电池由A123(APR18650M1A)制造,标称容量为1100mAh,标称电压为3.3V。它们在30°C的温度下循环,充电方案相同,但放电方案不同,直到出现故障。
麻省理工学院数据集中的电池与HUST数据集中的电池具有相同的类型和化学成分。然而,与HUST数据集的实验设置不同,MIT数据集考虑了多个快速充电策略和一个放电策略。具体来说,它们在一步或两步快速充电策略的快速充电实验下循环,并在4℃下放电。实验温度为30℃。
3.3 特征提取
稳健特征通常可以提高SOH估计的性能。然而,如何提取具有一般性和健壮性的特征是一个值得研究的问题。在现有的研究中,针对特定数据集和充放电协议提出了各种特征提取方法,但没有充分考虑特征的泛化。关于不同电池类型或充放电协议的通用特征提取方法的研究很少。为了提取更稳健和更具泛化能力的特征,我们提出了一种通过观察和探索多个数据集来从短周期充电电压曲线和电流曲线中提取特征的方法。毫无疑问,电池的放电过程是用户特定的。相比之下,充电过程是必要的,更固定和规则,电池充满电的可能性相对较高。我们发现,大多数数据集都包含恒流和恒压(CC-CV)充电模式。对于我们使用的四个公共数据集,无论电池使用什么策略放电,或者是否完全放电,最终都会在充电时充满电。
因此,我们选择了电池充满之前的一段短时间的数据来提取特征,如图1B所示。将电池的充电截止电压定义为Vend,并选择其值在[Vend−0.2,Vend]V内的电压数据。对于电流数据,我们选择恒压充电过程中电流在0.5A到0.1A之间的数据。无论电池是否完全放电,只要电池充满电,电压范围和电流范围始终存在。
所选电流和电压曲线的平均值、标准差、峰度、偏度、充电时间、累积电荷、曲线斜率和曲线熵(这些特征用数字表示分别为1-16。详情见补充说明2)。图1中给出了从XJTU数据集Batch1中提取的特征的图示3A。此外,我们从4个数据集的387个电池中分别提取了特征,并计算了每个数据集中特征与SOH之间的Pearson相关系数,如图3B所示。

图3
根据实验现象和图2的分析,提出了一种新的实验方法。3B,我们给出了一个自然猜想:每个特征与SOH之间的相关系数的大小与电池的化学成分有关,受充放电协议的影响较小。据我们所知,我们是第一个关注这一现象的人。从表1可以看出,XJTU数据集和TJU数据集都是LiNiCo-x型电池。尽管它们具有完全不同的额定容量和充放电协议,但从我们选择的范围中提取的特征非常相似。例如,特征11-16与SOH之间存在很强的负相关。特征9和特征10与SOH有很强的正相关。相比之下,麻省理工学院的数据集和华中科技大学的数据集都是LiFePO4电池。特征11-16与SOH呈弱正相关,特征9、10与SOH呈负相关。此外,后两个数据集的特征3-6和8与SOH呈显著正相关。
3.4 SOH估算
提取的16个特征和时间(周期)作为PINN的输入来估计SOH。为了减小特征幅值差异对模型的影响,使模型训练更加稳定,对特征进行最小-最大归一化。也就是说,所有要素都缩放到范围[−1,1]。图4A给出了建议的Pinn在4个数据集上的SOH估计结果(每个数据集中的测试电池数量可以在表2中找到)。

图4
表2

为了展示所提出的Pinn、具有相同结构和参数的多层感知器(MLP)和具有相似结构和参数的卷积神经网络(CNN)的先进性参数数量被用作比较方法。MLP和CNN的详细信息见补充说明3。对于每个数据集,我们将训练电池、验证电池和测试电池按大约6:2:2的比例进行划分。每个数据集中的测试电池数量见表S。为确保公平,测试电池的数量均匀分布在整个数据集中,如表S3-S6所示。表2显示了3个模型在4个数据集上的测试结果(只给出了每个数据集的平均测试误差,每个电池的测试结果可以在表S3-S6中查看)。从表中可以看出,我们的方法在大多数情况下具有最小的估计误差。PINN在4个数据集上的平均MAPE分别为0.85%、1.21%、0.65%和0.78%,而MLP的平均MAPE分别为2.60%、1.72%、0.83%和0.83%。值得注意的是,它们在推理过程中具有相同的参数数量和模型结构。
此外,为了反映模型的稳定性,每个模型在每个数据集上的训练和测试过程重复10次。测试结果如图4B所示。从图中可以看出,我们建议的Pinn在所有任务和所有指标上都是最稳定的。XJTU电池数据集每一批的样本量都很小,导致MLP和CNN的波动很大。相比之下,我们的方法更稳定,产生的测试误差更小。对于HUST数据集和MIT数据集,它们包含大量的训练样本,因此MLP和CNN的波动变小,测试误差变小。然而,我们提出的Pinn仍然是表现最好的模型。
3.5 用小样本进行实验
我们提出的PINN对电池退化动力学进行建模,考虑了更多的物理规律,因此可以使用更少的数据进行训练。与纯数据驱动的方法相比,在训练数据量较小的情况下,我们的方法可以显示出更大的优势。为了验证上述推论,在XJTU数据集和华中科技大学数据集上进行了小样本实验。
表3

具体来说,我们使用1个电池数据训练3个模型,并对多个电池进行测试(测试集与2.4中相同),并记录测试结果。此外,我们逐步增加训练电池的数量,并观察每个模型在测试集上的性能变化。表3和图5给出了结果(XJTU数据集只给出了批次1的结果,更多的结果可以在表S7和图7中找到)。S5)。

图5
可以看出,我们提出的PINN在所有任务和设置中都获得了最好的结果。随着训练电池数量的增加,三种模型的测试误差都有所减小。这是一个公认的事实:当训练数据很小时,增加训练样本的数量可以改善模型的性能。在图4B中,由于HUST数据集中的大量样本,CNN和MLP的性能与我们的Pinn相当。这也说明了当模型的结构或参数数目相同或相似时,给出足够的训练样本,模型的性能差别不大。然而,这一点从图2中可以明显看出。5当训练样本数较小时,我们的方法具有明显的优势。此外,值得注意的是,我们的Pinn只用1个电池训练的性能与MLP和CNN用3-4个电池训练的性能相当,这表明了我们的Pinn在小样本场景中的优越性。
4 讨论
准确的SOH评估有助于锂离子电池的健康管理和维护决策。现有的SOH估计方法需要针对不同的数据集提取不同的特征,模型的性能波动较大。在这项工作中,我们提出了一种用于电池SOH估计的通用Pinn。具体地说,我们提出了一种通用的特征提取方法,用于从电池充满之前的短时间数据中提取统计特征,这些数据包括在恒流和恒压模式下充电的电池中。然后,使用Pinn对电池退化动态进行建模,并以提取的特征作为输入估计电池的SOH。
为了验证我们的方法,我们进行了电池老化实验,并开发了一个包含55块电池的数据集。最后,我们用来自4个大规模数据集的不同化学成分和充放电协议的387块电池对我们的方法进行了验证。实验结果验证了该方法的有效性和可行性。此外,我们进行了小样本实验和迁移实验,证明了考虑物理知识有助于数据驱动模型更快、更好地从数据中学习。我们的研究强调了物理信息机器学习在电池退化建模和SOH估计中的前景。它可以利用现有的实验数据和少量的新数据来促进下一代电池电池管理系统的快速开发。
电池退化建模和SOH估计是电池健康管理领域的研究热点。随着电池老化,会发生各种界面退化过程,以及锂库存和活性物质的损失,导致离子和电子转移以及插层反应中的阻力增加,从而导致其充电曲线发生变化。因此,充电曲线包含了关于降解过程的丰富信息。然而,使用充放电曲线来估算电池的SOH可能会陷入信息泄漏的陷阱。Geslin等人指出,充放电协议、使用条件等不一致可能会导致信息泄露,这是一个可能被学者忽视的严重问题。他们认为,固定的CC-CV模式可以缓解信息泄露的问题。因此,在执行SOH估计任务时,建议尽量避免纳入与内部电池质量、制造可变性和使用条件相关的因素。在我们的研究中,特征是从电池充满之前的CC-CV阶段的一小段数据中提取的,这与电池的使用条件无关。这保证了我们提取的特征的实用性和通用性,同时避免了由于计费协议不一致或电池使用条件不一致而导致的信息泄漏问题。在训练和测试阶段,我们使用电池A的数据来训练模型,并在电池B上对其进行测试;而不是用电池A的早期数据来训练模型,然后用后来的数据来测试它,避免了从训练集到测试集的信息泄漏。
在建立SOH估计模型时,提出了一种用于电池SOH估计的PINN。物理信息神经网络有望成为利用人工智能解决实际工程问题的有效途径。通过融合传统物理模型和神经网络模型,它可以更准确地捕捉电池系统复杂的动态行为,从而有助于更可靠和精确的状态估计。然而,这个新兴的领域仍然需要学者们进一步的探索。
在Aykol等人提出的框架内,混合方法将成为长期的主导方法,该方法利用物理方程来约束神经网络或将物理方程集成到神经网络中。这类混合方法有可能将基于物理的模型的因果关系和外推能力与神经网络的速度、灵活性和高维能力结合起来。然而,这些方法的局限性在于电池的物理模型(如P2D模型)复杂,包含众多参数,而且电池的内部参数很难收集。目前还没有令人满意的方法来无缝集成物理模型和神经网络。本文提出的PINN模型是从经验退化和状态空间方程的角度建模的,只是对这种混合方法的一种探索,并对进一步的研究起到了催化剂的作用。此外,我们只考虑从易于访问的电流和电压数据中提取特征。随着更多的数据和内部变量的出现,可以考虑更复杂的电化学模型。在现有数据和计算资源的限制下,电池控制方程和用于健康管理的神经网络的最佳集成仍然成熟,有待进一步探索。
5 代码、数据整理如下:

点击下方卡片获取代码!