Applied Energy期刊论文学习——基于物理信息神经网络的锂离子电池健康状态、剩余使用寿命及短期退化路径协同估计

Hi,大家好,我是半亩花海。现对领域内一篇SCI一区TOP期刊论文进行阅读,文献记录如下。本文提出了一种基于物理信息神经网络(PINN)的锂离子电池健康管理新方法,实现了健康状态(SOH)、剩余寿命(RUL)和短期退化路径(S-DP)的协同估计。通过定制门控模型(CGC)整合多任务学习框架,结合简化Transformer时序特征提取和物理约束,显著提升了模型性能。实验结果表明,该方法在三种电池材料上均表现优异,SOH估计MAPE低至0.75%,且在迁移学习和小样本场景下展现出色泛化能力。研究为电池健康管理提供了兼具高精度和物理可解释性的解决方案,但低温环境适应性和计算成本优化仍需进一步探索。


目录

一、研究背景与动机

[1.1 研究背景](#1.1 研究背景)

[1.2 现有方法的局限性](#1.2 现有方法的局限性)

二、研究目标与创新贡献

[2.1 研究目标](#2.1 研究目标)

[2.2 核心创新点](#2.2 核心创新点)

三、数据集与特征工程

[3.1 数据集描述](#3.1 数据集描述)

[3.2 特征提取方法](#3.2 特征提取方法)

[3.3 特征相关性分析](#3.3 特征相关性分析)

四、方法论(模型架构)

[4.1 整体框架](#4.1 整体框架)

[4.2 定制门控控制模型(CGC)](#4.2 定制门控控制模型(CGC))

[4.3 简化时序Transformer模型](#4.3 简化时序Transformer模型)

[4.4 物理信息神经网络(PINN)](#4.4 物理信息神经网络(PINN))

[4.5 损失函数与权重调优](#4.5 损失函数与权重调优)

[4.6 超参数配置](#4.6 超参数配置)

五、实验结果与分析

[5.1 实验设置](#5.1 实验设置)

[5.2 SOH、S-DP、RUL估计结果](#5.2 SOH、S-DP、RUL估计结果)

[5.3 训练样本量敏感性分析(小样本)](#5.3 训练样本量敏感性分析(小样本))

[5.6 迁移学习实验](#5.6 迁移学习实验)

六、结论与展望

[6.1 主要结论](#6.1 主要结论)

[6.2 工业部署挑战与未来方向](#6.2 工业部署挑战与未来方向)


本篇期刊论文的具体信息如下:

项目 内容
论文标题 Physics-informed neural network for co-estimation of state of health, remaining useful life, and short-term degradation path in Lithium-ion batteries
作者 Li Yang, Mingjian He*, Yatao Ren*, Baohai Gao, Hong Qi
单位 哈尔滨工业大学能源科学与工程学院;工业和信息化部航空航天热物理重点实验室
期刊 Applied Energy
发表时间 2025年7月10日在线发表
DOI https://doi.org/10.1016/j.apenergy.2025.126427
研究类型 数据驱动+物理信息的混合方法
关键词 锂离子电池;SOH;RUL;物理信息神经网络;多任务

一、研究背景与动机

1.1 研究背景

(1)锂离子电池的应用与挑战:

  • 锂离子电池因其环境兼容性好、能量密度高、效率优异,广泛应用于电动汽车、消费电子和储能系统
  • 随着使用时间增加,电池会出现锂析出、活性材料损失、结构变化和副反应增加等问题
  • 这些变化表现为宏观性能退化:容量衰减、内阻增加、温度升高
  • 过度充放电会显著加速电池老化过程,增加热失控概率

(2)电池健康管理的核心任务:

任务 定义 作用
SOH估计 健康状态(State of Health),定义为剩余容量与额定容量的比值 反映电池当前状态
DP预测 退化路径(Degradation Path),展示SOH随充放电循环的恶化过程 illustrating电池老化趋势
RUL预测 剩余使用寿命(Remaining Useful Life),直接指示电池可用剩余时间 提前故障预警

(3)SOH阈值警示: 当SOH低于80%时,电池安全风险显著增加,可能导致热失控、泄漏或短路等危险事件。

1.2 现有方法的局限性

(1)模型驱动方法:

  • 经验公式(指数、线性、多项式):简单但参数缺乏直接物理解释,泛化能力有限
  • 等效电路模型:用电阻电容模拟退化过程,简化计算但忽略电池内部动力学原理
  • 电化学模型(如P2D模型):基于物质和能量守恒方程,能清晰解释退化机制,但高度复杂,需要定义大量参数并求解偏微分方程组

(2)数据驱动方法:

  • 优点:网络结构简单、计算效率高
  • 局限:数据稀缺时性能差、跨域迁移能力有限、泛化能力不足、难以捕捉长短期时序依赖关系

(3)物理信息神经网络(PINN):

  • 当前研究主要集中在用物理信息++指导输入空间构建++ 和应用简单数据关系++约束目标函数++
  • 由于电池退化模型的复杂性,使用++电化学偏微分方程++作为物理约束网络的目标函数仍是重大挑战

二、研究目标与创新贡献

2.1 研究目标

开发一种通用电池健康管理模型,能够适应不同电池材料(跨域)、工作环境(不同条件)和多样化(多任务)任务需求,实现SOH估计、RUL预测和短期退化路径(S-DP)预测的协同处理。

2.2 核心创新点

创新点 具体内容 技术价值
创新1 基于定制门控模型 (CGC) 的多任务框架 实现SOH、RUL、S-DP三项任务的同步处理,利用共享和任务特定参数的协同设计
创新2 简化的Transformer模型 全面提取时序和特征信息,克服传统RNN/LSTM的梯度消失/爆炸问题
创新3 利用任务输出的偏导数揭示隐藏物理信息 通过自动微分计算目标估计的偏导数,增强模型泛化能力和可解释性

三、数据集与特征工程

3.1 数据集描述

研究使用了两个公开数据集,共198个电池196,200次循环数据:

数据集 电池类型 额定容量 截止电压 实验温度 电池数量 循环寿命
HUST LiFePO₄(LFP)/石墨 1.1 Ah 2.0-3.6 V 30°C 77 1100-2700循环
TJU-NCA Li₀.₈₆Ni₀.₈₆Co₀.₁₁Al₀.₀₃O₂/石墨 3.5 Ah 2.65-4.2 V 25/35/45°C 66 50-1250循环
TJU-NCM Li₀.₈₄Ni₀.₈₃Co₀.₁₁Mn₀.₀₇O₂/石墨 3.5 Ah 2.5-4.2 V 25/35/45°C 55 50-1250循环

充放电策略差异:

  • HUST数据集:采用多样化多阶段恒流放电策略;充电协议标准化(5C恒流充至80% SOC → 1C恒流充至3.6V → 恒压充至电流降至1/20C)
  • TJU数据集:充电为恒流(0.25-1C)至4.2V截止电压后恒压充;放电为1C恒流至截止电压

3.2 特征提取方法

(1)特征提取区域: 围绕恒压充电阶段前后的电压和电流曲线段(如图1(c)所示)

(2)提取的20个统计特征包括:

  • 循环次数(cycle)
  • 累积电荷量(sum)
  • 均值(mean)、标准差(std)
  • 持续时间(len)
  • 峰度(ku)、偏度(sk)
  • 曲线斜率(grad)、曲线熵(entropy)
  • 跨时间维度特征:与第10次循环曲线的差值的均值和标准差(如mean_V_10)

(3)特征设计理由:

  • 充电过程通常遵循明确策略,比放电过程更具一致性和普适性
  • 引入当前循环次数提供时间上下文,反映电池退化阶段
  • 跨时间维度特征捕捉跨时间信息,增强特征表达能力
  • 温度和充放电策略不作为输入特征,但隐含嵌入在数据分布中

3.3 特征相关性分析

关键发现(图2):

  • 电池化学成分对特性起关键作用,不同成分的特征与目标值相关性显著不同
  • SOH与特征的相关性强于RUL:SOH估计是短期任务,RUL预测是长期任务
  • NCA和NCM电池的RUL相关系数相对较低,可归因于数据分散性和退化模式多样性

四、方法论(模型架构)

4.1 整体框架

模型整合了定制门控控制模型(CGC)物理信息神经网络(PINN),整体架构如图3所示:

通俗点,可以以下面这张图作为理解:

4.2 定制门控控制模型(CGC)

(1)设计动机: 解决多任务学习中的负迁移跷跷板现象

  • 负迁移:任务间相关性弱或矛盾时,共享信息无效甚至有害
  • 跷跷板现象:任务竞争资源或目标冲突,一个任务改进以牺牲其他任务为代价

(2)CGC三组件:

  • 底部专家模块:多个专家网络(超参数)
  • 中间门控模块:选择性加权和组合专家输出
  • 顶部塔式模块:各任务的输出网络

(3)数学表达(以SOH任务为例):

(4)实现配置:

  • 4个专家模块(1个SOH专家、2个共享专家、1个DP专家、1个RUL专家)
  • 共享专家模块含2个全连接神经网络,其余3个各含1个
  • 所有专家网络:2隐藏层,每层25神经元,ReLU激活
  • 输入20维,输出8维学习特征向量

4.3 简化时序Transformer模型

(1)模型改进要点:

  • 专注于增强Transformer编码器
  • 修改输入编码和输出映射层以适应时序预测
  • 不包含解码器结构、教师强制机制、训练与推理的输入逻辑差异

(2)六个组件结构(图4a):

组件 功能 关键技术
位置编码 编码时序和特征维度信息 正弦/余弦函数
多头注意力 捕捉时间和特征维度的复杂关联 缩放点积自注意力
残差网络 避免梯度消失,构建更深网络 跳跃连接
层归一化 稳定数值变化,增强鲁棒性 特征维度归一化
前馈神经网络 增强非线性映射能力 两线性层+激活函数
映射网络 转换为最终输出 MLP

(3)位置编码公式:

(4)多头注意力输出:

(5)任务分配:

  • SOH估计、RUL预测、PINN:简化Transformer模型
  • 退化路径预测:Bi-LSTM(编码器-解码器结构更适合迭代预测)

4.4 物理信息神经网络(PINN)

(1)核心思想: 通过计算多任务模型输出的偏导数,构建深度隐藏物理模型,与数据驱动方法结合

(2)物理模型假设:

①容量模型假设:,其中 t 表示时间,x 表示影响退化的因素(如温度、充放电策略);

②退化模型推导:

③隐式物理方程:

(3)关键设计选择:

  • 仅使用SOH和RUL计算偏导数作为PINN输入(S-DP数据量大,加入会提高计算成本)
  • 排除目标输出的时间导数以防止信息泄露
  • PINN仅接收输入特征、任务输出及其空间(特征-wise)偏导数

4.5 损失函数与权重调优

(1)自适应权重方法: 采用不确定性加权(Uncertainty Weighting) 基于贝叶斯模型的同方差不确定性原理

(2)四项损失函数:

损失类型 公式
SOH损失
RUL损失
DP损失
物理损失

(3)总损失:

(4)评估指标:

  • MSE(均方误差,用于模型训练)
  • RMSE(均方根误差)
  • MAPE(平均绝对百分比误差)

4.6 超参数配置

模块 参数 配置值
CGC 专家数量(SOH/共享/DP/RUL) 1/2/1/1
全连接层数 2
输入/输出维度 20/8
每层神经元 25
SOH/RUL塔 编码器层数 3
注意力头数 2
前馈层宽度 50
DP塔 层数 1
神经元 20
网络类型 Bi-LSTM
PINN 编码器层数 3
层数 2
训练配置 批次大小 256
优化器 Adam
最大epoch 1000
学习率 0.01
调度策略 余弦退火
正则化 Dropout

五、实验结果与分析

5.1 实验设置

  • 数据划分: 训练集70% : 验证集15% : 测试集15%
  • 测试/验证集: 从不同实验测量批次均匀采样
  • 数据预处理: Min-Max归一化(min/max来自训练集,防止数据泄露)
  • 输入: 30次充电循环的历史数据
  • 独立运行: 每组实验10次独立运行取平均
  • 硬件: Intel i5-13600KF CPU, 64GB RAM, NVIDIA RTX 4060 Ti GPU

5.2 SOH、S-DP、RUL估计结果

(1)表3 性能对比:

(2)SOH估计结果:

  • 在三种材料数据集上均优于对比模型
  • NCM数据集表现最佳(MAPE 0.75%)
  • 与Wang et al.[48]对比:LFP相当,NCA和NCM显著提升

计算效率:

  • 训练时间:MLP 2.1min, Bi-LSTM 5.9min, Transformer 4.3min, 本文模型 21.2min
  • 推理延迟:GPU 0.069ms, CPU 0.114ms(与Bi-LSTM相当)
  • 训练内存:GPU 139.2MB, CPU 252.8MB

(3)短期退化路径(S-DP)预测结果:

①预测长度设置:

  • LFP数据集:600循环
  • NCA/NCM数据集:150循环

②误差分布: 误差主要聚集在0.01左右(图5c,g,k)

③设计理由: 仅关注短期预测以确保准确性和可靠性,长期预测会随时间逐渐偏离真实值

(4)RUL预测结果:

  • 电池生命周期早期预测更准确,后期较差
  • NCA/NCM后期预测性能较差的原因:温度变化大、一致条件下样本少、非线性退化行为强
  • 与特征相关性分析一致(图2):RUL与特征相关性较弱

5.3 训练样本量敏感性分析(小样本)

(1)实验设计: 使用LFP数据集,系统评估不同训练样本量下的模型性能演化

(2)关键发现(图6):

  • 所有模型性能随训练样本减少而下降(符合预期)
  • 本文模型在不同数据规模下均保持显著竞争优势
  • 在极端小样本场景(仅5或15个电池数据)下,鲁棒性明显优于对比模型
  • 充分验证了方法在小样本学习场景中的技术先进性

5.6 迁移学习实验

(1)框架设计(图7):

  • 源域(Group A)训练获得先验知识 → 目标域(Group B)微调
  • 参数冻结策略: 固定物理特征提取层网络权重
  • 微调学习率: 1e-4量级自适应优化剩余可训练参数

(2)表4 迁移学习结果(RMSE评估):

  • 引入迁移学习机制后,各任务误差显著降低
  • 目标域仅需2个电池数据进行微调
  • 强烈验证了基于物理信息共享跨材料电池健康管理迁移策略有效性

六、结论与展望

6.1 主要结论

  1. 提出了一种新颖的多任务健康管理方法,整合多任务处理框架与物理信息神经网络
  2. 核心优势: 利用共享和独立参数实现任务协同,同时利用PINN挖掘数据中的潜在退化物理
  3. 特征提取策略: 从恒压充电阶段前后的电压电流数据段提取特征,具有广泛的适用性
  4. 性能表现:
    • SOH估计MAPE:0.75%
    • S-DP预测平均偏差:约0.01
    • RUL预测MAE:104循环
  5. 泛化能力: 小样本学习和迁移学习实验验证了模型的强泛化能力和实际适用性

6.2 工业部署挑战与未来方向

挑战 解决方向
低温环境 评估模型在低温条件下的鲁棒性和适应性
计算成本 云端训练+本地推理结合,平衡计算成本与响应速度
物理解释性 整合微观电化学老化机制,提高物理一致性
物理约束 探索更鲁棒的物理信息约束(符号约束、物理引导先验、解耦单调性损失)
相关推荐
有Li19 小时前
CIA-net:用于多模态MRI卵巢肿瘤分割的跨模态交互与聚合网络/文献速递-大模型与图像分割在医疗影像中应用
论文阅读·人工智能·深度学习·计算机视觉·文献
敲代码的猴先生21 小时前
论文分享 | TwinBreak:基于孪生提示词的大模型安全对齐越狱攻击
论文阅读·人工智能·安全·语言模型
资深web全栈开发1 天前
迁移学习:站在巨人的肩膀上
人工智能·机器学习·迁移学习
传说故事1 天前
【论文阅读】DreamZero:World Action Models are Zero-shot Policies
论文阅读·人工智能·机器人·具身智能·wa
檐下翻书1731 天前
PC流程图模板大全 中文定制化满足不同行业需求
论文阅读·信息可视化·数据挖掘·数据分析·流程图
on_pluto_1 天前
论文Heterogeneous Graph Transformer(HGT)阅读笔记
论文阅读·人工智能·笔记·深度学习·学习方法
STLearner1 天前
ICLR 2026 | 时空数据(Spatial-Temporal)论文总结[上](交通与城市科学:交通预测,轨迹挖掘,自动驾驶等)
大数据·论文阅读·人工智能·深度学习·机器学习·数据挖掘·自动驾驶
c0d1ng1 天前
论文阅读(三月第二周)
论文阅读
Chunyyyen1 天前
【第三十五周】论文阅读01
论文阅读