【论文阅读31】-CNN-LSTM（2025）-电池健康预测

本文提出了一个基于多模态充电数据和残差神经网络的 SOH 估算框架，利用真实 EV 车队大数据验证了方法的有效性，并实现开源发布，推动了电池健康管理从实验室走向实际应用。

$1\]Liu H, Li C, Hu X, et al. Multi-modal framework for battery state of health evaluation using open-source electric vehicle data\[J\]. Nature Communications, 2025, 16(1): 1137. 基于开源电动车数据的多模态电池健康状态评估框架$

作者信息：

Hongao Liu¹²⁵，Chang Li¹⁵，Xiaosong Hu²，Jinwen Li²，Kai Zhang³，Yang Xie¹，Ranglei Wu¹，Ziyou Song⁴

作者单位：

智能汽车安全技术国家重点实验室，重庆，中国
重庆大学机械与运载工程学院，重庆，中国
重庆大学能源与动力工程学院，重庆，中国
新加坡国立大学机械工程系，新加坡
共同第一作者：Hongao Liu，Chang Li

通讯作者邮箱 ：
xiaosonghu@ieee.org；ziyou@nus.edu.sg

期刊：Nature Communications（2025）

📖 本文主要内容概述：

这篇论文围绕电动汽车（EV）动力电池的 SOH（State of Health，健康状态）估计 问题，提出了一个基于多模态数据（multimodal data）和深度学习的 SOH 估算框架，并且利用了真实车队（300 辆 EV、3 年数据）的大规模实测数据来验证方法效果。

📌 核心亮点：

1️⃣ 提出多模态健康指标（health indicators, HIs）：

利用充电过程中的多种传感器数据（如电压、电流、温度、充电时间等）。
从不同模态提取能有效表征电池老化特征的健康指标（HIs）。
这些指标不依赖实验室测试，可通过车辆日常充电数据提取。

2️⃣ 构建残差网络（ResNet）深度学习模型：

设计了一个基于残差结构的神经网络架构，用于处理多模态 HI 数据。
网络自动学习 HIs 与电池 SOH 之间的非线性映射关系。
优化了模型训练策略，采用预热+指数衰减学习率的方法提高性能。

3️⃣ 大规模真实 EV 现场数据验证：

数据来自 300 辆 EV，3 年现场运行充电数据，包含数万个充电周期。
验证了多模态 HIs 的可解释性和 SOH 估算框架的准确性、稳定性和普适性。

4️⃣ 开源数据与代码：

论文将数据和代码全部开源，便于同行复现和继续研究。

📊 实际意义：

过去 SOH 估算方法依赖实验室测试，难以应用于真实车队。
本方法只需常规充电数据，能够实时、无侵入、低成本地监测 EV 电池健康。
对车联网、车队运维、电池管理系统（BMS）有很强实用价值。

摘要电池健康状态（State of Health, SOH）的准确、实用且稳健的评估，对于电动汽车的高效与可靠运行至关重要。然而，大规模、高质量实车运行数据的有限性，阻碍了电池管理系统在健康状态评估、寿命预测以及故障检测等多种应用场景下的发展。为探究制约实际车辆中电池管理系统性能的潜在因素，本文基于 300 辆不同类型电动汽车为期三年的运行数据，系统分析了实车数据与实验室电池测试数据之间的差异及其对健康状态评估的影响。

此外，本文提出了一种基于深度学习的多模态框架，能够高效利用车辆历史数据，实现电池健康状态的高效、准确且经济的估算。所提出的方法在多传感器系统中的状态估计与故障诊断等多种应用场景中展现出良好的应用潜力。与此同时，本文还将上述电动汽车运行数据向公众开放，旨在促进面向实际车辆的高效、可靠电池管理系统的开发与研究。

引言

锂离子电池凭借其高能量密度和长使用寿命，已成为一种极具前景的能源技术，特别是在日益普及的电动汽车（EV）领域。然而，锂电池的电化学机理不可避免地导致电池老化，表现为电池容量衰减和内阻增加。锂离子电池的老化主要源于固态电解质界面（SEI）膜的增长、活性物质损耗以及锂枝晶的析出等因素。在电动汽车中，电池系统通常由大量单体电池组成，由于"木桶效应"，单体电池间的不一致性会加速系统整体性能的衰退。

电池健康状态（State of Health, SOH）是衡量电池性能衰退程度的重要指标，通常定义为当前内阻相对于新电池内阻的比值，或当前容量与初始容量的比值。SOH 的准确估算对于下一代电池管理系统（BMS）的开发至关重要，有助于提升电动汽车的安全性与性能。随着电池老化，可用容量下降，直接限制了电动汽车单次充电的续航里程。在实际应用中，当 SOH 降至 80% 或 70% 时，电池即被认定达到使用寿命终点。在质保期内，制造商需承担电池维修或更换责任。因此，SOH 的高效、准确估算成为电动汽车制造商与用户关注的重要研究课题。

实现电池 SOH 估算和寿命预测，需依赖高质量、细粒度且信息丰富的数据。电池老化测试周期长，需经过反复充电、静置和放电过程诱发退化，通常需要上百次充放电循环才能准确描绘电池性能衰退模式。因此，开源电池数据集的可用性对于推进电池研究至关重要。当前，已有诸多公开电池测试数据集极大地促进了该领域进展。例如，CALCE 团队提供了涵盖 18650 圆柱电池、A123 系统和 CS2 电池在多种负载和温度下的循环测试数据；牛津大学研究者也开放了数个电池退化数据集；Zhang 等汇编了包含 20,000 余组电化学阻抗谱（EIS）数据的数据集，覆盖不同 SOH、SOC 和温度条件；Severson 等发布了 124 颗商业锂离子电池在快速变化工况下的循环测试数据；Li 等提供了 48 颗在相同工况下老化的电池时序数据集。此外，Lu 和 Weng 等学者也整理了多种开源数据集，美国能源部（DOE）下属的电池数据库亦持续更新，为研究人员提供多样化工况下的电池老化测试数据。

除实验室数据外，实车工况数据对于推进电池管理研究也至关重要。一方面，锂电池作为非线性、时变系统，受限于实验环境，实验室测试仅能覆盖电池特性的有限区间，难以全面反映真实工况下的复杂表现，从而导致基于实验数据开发的 BMS 算法在实际应用中存在外推误差。另一方面，实验室测试通常针对单体电池，而电动汽车电池系统则是由大量串并联电池组成，且存在显著的单体间差异、复杂信号源及多因素耦合现象。因此，基于实车数据的研究对于支撑电池管理系统开发至关重要。

当前，学术界、车企及第三方平台已开始合作，逐步开放电动汽车实车数据。Pozzato 等采集了一辆电动汽车一年以上的运行数据，基于该数据推导了与温度变化紧密相关的性能指标，丰富了环境因素对电池健康状态影响机制的认识。Zhang 等基于 347 辆电动汽车的大规模电池数据，探索了深度学习方法在电池故障检测中的可行性。Deng 等提供了 20 辆电动汽车 25 个月以上的充电记录。这些公开数据集覆盖了健康评估、寿命预测、故障检测等多个方向，有效支撑了电池管理相关研究。

在数据基础之外，SOH 估算方法也持续发展。近年来，基于数据驱动的机器学习方法在大规模 SOH 估算问题上展现出巨大潜力。SOH 估算模型的输入特征可来自多种来源，如电化学阻抗谱（EIS）分析、增量容量/微分电压（IC/DV）分析、微分热伏安（DTV）分析及车辆运行状态信号等。相应地，研究者提出了多种机器学习算法，如高斯过程回归（GPR）、前馈神经网络（FNN）、卷积神经网络（CNN）、循环神经网络（RNN）及长短期记忆网络（LSTM）等。基于深度神经网络的模型可实现自动特征提取，有效提升 SOH 估算效率与精度。例如，Jiang 等提出基于极限学习机（ELM）的方法，并在 NASA、CALCE 和 MIT 数据集上验证了其性能，但由于缺少实车数据，该方法尚未在实际车辆环境下测试。此外，现有模型多基于一组点特征作为输入，忽略了实车电池模块/电池包复杂特性，如单体差异性等。

Wang 等提出了物理启发神经网络，验证了充电过程中恒流-恒压阶段的电流和电压特征对 SOH 估算的有效性。但实际电动汽车充电通常缺少恒压阶段，且恒流阶段也存在电流波动与测量噪声等不确定性。Pozzato 等基于实车数据，提取了 3 个易于计算且与性能紧密相关的指标，尽管分析详尽，但未给出针对真实场景的 SOH 估算方法。Qi 等从两辆电动汽车提取带标签的容量值和多组健康特征，构建了 CNN-BiGRU 模型，探索基于实车数据的 SOH 估算方法，但依旧采用传统点特征，未充分考虑多模态信息，且受限于样本量，缺少在大规模、多驾驶习惯车辆群体上的泛化性验证。

值得注意的是，机器学习方法应用于真实场景时，算法在大规模车辆群体间缺乏泛化能力是关键难题。不同工况环境下的特征分布差异可能显著影响模型性能，现有研究尚未充分验证机器学习方法在多样化条件下是否具备稳定可靠的电池监测能力，这成为当前亟待解决的重要问题。

总体而言，常规机器学习方法（如 FNN）擅长处理基于专家经验选取的点特征，CNN 适用于二维图像特征提取，LSTM 则广泛应用于一维序列特征提取与预测任务，如 SOC 估算。LSTM 依靠门控机制，能捕捉长期依赖关系并保留有用信息，缓解梯度消失问题，提高模型泛化能力。然而，门控机制也导致参数数量增加，带来过拟合、推理速度慢及梯度爆炸等问题，简单模型难以有效处理多源复杂信息。

当前针对实际电动汽车运行工况下 SOH 估算的研究相对较少，受限于实车数据体量与质量，现有方法性能也受限于单模态输入。为应对上述挑战，本文基于 300 辆不同类型电动汽车三年历史监测数据，分析了真实工况电动汽车的运行特性，系统总结了理论方法向工程应用迁移过程中的瓶颈因素，明确影响算法精度的关键要素，并提出一种多模态深度学习框架 ，基于运行数据实现电动汽车电池 SOH 的高效、精准估算。结果表明，该方法具备显著潜力，有望变革现有电池测试模式，降低测试时间、成本和能耗，促进智能 BMS 和云端监测平台的开发，提升电动汽车使用效率。

此外，本文还将这批高质量大规模实车数据对外开放，包含完整的驾驶与充电记录，为电动汽车使用行为研究及电池退化预测提供坚实的数据基础，助力电池管理算法持续优化。

结果

实际电动汽车电池数据披露与分析

电池的全充放电测试对于设计准确的 SOH（State of Health，健康状态）估算方法至关重要。在该测试中，通过对充放电电流随时间积分获得电池的最大可用容量。然而，在电动汽车（EV）运行过程中，通常不会发生完整的充放电过程。相反，EV 的台架测试耗时且能耗较高（详见补充资料注释1中关于离线 SOH 基准测试的成本说明），使得该方法在大规模部署及周期性、频繁 SOH 跟踪估算中的实用性受限。因此，一种更具前景的方法是基于电池管理系统（BMS）记录的、EV 实际运行过程中的历史大数据来估算 SOH。

本研究基于 300 辆搭载三元锂离子电池（NCM）的电动汽车，获取了 3 年运行数据。电池包额定容量为 155 Ah，由 96 节电芯串联组成。这批 EV 车队的运行工况及使用强度差异显著。具体而言，行驶数据涵盖了随机的充放电模式，包括加速过程中的大电流放电、匀速行驶时的小电流放电以及动能回收制动过程中的临时充电。放电情况完全由驾驶员需求和车辆行驶状态决定，具有天然的随机性。

充电数据则包含两种场景：一种是多阶段恒流快充，充电倍率可达 0.8 C；另一种是约 0.15 C 的慢速充电。在快充条件下，充电倍率受电池包温度、最高单体电压以及充电设备功率限制的共同控制。与实验室数据不同，实际运行数据缺少静置时段记录，因为车辆关闭后 BMS 停止采集数据。原始数据包括时间戳、累计里程、SOC、总电流、电池包电压、最高/最低单体电压以及各单体电压，采样频率为 0.1 Hz。原始现场数据的详细信息见补充资料注释2。

图 2a 展示了车辆累计行驶里程分布，大部分车辆已行驶超过 10000 km，服役天数超 800 天（见图 2b）。经过长时间运行和累计行驶，电池性能出现明显退化，为电池衰退机理研究提供了丰富样本。图 2c 展示了该车队多样的驾驶强度，图 2d 显示了平均行驶速度。相较于实验室稳定的循环工况和测试环境，不同用户的驾驶风格与道路条件导致车辆间存在显著的老化差异，这为研究人员提供了广泛、无偏的样本集，可用于检验算法的适用性与鲁棒性。

关于充电行为，如图 2e 和 2f 所示，大多数驾驶员倾向于在 SOC 低于 50% 时启动充电，并持续充至满电。通过数据清洗，采用安时积分与开路电压（OCV）-SOC 修正的方法，获得了这些车辆的 SOH 标签，图 2h 展示了 SOH 标签的分布情况，通过三次样条拟合曲线可观察到容量衰减趋势。容量标签计算方法详见"方法"章节及补充资料注释3。

实际工况下 SOH 估算面临多重挑战，如车辆运行状态复杂且不可控、BMS 状态估算精度有限以及数据质量欠佳。我们随机选取一辆车作为示例，分析并揭示了现场数据与实验室数据的差异，并探讨了这些差异对 SOH 估算及其他电池管理任务的影响。

复杂的实际工况

EV 充放电负载几乎完全取决于用户决策，大多数用户不会完全耗尽电池电量，因此在实际使用中无法通过完整放电---充电的方式获取容量标签。图 2g 显示了用户在一段时间内的充电 SOC 区间及对应的可计算部分充电容量。由于缺乏真实容量值作为参照，难以准确评估电池容量衰减水平。此外，除老化退化外，电池 SOH 还受温度及近期充放电状况等因素影响，导致所计算容量出现波动。多重耦合因素的参与，使得传统经验老化模型难以适用，给 SOH 估算方法的鲁棒性带来挑战。因此，实际车辆 SOH 研究需全面考虑影响因素。

BMS 的 SOC 估算误差

BMS 的状态估算精度受电池老化、数据质量及估算算法等多因素影响，其中 SOC 估算误差对 SOH 估算影响尤为显著，特别是在车辆长时间未进行满充校准的情况下。基于静止状态条件，比较了 OCV 修正 SOC 与 BMS SOC 的差异，如图 2i 所示。结果表明，随着电池老化，BMS 无法及时更新容量信息，导致 SOC 估算频繁偏差。这一现象对基于随机局部充电片段的 SOH 计算方法构成挑战。为缓解该问题，利用车辆静置时段对 SOC 进行校准，以降低 SOC 误差对 SOH 标签提取的影响。此外，已有学者提出基于前馈深度神经网络的方法，可在存在数据噪声干扰的情况下实现高精度、连续 SOC 估算，有望进一步提升 SOH 估算精度。

数据质量受限

现场数据质量对车辆电池健康评估至关重要，尽管本研究数据包含丰富车辆信息，但与实验室测试数据相比仍存在以下局限：

数据噪声干扰：原始数据受传感器精度、电磁干扰及数据传输缺陷等因素影响，存在噪声。例如，充电过程中本应单调上升的电池单体电压可能出现随机波动，甚至瞬间跌至 0，尽管电池实际并无异常。可通过插值、单调调整或滤波平滑等方法修正异常数据。
数据缺失：主要分为两类，一是特定传感器未采集数据，二是整帧数据缺失，尽管电池系统仍在运行，但相应数据未能记录。可采用插值与拟合方法补充缺失数据，或将缺失区段视为不可靠，跳过该区段的计算。
采样频率较低：受限于 BMS 性能及数据存储容量，现场数据采样频率远低于实验室条件，影响动态工况下如 SOC 估算及行驶条件下安时积分等计算。此外，BMS 无法捕捉到电池响应，导致诸如 IC 分析等对数据精度敏感的计算难以开展。可通过提高采样频率，或在受限条件下优先采用对采样频率不敏感的分析方法，如将 IC 分析转化为充电容量序列分析。

此外，EV 充电过程常受 BMS、充电站协议、电压等级及温度等因素限制。尽管如 IC 曲线及增量电压差等特征可在充电过程中提取，但如图 2j 所示，受多阶段恒流充电的电流切换影响，部分充电过程 IC 曲线无法提取峰值特征，且峰值特征随电池老化未呈现规律性变化。这些因素限制了部分实验室常用特征在现场数据中的应用，降低了基于这些特征的 SOH 估算可行性与准确性。

基于上述原因，当前基于现场数据的 SOH 估算研究有限，且难以维持实验室条件下的估算精度。在此背景下，本文提出了一种 SOH 估算框架，用于探索现场数据条件下 SOH 估算算法的能力边界。凭借多模态特征提取与融合能力，该框架还可扩展至多传感器系统的状态估算与诊断。此外，公开大规模高价值现场数据，有助于促进电池管理技术的精细化、高效化与鲁棒化发展。

因此，对于每个 S O H SOH SOH 标签，我们匹配两个 H I HI HI 序列、一个 H I HI HI 热力图以及十五个 H I HI HI 点，组成用于模型训练的多模态 H I HI HI- S O H SOH SOH 样本。通常， H I HI HI 点与 S O H SOH SOH 之间的非线性关系可以通过支持向量机回归（ S V R SVR SVR）、随机森林回归（ R F R RFR RFR）、高斯过程回归（ G P R GPR GPR）和神经网络等机器学习方法进行表征。尽管 C N N CNN CNN 和 L S T M LSTM LSTM 等深度学习方法适合从 1 D 1D 1D 和 2 D 2D 2D 输入中提取特征，但现有研究在复杂多源信息场景下，针对 S O H SOH SOH 估计问题，尚未有效利用多模态 H I HI HI 数据，而是普遍采用单模态模型。因此，本文提出一种基于多模态深度学习的 S O H SOH SOH 估计框架，以实现对多模态 H I HI HI 的有效利用。

📖 提取多模态电池健康指标（HIs）

由于电动汽车（EV）运行工况复杂多变且采样频率较低，基于充电过程进行特征提取是一种适宜的解决方案。本研究提出了一种基于充电数据的多模态特征提取方法，旨在提取全面且有效的健康指标（HIs），用于反映电池的健康状态（SOH），以便后续进行估算。

首先，通过固定的充电电压区间来确定 HI 提取的时间段。这些车辆采用多阶段恒流充电策略，充电电流受电压和温度控制。在本研究中，选取了电压区间 $3900\\ \\text{mV},\\ 4050\\ \\text{mV}$ ，如图 3a 所示。该区间属于恒流充电段，覆盖的电压区间最大，能够保证提取足够的 HIs。该区段大约需要 100 个采样点（约 1000 秒），对应的 SOC 区间为 71%--84%，便于捕捉特定的充电行为并提取 HIs。

根据锂离子电池的领域知识，随着电池老化，在相同充电电量条件下，电池电压升高趋势更为明显。换句话说，在相同的充电电压区间内，随着电池老化，充入电池的容量逐渐减少[^12]。具体而言，充电过程中差分容量（IC）曲线的峰值和位置会在锂库存耗损与活性材料损耗的耦合作用下发生变化。由于 IC 曲线下方的面积代表充电容量，随着电池老化，该面积会逐渐减小。因此，将充电容量视作电压的函数，可以形成标准化的特征序列用于表征电池老化状态，这一方法已被广泛应用于 SOH 估算。正如图 3b 所示，从固定电压区间内提取充电容量序列 $Q_{\\text{HI}}$ ，作为第一组 HI 序列。

温度是衡量电池 SOH 的重要指标。在低温环境下，电池可用容量显著下降[^49]，原因在于电解液离子电导率降低，导致电极材料反应动力学减慢、内阻增大以及电极结构变化。另一方面，随着电池老化，内阻增大，导致充电过程中热量变化，这些变化可通过电池系统的温度传感器监测。因此，我们分析该电压区间内的温度增量，同时提取电池平均温度序列，作为第二组 HI 序列。如图 3c 所示，这两组序列构成与单个 SOH 标签对应的一维模态 HIs。

其次，考虑到充电过程中单体电芯电压存在不一致性，从原始数据中提取了 96 个单体电压数据。电池组内单体电芯一致性问题由多种因素引起，包括生产工差、散热结构设计以及均衡策略等。由于"木桶效应"，电池组容量受充电过程中电压最高单体的限制。单体电压不一致会导致，当某一单体达到电压上限时，其余单体尚未充满，从而限制整个电池组的充电量。此外，单体一致性差异还会导致内阻较大的电芯发生局部热量积聚，存在过充/过放风险，加速电池老化过程。因此，在估算电池健康状态时，有必要考虑单体一致性问题[^50]。

利用插值方法，生成了如图 3e 所示的 $96 \\times 96$ 二维伪 HI 图。图中横轴表示不同电芯，纵轴表示电压上升过程。该伪 HI 图可有效可视化充电过程中的单体一致性及电压变化，作为二维 HI 图输入。

最后，如表 1 所列及图 3f 所示，基于工程经验、实验结果及相关文献综述，从车辆运行数据中提取了一组 HI 点。由于这批 EV 全部由电池供能，车辆累计里程与电池劣化状态存在较强相关性，如图 2h 所示，因此选择累计行驶里程作为第一组 HI 点。

在与电池电化学反应相关的 HIs 中，从第二组 HI 序列中提取了充电过程的平均温度作为 HI 点。此外，为丰富模型对电池老化机理的理解，从 $Q_{\\text{HI}}$ 中提取了均值、中位数、标准差及极差等统计特征指标。随着电池老化，固定电压区间内的充电容量曲线逐渐下移，导致 $Q_{\\text{HI}}$ 的均值、中位数、标准差及极差均随 SOH 恶化而发生变化[^51]。

为进一步刻画充电过程中的单体一致性特征，提取了电芯电压极差序列（ $\\Delta V$ ）的均值、中位数、标准差及极差，如图 3d 所示。此外，充电功率受制于最大单体电压，以防止过充，同时受温度限制，以避免高温热失控和低温高速充电时的锂枝晶问题。由于充电行为差异性对电池老化特性有显著影响，因此还需考虑与充电条件相关的 HIs。因此，采用了充电过程中的平均充电电流、最大充电电流、最低温度及最低温度序列均值作为 HI 点。

另外，EV 有时会在不同的最高电压值停止充电，充电截止电压逐渐降低会限制电池可存储的总能量，因为电池可能未能完全充满。因此，充电结束电压也作为一个 HI 点纳入提取。这 15 个 HI 点能够有效反映电池老化特性。

综上所述，对于每个 SOH 标签，匹配两组 HI 序列、一张 HI 图以及 15 个 HI 点，组成多模态 HI--标签样本用于模型训练。

通常，HI 点与 SOH 之间的非线性关系可通过支持向量回归（SVR）、随机森林回归（RFR）、高斯过程回归（GPR）以及神经网络等机器学习方法进行建模。尽管 CNN 和 LSTM 等深度学习方法适用于一维和二维输入特征的提取，现有研究往往采用单一模态模型，尚未有效融合多模态 HIs，尤其是在复杂场景下涉及多源信息的 SOH 估算问题。为此，本文提出了一种基于多模态深度学习的 SOH 估算框架，实现对多模态 HIs 的有效利用。

多模态深度学习框架

如图 1d 所示，多模态框架包括 2 D 2D 2D H I HI HI 热力图处理域、 1 D 1D 1D H I HI HI 序列处理域和 H I HI HI 点处理域。在 1 D 1D 1D 和 2 D 2D 2D 处理域中，采用深度残差卷积神经网络（ R e s N e t ResNet ResNet）提取高维特征， H I HI HI 点处理域由多层全连接网络与非线性激活函数组成，用于执行 H I HI HI 点的非线性回归计算。作为 C N N CNN CNN 的变体， R e s N e t ResNet ResNet 融合了捷径连接（ s h o r t c u t shortcut shortcut）方法，将输入数据与卷积后的数据相加，有效避免了梯度消失问题，允许网络深度增加，从而最大化高维特征的提取能力。最终，三个子域分别通过全连接层进行特征融合与 S O H SOH SOH 回归估计。多模态框架的结构如图 1d 和补充说明 4 所示。

基于多模态深度学习框架的 S O H SOH SOH 估计

为验证所提多模态框架的性能，我们将样本随机划分为训练集与测试集，其中 80% 的样本作为训练集用于模型调优，20% 的样本作为测试集用于检验估计精度。在每个训练轮次（epoch）中，随机抽取 20% 的训练样本作为验证集，以验证模型精度并提升适应性。由于测试数据划分、模型初始化及参数迭代优化存在随机性，估计精度可能受到影响。为保证模型结果的一致性与可靠性，所有模型测试均重复进行十次。

为验证所提框架的优越性，将其与基于 H I HI HI 点的三种常用非线性回归机器学习方法进行对比。所有测试在搭载 I n t e l i 7 − 12700 H Intel\ i7-12700H Intel i7−12700H 处理器的笔记本电脑上进行，神经网络模型在 N v i d i a G e F o r c e R T X 3060 Nvidia\ GeForce\ RTX\ 3060 Nvidia GeForce RTX 3060 显卡上，采用 P y t h o n 3.8 Python\ 3.8 Python 3.8 与 T e n s o r f l o w 2.10 Tensorflow\ 2.10 Tensorflow 2.10 环境进行训练，其他 M L ML ML 方法基于 S c i k i t − l e a r n Scikit-learn Scikit−learn 库实现。采用平均绝对百分比误差（ M A P E MAPE MAPE）和均方根误差（ R M S E RMSE RMSE）衡量估计精度，计算公式如下：

M A P E = 1 n ∑ i = 1 n ∣ y i − y ^ i y i ∣ × 100 % MAPE = \frac{1}{n} \sum_{i=1}^{n} \left| \frac{y_i - \hat{y}_i}{y_i} \right| \times 100\% MAPE=n1i=1∑n yiyi−y^i ×100%

R M S E = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2} RMSE=n1i=1∑n(yi−y^i)2

如图 4 所示，所提框架的估计精度优于其余三种方法，其平均 M A P E MAPE MAPE 为 2.83%。其中， S V R SVR SVR 模型排名第四，平均 M A P E MAPE MAPE 为 3.34%， R F R RFR RFR 模型次之， M A P E MAPE MAPE 为 3.10%，但在低 S O H SOH SOH 样本估计方面表现较差。四种方法的误差分布见图 4e，现有 M L ML ML 方法在低 S O H SOH SOH 估计上的劣势尤为明显，而这对电动汽车电池退化后的健康评估至关重要。因此，本文重点分析 S O H SOH SOH 小于 85% 样本的估计结果。所提框架在此区间内的 M A P E MAPE MAPE 为 4.69%，较 R F R RFR RFR 模型降低 23.7%。其余三种 M L ML ML 模型的 M A P E MAPE MAPE 分别为 6.07%、6.15% 和 6.12%。

为考察网络结构及模态数量对估计精度的影响，本文新增六种对比模型：

2-模态模型 ：去除 2 D 2D 2D H I HI HI 热力图及对应子域输入。
1-模态模型 ：同时去除 2 D 2D 2D H I HI HI 热力图与 1 D 1D 1D H I HI HI 序列输入。
CNN 模型 ：保留三种 H I HI HI 模态输入，但将 R e s N e t ResNet ResNet 替换为常规卷积网络。
此外，将 1 D 1D 1D 模态处理子域替换为 R N N RNN RNN、 L S T M 52 LSTM^{52} LSTM52 和前馈神经网络（ F N N 53 FNN^{53} FNN53）模型，验证网络结构对性能的影响。

为保证训练过程的可重复性与公平性，七种模型均设定相同的学习率策略。图 5 展示了七种模型在测试集上的 S O H SOH SOH 估计结果。所提多模态模型表现出最佳估计精度。具体 M A P E MAPE MAPE、 R M S E RMSE RMSE 和最大估计误差如表 2 所示。

结果表明，1-模态模型 中仅加入 1 D 1D 1D H I HI HI 序列后， M A P E MAPE MAPE 降低 18.2 18.2% 18.2， R M S E RMSE RMSE 降低 15.2 15.2% 15.2；进一步加入 2 D 2D 2D H I HI HI 热力图至 2-模态模型 ， M A P E MAPE MAPE 和 R M S E RMSE RMSE 分别再降低 25.7 25.7% 25.7 和 21.3 21.3% 21.3。此外，将 C N N CNN CNN 更换为 R e s N e t ResNet ResNet，可使 M A P E MAPE MAPE 和 R M S E RMSE RMSE 分别降低 24.7 24.7% 24.7 和 21.1 21.1% 21.1。将 2 D 2D 2D 处理子域替换为 R N N RNN RNN、 L S T M LSTM LSTM 和 F N N FNN FNN 亦会不同程度降低估计精度。各模型估计性能对比如表 2 所示。

当输入仅包含 H I HI HI 点时，传统 M L ML ML 方法优于深度学习模型。然而，融入多模态 H I HI HI 数据后，所提多模态框架在估计精度上表现出显著优势。此外，本文使用相同框架，对另一批配备磷酸铁锂（ L i F e P O _ 4 LiFePO\_4 LiFePO_4）电池的车辆开展 S O H SOH SOH 评估实验，测试结果见补充说明 5，表明该框架能够适配不同电化学体系的电池，准确估计多种类型电池的 S O H SOH SOH。

讨论

为了开发适用于真实场景电动汽车（EV）电池的 SOH（State of Health，健康状态）评估方法，本文基于对 300 辆 EV 历时三年的历史数据进行分析。根据现场数据，我们分析了 EV 运行特性，并总结了将理论 SOH 估算方法迁移至工程应用中的瓶颈及影响算法精度的因素，这些因素包括复杂且不可控的车辆运行工况、BMS 状态估算精度较低、充电行为不稳定以及数据质量缺陷等。

此外，我们提出了一种多模态深度学习框架，利用运行数据精准预测 EV 电池 SOH。该方法从电池充电过程中的一致电压区间内提取多模态健康指标（HI）。为了利用这些多模态输入，我们设计了一种拥有 290 万可训练参数、基于残差网络结构的多模态深度学习框架。通过采用动态学习率策略，框架实现了极高精度的 SOH 估算，MAPE 为 2.83%。该结果表明，所提出框架在大规模 EV 电池评估中的应用潜力。

本方法不仅显著减少了时间、经济支出和能耗，同时推动了智能 BMS 与云端监测平台的发展，提升了 EV 使用体验。为促进电池管理算法领域发展，本文还对外公开发布了一套高质量 EV 电池数据集，涵盖车辆的详细行驶与充电日志，为分析车辆使用模式及预测电池退化提供了坚实数据基础。

尽管本研究结果令人鼓舞，但仍存在一些局限性，需进一步探索。该多模态框架整体表现可靠，但相较实验室数据，真实场景下 EV 电池状态可能突变，加之数据采样误差，易导致特征计算异常，从而产生异常特征输入，最终使模型在某些极端场景下输出错误结果。

此外，不同车辆间主导衰老机制差异显著。部分车辆以日历衰老为主，而另一些则以行驶相关衰老占主导。同时，受大规模生产制造差异影响，不同电池单体之间存在一致性差异，导致部分车辆退化模式明显不同。为缓解这些问题，需扩展训练数据，覆盖更广泛工况。因此，未来研究将聚焦于在积累足够真实场景数据基础上，探索如大型语言模型等更先进模型，尽管这需要一定时间。

同时，未来还将致力于通过为电池系统集成更多传感器（如每个单体的温度传感器、单体内部温度及应变传感器）来增强 BMS 性能。未来研究也将探索结合准确物理信息的数据驱动策略，为模型提供更强的机理理解和边界约束。凭借该框架多模态数据处理能力，更多基于物理特性的特征（如锂库存损失、活性材料损失等）也有望纳入多模态框架，进一步提升估算性能。

方法

EV 数据处理

本研究的 SOH 标签通过工作状态筛选策略、SOC 修正方法以及安时积分法从原始 EV 数据中获得。首先，从原始数据中提取静置工况，通过连续两帧数据的时间戳间隔确定。如果时间间隔超过 1 小时，则将唤醒时刻设为 t _ s t\_s t_s。静置 1 小时后，电池端电压趋近开路电压 (OCV)，此时可依据最大单体电压与 OCV--SOC 查找表校准电池 SOC。

本研究中，选取最大单体电压对应单体作为 SOC 校准依据，因为该单体通常代表电池组中最差单体。若校准后的 SOC 高于 0.6，则跳过该静置段，确保候选容量计算段覆盖较宽 SOC 区间以提升 SOH 计算精度。继续向前搜索至 SOC 达到 1，将该时刻设为 t _ e t\e t_e。当最大单体电压达到 4.25 V，BMS SOC 跳变至 1 且充电电流切断，表示电池组充满，此时记录容量计算段 (Seg _ ca \\text{ca} _ca)。利用安时积分法，可计算该段容量及 SOH 标签，详细计算方法见补充说明 3。

多模态健康指标提取

相比行驶过程，EV 充电过程工况较稳定。如前所述，SOH 标签计算采用充电段数据，充电行为通常从随机 SOC 开始，至充满电结束。基于数据清洗与特征提取方法，提取对应 SOH 标签的 HI。

首先，设定目标电压序列 V _ HI V\_\text{HI} V_HI 用于 HI 提取，定义如下：

V HI = { 3900 , 3901 , ⋯ , 4050 } V_\text{HI} = \{3900, 3901, \cdots, 4050\} VHI={3900,3901,⋯,4050}

对应 SOC 范围为 71--84%。对来自 Seg _ ca \_\text{ca} _ca 的一段充电原始数据，HI 提取段定义为：

Data HI = { Data t 1 , Data t 2 , ⋯ , Data t n } \text{Data}\text{HI} = \{ \text{Data}{t_1}, \text{Data}{t_2}, \cdots, \text{Data}{t_n} \} DataHI={Datat1,Datat2,⋯,Datatn}

其中 t _ 1 t\_1 t_1 和 t _ n t\n t_n 分别为最大单体电压达到 3900 mV 和 4050 mV 的时刻。不同充电过程由于起始 SOC、健康状态、充电策略等差异， Data _ HI \text{Data}\\text{HI} Data_HI 长度不等。

随后，对 HI 序列与矩阵进行标准化。本文 EV 电池包包含 96 节单体，充电过程各单体电压存在差异。为捕捉一致性，依据等间隔采样，提取 96×96 单体电压特征矩阵 V _ c V\_c V_c：

V c = [ V 1 , 1 V 1 , 2 ⋯ V 1 , 96 V 2 , 1 ⋯ ⋯ ⋮ ⋮ ⋮ ⋱ ⋮ V 96 , 1 ⋯ ⋯ V 96 , 96 ] V_c = \begin{bmatrix} V_{1,1} & V_{1,2} & \cdots & V_{1,96} \\ V_{2,1} & \cdots & \cdots & \vdots \\ \vdots & \vdots & \ddots & \vdots \\ V_{96,1} & \cdots & \cdots & V_{96,96} \end{bmatrix} Vc= V1,1V2,1⋮V96,1V1,2⋯⋮⋯⋯⋯⋱⋯V1,96⋮⋮V96,96

其中 V _ i , j V\_{i,j} V_i,j 表示第 j j j 个单体在第 i i i 次采样时的电压。 V _ c V\_c V_c 作为二维 HI 矩阵。

其次，提取最大单体电压序列：

V max = { V max ( t 1 ) , V max ( t 2 ) , ⋯ , V max ( t n ) } V_{\text{max}} = \{V_{\text{max}}(t_1), V_{\text{max}}(t_2), \cdots, V_{\text{max}}(t_n)\} Vmax={Vmax(t1),Vmax(t2),⋯,Vmax(tn)}

并计算充电容量序列：

Q t = { ∫ t 1 t i I d t } Q_t = \left\{ \int_{t_1}^{t_i} I\,dt \right\} Qt={∫t1tiIdt}

因 Data ∗ HI \text{Data}*\text{HI} Data∗HI 长度不等，需依据 V ∗ HI V*\text{HI} V∗HI 插值标准化：

Q HI ( V HI ) = { Q 1 , Q 2 , ⋯ , Q 151 } Q_{\text{HI}}(V_\text{HI}) = \{Q_1, Q_2, \cdots, Q_{151}\} QHI(VHI)={Q1,Q2,⋯,Q151}

同时，提取充电过程平均温度序列并等间隔压缩，得到：

T HI = { T 1 , T 2 , ⋯ , T 151 } T_\text{HI} = \{T_1, T_2, \cdots, T_{151}\} THI={T1,T2,⋯,T151}

最终，结合车况、单体一致性及充电行为等，提取 15 个 HI 点特征。详细定义见表 1。

据此，定义 SOH 训练-测试样本：

Sample = { output ∣ input } = { SOH ∣ V c , Q HI , T HI , HI 1 , HI 2 , ⋯ , HI 15 } \text{Sample} = \left\{\text{output} \left| \text{input} \right. \right\} = \left\{ \text{SOH} \left| V_c, Q_{\text{HI}}, T_{\text{HI}}, \text{HI}_1, \text{HI}2, \cdots, \text{HI}{15} \right. \right\} Sample={output∣input}={SOH∣Vc,QHI,THI,HI1,HI2,⋯,HI15}

残差网络结构

该多模态框架包括 2D 健康指标（HI）图像处理域 、1D HI 序列处理域 和 HI 点值处理域 。如图 6 所示，2D HI 图像处理域采用了残差网络（Residual Network, ResNet）结构 54 ^\text{54} 54，由输入卷积层、批归一化（Batch Normalization）层、最大池化（Max Pooling）层和四个残差块（Residual Block）组成。在该结构中，采用全局平均池化（Global Average Pooling）层和三层全连接（Fully Connected）层来获得 2D HI 图像处理域的输出。

与常规卷积神经网络（CNN）相比，ResNet 通过添加捷径连接（shortcut connection）来缓解梯度消失问题。这些捷径连接可以跳过一层或多层，使梯度在训练过程中能够顺利流动，从而允许神经网络加深而不会造成精度下降。

每个残差块包含两个基本块（Basic Block），其输出可以表示为：

H ( x ) = F ( x ) + x H(x) = F(x) + x H(x)=F(x)+x

其中， H ( x ) H(x) H(x) 表示基本块的输出， F ( x ) F(x) F(x) 表示由若干隐藏层提取的输入 x x x 的特征映射。

基本块由卷积层、批归一化层和修正线性单元（ReLU）激活函数组成。对于 2D 基本块，给定输入 C o n _ i n ∈ R M × N Con\_{in} \in \mathbb{R}^{M \times N} Con_in∈RM×N 和卷积核 w ∈ R U × V w \in \mathbb{R}^{U \times V} w∈RU×V，中间层可表示为：

C o n o u t ( i , j ) = ∑ u = 1 U ∑ v = 1 V [ w ( u , v ) ⋅ C o n i n ( i + u − 1 , j + v − 1 ) ] + b Con_{out}(i, j) = \sum_{u=1}^{U} \sum_{v=1}^{V} \left[ w(u, v) \cdot Con_{in}(i+u-1, j+v-1) \right] + b Conout(i,j)=u=1∑Uv=1∑V[w(u,v)⋅Conin(i+u−1,j+v−1)]+b

其中， C o n _ o u t ( i , j ) Con\_{out}(i, j) Con_out(i,j) 为输出矩阵在位置 ( i , j ) (i, j) (i,j) 处的元素， b b b 为卷积层的偏置项。

批归一化层的公式如下：

B N o u t = B N i n − μ σ 2 + ϵ ⋅ γ + β BN_{out} = \frac{BN_{in} - \mu}{\sqrt{\sigma^2 + \epsilon}} \cdot \gamma + \beta BNout=σ2+ϵ BNin−μ⋅γ+β

其中， B N _ o u t BN\{out} BN_out 为输出， B N _ i n BN\{in} BN_in 为输入， μ \mu μ 和 σ \sigma σ 分别为 B N _ i n BN\_{in} BN_in 的均值和标准差， ϵ \epsilon ϵ 是一个防止除零的极小常数， γ \gamma γ 和 β \beta β 是网络中的可训练参数。

激活函数采用 ReLU，以保证网络稀疏性，缓解梯度消失，并加速网络训练。ReLU 表达式如下：

y = max ⁡ ( 0 , x ) y = \max(0, x) y=max(0,x)

基于大量对比实验，确定了该模型的最优超参数，具体信息详见补充说明 4。

模型训练策略

在训练过程中，采用了预热（warm-up）技术，使模型在训练初期能够探索较宽的参数空间，进而达到全局最优。学习率从较低的初始值开始，在前 10 个 epoch（即预热阶段）逐渐升高至目标学习率。预热期结束后，采用指数衰减学习率策略来寻找最优参数。预热方法的详细信息见补充说明 6。

训练完成后，模型的结构和参数将被保存。在实际应用中，SOH 估算可以通过以下三个步骤完成：

从 EV 的历史运行数据中捕获充电行为，并进行数据预处理，如异常值处理和低质量数据段剔除。
提取能够有效反映电池老化状态的多模态健康指标（HIs），前提是充电过程完全覆盖电压范围 KaTeX parse error: Undefined control sequence: \[ at position 1: \̲[̲3900,\mathrm{mV...。
使用预训练模型，以这些健康指标作为输入，估算电池的 SOH。

数据可用性

EV 现场数据可通过以下链接获取：

http://ivstskl.changan.com.cn/?p=2697

本研究产生的源数据已存储于：

https://github.com/HoraceLiu1010/Multimodal-SOH-estimation-framework

本文附带了源数据。

代码可用性

本研究所用代码已发布于：

https://github.com/HoraceLiu1010/Multi-modal-SOH-estimation-framework