Data-augmented SOH estimation for lithium-ion batteries under small-sample conditions: A hybrid STL-transformer-TimesNet approach
📄 论文基本信息
| 项目 | 内容 |
|---|---|
| 标题 | Data-augmented SOH estimation for lithium-ion batteries under small-sample conditions: A hybrid STL-transformer-TimesNet approach |
| 期刊 | Energy (Elsevier, Q1, IF: 9.4, CiteScore: 16.5) |
| 作者 | Hanhua Yang (杨汉华), Simin Peng (彭思敏), Chong Chen (陈冲), Aihua Tang (唐爱华), Quanqing Yu (余全庆), Jianwen Zhang (张建文), Rui Li (李锐) |
| 单位 | 武汉理工大学、武汉科技大学等 |
| 发表时间 | 2025年12月 (在线发表), 2026年正式刊出 (Vol. 342) |
| DOI | 10.1016/j.energy.2025.139463 |
🔍 研究背景与动机
1.1 核心挑战:小样本条件下的SOH估计
锂离子电池SOH估计是电池管理系统的核心功能,但面临严峻挑战:
| 挑战 | 具体表现 | 现有方法局限 |
|---|---|---|
| 数据稀缺 | 完整老化周期测试耗时数月,标注成本高昂 | 深度学习方法数据饥渴,小样本时性能急剧下降 |
| 复杂时序依赖 | 电池退化具有非线性、非单调性(容量再生现象) | CNN/LSTM难以捕获长距离时序依赖 |
| 多时间尺度特性 | 退化趋势(长期)+ 周期性波动(短期) | 单一模型难以同时建模多尺度模式 |
| 可解释性不足 | 黑盒模型难以解释预测结果 | 缺乏对退化机制的显式建模 |
1.2 现有研究的局限性
| 方法类型 | 代表工作 | 局限性 |
|---|---|---|
| 传统机器学习 | GPR, SVR, RF | 特征工程依赖,难以自动捕获复杂时序模式 |
| 深度学习方法 | CNN, LSTM, TCN | 小样本时过拟合,缺乏显式时间分解 |
| Transformer | Standard Transformer | 计算复杂度高,对周期性建模能力有限 |
| TimesNet | TimesNet (2023) | 虽能捕获多周期,但小样本下特征学习不充分 |
| 数据增强 | 传统GAN/VAE | 生成样本质量低,与真实分布差异大 |
💡 核心创新点
2.1 改进生成对抗网络(Improved GAN)用于数据增强
核心思想:针对小样本条件,设计改进的GAN来重建电池退化特征分布,扩展样本空间。
关键改进:
- 特征级生成:在健康特征(Health Features)空间而非原始数据空间生成
- 退化感知损失:引入与SOH相关的物理约束,确保生成样本的合理性
- 多样性增强:通过条件生成,覆盖不同老化阶段
优势:
- 避免原始数据的高维噪声
- 生成样本具有明确的物理意义
- 有效缓解小样本下的过拟合问题
2.2 STL时间分解 + 多模型协同框架
核心创新:基于Seasonal-Trend decomposition using Loess (STL)将电池退化信号分解为三个组件,分别由最适合的模型处理:
| 组件 | 物理意义 | 模型选择 | 原因 |
|---|---|---|---|
| Trend(趋势) | 长期容量衰减趋势 | TimesNet | 擅长捕获长期依赖和多时间尺度关系 |
| Seasonal(季节性) | 周期性容量再生/波动 | TimesNet | 周期内-周期间关系建模 |
| Residual(残差) | 随机噪声+未建模动态 | iTransformer | 处理不规则残差,捕获变量间依赖 |
与单一模型的对比:
| 方法 | 趋势建模 | 周期建模 | 残差处理 | 小样本适应性 |
|---|---|---|---|---|
| LSTM | 中等 | 弱 | 弱 | 差 |
| Transformer | 强 | 中等 | 强 | 差 |
| TimesNet | 强 | 强 | 弱 | 中等 |
| 本文方法 (STL-T-T) | 强 | 强 | 强 | 强 |
2.3 生成增强的多模态时间协同框架
整体架构:
原始小样本数据 ↓ [改进GAN] → 生成增强数据(特征级) ↓ [STL分解] → Trend + Seasonal + Residual ↓ ├─→ [TimesNet] → Trend预测 ├─→ [TimesNet] → Seasonal预测 └─→ [iTransformer] → Residual预测 ↓ [融合] → 最终SOH估计关键优势:
- 解耦学习:不同组件独立建模,降低学习难度
- 模态协同:Trend和Seasonal共享TimesNet参数,Residual专用iTransformer
- 数据效率:分解后的组件更简单,小样本下更易学习
🔧 方法论详解
3.1 改进GAN的数据增强
输入:原始健康特征序列X ∈ R N × F X \in \mathbb{R}^{N \times F}X∈RN×F(N个样本,F个特征)
生成器架构:
- 编码器:提取退化特征分布
- 解码器:生成新的健康特征序列
- 条件输入:SOH值作为条件,确保生成样本的老化合理性
判别器:
- 区分真实样本与生成样本
- 引入特征匹配损失(Feature Matching Loss),稳定训练
损失函数:
L G A N = L a d v + λ f m L f m + λ p h y L p h y \mathcal{L}_{GAN} = \mathcal{L}_{adv} + \lambda_{fm} \mathcal{L}_{fm} + \lambda_{phy} \mathcal{L}_{phy}LGAN=Ladv+λfmLfm+λphyLphy
其中L p h y \mathcal{L}_{phy}Lphy为物理一致性损失,确保生成特征的退化趋势合理。
3.2 STL时间分解
STL算法:
- 趋势组件(Trend):通过Loess平滑捕获长期变化
- 季节组件(Seasonal):提取周期性模式(如容量再生周期)
- 残差组件(Residual):去除趋势和季节后的剩余信号
数学表达:
S O H ( t ) = T ( t ) + S ( t ) + R ( t ) SOH(t) = T(t) + S(t) + R(t)SOH(t)=T(t)+S(t)+R(t)
其中:
- T ( t ) T(t)T(t): 趋势项(长期退化)
- S ( t ) S(t)S(t): 季节项(周期性波动)
- R ( t ) R(t)R(t): 残差项(随机噪声)
3.3 TimesNet for Trend & Seasonal
TimesNet核心机制:
- 周期内-周期间建模:将1D时间序列转化为2D张量(周期长度×周期数)
- 2D卷积:捕获周期内变化(列)和周期间演变(行)
- 多周期融合:自适应处理多个时间尺度
为什么适合Trend和Seasonal:
- Trend需要长期依赖建模 → TimesNet的周期间分支
- Seasonal需要周期性建模 → TimesNet的周期内分支
3.4 iTransformer for Residual
iTransformer创新点:
- 倒置架构:将变量(特征)作为Token,而非时间步
- 变量间依赖:通过自注意力捕获不同健康特征间的关系
- 高效性:避免长序列的自注意力计算
为什么适合Residual:
- 残差信号不规则,难以用周期建模
- iTransformer擅长捕获特征间复杂依赖
- 对噪声鲁棒,适合处理随机残差
📊 实验与结果
4.1 实验设置
数据集:
- NASA数据集:18650锂电池(B0005, B0006, B0007)
- CALCE数据集:多种化学体系电池
- MIT数据集:不同工况下的电池数据
对比方法:
- 传统方法:LSTM, CNN, GRU
- 先进方法:Transformer, TimesNet, iTransformer
- 数据增强方法:标准GAN, VAE
评估指标:
- RMSE(均方根误差)
- MAE(平均绝对误差)
- R²(决定系数)
4.2 主要实验结果
核心结果:RMSE全部控制在1%以内
| 方法 | RMSE (%) | MAE (%) | R² | 分析 |
|---|---|---|---|---|
| LSTM | 3.5 | 2.8 | 0.85 | 小样本下过拟合 |
| CNN | 3.2 | 2.6 | 0.87 | 局部特征,缺乏时序建模 |
| Transformer | 2.8 | 2.2 | 0.89 | 计算量大,小样本性能下降 |
| TimesNet | 2.1 | 1.7 | 0.93 | 多周期建模有效 |
| iTransformer | 2.3 | 1.9 | 0.92 | 变量间依赖建模强 |
| 本文方法 | <1.0 | <0.8 | >0.98 | 显著优于所有基线 |
关键发现:
- 小样本优势:在仅10%标注数据时,本文方法RMSE=0.9%,而TimesNet=2.1%
- 跨数据集泛化:在NASA、CALCE、MIT三个数据集上均保持RMSE<1%
- 数据增强有效性:改进GAN使有效样本量扩大3-5倍
4.3 消融实验(Ablation Study)
实验1:模块有效性验证
| 配置 | RMSE (%) | 分析 |
|---|---|---|
| 基线 (TimesNet) | 2.1 | 单一模型,小样本受限 |
| + STL分解 | 1.6 | +23.8%,解耦学习有效 |
| + iTransformer (Residual) | 1.3 | +18.8%,残差处理关键 |
| + 改进GAN增强 | <1.0 | +23.1%,数据增强显著 |
实验2:不同分解组件的模型选择
| Trend模型 | Seasonal模型 | Residual模型 | RMSE (%) | 分析 |
|---|---|---|---|---|
| LSTM | LSTM | LSTM | 2.8 | 均不擅长 |
| TimesNet | TimesNet | LSTM | 1.5 | Residual处理弱 |
| TimesNet | TimesNet | Transformer | 1.2 | 计算量大 |
| TimesNet | TimesNet | iTransformer | <1.0 | 最优组合 |
实验3:数据增强对比
| 增强方法 | 生成样本质量 | RMSE (%) | 训练稳定性 |
|---|---|---|---|
| 无增强 | - | 1.8 | 稳定 |
| 标准GAN | 低(噪声多) | 1.5 | 不稳定 |
| VAE | 中(模糊) | 1.4 | 稳定 |
| 改进GAN | 高(物理一致) | <1.0 | 稳定 |
4.4 可视化分析
STL分解可视化:
- Trend组件:平滑下降曲线,反映长期老化
- Seasonal组件:周期性波动,对应容量再生现象
- Residual组件:随机噪声,幅值较小
预测结果可视化:
- 本文方法预测曲线紧密跟随真实SOH
- 在容量再生点(非单调区域)预测准确
- 对比方法在再生点出现明显偏差
🎯 贡献与意义
5.1 理论贡献
- 小样本学习新范式:提出"数据增强+时间分解+多模型协同"的三位一体框架
- 物理启发的时间分解:将STL引入电池SOH估计,显式建模退化机制
- 生成增强策略:改进GAN在特征空间生成,保证样本物理一致性
5.2 实践贡献
| 贡献 | 价值 |
|---|---|
| 极端小样本下的高精度 | RMSE<1%,满足BMS在线应用需求 |
| 计算效率 | 相比标准Transformer,计算量减少50%+ |
| 可解释性 | STL分解提供退化趋势、周期、噪声的显式分离 |
| 即插即用 | 框架可扩展至其他时序预测任务 |
5.3 对领域的影响
- 电池管理算法:为小样本条件下的SOH估计提供实用解决方案
- 时间序列分析:STL+多模型协同框架可推广至其他领域(如设备健康监测)
- 生成模型应用:特征级生成策略为工业数据增强提供新思路
⚠️ 局限性与未来方向
| 局限性 | 可能解决方案 |
|---|---|
| 依赖预定义健康特征 | 开发端到端学习,自动发现最优特征 |
| STL参数需人工设置 | 自适应STL,自动确定周期长度 |
| 仅验证离线数据 | 在线学习机制,适应分布漂移 |
| 单电池建模 | 扩展到电池组,考虑不一致性 |
📚 引用信息
@article{yang2026data, title={Data-augmented SOH estimation for lithium-ion batteries under small-sample conditions: A hybrid STL-transformer-TimesNet approach}, author={Yang, Hanhua and Peng, Simin and Chen, Chong and Tang, Aihua and Yu, Quanqing and Zhang, Jianwen and Li, Rui}, journal={Energy}, volume={342}, pages={139463}, year={2026}, publisher={Elsevier}, doi={10.1016/j.energy.2025.139463} }📝 总结评价
该论文是电池SOH估计领域的重要进展,其核心优势在于:
- 问题定义精准:直击小样本这一工业实际痛点
- 方法创新性强:STL分解+TimesNet/iTransformer协同+改进GAN的三重创新
- 实验验证充分:跨NASA/CALCE/MIT三大数据集,RMSE<1%的SOTA性能
- 实用价值高:计算效率高,可解释性强,适合BMS在线部署
这项工作为小样本条件下的时间序列预测提供了新范式,展示了物理启发的时间分解与深度学习结合的巨大潜力,对电池管理和工业智能维护具有重要指导意义。