基于ICEEMDAN-CMBE与BO-TCN-GRU的滚动轴承故障诊断及SHAP可解释分析
本文介绍了一种结合信号分解、特征提取、深度学习和可解释性分析的滚动轴承故障诊断方法,在CWRU数据集上取得了95%的测试准确率。
1. 引言
滚动轴承是旋转机械的核心部件,其运行状态直接影响设备的可靠性和安全性。传统的故障诊断方法依赖于专家经验和信号处理技术,难以处理复杂的非线性信号。近年来,深度学习在故障诊断领域展现出强大的特征学习能力,但如何选择最优网络参数、如何解释模型的决策过程仍是亟待解决的问题。
本文提出了一种ICEEMDAN-CMBE特征提取 + 贝叶斯优化TCN-GRU + SHAP可解释分析的故障诊断框架,主要贡献包括:
- ✅ 采用ICEEMDAN分解抑制模态混叠,提取有效的IMF分量
- ✅ 利用复合多尺度气泡熵(CMBE)捕捉信号的非线性特征
- ✅ 通过贝叶斯优化自动搜索TCN-GRU最优超参数
- ✅ 使用SHAP方法实现模型预测的可解释性分析
2. 方法框架
2.1 整体流程
原始振动信号 → ICEEMDAN分解 → IMF分量 → CMBE特征提取 → 特征向量
↓
贝叶斯优化 → TCN-GRU网络训练 → 故障分类
↓
SHAP分析 → 特征重要性解释

2.2 ICEEMDAN分解
ICEEMDAN(Improved Complete Ensemble EMD with Adaptive Noise)是一种改进的经验模态分解方法,通过添加自适应白噪声有效抑制模态混叠现象。
关键参数设置:
| 参数 | 取值 | 说明 |
|---|---|---|
| Nstd | 0.1 | 信噪比 |
| NR | 80 | 噪声添加次数 |
| MaxIter | 8 | 最大分解层数 |
分解后得到8个IMF分量,每个分量反映信号在不同时间尺度的特征。
2.3 复合多尺度气泡熵(CMBE)
气泡熵是一种基于排列熵改进的非线性特征,通过计算信号在不同尺度下的复杂度,能够更全面地反映轴承故障的动态特征。
参数配置:
matlab
maxScale = 10; % 最大尺度因子
m = 2; % 嵌入维数
r_factor = 0.15; % 相似容限系数
每个IMF分量提取10个尺度的CMBE值,最终每个样本获得80维特征向量(8个IMF × 10个尺度)。
2.4 TCN-GRU网络结构
TCN (时间卷积网络)通过因果卷积和空洞卷积捕捉长期依赖关系,GRU(门控循环单元)通过门控机制处理序列信息。两者结合充分发挥各自优势:
输入层 → TCN残差块 → GRU层 → 全连接层 → Softmax分类
2.5 贝叶斯优化
贝叶斯优化通过构建目标函数的概率代理模型,在较少迭代次数内找到近似最优解。本文优化的超参数包括:
| 超参数 | 搜索范围 | 最优值 |
|---|---|---|
| numFilters | 8, 32 | 13 |
| filterSize | 2, 6 | 6 |
| dropoutFactor | 0.05, 0.3 | 0.24 |
| numBlocks | 1, 3 | 1 |
| gruUnits | 32, 128 | 109 |
| InitialLearnRate | 1e-4, 1e-2 | 0.0097 |
| LearnRateDropFactor | 0.5, 0.9 | 0.62 |
3. 实验设置
3.1 数据集
采用**美国凯斯西储大学(CWRU)**轴承数据中心的标准数据集:
- 10种状态:1种正常 + 9种故障
- 故障类型:内圈故障、滚动体故障、外圈故障
- 损伤直径:0.007、0.014、0.021英寸
- 样本配置:每类120个样本,共1200个样本
- 数据划分:每类前90个训练,后30个测试
3.2 训练配置
matlab
maxEpochs = 120; % 最大训练轮数
miniBatchSize = 30; % 批次大小
optimizer = 'adam'; % 优化器
4. 实验结果
4.1 贝叶斯优化过程
经过30次迭代 优化,验证集错误率从17%降至10.33%,优化耗时约317秒。


图1:贝叶斯优化目标函数值收敛曲线
4.2 网络结构

图2:优化后的TCN-GRU网络结构
4.3 分类性能
| 数据集 | 准确率 |
|---|---|
| 训练集 | 96.56% |
| 测试集 | 95.00% |

图3:训练集预测结果对比

图4:测试集预测结果对比
4.4 混淆矩阵

图5:训练集混淆矩阵

图6:测试集混淆矩阵
从混淆矩阵可以看出,大部分样本被正确分类,主要混淆发生在第7类和第9类故障之间。
5. SHAP可解释性分析
5.1 SHAP蜂群图

图7:SHAP蜂群图(Summary Plot)
解读:
- 横轴:SHAP值(正值增加预测概率,负值降低预测概率)
- 纵轴:特征编号
- 颜色:红色表示高特征值,蓝色表示低特征值
5.2 特征重要性排名

图8:各特征的平均绝对SHAP值排名
关键发现:
- 特征2、特征22、特征24对模型预测贡献最大
- 这些特征对应IMF分量在特定尺度下的CMBE值
- 高重要性特征可用于指导实际故障监测
5.3 特征依赖图

图9:特征值与SHAP值的非线性关系
特征依赖图揭示了特征值与预测贡献之间的复杂非线性关系,为理解模型决策机制提供了直观依据。
6. 总结与展望
6.1 主要成果
| 方法 | 效果 |
|---|---|
| ICEEMDAN-CMBE特征提取 | 有效捕捉非线性故障特征 |
| 贝叶斯优化TCN-GRU | 测试准确率达95% |
| SHAP可解释分析 | 揭示关键特征贡献 |
6.2 创新点
- 特征提取:ICEEMDAN抑制模态混叠 + CMBE多尺度特征
- 自动调参:贝叶斯优化替代人工试错
- 可解释性:SHAP分析增强模型透明度
6.3 未来方向
- 引入更多特征提取方法(如小波包能量、奇异值分解等)
- 尝试Transformer等新型网络架构
- 在实际工业数据上验证方法泛化能力
- 开发在线故障诊断系统
7. 代码获取
完整MATLAB代码已整理,包含:
- 数据预处理模块
- ICEEMDAN分解函数
- CMBE特征提取函数
- TCN-GRU网络构建
- 贝叶斯优化流程
- SHAP分析可视化
参考文献
- Torres M E, et al. A complete ensemble empirical mode decomposition with adaptive noiseC. IEEE ICASSP, 2011.
- Manis G, et al. Bubble entropy: An entropy almost free of parametersJ. IEEE TBME, 2017.
- Bai S, et al. An empirical evaluation of generic convolutional and recurrent networks for sequence modelingJ. arXiv:1803.01271, 2018.
- Lundberg S M, Lee S I. A unified approach to interpreting model predictionsC. NeurIPS, 2017.
作者 :机器学习之心
日期:2026年5月26日
如果觉得有帮助,欢迎点赞、收藏、转发!