ICEEMDAN-CMBE特征提取+Bayes-TCN-GRU故障诊断+SHAP可解释分析！实验报告+MATLAB代码

基于ICEEMDAN-CMBE与BO-TCN-GRU的滚动轴承故障诊断及SHAP可解释分析

本文介绍了一种结合信号分解、特征提取、深度学习和可解释性分析的滚动轴承故障诊断方法，在CWRU数据集上取得了95%的测试准确率。

1. 引言

滚动轴承是旋转机械的核心部件，其运行状态直接影响设备的可靠性和安全性。传统的故障诊断方法依赖于专家经验和信号处理技术，难以处理复杂的非线性信号。近年来，深度学习在故障诊断领域展现出强大的特征学习能力，但如何选择最优网络参数、如何解释模型的决策过程仍是亟待解决的问题。

本文提出了一种ICEEMDAN-CMBE特征提取 + 贝叶斯优化TCN-GRU + SHAP可解释分析的故障诊断框架，主要贡献包括：

✅ 采用ICEEMDAN分解抑制模态混叠，提取有效的IMF分量
✅ 利用复合多尺度气泡熵（CMBE）捕捉信号的非线性特征
✅ 通过贝叶斯优化自动搜索TCN-GRU最优超参数
✅ 使用SHAP方法实现模型预测的可解释性分析

2. 方法框架

2.1 整体流程

复制代码

原始振动信号 → ICEEMDAN分解 → IMF分量 → CMBE特征提取 → 特征向量
    ↓
贝叶斯优化 → TCN-GRU网络训练 → 故障分类
    ↓
SHAP分析 → 特征重要性解释

2.2 ICEEMDAN分解

ICEEMDAN（Improved Complete Ensemble EMD with Adaptive Noise）是一种改进的经验模态分解方法，通过添加自适应白噪声有效抑制模态混叠现象。

关键参数设置：

参数	取值	说明
Nstd	0.1	信噪比
NR	80	噪声添加次数
MaxIter	8	最大分解层数

分解后得到8个IMF分量，每个分量反映信号在不同时间尺度的特征。

2.3 复合多尺度气泡熵（CMBE）

气泡熵是一种基于排列熵改进的非线性特征，通过计算信号在不同尺度下的复杂度，能够更全面地反映轴承故障的动态特征。

参数配置：

matlab 复制代码

maxScale = 10;      % 最大尺度因子
m = 2;              % 嵌入维数
r_factor = 0.15;    % 相似容限系数

每个IMF分量提取10个尺度的CMBE值，最终每个样本获得80维特征向量（8个IMF × 10个尺度）。

2.4 TCN-GRU网络结构

TCN （时间卷积网络）通过因果卷积和空洞卷积捕捉长期依赖关系，GRU（门控循环单元）通过门控机制处理序列信息。两者结合充分发挥各自优势：

复制代码

输入层 → TCN残差块 → GRU层 → 全连接层 → Softmax分类

2.5 贝叶斯优化

贝叶斯优化通过构建目标函数的概率代理模型，在较少迭代次数内找到近似最优解。本文优化的超参数包括：

超参数	搜索范围	最优值
numFilters	$8, 32$	13
filterSize	$2, 6$	6
dropoutFactor	$0.05, 0.3$	0.24
numBlocks	$1, 3$	1
gruUnits	$32, 128$	109
InitialLearnRate	$1e-4, 1e-2$	0.0097
LearnRateDropFactor	$0.5, 0.9$	0.62

3. 实验设置

3.1 数据集

采用**美国凯斯西储大学（CWRU）**轴承数据中心的标准数据集：

10种状态：1种正常 + 9种故障
故障类型：内圈故障、滚动体故障、外圈故障
损伤直径：0.007、0.014、0.021英寸
样本配置：每类120个样本，共1200个样本
数据划分：每类前90个训练，后30个测试

3.2 训练配置

matlab 复制代码

maxEpochs = 120;        % 最大训练轮数
miniBatchSize = 30;     % 批次大小
optimizer = 'adam';     % 优化器

4. 实验结果

4.1 贝叶斯优化过程

经过30次迭代 优化，验证集错误率从17%降至10.33%，优化耗时约317秒。

图1：贝叶斯优化目标函数值收敛曲线

4.2 网络结构

图2：优化后的TCN-GRU网络结构

4.3 分类性能

数据集	准确率
训练集	96.56%
测试集	95.00%

图3：训练集预测结果对比

图4：测试集预测结果对比

4.4 混淆矩阵

图5：训练集混淆矩阵

图6：测试集混淆矩阵

从混淆矩阵可以看出，大部分样本被正确分类，主要混淆发生在第7类和第9类故障之间。

5. SHAP可解释性分析

5.1 SHAP蜂群图

图7：SHAP蜂群图（Summary Plot）

解读：

横轴：SHAP值（正值增加预测概率，负值降低预测概率）
纵轴：特征编号
颜色：红色表示高特征值，蓝色表示低特征值

5.2 特征重要性排名

图8：各特征的平均绝对SHAP值排名

关键发现：

特征2、特征22、特征24对模型预测贡献最大
这些特征对应IMF分量在特定尺度下的CMBE值
高重要性特征可用于指导实际故障监测

5.3 特征依赖图

图9：特征值与SHAP值的非线性关系

特征依赖图揭示了特征值与预测贡献之间的复杂非线性关系，为理解模型决策机制提供了直观依据。

6. 总结与展望

6.1 主要成果

方法	效果
ICEEMDAN-CMBE特征提取	有效捕捉非线性故障特征
贝叶斯优化TCN-GRU	测试准确率达95%
SHAP可解释分析	揭示关键特征贡献

6.2 创新点

特征提取：ICEEMDAN抑制模态混叠 + CMBE多尺度特征
自动调参：贝叶斯优化替代人工试错
可解释性：SHAP分析增强模型透明度

6.3 未来方向

引入更多特征提取方法（如小波包能量、奇异值分解等）
尝试Transformer等新型网络架构
在实际工业数据上验证方法泛化能力
开发在线故障诊断系统

7. 代码获取

完整MATLAB代码已整理，包含：

数据预处理模块
ICEEMDAN分解函数
CMBE特征提取函数
TCN-GRU网络构建
贝叶斯优化流程
SHAP分析可视化

参考文献

Torres M E, et al. A complete ensemble empirical mode decomposition with adaptive noise $C$ . IEEE ICASSP, 2011.
Manis G, et al. Bubble entropy: An entropy almost free of parameters $J$ . IEEE TBME, 2017.
Bai S, et al. An empirical evaluation of generic convolutional and recurrent networks for sequence modeling $J$ . arXiv:1803.01271, 2018.
Lundberg S M, Lee S I. A unified approach to interpreting model predictions $C$ . NeurIPS, 2017.

作者：机器学习之心
日期：2026年5月26日

如果觉得有帮助，欢迎点赞、收藏、转发！