【故障诊断】DSCNN-HA-TL:融合Swin窗口注意力和全局注意力机制的变工况轴承故障诊断(迁移学习/小样本)

在工业旋转机械中,滚动轴承是最关键、也最容易发生故障的部件之一。然而,变工况、故障样本稀缺、跨域泛化能力差三大难题,长期制约着故障诊断模型的落地效果。

近期,来自河北工程大学、天津大学等机构的研究团队提出了一种全新的诊断框架 ------ DSCNN-HA-TL ,在 CWRU 公开数据集和自建实验平台上的跨工况迁移任务中,平均精度分别达到 99.93%99.55%

本文带你一文读懂这项研究的技术路线与核心亮点。

一、研究背景:为什么变工况轴承诊断这么难?

在实际工业场景中,轴承往往在变转速、变负载条件下运行,振动信号分布差异显著。传统深度学习方法依赖"同分布"假设,一旦工况变化,诊断精度就会急剧下降。

更棘手的是:

  • 故障样本极少,难以训练复杂模型;

  • 跨设备、跨工况数据分布偏移严重;

  • 单一注意力机制难以兼顾局部与全局特征。

👉 这些正是当前深度学习故障诊断从"实验室"走向"工业现场"的核心障碍。

二、研究目的:构建一个"小样本 + 变工况"可用的轻量高精度模型

研究团队的目标非常明确:

设计一个融合迁移学习混合注意力机制的轻量化卷积网络,在仅使用少量目标域样本的情况下,实现对不同工况下轴承故障的高精度识别。

三、研究方法:DSCNN-HA-TL 框架全解析

整体流程(原文 Fig.4,第8-9页)

该框架包含四个关键阶段:

  1. 信号预处理

    使用**连续小波变换(CWT)**将一维振动信号转换为224×224的二维时频图(原文第10页)。

  2. 双分支特征提取

    • Swin窗口注意力:提取局部时频特征

    • GAM全局注意力:增强通道与空间维度的全局交互

  3. 特征融合

    将局部与全局特征拼接,通过自适应池化压缩为固定长度向量。

  4. 迁移学习诊断

    源域预训练 → 目标域少量样本微调 → 跨工况故障分类。

四、研究过程:两个数据集 + 七类对比模型

数据集

  • CWRU公开数据集:0/1/2 hp,7类故障(含正常、内圈、外圈、滚动体)

  • 自建实验平台:0/0.25/0.5 MPa,同样7类故障(原文第18-19页)

对比模型

DSCNN、Swin、DSCNN-GAM、VGG16、ResNet、CNN-SwinGAM

评估指标

准确率、损失率、损失曲线、混淆矩阵、t-SNE

五、研究重难点:模型设计中的三个关键挑战

难点1:如何兼顾轻量与表达能力?

解决方案 :采用**深度可分离卷积(DSC)**替代标准卷积。

  • 参数量和计算量分别降至标准卷积的 1/C_out + 1/K²(原文公式(5)(6))

  • 同时保持较强的特征表达能力

难点2:单一注意力机制难以捕捉多尺度特征

解决方案 :提出**窗口注意力(Swin)+ 全局注意力(GAM)**的混合机制。

  • Swin:提取局部短时依赖

  • GAM:强化跨通道与空间维度的全局交互

难点3:跨工况下分布漂移严重

解决方案 :引入迁移学习

  • 源域充分预训练

  • 目标域仅用40%样本微调,即可实现高精度迁移(原文第13页)

六、研究结论:精度、损失、可视化三重验证

1. 准确率全面领先

CWRU 单工况(原文 Table 3,第14页)
  • DSCNN-SwinGAM:100%(平均)

  • 对比模型:DSCNN(96.10%)、ResNet(99.30%)

CWRU 迁移任务(原文 Table 4,第14页)
  • 平均精度:99.93%

  • 6个迁移任务中多个达到100%

自建平台迁移任务(原文 Table 9,第21页)
  • 平均精度:99.55%

  • 比DSCNN高出12个百分点

2. 损失率显著更低(原文 Table 6、11)

  • CWRU迁移任务平均损失:0.0755(DSCNN为3.22)

  • 自建平台迁移任务平均损失:0.4119(DSCNN为12.14)

3. 收敛速度更快(原文 Fig.8、15)

  • DSCNN-SwinGAM 在训练早期即快速收敛

  • 最终损失值最低,表明拟合能力强、过拟合风险低

4. 特征聚类更清晰(原文 Fig.10、17)

  • 同类故障特征高度聚集

  • 不同故障类别之间边界明显

  • 对比模型存在明显混叠现象

七、未来展望:从实验室到工业现场的下一步

作者也明确指出了当前方法仍可改进的方向:

  1. 进一步提升训练效率,适应实时或在线诊断需求;

  2. 拓展到更复杂的工业场景

    • 变转速

    • 变温度

    • 跨设备(不同型号轴承)

  3. 构建端到端的在线故障诊断流水线,真正实现"边采边诊"。

写在最后:为什么这篇工作值得关注?

维度 亮点
🧠 方法创新 首次将Swin + GAM双注意力与DSC + 迁移学习融合
⚙️ 轻量高效 深度可分离卷积显著降低参数量
🎯 适用性强 专为小样本、变工况设计,贴近工业现实
📊 验证充分 双数据集、7类对比、多指标、消融实验齐全

如果你想在自己的轴承故障诊断任务中尝试该方法,建议优先复现其CWT时频图 + DSCNN-SwinGAM + 迁移学习的组合,这三点是精度提升的核心。

关注我们,获取更多工业智能诊断、深度学习前沿解读。

本文解读自论文:

*DSCNN-HA-TL: A Transfer Learning Framework with Hybrid Attention for Bearing Fault Diagnosis under Variable Operating Conditions (Struct Durab Health Monit, 2025)*

注:更多关于小样本齿轮箱故障诊断的前沿知识小编之前有推荐,可以详查置顶文章:【本周六开课】-数据驱动智能故障诊断技术应用与实践

如果您觉得文章不错,欢迎点赞、关注、收藏及转发~

相关推荐
DreamLife☼6 小时前
OpenBCI-实战五:脑电数据可视化仪表板
人工智能·机器学习·信息可视化·开源硬件·脑机接口·openbci
行业研究员9 小时前
腾讯云AgentMemory产品介绍与核心痛点解决
人工智能·机器学习·腾讯云·agentmem
苏州邦恩精密10 小时前
江苏蔡司3D扫描仪定制厂家:专业三维检测方案助力智能制造升级
人工智能·科技·机器学习·3d·自动化·制造
树谷-胡老师10 小时前
2024年中国大型数据中心空间分布及环境属性数据集
人工智能·机器学习
小马哥crazymxm10 小时前
自动驾驶“跨化身”!Sensor2Sensor用4D高斯泼溅+扩散模型,把网络行车记录仪变成高精度LiDAR真数据
人工智能·机器学习·自动驾驶
大模型最新论文速读11 小时前
UnityMAS-O:专用于多 agent 工作流训练的 RL 框架
论文阅读·人工智能·深度学习·机器学习·自然语言处理
love530love11 小时前
根治 PyTorch CUDA `pynvml` 弃用警告:直接修改 `torch/cuda/__init__.py` 的实践记录
人工智能·pytorch·windows·python·深度学习·机器学习·pynvml
数智工坊12 小时前
周志华《Machine Learning》学习笔记--第六章--支持向量机
笔记·神经网络·学习·算法·机器学习·支持向量机
大模型最新论文速读12 小时前
06-04 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
数智工坊14 小时前
周志华《Machine Learning》学习笔记--第五章--神经网络
人工智能·笔记·神经网络·学习·机器学习