【故障诊断】DSCNN-HA-TL:融合Swin窗口注意力和全局注意力机制的变工况轴承故障诊断(迁移学习/小样本)

在工业旋转机械中,滚动轴承是最关键、也最容易发生故障的部件之一。然而,变工况、故障样本稀缺、跨域泛化能力差三大难题,长期制约着故障诊断模型的落地效果。

近期,来自河北工程大学、天津大学等机构的研究团队提出了一种全新的诊断框架 ------ DSCNN-HA-TL ,在 CWRU 公开数据集和自建实验平台上的跨工况迁移任务中,平均精度分别达到 99.93%99.55%

本文带你一文读懂这项研究的技术路线与核心亮点。

一、研究背景:为什么变工况轴承诊断这么难?

在实际工业场景中,轴承往往在变转速、变负载条件下运行,振动信号分布差异显著。传统深度学习方法依赖"同分布"假设,一旦工况变化,诊断精度就会急剧下降。

更棘手的是:

  • 故障样本极少,难以训练复杂模型;

  • 跨设备、跨工况数据分布偏移严重;

  • 单一注意力机制难以兼顾局部与全局特征。

👉 这些正是当前深度学习故障诊断从"实验室"走向"工业现场"的核心障碍。

二、研究目的:构建一个"小样本 + 变工况"可用的轻量高精度模型

研究团队的目标非常明确:

设计一个融合迁移学习混合注意力机制的轻量化卷积网络,在仅使用少量目标域样本的情况下,实现对不同工况下轴承故障的高精度识别。

三、研究方法:DSCNN-HA-TL 框架全解析

整体流程(原文 Fig.4,第8-9页)

该框架包含四个关键阶段:

  1. 信号预处理

    使用**连续小波变换(CWT)**将一维振动信号转换为224×224的二维时频图(原文第10页)。

  2. 双分支特征提取

    • Swin窗口注意力:提取局部时频特征

    • GAM全局注意力:增强通道与空间维度的全局交互

  3. 特征融合

    将局部与全局特征拼接,通过自适应池化压缩为固定长度向量。

  4. 迁移学习诊断

    源域预训练 → 目标域少量样本微调 → 跨工况故障分类。

四、研究过程:两个数据集 + 七类对比模型

数据集

  • CWRU公开数据集:0/1/2 hp,7类故障(含正常、内圈、外圈、滚动体)

  • 自建实验平台:0/0.25/0.5 MPa,同样7类故障(原文第18-19页)

对比模型

DSCNN、Swin、DSCNN-GAM、VGG16、ResNet、CNN-SwinGAM

评估指标

准确率、损失率、损失曲线、混淆矩阵、t-SNE

五、研究重难点:模型设计中的三个关键挑战

难点1:如何兼顾轻量与表达能力?

解决方案 :采用**深度可分离卷积(DSC)**替代标准卷积。

  • 参数量和计算量分别降至标准卷积的 1/C_out + 1/K²(原文公式(5)(6))

  • 同时保持较强的特征表达能力

难点2:单一注意力机制难以捕捉多尺度特征

解决方案 :提出**窗口注意力(Swin)+ 全局注意力(GAM)**的混合机制。

  • Swin:提取局部短时依赖

  • GAM:强化跨通道与空间维度的全局交互

难点3:跨工况下分布漂移严重

解决方案 :引入迁移学习

  • 源域充分预训练

  • 目标域仅用40%样本微调,即可实现高精度迁移(原文第13页)

六、研究结论:精度、损失、可视化三重验证

1. 准确率全面领先

CWRU 单工况(原文 Table 3,第14页)
  • DSCNN-SwinGAM:100%(平均)

  • 对比模型:DSCNN(96.10%)、ResNet(99.30%)

CWRU 迁移任务(原文 Table 4,第14页)
  • 平均精度:99.93%

  • 6个迁移任务中多个达到100%

自建平台迁移任务(原文 Table 9,第21页)
  • 平均精度:99.55%

  • 比DSCNN高出12个百分点

2. 损失率显著更低(原文 Table 6、11)

  • CWRU迁移任务平均损失:0.0755(DSCNN为3.22)

  • 自建平台迁移任务平均损失:0.4119(DSCNN为12.14)

3. 收敛速度更快(原文 Fig.8、15)

  • DSCNN-SwinGAM 在训练早期即快速收敛

  • 最终损失值最低,表明拟合能力强、过拟合风险低

4. 特征聚类更清晰(原文 Fig.10、17)

  • 同类故障特征高度聚集

  • 不同故障类别之间边界明显

  • 对比模型存在明显混叠现象

七、未来展望:从实验室到工业现场的下一步

作者也明确指出了当前方法仍可改进的方向:

  1. 进一步提升训练效率,适应实时或在线诊断需求;

  2. 拓展到更复杂的工业场景

    • 变转速

    • 变温度

    • 跨设备(不同型号轴承)

  3. 构建端到端的在线故障诊断流水线,真正实现"边采边诊"。

写在最后:为什么这篇工作值得关注?

维度 亮点
🧠 方法创新 首次将Swin + GAM双注意力与DSC + 迁移学习融合
⚙️ 轻量高效 深度可分离卷积显著降低参数量
🎯 适用性强 专为小样本、变工况设计,贴近工业现实
📊 验证充分 双数据集、7类对比、多指标、消融实验齐全

如果你想在自己的轴承故障诊断任务中尝试该方法,建议优先复现其CWT时频图 + DSCNN-SwinGAM + 迁移学习的组合,这三点是精度提升的核心。

关注我们,获取更多工业智能诊断、深度学习前沿解读。

本文解读自论文:

*DSCNN-HA-TL: A Transfer Learning Framework with Hybrid Attention for Bearing Fault Diagnosis under Variable Operating Conditions (Struct Durab Health Monit, 2025)*

注:更多关于小样本齿轮箱故障诊断的前沿知识小编之前有推荐,可以详查置顶文章:【本周六开课】-数据驱动智能故障诊断技术应用与实践

如果您觉得文章不错,欢迎点赞、关注、收藏及转发~

相关推荐
沪漂阿龙2 小时前
AI大模型面试题:数据处理与特征工程详解——特征工程、缺失值、标准化、归一化、特征选择、数据不平衡、数据泄漏一次讲透
人工智能·机器学习
MediaTea2 小时前
人工智能通识课:机器学习之强化学习
人工智能·机器学习
曦月逸霜10 小时前
啥是RAG 它能干什么?
人工智能·python·机器学习
CSND74010 小时前
YOLO resume断点续训(不能用官方的权重,是自己训练一半生成的last.pt)
深度学习·yolo·机器学习
AI医影跨模态组学11 小时前
J Clin Oncol(IF=43.4)美国Cedars-Sinai医学中心等团队:基于计算组织学人工智能的晚期胰腺癌化疗选择预测性生物标志物的开发与验证
人工智能·机器学习·论文·医学·医学影像·影像组学
温九味闻醉12 小时前
关于腾讯广告算法大赛2025项目分析3-重读
人工智能·机器学习
1560025484014 小时前
基于VU9P+Zynq的双FMC基带信号处理板(支持国产替换)
信号处理
嵌入式小能手14 小时前
飞凌嵌入式ElfBoard-进程间的通信之信号处理pause
信号处理
AI医影跨模态组学16 小时前
Cancer Letters(IF=10.1)中山大学附属第六医院等团队:基于治疗前MRI影像的RCMIX模型预测MRI定义的cT4期直肠癌T分期下降
人工智能·机器学习·论文·医学·医学影像·影像组学