可解释性AI 综述《Explainable AI for Industrial Fault Diagnosis: A Systematic Review》

随着工业4.0与工业5.0的发展，工业生产越来越依赖自动化与智能化手段，以实现高效、预测性维护与运行优化。在这一背景下，人工智能（AI）与机器学习（ML）因其强大的数据处理和预测能力，在设备故障检测（Fault Detection and Diagnosis, FDD）中发挥着日益重要的作用。

然而，工业用户对这些AI系统的"黑箱性"持怀疑态度。具体来说，深度学习模型虽具备强大泛化能力，但其决策过程缺乏透明性，导致用户在出现异常时难以溯因与干预。这不仅影响用户信任度，也不符合正在推进的如欧盟《AI法案》（EU AI Act）等法规对"可审计性""可控性""可解释性"的明确要求。

因此，**可解释人工智能（XAI）**应运而生，其目标是在不牺牲性能的前提下，增强模型对人类用户的可理解性与可控性，为AI系统的落地提供合规性与可接受性保障。

为系统总结工业XAI的现状，作者基于Scopus数据库进行系统文献回顾（Systematic Literature Review, SLR），筛选了2020--2024年间33篇与工业故障检测紧密相关的高质量文献，构建了一个多维度的XAI方法分类体系：

透明模型（Transparent models）：如逻辑回归、决策树、KNN，本身结构简单、便于分析解释；
黑箱模型（Black-box models）：如CNN、Transformer等深度神经网络，需依赖XAI技术生成后验解释（post-hoc explainability）。

涵盖六大主流方法：

作者总结的33篇文献覆盖了XAI在工业中的多元场景，归纳如下：

SHAP：使用频率最高（13次），适配性广，支持全局+局部解释；
GradCAM：用于图像识别类CNN模型；
LIME、LRP、SmoothGrad：多聚焦于局部特征归因；
Decision Tree、Bayesian Network、Zero-bias CNN：少量为模型内在可解释方法（intrinsic explainability）。

作者指出，目前XAI评估缺乏标准化框架，主要分为三类：

作者强调将图形输出与数值指标结合（如SHAP图+CEI评分）可提升XAI输出的直观性与深度。

尽管XAI研究热度持续上升，但工业应用仍面临若干瓶颈：

DL模型性能高但不可解释，传统模型可解释但精度低，需在透明度与效果之间折中。

当前多数工作仍限于理论探讨，缺少结合现场工人/工程师反馈的评估平台。

如贝叶斯网络、规则系统虽可解释，但难以处理复杂数据流。

本文综述指出，XAI正逐步成为工业AI系统落地的关键驱动力。当前以SHAP、LIME等后验解释方法为主，广泛应用于工业设备检测、过程监控与安全防护中。但整体仍处于"工具阶段"，缺乏统一评估框架、标准化流程与跨行业通用模式。

未来，推动XAI从"补充模块"向"系统内核"转变，将是实现工业5.0"人本-透明-可信"目标的必要路径。