SHAP值理论

一、优点

线性回归的系数越大并不意味着影响越强,shap是同一维度的;

XGBoost的对比是没有正负向;

ps:不会受到缺失值的影响

二、理论基础

博弈论:

ABC三人有每个人完成的效率 ,每两个人完成的效率(有交互作用),三个人一起完成something,应该怎么分配------加性的一种边际分配。

三、shap的应用

1、基础版------shap_values

复制代码
explainer = shap.Explainer(model)
shap_values = explainer(X)
#也可以shap_values = explainer.shap_values(X) ,X训练集

在SHAP中进行模型解释需要先创建一个explainer,SHAP支持很多类型的explainer

deep:用于计算深度学习模型,基于DeepLIFT算法,支持TensorFlow / Keras。

gradient:用于深度学习模型,综合了SHAP、集成梯度、和SmoothGrad等思想,形成单一期望值方程,但速度比DeepExplainer慢,并且做出了不同的假设。 此方法基于Integrated Gradient归因方法,并支持TensorFlow / Keras / PyTorch。

kernel:模型无关,适用于任何模型

linear:适用于特征独立不相关的线性模型

tree:适用于树模型和基于树模型的集成算法,如XGBoost,LightGBM或CatBoost

shap.SamplingExplainer --- SHAP latest documentation

复制代码
print("shap维度:",shap_values.shape)
print("测试集维度:",X_train.shape)
#the same

训练集or测试集的X都可以。

相关推荐
甲维斯31 分钟前
坦克大战测试全翻车了!豆包,DeepSeek,Qwen,GPT,Claude
前端·人工智能·游戏开发
若丶相见1 小时前
AI 大模型零基础知识扫盲
人工智能
猿人谷2 小时前
不只是 CPU 阈值:STAR 如何用 GAT + Transformer 做容器级自动扩缩容?
人工智能·算法
说了很好3 小时前
PyTorch从零搭建DDPM:时间嵌入+UNet网络+扩散调度完整复现
人工智能
Bigfish_coding3 小时前
前端转agent-【python】-06 长期记忆(向量数据库 + 嵌入)
人工智能
小林ixn3 小时前
别再手写Prompt了!用AI Loop实现自动化自我迭代,效率提升10倍
人工智能·自动化运维
说了很好3 小时前
逐行注释DDPM源码:正向加噪、逆向去噪、MSE损失全流程复现
人工智能
Dilee3 小时前
Spring AI 1.1.7 接入 MCP:Filesystem Server 最小 Demo
人工智能·后端
Token炼金师3 小时前
大模型推理超参数原理详解
人工智能
Token炼金师3 小时前
大模型训练超参数:从Loss曲面到收敛策略的底层逻辑
人工智能