SHAP值理论

一、优点

线性回归的系数越大并不意味着影响越强,shap是同一维度的;

XGBoost的对比是没有正负向;

ps:不会受到缺失值的影响

二、理论基础

博弈论:

ABC三人有每个人完成的效率 ,每两个人完成的效率(有交互作用),三个人一起完成something,应该怎么分配------加性的一种边际分配。

三、shap的应用

1、基础版------shap_values

复制代码
explainer = shap.Explainer(model)
shap_values = explainer(X)
#也可以shap_values = explainer.shap_values(X) ,X训练集

在SHAP中进行模型解释需要先创建一个explainer,SHAP支持很多类型的explainer

deep:用于计算深度学习模型,基于DeepLIFT算法,支持TensorFlow / Keras。

gradient:用于深度学习模型,综合了SHAP、集成梯度、和SmoothGrad等思想,形成单一期望值方程,但速度比DeepExplainer慢,并且做出了不同的假设。 此方法基于Integrated Gradient归因方法,并支持TensorFlow / Keras / PyTorch。

kernel:模型无关,适用于任何模型

linear:适用于特征独立不相关的线性模型

tree:适用于树模型和基于树模型的集成算法,如XGBoost,LightGBM或CatBoost

shap.SamplingExplainer --- SHAP latest documentation

复制代码
print("shap维度:",shap_values.shape)
print("测试集维度:",X_train.shape)
#the same

训练集or测试集的X都可以。

相关推荐
是一碗螺丝粉16 分钟前
5分钟上手LangChain.js:用DeepSeek给你的App加上AI能力
前端·人工智能·langchain
两万五千个小时24 分钟前
落地实现 Anthropic Multi-Agent Research System
人工智能·python·架构
用户48159301959125 分钟前
揭秘GPT-4与LLaMA背后的加速黑科技:KV Cache、MQA、GQA、稀疏注意力与MoE全解析
人工智能
用户51914958484526 分钟前
Cisco SMA 暴露面检测工具 - 快速识别CVE-2025-20393风险
人工智能·aigc
碳基沙盒32 分钟前
AI工具的“超级外挂”:从零手把手教你搭建私人 MCP 服务器
人工智能
马腾化云东33 分钟前
Agent开发应知应会(langfuse):Langfuse Score概念详解和实战应用
人工智能·llm·ai编程
Baihai_IDP38 分钟前
HackerNews 热榜第一名:AGI 的 A,原来代表的是 Ads(广告)
人工智能·程序员·llm
ma_king38 分钟前
claude+tmux 团队模式使用
人工智能·claude
蓝桉_T1 小时前
Ollama 本地跑 DeepSeek-Coder V3 保姆级教程(Java 调用示例)
人工智能
风象南3 小时前
Token太贵?我用这个数据格式把上下文窗口扩大2倍
人工智能·后端