SHAP值理论

一、优点

线性回归的系数越大并不意味着影响越强,shap是同一维度的;

XGBoost的对比是没有正负向;

ps:不会受到缺失值的影响

二、理论基础

博弈论:

ABC三人有每个人完成的效率 ,每两个人完成的效率(有交互作用),三个人一起完成something,应该怎么分配------加性的一种边际分配。

三、shap的应用

1、基础版------shap_values

复制代码
explainer = shap.Explainer(model)
shap_values = explainer(X)
#也可以shap_values = explainer.shap_values(X) ,X训练集

在SHAP中进行模型解释需要先创建一个explainer,SHAP支持很多类型的explainer

deep:用于计算深度学习模型,基于DeepLIFT算法,支持TensorFlow / Keras。

gradient:用于深度学习模型,综合了SHAP、集成梯度、和SmoothGrad等思想,形成单一期望值方程,但速度比DeepExplainer慢,并且做出了不同的假设。 此方法基于Integrated Gradient归因方法,并支持TensorFlow / Keras / PyTorch。

kernel:模型无关,适用于任何模型

linear:适用于特征独立不相关的线性模型

tree:适用于树模型和基于树模型的集成算法,如XGBoost,LightGBM或CatBoost

shap.SamplingExplainer --- SHAP latest documentation

复制代码
print("shap维度:",shap_values.shape)
print("测试集维度:",X_train.shape)
#the same

训练集or测试集的X都可以。

相关推荐
chools5 分钟前
Java后端拥抱AI开发之个人学习路线 - - Spring AI【第一期】
java·人工智能·学习·spring·ai
IT_陈寒11 分钟前
Vite热更新坑了我三天,原来配置要这么写
前端·人工智能·后端
子兮曰33 分钟前
CLI正在吞掉GUI:不是替代,是统治,AI时代的入口争夺战
人工智能·github·命令行
星星也在雾里1 小时前
Dify Agent + FastAPI + PostgreSQL实现数据库查询
数据库·人工智能·fastapi
Maschera961 小时前
openclaw-lark 的 Bot@Bot 跨Bot提及功能 - 开发经验分享
人工智能·node.js
TDengine (老段)1 小时前
以事件为核心 + 以资产为核心:工业数据中缺失的关键一环
大数据·数据库·人工智能·时序数据库·tdengine·涛思数据
阿里云大数据AI技术1 小时前
欣和大数据阿里云上升级,打造湖仓一体平台
大数据·人工智能
CC数分1 小时前
大模型时代的数据分析:AI会取代数据分析师吗?
人工智能·数据挖掘·数据分析
PHOSKEY1 小时前
直面消费电子检测新挑战——光子精密3D工业相机折叠屏铰链检测应用方案
人工智能
guslegend1 小时前
RAG系统的需求分析
人工智能·大模型