SHAP值理论

一、优点

线性回归的系数越大并不意味着影响越强,shap是同一维度的;

XGBoost的对比是没有正负向;

ps:不会受到缺失值的影响

二、理论基础

博弈论:

ABC三人有每个人完成的效率 ,每两个人完成的效率(有交互作用),三个人一起完成something,应该怎么分配------加性的一种边际分配。

三、shap的应用

1、基础版------shap_values

复制代码
explainer = shap.Explainer(model)
shap_values = explainer(X)
#也可以shap_values = explainer.shap_values(X) ,X训练集

在SHAP中进行模型解释需要先创建一个explainer,SHAP支持很多类型的explainer

deep:用于计算深度学习模型,基于DeepLIFT算法,支持TensorFlow / Keras。

gradient:用于深度学习模型,综合了SHAP、集成梯度、和SmoothGrad等思想,形成单一期望值方程,但速度比DeepExplainer慢,并且做出了不同的假设。 此方法基于Integrated Gradient归因方法,并支持TensorFlow / Keras / PyTorch。

kernel:模型无关,适用于任何模型

linear:适用于特征独立不相关的线性模型

tree:适用于树模型和基于树模型的集成算法,如XGBoost,LightGBM或CatBoost

shap.SamplingExplainer --- SHAP latest documentation

复制代码
print("shap维度:",shap_values.shape)
print("测试集维度:",X_train.shape)
#the same

训练集or测试集的X都可以。

相关推荐
每天一个java小知识12 小时前
AI Agent
人工智能
猫头虎12 小时前
如何解决 pip install 编译报错 fatal error: hdf5.h: No such file or directory(h5py)问题
人工智能·python·pycharm·开源·beautifulsoup·ai编程·pip
龙赤子12 小时前
人工智能AI的大框架
人工智能
比奥利奥还傲.12 小时前
本地+AI+大模型自由用!Cherry+Studio打破局域网限制
人工智能
雪碧聊技术12 小时前
深度学习、机器学习、人工智能三者的关系
人工智能·深度学习·机器学习
β添砖java12 小时前
机器学习初级
人工智能·机器学习
陈奕昆12 小时前
n8n实战营Day3:电商订单全流程自动化·需求分析与流程拆解
大数据·开发语言·人工智能·自动化·需求分析·n8n
努力改掉拖延症的小白12 小时前
Intel笔记本也能部署大模型(利用Ultra系列gpu通过优化版ollama实现)
人工智能·ai·语言模型·大模型
优爱蛋白12 小时前
B细胞细胞因子:免疫系统的“信使军团“与疾病治疗的新前沿
人工智能·经验分享·健康医疗
陈奕昆12 小时前
n8n实战营Day1课时3:高频节点解析+Webhook表单同步Excel实操
人工智能·python·n8n