SHAP值理论

一、优点

线性回归的系数越大并不意味着影响越强,shap是同一维度的;

XGBoost的对比是没有正负向;

ps:不会受到缺失值的影响

二、理论基础

博弈论:

ABC三人有每个人完成的效率 ,每两个人完成的效率(有交互作用),三个人一起完成something,应该怎么分配------加性的一种边际分配。

三、shap的应用

1、基础版------shap_values

复制代码
explainer = shap.Explainer(model)
shap_values = explainer(X)
#也可以shap_values = explainer.shap_values(X) ,X训练集

在SHAP中进行模型解释需要先创建一个explainer,SHAP支持很多类型的explainer

deep:用于计算深度学习模型,基于DeepLIFT算法,支持TensorFlow / Keras。

gradient:用于深度学习模型,综合了SHAP、集成梯度、和SmoothGrad等思想,形成单一期望值方程,但速度比DeepExplainer慢,并且做出了不同的假设。 此方法基于Integrated Gradient归因方法,并支持TensorFlow / Keras / PyTorch。

kernel:模型无关,适用于任何模型

linear:适用于特征独立不相关的线性模型

tree:适用于树模型和基于树模型的集成算法,如XGBoost,LightGBM或CatBoost

shap.SamplingExplainer --- SHAP latest documentation

复制代码
print("shap维度:",shap_values.shape)
print("测试集维度:",X_train.shape)
#the same

训练集or测试集的X都可以。

相关推荐
Yeats_Liao12 分钟前
CANN Samples(十一):媒体处理接口V1与V2的取舍与迁移
人工智能·媒体
汤姆yu19 分钟前
基于srpingboot心情治愈调整系统
人工智能
国科安芯24 分钟前
航天医疗领域AS32S601芯片的性能分析与适配性探讨
大数据·网络·人工智能·单片机·嵌入式硬件·fpga开发·性能优化
咚咚王者27 分钟前
人工智能之数据分析 Pandas:第五章 文件处理
人工智能·数据分析·pandas
zhaodiandiandian1 小时前
人工智能与就业重构:机遇、挑战与政策应对
人工智能·百度·重构
浔川python社1 小时前
浔川社团:技术创作与社区运营的双重成功
人工智能
LUU_791 小时前
Day27 机器学习管道pipeline
人工智能·机器学习
冯骐1 小时前
基于 DeepSeek V3.2 的 Native Agent 实践指南,真香
人工智能·agent·deepseek
亚马逊云开发者1 小时前
利用Amazon Bedrock构建智能报告生成Agent
人工智能
孟祥_成都2 小时前
Prompt 还能哄女朋友!你真的知道如何问 ai 问题吗?
前端·人工智能