如何解释 SHAP 总结图?

数据挖掘 机器学习 分类 预测建模 随机森林 形状
2022-03-04 20:45:21

我已经在这里这里提到了这些帖子所以,请不要将其标记为重复

我正在使用随机森林进行二元分类,类别标签为 1 和 0。供应商达到目标的可能性有多大

我从 SHAP 摘要图中得到了以下输出

在此处输入图像描述

我如何知道哪个特征导致 1 类和 0 类?

这是否意味着每个特征的高值导致第 1 类?

每个特征的低值导致0级?

当我的输出概率范围是 0 到 1 时,为什么 SHAP 图会返回 0 到 0.20 之类的东西

SHAP 值是什么意思?

1个回答

我如何知道哪个特征导致 1 类和 0 类?

条形的长度告诉您该特征对预测的影响有多大。

这是否意味着每个特征的高值导致第 1 类?

不,要查看此使用摘要图

每个特征的低值导致0级?

与上一个答案相同。

当我的输出概率范围是 0 到 1 时,为什么 SHAP 图会返回 0 到 0.20 之类的东西

它向您展示的是每个特征对预测的平均贡献程度。而且我怀疑贡献总和不等于 1 的原因是您的数据集不平衡。

SHAP 值是什么意思?

SHAP 首先计算每个观察的分数,但为了获得每个特征的整体贡献,它会平均所有观察的值。