SHAP xAI 图形散点

SHAP xAI Graph scattered points

我使用Python中的SHAP xAI来解释整个测试数据

.

我想知道每行的点是怎么分布的?更密集的点区域是什么意思?为什么每一行的散乱区域之间都有空格?

Y轴是特征名称。散点图上的每条线代表一个特征。

X 轴是 SHAP 值。每行中的点数相同:即数据集中的数据点数。线上的每个点都描述了该特定点产生的 SHAP 值。值的聚类意味着这些特征 [值] 倾向于产生相似的 SHAP 值(由于输出不敏感或特征值本身的低分散性)。

点的颜色是原始单位的特征值。

所以把它们放在一起,最后一行可能是这样的:

  • 低特征值往往会产生低 SHAP(ley) 值(蓝色数据点具有负 SHAP 值)
  • 结果对特征值非常不敏感(因为 SHAP 值聚集在零附近)
  • 结果对该特征的敏感性 saturates/clipped 在低负值(没有负尖峰)
  • 至少有 2 个数据点具有高于平均 SHAP 值的[此特定]特征值。

请注意,每当我说“不敏感”时,我的意思是“所有可能的联盟的平均边际贡献都很低”。