SHAP xAI 图形散点
SHAP xAI Graph scattered points
我使用Python中的SHAP xAI来解释整个测试数据
.
我想知道每行的点是怎么分布的?更密集的点区域是什么意思?为什么每一行的散乱区域之间都有空格?
Y轴是特征名称。散点图上的每条线代表一个特征。
X 轴是 SHAP 值。每行中的点数相同:即数据集中的数据点数。线上的每个点都描述了该特定点产生的 SHAP 值。值的聚类意味着这些特征 [值] 倾向于产生相似的 SHAP 值(由于输出不敏感或特征值本身的低分散性)。
点的颜色是原始单位的特征值。
所以把它们放在一起,最后一行可能是这样的:
- 低特征值往往会产生低 SHAP(ley) 值(蓝色数据点具有负 SHAP 值)
- 结果对特征值非常不敏感(因为 SHAP 值聚集在零附近)
- 结果对该特征的敏感性 saturates/clipped 在低负值(没有负尖峰)
- 至少有 2 个数据点具有高于平均 SHAP 值的[此特定]特征值。
请注意,每当我说“不敏感”时,我的意思是“所有可能的联盟的平均边际贡献都很低”。
我使用Python中的SHAP xAI来解释整个测试数据
我想知道每行的点是怎么分布的?更密集的点区域是什么意思?为什么每一行的散乱区域之间都有空格?
Y轴是特征名称。散点图上的每条线代表一个特征。
X 轴是 SHAP 值。每行中的点数相同:即数据集中的数据点数。线上的每个点都描述了该特定点产生的 SHAP 值。值的聚类意味着这些特征 [值] 倾向于产生相似的 SHAP 值(由于输出不敏感或特征值本身的低分散性)。
点的颜色是原始单位的特征值。
所以把它们放在一起,最后一行可能是这样的:
- 低特征值往往会产生低 SHAP(ley) 值(蓝色数据点具有负 SHAP 值)
- 结果对特征值非常不敏感(因为 SHAP 值聚集在零附近)
- 结果对该特征的敏感性 saturates/clipped 在低负值(没有负尖峰)
- 至少有 2 个数据点具有高于平均 SHAP 值的[此特定]特征值。
请注意,每当我说“不敏感”时,我的意思是“所有可能的联盟的平均边际贡献都很低”。