如何为预测添加一些全局和本地可解释性以了解客户流失的原因?

How to add some global and local explainability to a predictions to understand for which reasons a customer churns?

主要目标是理解:

  1. 客户流失的可能性有多大?
  2. 确定流失原因每个用户

目前,我使用的是随机森林模型。我可以看到对所有用户来说最重要的功能。有没有办法让我获得每个用户的重要功能?例如,可能一位顾客因为不喜欢该产品而离开,而另一位顾客因为它是一种昂贵的产品而离开,等等。

提前致谢!

单个 SHAP 值可用于这种局部可解释性。 SHAP 值计算每个预测变量的贡献,并且可以全局应用,或应用于特定群体(即离开的客户)或个人客户。