Lime 解释器显示与分类器预测不同的预测概率 - 情感分析

Lime explainer shows prediction probabilities different to the classifier prediction - sentiment analysis

我正在使用 Lime 来追踪模型决定预测这句话是否为(NEG、POS 或 NEUTRAL)背后的行为,并且在大多数情况下 lime 解释正确,但在这种情况下我输入的原因NEG 句子,模型将其预测为 NEUTRAL,但 Lime 以 NEG 最高百分比将其可视化,那么为什么我会出现这样的逻辑错误?

Model prediction vs Lime prediction

你没有提供很多细节,所以我的回答同样笼统:你原来的模型做出了错误的预测。然后石灰正在对模型进行线性近似。由于线性模型的近似性,这与原始模型不完全相同并且偏离了原始模型。在你的情况下,原始模型给出了错误的预测,线性近似的偏差 - 偶然地 - 在正确答案的方向上,所以你 - 偶然地 - 从近似中得到正确的答案,尽管原始模型是错误的.