逻辑回归输出中只有两个不同的概率值

Only two distinct values of probabilities in Logistic regression output

我是运行 R 中的逻辑回归,并使用

为大约 15,000 行的测试数据提取预测概率
predict(modelglm, test_data, type = "prob") 

我期望得到介于 0 和 1 之间的各种概率值,但实际上只有两个不同的概率值。所有概率都是 1 或 2.220446e-16(实际上等于零)。实际上,我得到的是二元分类而不是概率。

为什么会这样?

您没有提供可重现的示例,但我认为 type 参数是错误的。使用 "response" 代替 "prob".

predict(modelglm, test_data, type="response")

解释变量可能解释得太多了。 F.ex 如果在每种情况下因变量为真,B2 为 1,而对于每种因变量为假的情况,B2 为 0,则模型可能会变得太好,并且仅预测 0 或 1 ( R 通常给出 2.220446e-16 和 1 就像你说的那样)。