如何使用二元变量建立逻辑回归模型?

How to use a binary variable to build a logistic regression model?

如您所见,这是我的因变量 (G3) 的结构:

G3 是学生期末成绩。它是一个二元变量,如果G3<10,学生不及格;如果 G3>=10,学生通过。用“1”表示不通过,“2”表示通过。

现在我要建立逻辑回归模型。我需要将这个二进制变量转换为数值变量,我们假设如果因变量 G3 等于 1,如果学生不及格,如果 G3 等于 0,如果学生通过。我该怎么办?

然后又检查了G3的结构:

变成了数值变量,但"fail"或"pass"仍用“1”和“2”表示。我怎样才能将它们更改为“1”和“0”?

怎么样

performance$G3 <- 2-performance$G3 

?

或者,您可以从头开始

performance$G3 <- ifelse(performance$G3=="fail",0,1)

最后,您可以使用因子变量作为响应。从?binomial开始,如果响应变量是一个因素,

... ‘success’ is interpreted as the factor not having the first level (and hence usually of having the second level).

您必须更改级别的顺序,例如

 performance$G3 <- factor(performance$G3, levels=c("pass", "fail"))