如何使用二元变量建立逻辑回归模型?
How to use a binary variable to build a logistic regression model?
如您所见,这是我的因变量 (G3
) 的结构:
G3
是学生期末成绩。它是一个二元变量,如果G3
<10,学生不及格;如果 G3
>=10,学生通过。用“1”表示不通过,“2”表示通过。
现在我要建立逻辑回归模型。我需要将这个二进制变量转换为数值变量,我们假设如果因变量 G3 等于 1,如果学生不及格,如果 G3 等于 0,如果学生通过。我该怎么办?
然后又检查了G3的结构:
变成了数值变量,但"fail"或"pass"仍用“1”和“2”表示。我怎样才能将它们更改为“1”和“0”?
怎么样
performance$G3 <- 2-performance$G3
?
或者,您可以从头开始
performance$G3 <- ifelse(performance$G3=="fail",0,1)
最后,您可以使用因子变量作为响应。从?binomial
开始,如果响应变量是一个因素,
... ‘success’ is interpreted as the factor not
having the first level (and hence usually of having the
second level).
您必须更改级别的顺序,例如
performance$G3 <- factor(performance$G3, levels=c("pass", "fail"))
如您所见,这是我的因变量 (G3
) 的结构:
G3
是学生期末成绩。它是一个二元变量,如果G3
<10,学生不及格;如果 G3
>=10,学生通过。用“1”表示不通过,“2”表示通过。
现在我要建立逻辑回归模型。我需要将这个二进制变量转换为数值变量,我们假设如果因变量 G3 等于 1,如果学生不及格,如果 G3 等于 0,如果学生通过。我该怎么办?
然后又检查了G3的结构:
变成了数值变量,但"fail"或"pass"仍用“1”和“2”表示。我怎样才能将它们更改为“1”和“0”?
怎么样
performance$G3 <- 2-performance$G3
?
或者,您可以从头开始
performance$G3 <- ifelse(performance$G3=="fail",0,1)
最后,您可以使用因子变量作为响应。从?binomial
开始,如果响应变量是一个因素,
... ‘success’ is interpreted as the factor not having the first level (and hence usually of having the second level).
您必须更改级别的顺序,例如
performance$G3 <- factor(performance$G3, levels=c("pass", "fail"))