Augment with newdata 适用于一种模型,但无法用于另一种模型

Augment with newdata works with one model fails with another

我在这里遗漏了一些非常基本的东西——为什么 augment 可以与 一个模型而不是另一个模型?


iris$cSepal.Length <- scale(iris$Sepal.Length, center = TRUE, scale = FALSE)
nd <- expand.grid(Sepal.Length = seq(4, 8, 0.1), Species = factor(levels(iris$Species)))
nd$cSepal.Length <- nd$Sepal.Length - mean(iris$Sepal.Length)

m0 <- lm(Sepal.Width ~ Sepal.Length * Species, data = iris)
pred.0 <- augment(m0, newdata = nd)
m1 <- lm(Sepal.Width ~ cSepal.Length * Species, data = iris)
pred.1 <- augment(m1, newdata = nd)

## Error in data.frame(..., check.names = FALSE): arguments imply differing number of rows: 123, 150


这里的问题是 scale()。它返回一个矩阵而不是一个向量。将矩阵分配到 data.frame 会导致问题。您正在使用 scale() 创建 iris$cSepal.Length,但正在使用 x-mean(x) 创建 nd$cSepal.Length。这会创建两种不同的数据类型,当您使用 cSepal.Length 列时,这会在两种不同模型的预测过程中导致问题。


iris$cSepal.Length <- iris$Sepal.Length - mean(iris$Sepal.Length)
