数据帧错误 *tmp* 替换有 x 数据有 y

Error in dataframe *tmp* replacement has x data has y

我是 R 的初学者。这是一个非常简单的代码,我试图在其中保存残差项:

# Create variables for child's EA:

dat$cldeacdi <- rowMeans(dat[,c('cdcresp', 'cdcinv')],na.rm=T)
dat$cldeacu <- rowMeans(dat[,c('cucresp', 'cucinv')],na.rm=T)

# Create a residual score for child EA:

dat$cldearesid <- resid(lm(cldeacu ~ cldeacdi, data = dat))

我收到以下消息:

Error in `$<-.data.frame`(`*tmp*`, cldearesid, value = c(-0.18608488908881,  : 
  replacement has 366 rows, data has 367

我搜索了这个错误,但找不到任何可以解决这个问题的方法。此外,我为妈妈的 EA 创建了完全相同的代码,它保存了残差,没有错误。如果有人能帮我解决这个问题,我将不胜感激。

我感觉你的数据中有 NAs。看这个例子:

#mtcars data set
test <- mtcars
#adding just one NA in the cyl column
test[2, 2] <- NA

#running linear model and adding the residuals to the data.frame
test$residuals <- resid(lm(mpg ~ cyl, test))
Error in `$<-.data.frame`(`*tmp*`, "residuals", value = c(0.382245430809409,  : 
  replacement has 31 rows, data has 32

如您所见,这会导致与您的类似的错误。

作为验证:

length(resid(lm(mpg ~ cyl, test)))
#31
nrow(test)
#32

发生这种情况是因为 lm 将在 运行 回归之前对数据集 运行 na.omit,因此如果您有任何带有 NA 的行,这些行将得到消除导致更少的结果。

如果您 运行 na.omit 在您的 dat 数据集上(即 dat <- na.omit(dat) 在代码的最开头,那么您的代码应该可以工作。

这是一个旧线程,但也许这可以帮助面临同样问题的其他人。对于 LyzandeR 的观点,检查 NA 作为第一道防线。此外,请确保您在 x 中没有任何因素,因为这也会导致错误。