逗号分隔因变量在线性回归中意味着什么?

What does a comma separating dependent variables mean in a linear regression?

我不明白 lm 函数中因变量之间的逗号是什么意思。与用 + 分隔因变量的模型相比,用逗号分隔因变量的模型提供了更小的 AIC。如果有人能启发我,将不胜感激!

我已经尝试查阅 lm 手册和一些多元线性回归指南。

带逗号分隔符

m15 <- lm(FAD~ mobldata$meanmarchtemp , mobldata$snowcover,
          data=mobldata)
summary(m15)
AIC(m15)
[1] 254.3559

对比

带 + 分隔符

m9 <- lm(FAD~mobldata$snowcover + mobldata$meanmarchtemp, data = mobldata)
summary(m9)
AIC(m9)
[1] 357.9709

我在构建模型摘要时遇到了这个问题 table。 再次感谢您的帮助!

逗号后的任何内容都是 lm() 的单独参数,而不是实际回归公式的一部分。 lm() 的参数是 lm(formula, data, subset, ...),并且 data 作为命名参数处理,因此 snowcover 将是 subset 参数。

假设 snowcover 是一个逻辑变量,带有 subset 参数的模型仅适用于 snowcoverTRUE 的观测值。 (如果 snowcover 不是这样的二进制变量,则可能会发生意外情况)。因为模型适合不同数量的观察,所以我认为 AIC 不具有可比性。