格式化数据帧以进行统计分析

Formatting dataframes for statistical analyses

我想做的是测试一个响应和一个解释变量之间的统计关系。为此,我假设单向方差分析是一种有效的程序。但是,我的数据框未设置为执行此操作。我有一列用于响应变量 (df1),但有几列将被归类为下面我想要的解释变量(df2 和 df3)。作为一个粗略的例子,df2 和 df3 代表 2 个不同位置的季节(夏季)。在这种情况下,我将如何测试夏季对响应变量的影响?

df1 <- as.data.frame(matrix(sample(0:1000, 36*10, replace=TRUE), ncol=1))
df2 <- as.data.frame(matrix(sample(0:500, 36*10, replace=TRUE), ncol=1))
df3 <- as.data.frame(matrix(sample(0:200, 36*10, replace=TRUE), ncol=1))
Example <- cbind(df1,df2,df3)

这是否涉及重组数据框,使 df2 和 df3 合并成为一个长列并使 df1 的长度加倍?

提前感谢您的帮助!

正如 Jaap 和 Andrew Taylor 所建议的,问题在于格式化线性回归。这是通过 'stack' 和 'cbind' 函数实现的。

df1 <- as.data.frame(matrix(sample(0:1000, 36*10, replace=TRUE), ncol=1))
df2 <- as.data.frame(matrix(sample(0:500, 36*10, replace=TRUE), ncol=1))
df3 <- as.data.frame(matrix(sample(0:200, 36*10, replace=TRUE), ncol=1))
Example <- cbind(df2,df3)
Stacked <- stack(Example)
Combined <- cbind(df1,Stacked)
colnames(Combined) <- c("Response","Explanatory","Variable")
Linear <- lm(Explanatory~Response, data = Combined)
summary(Linear)

Stack 将所有解释变量(df2 和 df3)放入一列,而 cbind 将这一新列与来自响应 (df1) 的值组合,并复制这些值以创建具有偶数行的数据框,根据 SabDeM 的评论。