方差分析重复测量多个数据帧 r

ANOVA repeated measure on multiple data frames r

我有数百个数据框。我需要对这些数据帧中的每一个执行 ANOVA RM 测试。输出应该是一个单一的数据帧,每个 p 值的平均值。

我试过了:

#crate dataframes
df1 <- data.frame(replicate(16,sample(-10:10,10,rep=TRUE)))
df2 <- data.frame(replicate(16,sample(-10:10,10,rep=TRUE)))
df3 <- data.frame(replicate(16,sample(-10:10,10,rep=TRUE)))
Group <- c(rep("A",8),rep("B",8))
Time <- c(rep("before",4),rep("after",4),rep("before",4),rep("after",4))
Name <- rep(rep(1:4, 4))
conds <- data.frame(Name,Time,Group)
#create list
list <- list(df1,df2,df3)

#for loop ANOVA repeated measures
for ( i in list){
  data <- cbind(conds,i)
  t=NULL
  name <- colnames(data)[4:ncol(data)]
  for(i in 4:ncol(data)) { z <- aov(data[,i] ~ Group*Time+Error(Name/(Group*Time)), data=data) 
  sz <- as.list(summary(z))
  t <- as.data.frame(c(t,sz[4]$`Error: Name:Group:Time`[[1]]$`Pr(>F)`[1]))
  t
  }
}
mean(t)

R 作为一种矢量化语言旨在尽可能避免 for 循环。您可以采用 sapply 方法。

当您列出数据框时,使用 df1= 之类的名称,这稍后有助于 result 完成计算。

(并且不要使用 list 作为对象名称,因为您会感到困惑,因为还有一个 list 函数。另外 datadf 和朋友是 "bad" 名字,你可以经常检查,例如 ?list 如果名字已经被占用。)

list1 <- list(df1=df1, df2=df2, df3=df3)

res <- sapply(list1, function(x) {
  dat <- cbind(conds, x)
  sapply(dat[-(1:3)], function(y) {
    z <- aov(y ~ Group*Time + Error(Name/(Group*Time)), data=dat)
    sz <- summary(z)
    p <- sz$`Error: Name:Group:Time`[[1]][1, 5]
    p
  })
})

我们从生成的矩阵中获取列均值。

colMeans(res)
#       df1       df2       df3 
# 0.4487419 0.4806528 0.4847789

数据:

set.seed(42)
df1 <- data.frame(replicate(16,sample(-10:10,16,rep=TRUE)))
df2 <- data.frame(replicate(16,sample(-10:10,16,rep=TRUE)))
df3 <- data.frame(replicate(16,sample(-10:10,16,rep=TRUE)))
conds <- data.frame(Name=c(rep("A",8),rep("B",8)), 
                    Time=c(rep("before",4),rep("after",4),
                           rep("before",4),rep("after",4)),
                    Group=rep(1:4, 4))