在 R 中,如何从多个数据帧中导出列的平均百分比统计信息?
In R, how to derive an average percentage statistics on a column from multiple dataframes?
不久前,我用 mice()
进行了 20 次多重插补,并使用以下方法保存了这些:
for (i in 1:20)
{
write.csv(complete(imp20, i), file=paste("imp", i, ".csv", sep=""))
}
现在我想推导出名为 "remitted" 的变量的平均值 n 和 %(指缓解期在所有这 20 个数据框中,“性虐待”(该变量指的是儿童期性虐待)导致精神病)。我希望在 R 中有一种更简单的方法,而不是分别执行 20 次然后手动得出平均值。我将不胜感激任何建议。下面展示了我的一小部分数据。谢谢您的帮助。
> head(df, 10)
sexabuse remitted
1 0. No 1. Yes
2 0. No 0. No
3 0. No 0. No
4 0. No 0. No
5 0. No 0. No
6 1. Yes 1. Yes
7 1. Yes 0. No
8 0. No 0. No
9 0. No 0. No
10 0. No 1. Yes
如果我理解你问题正确(你想找到 20 个不同 data.frame 的平均值)。然后您可以执行以下操作:
df <- do.call(rbind,imp20) ##imp20 here is the 20 data.frames
write.table(df,file = "name of your file")
tablee <- read.table("name of your file")
tablee
summ_result <- apply(tablee,2,summary) ##this will gives you all the summary statistic including the mean for your all variables.
summ_result
不久前,我用 mice()
进行了 20 次多重插补,并使用以下方法保存了这些:
for (i in 1:20)
{
write.csv(complete(imp20, i), file=paste("imp", i, ".csv", sep=""))
}
现在我想推导出名为 "remitted" 的变量的平均值 n 和 %(指缓解期在所有这 20 个数据框中,“性虐待”(该变量指的是儿童期性虐待)导致精神病)。我希望在 R 中有一种更简单的方法,而不是分别执行 20 次然后手动得出平均值。我将不胜感激任何建议。下面展示了我的一小部分数据。谢谢您的帮助。
> head(df, 10)
sexabuse remitted
1 0. No 1. Yes
2 0. No 0. No
3 0. No 0. No
4 0. No 0. No
5 0. No 0. No
6 1. Yes 1. Yes
7 1. Yes 0. No
8 0. No 0. No
9 0. No 0. No
10 0. No 1. Yes
如果我理解你问题正确(你想找到 20 个不同 data.frame 的平均值)。然后您可以执行以下操作:
df <- do.call(rbind,imp20) ##imp20 here is the 20 data.frames
write.table(df,file = "name of your file")
tablee <- read.table("name of your file")
tablee
summ_result <- apply(tablee,2,summary) ##this will gives you all the summary statistic including the mean for your all variables.
summ_result