数据框列中的 Pearson 相关性和 p 值

Pearson correlation and p-value in columns from a data frame

例如,如果我们计算数据集 mtcars 的前两个变量的 Pearson 相关性和 P 值,结果是这样的:

Correlation value:

      mpg  disp    
mpg   1.00 -0.85 
disp -0.85  1.00  

P-value:

      mpg    disp   
mpg  0.0000 0.0000 
disp 0.0000 0.0000       

除了这个,有没有办法得到这样的结果:

          Corr.   p-value
mp  mp    1.00    0.0000
mp  dip  -0.85    0.0000

我有 200 多个变量,想生成这样的结果,然后使用 write.csv 命令将这些结果写入 CSV 文件。谢谢!

如果我们想要成对 cor.test,请使用 combn

out <- combn(mtcars, 2, FUN = function(x) 
    cor.test(x[[1]], x[[2]], conf.level = 0.95), simplify = FALSE)
names(out) <- combn(names(mtcars), 2, FUN = paste, collapse='_')

corr.test 的输出是 list

str(out[[1]])
#List of 9
# $ statistic  : Named num -8.92
#  ..- attr(*, "names")= chr "t"
# $ parameter  : Named int 30
#  ..- attr(*, "names")= chr "df"
# $ p.value    : num 6.11e-10
# $ estimate   : Named num -0.852
#  ..- attr(*, "names")= chr "cor"
# $ null.value : Named num 0
#  ..- attr(*, "names")= chr "correlation"
# $ alternative: chr "two.sided"
# $ method     : chr "Pearson's product-moment correlation"
# $ data.name  : chr "x[[1]] and x[[2]]"
# $ conf.int   : num [1:2] -0.926 -0.716
#  ..- attr(*, "conf.level")= num 0.95

可以直接用列表提取的方法提取,即$[[

mydata <– do.call(rbind, Map(cbind, corgroups = names(out), 
 unname(lapply(out, function(x)
        data.frame(cor.value = x$estimate, cor.pvalue = x$p.value)))))