使用 dplyr 计算分组数据中相关性的显着性

Question

我对数据进行了分组，我想为此测试几个基本的推理统计。

library(tidyverse)

df <- data.frame(x=runif(50, min = 0, max = 25),y=runif(50, min = 10, max = 25), group=rep(0:1,25))

df %>%
  group_by(group) %>%
  summarize(cor(x,y))

在这里我可以很容易地得到相关性，但我还需要检查它的统计显着性。不幸的是，像 cor.test 这样的选项在 dyplr 中不起作用。有简单的解决方法吗？

Answer 1

这就是你想要的吗？

df %>%
    group_by(group) %>%
    summarize(cor.test(x,y)[["p.value"]])

问题是 cor.test() returns 是一个列表而不是单个值，因此您需要从列表中选择您感兴趣的元素。

使用 dplyr 计算分组数据中相关性的显着性

Calculate significance of correlation in grouped data with dplyr

r

significance

dplyr

pearson-correlation