使用 dplyr 计算分组数据中相关性的显着性
Calculate significance of correlation in grouped data with dplyr
我对数据进行了分组,我想为此测试几个基本的推理统计。
library(tidyverse)
df <- data.frame(x=runif(50, min = 0, max = 25),y=runif(50, min = 10, max = 25), group=rep(0:1,25))
df %>%
group_by(group) %>%
summarize(cor(x,y))
在这里我可以很容易地得到相关性,但我还需要检查它的统计显着性。不幸的是,像 cor.test
这样的选项在 dyplr
中不起作用。有简单的解决方法吗?
这就是你想要的吗?
df %>%
group_by(group) %>%
summarize(cor.test(x,y)[["p.value"]])
问题是 cor.test()
returns 是一个列表而不是单个值,因此您需要从列表中选择您感兴趣的元素。
我对数据进行了分组,我想为此测试几个基本的推理统计。
library(tidyverse)
df <- data.frame(x=runif(50, min = 0, max = 25),y=runif(50, min = 10, max = 25), group=rep(0:1,25))
df %>%
group_by(group) %>%
summarize(cor(x,y))
在这里我可以很容易地得到相关性,但我还需要检查它的统计显着性。不幸的是,像 cor.test
这样的选项在 dyplr
中不起作用。有简单的解决方法吗?
这就是你想要的吗?
df %>%
group_by(group) %>%
summarize(cor.test(x,y)[["p.value"]])
问题是 cor.test()
returns 是一个列表而不是单个值,因此您需要从列表中选择您感兴趣的元素。