使用 dplyr 将新计算分组到一个数据框中
Using dplyr to group the new calculations into one data frame
我有以下 table,我必须为 x 的每个 唯一 值获得 y 的标准差。
ID x y
1 1 4
2 2 3
3 3 7
4 1 2
5 2 6
6 3 8
例如,x 的每个唯一值,我有 y=4 和 y=2,所以标准差将为:
x1 <- c(4,2)
sd(x1)
#output is 1.41
x2 <-c(3,6)
sd(x2)
#output is 2.21
x3 <-c(3,6)
sd(x3)
#output is 0.71
有没有办法使用 dplyr 和管道更快地完成每个输出并将其放入数据帧?我尝试使用 mutate 和 group_by,但它似乎不起作用。我希望结果看起来如下 count_y (# of y values to each unique x)
x count_y Std_Dev
1 2 1.41
2 2 2.21
3 2 0.71
我们不需要 mutate
(mutate
创建或转换列)。这里,需要的输出是每组一行,可以用 summarise
完成
library(dplyr)
df1 %>%
group_by(x) %>%
summarise(count_y = n(), Std_Dev = sd(y))
-输出
# A tibble: 3 × 3
x count_y Std_Dev
<int> <int> <dbl>
1 1 2 1.41
2 2 2 2.12
3 3 2 0.707
数据
df1 <- structure(list(ID = 1:6, x = c(1L, 2L, 3L, 1L, 2L, 3L), y = c(4L,
3L, 7L, 2L, 6L, 8L)), class = "data.frame", row.names = c(NA,
-6L))
我有以下 table,我必须为 x 的每个 唯一 值获得 y 的标准差。
ID x y
1 1 4
2 2 3
3 3 7
4 1 2
5 2 6
6 3 8
例如,x 的每个唯一值,我有 y=4 和 y=2,所以标准差将为:
x1 <- c(4,2)
sd(x1)
#output is 1.41
x2 <-c(3,6)
sd(x2)
#output is 2.21
x3 <-c(3,6)
sd(x3)
#output is 0.71
有没有办法使用 dplyr 和管道更快地完成每个输出并将其放入数据帧?我尝试使用 mutate 和 group_by,但它似乎不起作用。我希望结果看起来如下 count_y (# of y values to each unique x)
x count_y Std_Dev
1 2 1.41
2 2 2.21
3 2 0.71
我们不需要 mutate
(mutate
创建或转换列)。这里,需要的输出是每组一行,可以用 summarise
library(dplyr)
df1 %>%
group_by(x) %>%
summarise(count_y = n(), Std_Dev = sd(y))
-输出
# A tibble: 3 × 3
x count_y Std_Dev
<int> <int> <dbl>
1 1 2 1.41
2 2 2 2.12
3 3 2 0.707
数据
df1 <- structure(list(ID = 1:6, x = c(1L, 2L, 3L, 1L, 2L, 3L), y = c(4L,
3L, 7L, 2L, 6L, 8L)), class = "data.frame", row.names = c(NA,
-6L))