如何使用 dplyr 获取两列的平均值?
How to get the average of two columns using dplyr?
如何使用 dplyr 获取数据 table 两列的平均值?例如,如果我的数据如下所示:
dt <- data.table(A=1:5, B=c(1,4,NA,6,8))
我想创建一个新列 "Avg",这是 A 列和 B 列每一行的平均值:
dt %>% mutate(Avg=mean(c(A, B), na.rm=T))
但是这段代码没有给我正确的结果。这该怎么做?非常感谢。
怎么样
dt %>% mutate(Avg=rowMeans(cbind(A, B), na.rm=T))
mean
未矢量化。它将所有输入折叠为一个值。如果你用 cbind()
做一个矩阵,你可以用 rowMeans
来做这个技巧。
如果你想使用 dplyr 来实现这个,我建议使用函数 rowwise()
:
R> library(dplyr)
R> dt <- data.table(A=1:5, B=c(1,4,NA,6,8))
R> j <- dt %>% rowwise() %>% mutate(Avg=mean(c(A, B), na.rm=T))
R> j
Source: local data frame [5 x 3]
Groups: <by row>
A B Avg
(int) (dbl) (dbl)
1 1 1 1.0
2 2 4 3.0
3 3 NA 3.0
4 4 6 5.0
5 5 8 6.5
由于初始数据集是 data.table
,我们可以使用 data.table
方法
dt[, Avg:= mean(unlist(.SD), na.rm=TRUE) , .1:nrow(dt)]
dt
# A B Avg
#1: 1 1 1.0
#2: 2 4 3.0
#3: 3 NA 3.0
#4: 4 6 5.0
#5: 5 8 6.5
如何使用 dplyr 获取数据 table 两列的平均值?例如,如果我的数据如下所示:
dt <- data.table(A=1:5, B=c(1,4,NA,6,8))
我想创建一个新列 "Avg",这是 A 列和 B 列每一行的平均值:
dt %>% mutate(Avg=mean(c(A, B), na.rm=T))
但是这段代码没有给我正确的结果。这该怎么做?非常感谢。
怎么样
dt %>% mutate(Avg=rowMeans(cbind(A, B), na.rm=T))
mean
未矢量化。它将所有输入折叠为一个值。如果你用 cbind()
做一个矩阵,你可以用 rowMeans
来做这个技巧。
如果你想使用 dplyr 来实现这个,我建议使用函数 rowwise()
:
R> library(dplyr)
R> dt <- data.table(A=1:5, B=c(1,4,NA,6,8))
R> j <- dt %>% rowwise() %>% mutate(Avg=mean(c(A, B), na.rm=T))
R> j
Source: local data frame [5 x 3]
Groups: <by row>
A B Avg
(int) (dbl) (dbl)
1 1 1 1.0
2 2 4 3.0
3 3 NA 3.0
4 4 6 5.0
5 5 8 6.5
由于初始数据集是 data.table
,我们可以使用 data.table
方法
dt[, Avg:= mean(unlist(.SD), na.rm=TRUE) , .1:nrow(dt)]
dt
# A B Avg
#1: 1 1 1.0
#2: 2 4 3.0
#3: 3 NA 3.0
#4: 4 6 5.0
#5: 5 8 6.5