如何使用 dplyr 获取两列的平均值?

How to get the average of two columns using dplyr?

如何使用 dplyr 获取数据 table 两列的平均值?例如,如果我的数据如下所示:

dt <- data.table(A=1:5, B=c(1,4,NA,6,8))

我想创建一个新列 "Avg",这是 A 列和 B 列每一行的平均值:

dt %>% mutate(Avg=mean(c(A, B), na.rm=T))

但是这段代码没有给我正确的结果。这该怎么做?非常感谢。

怎么样

dt %>% mutate(Avg=rowMeans(cbind(A, B), na.rm=T))

mean 未矢量化。它将所有输入折叠为一个值。如果你用 cbind() 做一个矩阵,你可以用 rowMeans 来做这个技巧。

如果你想使用 dplyr 来实现这个,我建议使用函数 rowwise():

    R> library(dplyr)
    R> dt <- data.table(A=1:5, B=c(1,4,NA,6,8))
    R> j <- dt %>% rowwise() %>% mutate(Avg=mean(c(A, B), na.rm=T)) 
    R> j
Source: local data frame [5 x 3]
Groups: <by row>

      A     B   Avg
  (int) (dbl) (dbl)
1     1     1   1.0
2     2     4   3.0
3     3    NA   3.0
4     4     6   5.0
5     5     8   6.5

由于初始数据集是 data.table,我们可以使用 data.table 方法

dt[, Avg:= mean(unlist(.SD), na.rm=TRUE) , .1:nrow(dt)]
dt
#   A  B Avg
#1: 1  1 1.0
#2: 2  4 3.0
#3: 3 NA 3.0
#4: 4  6 5.0
#5: 5  8 6.5