dplyr: group_by, 子集和总结

Question

假设我有一个由多行组成的数据框，如下所示：

df <- data.frame(Group = c(0,0,1,1,1,0),V1=c(0,0,0,4,5,7), V2=c(0,3,0,4,0,1))

  Group V1 V2
1     0  0  0
2     0  0  3
3     1  0  0
4     1  4  4
5     1  5  0
6     0  7  1

组是二进制的，V1和V2有零-inflation（很多观察== 0）我想（依次）对每一列进行子集化以删除 0 个 obs，然后计算剩余数据的分位数。至关重要的是，我只想删除给定变量的 0，而不是删除整行，因为我想为下一列重新设置和子集。

下面是我的分位数代码。有什么方法可以潜入子集函数，还是我需要其他方法？

#Functions for quantiles
quant25 <- function(x) quantile(x, probs=0.25, na.rm=TRUE)
quant50 <- function(x) quantile(x, probs=0.50, na.rm=TRUE)  
quant75 <- function(x) quantile(x, probs=0.75, na.rm=TRUE)

#Grouped calls on these functions
group_by(df, Group) %>%
summarise_each(funs(quant25, quant50, quant75), V1, V2)

Answer 1

我想我已经为我的目的想出了这个：df[,2:3][df[,2:3]==0] <- NA 声明缺少 0 个观测值，其余的似乎按预期处理。（谢谢，夏侯）

dplyr: group_by, 子集和总结

dplyr: group_by, subset and summarise

r

dplyr