使用 dplyr 动词查找数据集中每种文件格式的行数

Find how many lines for each file format in a dataset using dplyr verbs

我需要使用 'group_by' 和 'summarise'(dplyr 包的一部分)来查找数据集中每种类型的文件有多少行。我试图了解这是如何工作的,因为稍后我需要将结果用于其他事情。 我试过这样的事情:

```{r problem}
grouped_files <- group_by(files_ENCODE, V5)
files_types <- summarise(grouped_files, V5)
```

V5 是包含文件格式的列,files_ENCODE 是包含所有内容的数据集。 我以前从未使用过 R,甚至我的朋友 Google 也无法帮助我学习如何使用这两个功能。请帮忙! :O

set.seed(123)
file_data <- data.frame(V5 = sample(c("format_1", "format_2", "format_3"), 20, replace = TRUE))

您可以简单地使用 table:

table(file_data)
file_data
format_1 format_2 format_3 
       6        6        8 

但如果必须 dplyr 执行以下操作:

file_data %>% group_by(V5) %>% summarise(n = n())
Source: local data frame [3 x 2]

        V5 n()
1 format_1   6
2 format_2   6
3 format_3   8