使用 dplyr 动词查找数据集中每种文件格式的行数
Find how many lines for each file format in a dataset using dplyr verbs
我需要使用 'group_by' 和 'summarise'(dplyr 包的一部分)来查找数据集中每种类型的文件有多少行。我试图了解这是如何工作的,因为稍后我需要将结果用于其他事情。
我试过这样的事情:
```{r problem}
grouped_files <- group_by(files_ENCODE, V5)
files_types <- summarise(grouped_files, V5)
```
V5 是包含文件格式的列,files_ENCODE 是包含所有内容的数据集。
我以前从未使用过 R,甚至我的朋友 Google 也无法帮助我学习如何使用这两个功能。请帮忙! :O
set.seed(123)
file_data <- data.frame(V5 = sample(c("format_1", "format_2", "format_3"), 20, replace = TRUE))
您可以简单地使用 table
:
table(file_data)
file_data
format_1 format_2 format_3
6 6 8
但如果必须 dplyr
执行以下操作:
file_data %>% group_by(V5) %>% summarise(n = n())
Source: local data frame [3 x 2]
V5 n()
1 format_1 6
2 format_2 6
3 format_3 8
我需要使用 'group_by' 和 'summarise'(dplyr 包的一部分)来查找数据集中每种类型的文件有多少行。我试图了解这是如何工作的,因为稍后我需要将结果用于其他事情。 我试过这样的事情:
```{r problem}
grouped_files <- group_by(files_ENCODE, V5)
files_types <- summarise(grouped_files, V5)
```
V5 是包含文件格式的列,files_ENCODE 是包含所有内容的数据集。 我以前从未使用过 R,甚至我的朋友 Google 也无法帮助我学习如何使用这两个功能。请帮忙! :O
set.seed(123)
file_data <- data.frame(V5 = sample(c("format_1", "format_2", "format_3"), 20, replace = TRUE))
您可以简单地使用 table
:
table(file_data)
file_data
format_1 format_2 format_3
6 6 8
但如果必须 dplyr
执行以下操作:
file_data %>% group_by(V5) %>% summarise(n = n())
Source: local data frame [3 x 2]
V5 n()
1 format_1 6
2 format_2 6
3 format_3 8