R:总结多个变量的观察次数的最快方法
R: Quickest way to summarize number of observations for multiple variables
我确信这是一件非常简单的事情,但我找不到真正快速和简单的解决方案。
我有很多列的患者数据,格式如下:
patID disease category ...
1 1 A
2 0 B
3 1 C
4 1 B
如何快速生成摘要 table,其中包括数据框中每个 column/variable 的观测值数量?结果应该是这样的:
VARIABLE Number of rows
disease:1 3
disease:0 1
category:A 1
category:B 2
category:C 1
...
我知道我可以通过使用 table(data$column) 对单个变量执行此操作。但是我怎样才能为数据框中的所有列生成类似的东西呢?
使用 tidyr
和 dplyr
:
gather(data, variable, value, -patID) %>%
count(variable, value)
(感谢@Frank 提醒我 tally
和 count
。)
我确信这是一件非常简单的事情,但我找不到真正快速和简单的解决方案。
我有很多列的患者数据,格式如下:
patID disease category ...
1 1 A
2 0 B
3 1 C
4 1 B
如何快速生成摘要 table,其中包括数据框中每个 column/variable 的观测值数量?结果应该是这样的:
VARIABLE Number of rows
disease:1 3
disease:0 1
category:A 1
category:B 2
category:C 1
...
我知道我可以通过使用 table(data$column) 对单个变量执行此操作。但是我怎样才能为数据框中的所有列生成类似的东西呢?
使用 tidyr
和 dplyr
:
gather(data, variable, value, -patID) %>%
count(variable, value)
(感谢@Frank 提醒我 tally
和 count
。)