有没有一种方法可以汇总我的问卷数据以显示每个问题的每个答复的数量?
Is there a way to summarise my questionnaire data to show the number of each response for each question?
我的数据看起来有点像这样:
Q1 Q2 Q3 Q4
S NS S S
NS . S PMI
S S TMI S
PMI S S NS
唯一的选项是 S、TMI、PMI、NS(或缺失,这是一个 .)。我希望它看起来像这样(df 称为 PCP):
Q1 Q2 Q2 Q4
S 2 2 3 2
NS 1 1 0 1
PMI 1 0 0 1
TMI 0 0 1 0
. 0 1 0 0
我可以用这段代码分两步完成:
Counts <- melt(table(PCP$Q1)) %>%
join(y = melt(table(PCP$Q2)), type = "full") %>%
join(y = melt(table(PCP$Q3)), type = "full") %>%
join(y = melt(table(PCP$Q4)), type = "full")
Counts <- melt(Counts, key='Var1')
Bur 是否有一种很好的方法可以一步完成此操作,也许使用 dplyr/plyr 包?
这个怎么样:
library(tidyverse)
PCP %>%
gather(question, answer) %>%
mutate(answer = replace(answer, answer==".", "Missing")) %>%
count(question, answer) %>%
spread(question, n, fill=0)
answer Q1 Q2 Q3 Q4
1 Missing 0 1 0 0
2 NS 1 1 0 1
3 PMI 1 0 0 1
4 S 2 2 3 2
5 TMI 0 0 1 0
使用 tidyverse
和 reshape2
:
df %>%
gather(var, val) %>%
group_by(var) %>%
add_count(val) %>%
dcast(val ~ var, value.var = "n")
val Q1 Q2 Q3 Q4
1 . 0 1 0 0
2 NS 1 1 0 1
3 PMI 1 0 0 1
4 S 2 2 3 2
5 TMI 0 0 1 0
我的数据看起来有点像这样:
Q1 Q2 Q3 Q4
S NS S S
NS . S PMI
S S TMI S
PMI S S NS
唯一的选项是 S、TMI、PMI、NS(或缺失,这是一个 .)。我希望它看起来像这样(df 称为 PCP):
Q1 Q2 Q2 Q4
S 2 2 3 2
NS 1 1 0 1
PMI 1 0 0 1
TMI 0 0 1 0
. 0 1 0 0
我可以用这段代码分两步完成:
Counts <- melt(table(PCP$Q1)) %>%
join(y = melt(table(PCP$Q2)), type = "full") %>%
join(y = melt(table(PCP$Q3)), type = "full") %>%
join(y = melt(table(PCP$Q4)), type = "full")
Counts <- melt(Counts, key='Var1')
Bur 是否有一种很好的方法可以一步完成此操作,也许使用 dplyr/plyr 包?
这个怎么样:
library(tidyverse)
PCP %>%
gather(question, answer) %>%
mutate(answer = replace(answer, answer==".", "Missing")) %>%
count(question, answer) %>%
spread(question, n, fill=0)
answer Q1 Q2 Q3 Q4 1 Missing 0 1 0 0 2 NS 1 1 0 1 3 PMI 1 0 0 1 4 S 2 2 3 2 5 TMI 0 0 1 0
使用 tidyverse
和 reshape2
:
df %>%
gather(var, val) %>%
group_by(var) %>%
add_count(val) %>%
dcast(val ~ var, value.var = "n")
val Q1 Q2 Q3 Q4
1 . 0 1 0 0
2 NS 1 1 0 1
3 PMI 1 0 0 1
4 S 2 2 3 2
5 TMI 0 0 1 0