如何分析 R 中的多项选择题?
How can I analyse multiple choice questions in R?
我有一份来自在线调查的 CSV,其中包括数字题、单选题和多选题。多项选择题是这样表示的:
┌─────┬─────┬────┬─────┐
│ A │ B │ C │ D │
├─────┼─────┼────┼─────┤
│ "Y" │ NA │ NA │ NA │
│ NA │ "Y" │ NA │ "Y" │
│ NA │ NA │ NA │ NA │
│ "Y" │ "Y" │ NA │ NA │
└─────┴─────┴────┴─────┘
所以答案是字符“Y”或空值。
现在我的问题是是否有一个解决方案可以让我轻松制作直方图或类似的东西来可视化每个答案的频率并将其用于 R 中的统计测试。
抱歉,如果这是微不足道的,但我没有经验,还不能挖掘一些东西。
如果您的 csv 作为数据帧读入,则 df:
df2 <- !is.na(df)
nrows <- nrow(df2)
yes <- apply(df2, 2, sum)
percentyes <- 100 * yes / nrows
percentno = 100 - percentyes
barplot(percentyes)
我有一份来自在线调查的 CSV,其中包括数字题、单选题和多选题。多项选择题是这样表示的:
┌─────┬─────┬────┬─────┐
│ A │ B │ C │ D │
├─────┼─────┼────┼─────┤
│ "Y" │ NA │ NA │ NA │
│ NA │ "Y" │ NA │ "Y" │
│ NA │ NA │ NA │ NA │
│ "Y" │ "Y" │ NA │ NA │
└─────┴─────┴────┴─────┘
所以答案是字符“Y”或空值。
现在我的问题是是否有一个解决方案可以让我轻松制作直方图或类似的东西来可视化每个答案的频率并将其用于 R 中的统计测试。
抱歉,如果这是微不足道的,但我没有经验,还不能挖掘一些东西。
如果您的 csv 作为数据帧读入,则 df:
df2 <- !is.na(df)
nrows <- nrow(df2)
yes <- apply(df2, 2, sum)
percentyes <- 100 * yes / nrows
percentno = 100 - percentyes
barplot(percentyes)