查找数据集列中特定值的百分比

Question

我有一个名为 college 的数据集，其中一列是 'accepted'。此列有两个值 - 1（表示学生被录取）和 0（表示学生未被录取）。我是要找到录取的学生百分比。

我这样做了...

table(college$accepted)

这给了我 1 和 0 的频率。（1 = 44,224 和 0 = 75,166）。然后我手动将这两个值相加 (119,390) 并将 44,224/119,390 相除。这很好，让我得到了我一直在寻找的价值。但我真的很想知道我如何使用 R 代码做到这一点，因为我确信有一种我只是没有想到的方法。

谢谢！

Answer 1

也许你可以像下面这样使用prop.table

prop.table(table(college$accepted))["1"]

Answer 2

可以先对列求和，然后统计列中的总数

sum(college$accepted)/length(college$accepted)

Answer 3

如果它是一个简单的 0/1 列，那么您只需要取该列的平均值。

mean_accepted <- mean(df$accepted)

Answer 4

为了使代码更明确并更好地描述您的意图，我建议使用条件来识别符合您的包含标准的案例。例如：

college$accepted == 1

然后取逻辑向量的平均值来计算比例（介于0和1之间），乘以100得到百分比。

100 * mean(college$accepted == 1, na.rm = TRUE)

Finding the percentage of a specific value in the column of a data set