查找数据集列中特定值的百分比

Finding the percentage of a specific value in the column of a data set

我有一个名为 college 的数据集,其中一列是 'accepted'。此列有两个值 - 1(表示学生被录取)和 0(表示学生未被录取)。我是要找到录取的学生百分比。

我这样做了...

table(college$accepted)

这给了我 1 和 0 的频率。(1 = 44,224 和 0 = 75,166)。然后我手动将这两个值相加 (119,390) 并将 44,224/119,390 相除。这很好,让我得到了我一直在寻找的价值。但我真的很想知道我如何使用 R 代码做到这一点,因为我确信有一种我只是没有想到的方法。

谢谢!

也许你可以像下面这样使用prop.table

prop.table(table(college$accepted))["1"]

可以先对列求和,然后统计列中的总数

sum(college$accepted)/length(college$accepted)

如果它是一个简单的 0/1 列,那么您只需要取该列的平均值。

mean_accepted <- mean(df$accepted)

为了使代码更明确并更好地描述您的意图,我建议使用条件来识别符合您的包含标准的案例。例如:

college$accepted == 1

然后取逻辑向量的平均值来计算比例(介于0和1之间),乘以100得到百分比。

100 * mean(college$accepted == 1, na.rm = TRUE)