查找数据集列中特定值的百分比
Finding the percentage of a specific value in the column of a data set
我有一个名为 college 的数据集,其中一列是 'accepted'。此列有两个值 - 1(表示学生被录取)和 0(表示学生未被录取)。我是要找到录取的学生百分比。
我这样做了...
table(college$accepted)
这给了我 1 和 0 的频率。(1 = 44,224 和 0 = 75,166)。然后我手动将这两个值相加 (119,390) 并将 44,224/119,390 相除。这很好,让我得到了我一直在寻找的价值。但我真的很想知道我如何使用 R 代码做到这一点,因为我确信有一种我只是没有想到的方法。
谢谢!
也许你可以像下面这样使用prop.table
prop.table(table(college$accepted))["1"]
可以先对列求和,然后统计列中的总数
sum(college$accepted)/length(college$accepted)
如果它是一个简单的 0/1 列,那么您只需要取该列的平均值。
mean_accepted <- mean(df$accepted)
为了使代码更明确并更好地描述您的意图,我建议使用条件来识别符合您的包含标准的案例。例如:
college$accepted == 1
然后取逻辑向量的平均值来计算比例(介于0和1之间),乘以100得到百分比。
100 * mean(college$accepted == 1, na.rm = TRUE)
我有一个名为 college 的数据集,其中一列是 'accepted'。此列有两个值 - 1(表示学生被录取)和 0(表示学生未被录取)。我是要找到录取的学生百分比。
我这样做了...
table(college$accepted)
这给了我 1 和 0 的频率。(1 = 44,224 和 0 = 75,166)。然后我手动将这两个值相加 (119,390) 并将 44,224/119,390 相除。这很好,让我得到了我一直在寻找的价值。但我真的很想知道我如何使用 R 代码做到这一点,因为我确信有一种我只是没有想到的方法。
谢谢!
也许你可以像下面这样使用prop.table
prop.table(table(college$accepted))["1"]
可以先对列求和,然后统计列中的总数
sum(college$accepted)/length(college$accepted)
如果它是一个简单的 0/1 列,那么您只需要取该列的平均值。
mean_accepted <- mean(df$accepted)
为了使代码更明确并更好地描述您的意图,我建议使用条件来识别符合您的包含标准的案例。例如:
college$accepted == 1
然后取逻辑向量的平均值来计算比例(介于0和1之间),乘以100得到百分比。
100 * mean(college$accepted == 1, na.rm = TRUE)