你如何在 R 中找到柱形图的统计信息?
How do you find stats of a column chart in R?
我的数据集有 2 个变量:
1)Match_City(举办足球比赛的城市名称)
2) Home_score(主队进球数)
问题是有 1500 多个城市,无法确定哪些城市的 Home_score 总数最高。我想知道我是否可以获得该柱形图的数据,即 A 市共有 20 个主队进球。我目前正在使用 geom_col() 制作柱形图。我需要帮助!
理解您的问题有点困难,正如其他人指出的那样,您应该尝试为我们提供一个可重现的代码示例。
但是,如果我正确理解你的问题...
你有一个包含两列(Match_City 和 Home_score)的大型数据框,你制作了一个柱形图来比较每个 Match_City 的 Home_score 的总数.
现在您可以直观地看到哪个 Match_City 的总数最高 Home_score 但您希望 R 以您可以使用的方式计算这些数字。聚合函数是您最好的选择。
一些示例代码:
#Let's Create Some Data
df <- data.frame(Match_City=sample(LETTERS[1:5], size = 100, replace = TRUE), Home_score=sample(1:6, size = 100, replace = TRUE))
#Aggregate will find the sum of Home_score for each Match_City
score_summary<-aggregate(Home_score~Match_City, data = df, FUN = sum)
#You can then sort the score_summary data frame so that the Home_score sums are in decreasing order
score_summary<-score_summary[order(score_summary$Home_score, decreasing = TRUE),]
我的数据集有 2 个变量:
1)Match_City(举办足球比赛的城市名称) 2) Home_score(主队进球数)
问题是有 1500 多个城市,无法确定哪些城市的 Home_score 总数最高。我想知道我是否可以获得该柱形图的数据,即 A 市共有 20 个主队进球。我目前正在使用 geom_col() 制作柱形图。我需要帮助!
理解您的问题有点困难,正如其他人指出的那样,您应该尝试为我们提供一个可重现的代码示例。
但是,如果我正确理解你的问题...
你有一个包含两列(Match_City 和 Home_score)的大型数据框,你制作了一个柱形图来比较每个 Match_City 的 Home_score 的总数.
现在您可以直观地看到哪个 Match_City 的总数最高 Home_score 但您希望 R 以您可以使用的方式计算这些数字。聚合函数是您最好的选择。
一些示例代码:
#Let's Create Some Data
df <- data.frame(Match_City=sample(LETTERS[1:5], size = 100, replace = TRUE), Home_score=sample(1:6, size = 100, replace = TRUE))
#Aggregate will find the sum of Home_score for each Match_City
score_summary<-aggregate(Home_score~Match_City, data = df, FUN = sum)
#You can then sort the score_summary data frame so that the Home_score sums are in decreasing order
score_summary<-score_summary[order(score_summary$Home_score, decreasing = TRUE),]