我怎样才能将男性和女性的人口加在一起,以消除性别作为人口统计中的变量 table。在 R 工作室
How can I add the populations of males and females together to remove gender as a variable in a demographics table. In R Studio
这是我第一次发布问题,所以可能没有正确的信息可以开始,提前致歉。我是 R 的新手。更喜欢使用 dplyr 或 tidyverse,因为这些是我们迄今为止使用的包。我确实搜索了一个类似的问题,但大多数 gender/sex 相关问题都是关于分离数据,或分别对每个数据执行操作。
我有一个 table 的人口统计,变量(因素)年龄范围、年份和性别,人口作为因变量。我想创建一个图来显示人口是否正在老龄化 - 也就是说,显示不同年龄组的相对比例如何随时间变化。但性别无关紧要,所以我想 将每个年份和年龄段的男性和女性人口总数相加。
我不知道如何提供原始数据.csv文件的副本,所以如果您有任何建议,请告诉我。
这是数据样本(输出table):
到目前为止的代码如下:
file_name <- "AusPopDemographics.csv"
AusDemo_df = read.table(file_name,",", header=TRUE)
(grp_AusDemo_df <- AusDemo_df %>% group_by(Year, Age))
我猜它可能类似于 pivot(wider) 将男性和女性作为列标题,然后 transmute() 对它们求和并创建一个新的人口列。
感谢您的帮助。
使用 dplyr
你可以做这样的事情
library(dplyr)
grp_AusDemo_df <- AusDemo_df %>%
group_by(Year, Age) %>%
summarise(Population = sum(Population, na.rm = TRUE))
这是我第一次发布问题,所以可能没有正确的信息可以开始,提前致歉。我是 R 的新手。更喜欢使用 dplyr 或 tidyverse,因为这些是我们迄今为止使用的包。我确实搜索了一个类似的问题,但大多数 gender/sex 相关问题都是关于分离数据,或分别对每个数据执行操作。
我有一个 table 的人口统计,变量(因素)年龄范围、年份和性别,人口作为因变量。我想创建一个图来显示人口是否正在老龄化 - 也就是说,显示不同年龄组的相对比例如何随时间变化。但性别无关紧要,所以我想 将每个年份和年龄段的男性和女性人口总数相加。
我不知道如何提供原始数据.csv文件的副本,所以如果您有任何建议,请告诉我。
这是数据样本(输出table):
到目前为止的代码如下:
file_name <- "AusPopDemographics.csv"
AusDemo_df = read.table(file_name,",", header=TRUE)
(grp_AusDemo_df <- AusDemo_df %>% group_by(Year, Age))
我猜它可能类似于 pivot(wider) 将男性和女性作为列标题,然后 transmute() 对它们求和并创建一个新的人口列。
感谢您的帮助。
使用 dplyr
你可以做这样的事情
library(dplyr)
grp_AusDemo_df <- AusDemo_df %>%
group_by(Year, Age) %>%
summarise(Population = sum(Population, na.rm = TRUE))