Table in r 待加权
Table in r to be weighted
我正在尝试 运行 crosstab/contingency table,但需要通过加权变量对其进行加权。
这是一些示例数据。
set.seed(123)
sex <- sample(c("Male", "Female"), 100, replace = TRUE)
age <- sample(c("0-15", "16-29", "30-44", "45+"), 100, replace = TRUE)
wgt <- sample(c(1:10), 100, replace = TRUE)
df <- data.frame(age,sex, wgt)
我运行这是为了得到一个常规的交叉表table
table(df$sex, df$age)
为了获得加权频率,我尝试了 Hmisc 包(如果您知道更好的包,请告诉我)
library(Hmisc)
wtd.table(df$sex, df$age, weights=df$wgt)
Error in match.arg(type) : 'arg' must be of length 1
我不确定哪里出了问题,但确实没有 运行,所以任何帮助都会很棒。
或者,如果您知道如何在另一个包中执行此操作,这可能更适合分析调查数据,那也很好。非常感谢。
一个解决方案是按重量重复 data.frame 的行,然后 table
结果。
以下重复了 data.frame 的行(仅相关列):
df[rep(row.names(df), df$wgt), 1:2]
并且可以用来获取偶发事件table。
table(df[rep(row.names(df), df$wgt), 1:2])
# sex
#age Female Male
# 0-15 56 76
# 16-29 73 99
# 30-44 60 106
# 45+ 76 90
试试这个
GDAtools::wtable(df$sex, df$age, w = df$wgt)
输出
0-15 16-29 30-44 45+ NA tot
Female 56 73 60 76 0 265
Male 76 99 106 90 0 371
NA 0 0 0 0 0 0
tot 132 172 166 166 0 636
更新
如果您不想安装整个软件包,这里有两个您需要的基本功能:
获取它们,您应该可以毫无问题地使用 wtable
。
一个tidyverse
解决方案使用你的数据相同set.seed,uncount
相当于@Rui的rep
权重。
library(dplyr)
library(tidyr)
df %>%
uncount(weights = .$wgt) %>%
select(-wgt) %>%
table
#> sex
#> age Female Male
#> 0-15 56 76
#> 16-29 73 99
#> 30-44 60 106
#> 45+ 76 90
Base R,在 stats
中,有 xtabs
正是这个:
xtabs(wgt ~ age + sex, data=df)
我正在尝试 运行 crosstab/contingency table,但需要通过加权变量对其进行加权。 这是一些示例数据。
set.seed(123)
sex <- sample(c("Male", "Female"), 100, replace = TRUE)
age <- sample(c("0-15", "16-29", "30-44", "45+"), 100, replace = TRUE)
wgt <- sample(c(1:10), 100, replace = TRUE)
df <- data.frame(age,sex, wgt)
我运行这是为了得到一个常规的交叉表table
table(df$sex, df$age)
为了获得加权频率,我尝试了 Hmisc 包(如果您知道更好的包,请告诉我)
library(Hmisc)
wtd.table(df$sex, df$age, weights=df$wgt)
Error in match.arg(type) : 'arg' must be of length 1
我不确定哪里出了问题,但确实没有 运行,所以任何帮助都会很棒。 或者,如果您知道如何在另一个包中执行此操作,这可能更适合分析调查数据,那也很好。非常感谢。
一个解决方案是按重量重复 data.frame 的行,然后 table
结果。
以下重复了 data.frame 的行(仅相关列):
df[rep(row.names(df), df$wgt), 1:2]
并且可以用来获取偶发事件table。
table(df[rep(row.names(df), df$wgt), 1:2])
# sex
#age Female Male
# 0-15 56 76
# 16-29 73 99
# 30-44 60 106
# 45+ 76 90
试试这个
GDAtools::wtable(df$sex, df$age, w = df$wgt)
输出
0-15 16-29 30-44 45+ NA tot
Female 56 73 60 76 0 265
Male 76 99 106 90 0 371
NA 0 0 0 0 0 0
tot 132 172 166 166 0 636
更新
如果您不想安装整个软件包,这里有两个您需要的基本功能:
获取它们,您应该可以毫无问题地使用 wtable
。
一个tidyverse
解决方案使用你的数据相同set.seed,uncount
相当于@Rui的rep
权重。
library(dplyr)
library(tidyr)
df %>%
uncount(weights = .$wgt) %>%
select(-wgt) %>%
table
#> sex
#> age Female Male
#> 0-15 56 76
#> 16-29 73 99
#> 30-44 60 106
#> 45+ 76 90
Base R,在 stats
中,有 xtabs
正是这个:
xtabs(wgt ~ age + sex, data=df)