使用 R 中的 ANESRAKE 包的加权值汇总统计

Summary statistics for weighted values using the ANESRAKE package in R

我使用 anesrakeweights 包在我的调查中创建了加权数据。但是,除了包中的 wpct 函数之外,我不确定之后如何使用权重。我如何计算描述性统计数据并将加权数据与其他数据整合 functions/packages?

来自 anesrake 包的可重现数据:

data("anes04")
anes04$caseid <- 1:length(anes04$age)
anes04$agecats <- cut(anes04$age, c(0, 25,35,45,55,65,99))
levels(anes04$agecats) <- c("age1824", "age2534", "age3544",
"age4554", "age5564", "age6599")
marriedtarget <- c(.4, .6)
agetarg <- c(.10, .15, .17, .23, .22, .13)
names(agetarg) <- c("age1824", "age2534", "age3544",
"age4554", "age5564", "age6599")
targets <- list(marriedtarget, agetarg)
names(targets) <- c("married", "agecats")
outsave <- anesrake(targets, anes04, caseid=anes04$caseid,
verbose=TRUE)
caseweights <- data.frame(cases=outsave$caseid, weights=outsave$weightvec)

这将为我提供一个带有数据框权重的新向量。那么,我的问题是,我怎样才能知道分析数据呢?我如何将这些权重与汇总统计数据结合起来?

您可以将权重作为 weights= 参数提供给 survey::svydesign。理想情况下,您会在调查包中进行倾斜,这样您就可以考虑倾斜带来的方差减少,但这是非常标准的(至少在 public-use 数据中)分析倾斜的权重,就好像它们只是抽样一样权重。

或者,如果您最终得到的抽取规范足够简单,可以在 survey::rakesurvey::calibrate 中重现,您可以在调查包中重做抽取。

使用调查包的原因是它允许进行非常广泛的其他分析(svyVGAM 甚至更多)。