使用 R 中的 ANESRAKE 包的加权值汇总统计

Question

我使用 anesrake 和 weights 包在我的调查中创建了加权数据。但是，除了包中的 wpct 函数之外，我不确定之后如何使用权重。我如何计算描述性统计数据并将加权数据与其他数据整合 functions/packages?

来自 anesrake 包的可重现数据：

data("anes04")
anes04$caseid <- 1:length(anes04$age)
anes04$agecats <- cut(anes04$age, c(0, 25,35,45,55,65,99))
levels(anes04$agecats) <- c("age1824", "age2534", "age3544",
"age4554", "age5564", "age6599")
marriedtarget <- c(.4, .6)
agetarg <- c(.10, .15, .17, .23, .22, .13)
names(agetarg) <- c("age1824", "age2534", "age3544",
"age4554", "age5564", "age6599")
targets <- list(marriedtarget, agetarg)
names(targets) <- c("married", "agecats")
outsave <- anesrake(targets, anes04, caseid=anes04$caseid,
verbose=TRUE)
caseweights <- data.frame(cases=outsave$caseid, weights=outsave$weightvec)

这将为我提供一个带有数据框权重的新向量。那么，我的问题是，我怎样才能知道分析数据呢？我如何将这些权重与汇总统计数据结合起来？

Answer 1

您可以将权重作为 weights= 参数提供给 survey::svydesign。理想情况下，您会在调查包中进行倾斜，这样您就可以考虑倾斜带来的方差减少，但这是非常标准的（至少在 public-use 数据中）分析倾斜的权重，就好像它们只是抽样一样权重。

或者，如果您最终得到的抽取规范足够简单，可以在 survey::rake 或 survey::calibrate 中重现，您可以在调查包中重做抽取。

使用调查包的原因是它允许进行非常广泛的其他分析（svyVGAM 甚至更多）。

使用 R 中的 ANESRAKE 包的加权值汇总统计

Summary statistics for weighted values using the ANESRAKE package in R

r

survey

weighted