您应该如何在 R 的调查包中使用带有 svydesign() 函数的缩放权重?
How should you use scaled weights with the svydesign() function in the survey package in R?
我正在使用 survey package in R to analyse the "Understanding Society" social survey. The main user guide 进行调查指定(第 45 页)权重已缩放为平均值为 1。使用 svydesign()
函数时,我正在传递weight
参数的权重变量。
在survey package documentation中,在surveysummary()
函数下,它声明:
Note that the design effect will be incorrect if the weights have been rescaled so that they are not reciprocals of sampling probabilities.
因此,在使用 svyglm()
等函数时,我会得到不正确的估计 and/or 标准误差吗?
这引起了我的注意,因为在使用 psrsq()
函数获取模型的伪 R 平方时,我收到了以下警告:
Weights appear to be scaled: rsquared may be wrong
如有任何帮助,我们将不胜感激!谢谢!
不,你不用担心
警告仅关于设计效果估计(大多数人不想这样做),并且仅关于无替换设计效果(DEFF 而不是 DEFT)。大多数人不需要做设计效果估计,他们只需要估计和标准误差。这些很好;没问题。
如果你想估计设计效果,R 需要估计标准误差(这很好),还需要估计在没有放回的简单随机抽样下,样本量相同时标准误差是多少。第二部分是问题所在:计算 SRSWoR 下的方差需要知道人口规模。如果缩放了权重,R 将无法计算出人口规模。
如果您确实需要设计效果(例如,为另一项调查进行功效计算),您仍然可以获得与带放回的简单随机抽样相比的 DEFT 设计效果。只有当你想要设计效果与不放回的简单随机抽样相比时,你才需要担心权重的缩放。很少有人处于这种情况。
最后说明 surveysummary
不是函数,它是帮助页面。
我正在使用 survey package in R to analyse the "Understanding Society" social survey. The main user guide 进行调查指定(第 45 页)权重已缩放为平均值为 1。使用 svydesign()
函数时,我正在传递weight
参数的权重变量。
在survey package documentation中,在surveysummary()
函数下,它声明:
Note that the design effect will be incorrect if the weights have been rescaled so that they are not reciprocals of sampling probabilities.
因此,在使用 svyglm()
等函数时,我会得到不正确的估计 and/or 标准误差吗?
这引起了我的注意,因为在使用 psrsq()
函数获取模型的伪 R 平方时,我收到了以下警告:
Weights appear to be scaled: rsquared may be wrong
如有任何帮助,我们将不胜感激!谢谢!
不,你不用担心
警告仅关于设计效果估计(大多数人不想这样做),并且仅关于无替换设计效果(DEFF 而不是 DEFT)。大多数人不需要做设计效果估计,他们只需要估计和标准误差。这些很好;没问题。
如果你想估计设计效果,R 需要估计标准误差(这很好),还需要估计在没有放回的简单随机抽样下,样本量相同时标准误差是多少。第二部分是问题所在:计算 SRSWoR 下的方差需要知道人口规模。如果缩放了权重,R 将无法计算出人口规模。
如果您确实需要设计效果(例如,为另一项调查进行功效计算),您仍然可以获得与带放回的简单随机抽样相比的 DEFT 设计效果。只有当你想要设计效果与不放回的简单随机抽样相比时,你才需要担心权重的缩放。很少有人处于这种情况。
最后说明 surveysummary
不是函数,它是帮助页面。