Stata 识别有影响力的观察 post svy 回归

Stata identify influential observations post svy regression

使用Stata svy命令时,如:

svy: logistic graduate age female i.math i.english

应该完成各种后续步骤。例如,寻找重要的异常值或高杠杆点。如果没有 'svy' 元素,以下命令将起作用:

predict p
predict stdres, rstand
scatter stdres p, mlabel(snum) ylab(-4(2) 16) yline(0)

然而,当逻辑回归 运行 和 svy 前言时,它只会产生以下错误:

option rstandard not allowed after svy estimation

太棒了。什么是允许的?人们如何看待重要的异常值或高杠杆点?

@NickCox 在他的评论中是正确的——在将诊断扩展到复杂的调查设置方面没有做太多工作。原因之一是,从技术上讲,调查推断是非参数的:推断的对象不是变量之间的某种理想化关系,而是人口普查回归,以及全部人口可能具有的所有“异常值”。不会受到异常值的严重影响;只有估计方程式,标准误差无论如何都是“稳健的”(即使用三明治公式而不是 Hessian。)

那里的工作大部分是由 Rick Valliant 完成的(R 包 svydiagshttps://cran.r-project.org/web/packages/svydiags/, dissertation by his student Jianzhu Li: https://drum.lib.umd.edu/bitstream/handle/1903/7598/umi-umd-4863.pdf?sequence=1&isAllowed=y; 我无法立即找到那篇论文发表的一些后续论文。 )

(这一切感觉更像是在讨论 CrossValidated/stats 而不是 SO/Stata。)