Stata 识别有影响力的观察 post svy 回归

Question

使用Stata svy命令时，如：

svy: logistic graduate age female i.math i.english

应该完成各种后续步骤。例如，寻找重要的异常值或高杠杆点。如果没有 'svy' 元素，以下命令将起作用：

predict p
predict stdres, rstand
scatter stdres p, mlabel(snum) ylab(-4(2) 16) yline(0)

然而，当逻辑回归运行和 svy 前言时，它只会产生以下错误：

option rstandard not allowed after svy estimation

太棒了。什么是允许的？人们如何看待重要的异常值或高杠杆点？

Answer 1

@NickCox 在他的评论中是正确的——在将诊断扩展到复杂的调查设置方面没有做太多工作。原因之一是，从技术上讲，调查推断是非参数的：推断的对象不是变量之间的某种理想化关系，而是人口普查回归，以及全部人口可能具有的所有“异常值”。不会受到异常值的严重影响；只有估计方程式，标准误差无论如何都是“稳健的”（即使用三明治公式而不是 Hessian。）

那里的工作大部分是由 Rick Valliant 完成的（R 包 svydiags：https://cran.r-project.org/web/packages/svydiags/, dissertation by his student Jianzhu Li: https://drum.lib.umd.edu/bitstream/handle/1903/7598/umi-umd-4863.pdf?sequence=1&isAllowed=y; 我无法立即找到那篇论文发表的一些后续论文。 )

（这一切感觉更像是在讨论 CrossValidated/stats 而不是 SO/Stata。）

Stata 识别有影响力的观察 post svy 回归

Stata identify influential observations post svy regression

survey

outliers

stata