Stata 识别有影响力的观察 post svy 回归
Stata identify influential observations post svy regression
使用Stata svy命令时,如:
svy: logistic graduate age female i.math i.english
应该完成各种后续步骤。例如,寻找重要的异常值或高杠杆点。如果没有 'svy' 元素,以下命令将起作用:
predict p
predict stdres, rstand
scatter stdres p, mlabel(snum) ylab(-4(2) 16) yline(0)
然而,当逻辑回归 运行 和 svy
前言时,它只会产生以下错误:
option rstandard not allowed after svy estimation
太棒了。什么是允许的?人们如何看待重要的异常值或高杠杆点?
@NickCox 在他的评论中是正确的——在将诊断扩展到复杂的调查设置方面没有做太多工作。原因之一是,从技术上讲,调查推断是非参数的:推断的对象不是变量之间的某种理想化关系,而是人口普查回归,以及全部人口可能具有的所有“异常值”。不会受到异常值的严重影响;只有估计方程式,标准误差无论如何都是“稳健的”(即使用三明治公式而不是 Hessian。)
那里的工作大部分是由 Rick Valliant 完成的(R 包 svydiags
:https://cran.r-project.org/web/packages/svydiags/, dissertation by his student Jianzhu Li: https://drum.lib.umd.edu/bitstream/handle/1903/7598/umi-umd-4863.pdf?sequence=1&isAllowed=y; 我无法立即找到那篇论文发表的一些后续论文。 )
(这一切感觉更像是在讨论 CrossValidated/stats 而不是 SO/Stata。)
使用Stata svy命令时,如:
svy: logistic graduate age female i.math i.english
应该完成各种后续步骤。例如,寻找重要的异常值或高杠杆点。如果没有 'svy' 元素,以下命令将起作用:
predict p
predict stdres, rstand
scatter stdres p, mlabel(snum) ylab(-4(2) 16) yline(0)
然而,当逻辑回归 运行 和 svy
前言时,它只会产生以下错误:
option rstandard not allowed after svy estimation
太棒了。什么是允许的?人们如何看待重要的异常值或高杠杆点?
@NickCox 在他的评论中是正确的——在将诊断扩展到复杂的调查设置方面没有做太多工作。原因之一是,从技术上讲,调查推断是非参数的:推断的对象不是变量之间的某种理想化关系,而是人口普查回归,以及全部人口可能具有的所有“异常值”。不会受到异常值的严重影响;只有估计方程式,标准误差无论如何都是“稳健的”(即使用三明治公式而不是 Hessian。)
那里的工作大部分是由 Rick Valliant 完成的(R 包 svydiags
:https://cran.r-project.org/web/packages/svydiags/, dissertation by his student Jianzhu Li: https://drum.lib.umd.edu/bitstream/handle/1903/7598/umi-umd-4863.pdf?sequence=1&isAllowed=y; 我无法立即找到那篇论文发表的一些后续论文。 )
(这一切感觉更像是在讨论 CrossValidated/stats 而不是 SO/Stata。)