识别面板数据模型(stata)中观察很少的组

identify groups with few observations in paneldata models (stata)

如何识别面板数据模型中观测值很少的组?

我使用xtlogit估计了几个随机效应模型。平均而言,我每组有 26 个观察结果,但有些组只记录 1 个观察结果。我想识别它们并将它们从模型中排除......有什么建议吗? 我的面板数据设置使用:xtset countrycode year

让我们假设一个足够大的面板的神奇数字是 7,并且您适合第一个模型。

   bysort countrycode : egen n_used = total(e(sample)) 

然后会为您提供可用和可以使用的观测值的计数,之后您对后续模型的标准是 if n_used >= 7

你可以去

bysort countrycode : gen n_available = _N 

无论模型拟合如何。

区别是two-fold:

  1. 最后一条语句将忽略模型拟合中使用的变量中的任何缺失值。

  2. 如果您还使用 if and/or in 将模型拟合限制为特定的观察子集,那么 e(sample) 知道这一点,但是最后一句没有。