识别面板数据模型（stata）中观察很少的组

Question

如何识别面板数据模型中观测值很少的组？

我使用xtlogit估计了几个随机效应模型。平均而言，我每组有 26 个观察结果，但有些组只记录 1 个观察结果。我想识别它们并将它们从模型中排除......有什么建议吗？我的面板数据设置使用：xtset countrycode year

Answer 1

让我们假设一个足够大的面板的神奇数字是 7，并且您适合第一个模型。

   bysort countrycode : egen n_used = total(e(sample))

然后会为您提供可用和可以使用的观测值的计数，之后您对后续模型的标准是 if n_used >= 7

你可以去

bysort countrycode : gen n_available = _N

无论模型拟合如何。

区别是two-fold:

identify groups with few observations in paneldata models (stata)