嵌套随机效应和相关固定效应

Question

我有跨国面板数据，我想知道 IV 对二元学生水平结果的影响 DV

我想包括一个嵌套的随机效应，考虑到学生所在的学校会影响结果，并且学校在不同国家/地区存在显着差异：(1|country/school)。所以我开始的模型是：

model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')

我还想考虑时间趋势。起初我认为我应该做年度固定效应，但这些国家的政治发展随时间变化很大，我想抓住这一点，虽然 1991 年可能让 A 国的学校陷入动荡，但 1991 年可能是教育资金的丰收年在 B 国。因此我认为我应该包括一个国家年固定效应，如下所示：

model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
                data=data, family = 'binomial')

模型的随机效应是：

Random effects:
 Groups          Name        Variance  Std.Dev. 
 school:country (Intercept) 5.703e-02 2.388e-01
 country         (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups:  school:country, 51; country, 22

当模型中已经包含国家/地区随机效应时，包含国家/地区年份固定效应是否不正确？

另一种提问方式：我应该如何处理 school 是 country 的子集，而 country_year 是 country 的子集，但 school 或 country_year 是彼此的子集吗？

Answer 1

据我所知，你有 22 个国家。目前尚不清楚 country_year 是什么，但假设它只是 country:year 的一个虚拟变量，那么将其作为固定效应（作为一个因素）包括在内可能不是一个好主意，因为有将有太多级别无法有用地解释。

由于您对时间趋势感兴趣，因此将 year 作为固定效应包括在内是有意义的：

DV ~ IV + (1|country/school) + as.factor(year)

如果有很多 years，您可能会发现最好将年份包含为数字

DV ~ IV + (1|country/school) + as.numeric(year)

..因为这将估计一年的单一（线性）趋势，而如果它是一个因素，那么它将计算一个估计值，无论有多少年（减去 1），这在什么时候不容易解释有很多层次。但是，当编码为一个因素时，估计值可以指示是否存在非线性趋势，然后您可以切换到 as.numeric 并引入非线性项。

OP 的最后一段有点混乱。如果 country_year 确实嵌套在 country 中，那么我们将有：

DV ~ IV + (1|country/school) + (1|country:country_year)

..等同于：

DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)

...但是这不会估计任何时间趋势。如果你想估计一个趋势，那么你需要包括 year（或 country_year）作为上面提到的固定效应 - 你可以允许这个不同在学校（and/or 个国家/地区）之间，将其作为随机斜率包括在内，例如：

DV ~ IV + year + (1|country) + (year|school:country)

嵌套随机效应和相关固定效应

Nested random effects and related fixed effects

r

lme4

mixed-models

nlme

multilevel-analysis