嵌套随机效应和相关固定效应

Nested random effects and related fixed effects

我有跨国面板数据,我想知道 IV 对二元学生水平结果的影响 DV

我想包括一个嵌套的随机效应,考虑到学生所在的学校会影响结果,并且学校在不同国家/地区存在显着差异:(1|country/school)。所以我开始的模型是:

model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')

我还想考虑时间趋势。起初我认为我应该做年度固定效应,但这些国家的政治发展随时间变化很大,我想抓住这一点,虽然 1991 年可能让 A 国的学校陷入动荡,但 1991 年可能是教育资金的丰收年在 B 国。因此我认为我应该包括一个国家年固定效应,如下所示:

model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
                data=data, family = 'binomial')

模型的随机效应是:

Random effects:
 Groups          Name        Variance  Std.Dev. 
 school:country (Intercept) 5.703e-02 2.388e-01
 country         (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups:  school:country, 51; country, 22

当模型中已经包含国家/地区随机效应时,包含国家/地区年份固定效应是否不正确?

另一种提问方式: 我应该如何处理 schoolcountry 的子集,而 country_yearcountry 的子集,但 schoolcountry_year 是彼此的子集吗?

据我所知,你有 22 个国家。目前尚不清楚 country_year 是什么,但假设它只是 country:year 的一个虚拟变量,那么将其作为固定效应(作为一个因素)包括在内可能不是一个好主意,因为有将有太多级别无法有用地解释。

由于您对时间趋势感兴趣,因此将 year 作为固定效应包括在内是有意义的:

DV ~ IV + (1|country/school) + as.factor(year)

如果有很多 years,您可能会发现最好将年份包含为数字

DV ~ IV + (1|country/school) + as.numeric(year)

..因为这将估计一年的单一(线性)趋势,而如果它是一个因素,那么它将计算一个估计值,无论有多少年(减去 1),这在什么时候不容易解释有很多层次。但是,当编码为一个因素时,估计值可以指示是否存在非线性趋势,然后您可以切换到 as.numeric 并引入非线性项。

OP 的最后一段有点混乱。如果 country_year 确实嵌套在 country 中,那么我们将有:

DV ~ IV + (1|country/school) + (1|country:country_year)

..等同于:

DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)

...但是这不会估计任何时间趋势。如果你想估计一个趋势,那么你需要包括 year(或 country_year)作为上面提到的固定效应 - 你 可以 允许这个不同在学校(and/or 个国家/地区)之间,将其作为随机斜率包括在内,例如:

DV ~ IV + year + (1|country) + (year|school:country)