嵌套随机效应和相关固定效应
Nested random effects and related fixed effects
我有跨国面板数据,我想知道 IV
对二元学生水平结果的影响 DV
我想包括一个嵌套的随机效应,考虑到学生所在的学校会影响结果,并且学校在不同国家/地区存在显着差异:(1|country/school)
。所以我开始的模型是:
model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')
我还想考虑时间趋势。起初我认为我应该做年度固定效应,但这些国家的政治发展随时间变化很大,我想抓住这一点,虽然 1991 年可能让 A 国的学校陷入动荡,但 1991 年可能是教育资金的丰收年在 B 国。因此我认为我应该包括一个国家年固定效应,如下所示:
model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
data=data, family = 'binomial')
模型的随机效应是:
Random effects:
Groups Name Variance Std.Dev.
school:country (Intercept) 5.703e-02 2.388e-01
country (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups: school:country, 51; country, 22
当模型中已经包含国家/地区随机效应时,包含国家/地区年份固定效应是否不正确?
另一种提问方式:
我应该如何处理 school
是 country
的子集,而 country_year
是 country
的子集,但 school
或 country_year
是彼此的子集吗?
据我所知,你有 22 个国家。目前尚不清楚 country_year
是什么,但假设它只是 country:year
的一个虚拟变量,那么将其作为固定效应(作为一个因素)包括在内可能不是一个好主意,因为有将有太多级别无法有用地解释。
由于您对时间趋势感兴趣,因此将 year
作为固定效应包括在内是有意义的:
DV ~ IV + (1|country/school) + as.factor(year)
如果有很多 years
,您可能会发现最好将年份包含为数字
DV ~ IV + (1|country/school) + as.numeric(year)
..因为这将估计一年的单一(线性)趋势,而如果它是一个因素,那么它将计算一个估计值,无论有多少年(减去 1),这在什么时候不容易解释有很多层次。但是,当编码为一个因素时,估计值可以指示是否存在非线性趋势,然后您可以切换到 as.numeric
并引入非线性项。
OP 的最后一段有点混乱。如果 country_year
确实嵌套在 country
中,那么我们将有:
DV ~ IV + (1|country/school) + (1|country:country_year)
..等同于:
DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)
...但是这不会估计任何时间趋势。如果你想估计一个趋势,那么你需要包括 year
(或 country_year
)作为上面提到的固定效应 - 你 可以 允许这个不同在学校(and/or 个国家/地区)之间,将其作为随机斜率包括在内,例如:
DV ~ IV + year + (1|country) + (year|school:country)
我有跨国面板数据,我想知道 IV
对二元学生水平结果的影响 DV
我想包括一个嵌套的随机效应,考虑到学生所在的学校会影响结果,并且学校在不同国家/地区存在显着差异:(1|country/school)
。所以我开始的模型是:
model = glmer(DV ~ IV + (1|country/school), data=data, family = 'binomial')
我还想考虑时间趋势。起初我认为我应该做年度固定效应,但这些国家的政治发展随时间变化很大,我想抓住这一点,虽然 1991 年可能让 A 国的学校陷入动荡,但 1991 年可能是教育资金的丰收年在 B 国。因此我认为我应该包括一个国家年固定效应,如下所示:
model = glmer(DV ~ IV + (1|country/school) + as.factor(country_year),
data=data, family = 'binomial')
模型的随机效应是:
Random effects:
Groups Name Variance Std.Dev.
school:country (Intercept) 5.703e-02 2.388e-01
country (Intercept) 4.118e-15 6.417e-08
Number of obs: 627, groups: school:country, 51; country, 22
当模型中已经包含国家/地区随机效应时,包含国家/地区年份固定效应是否不正确?
另一种提问方式:
我应该如何处理 school
是 country
的子集,而 country_year
是 country
的子集,但 school
或 country_year
是彼此的子集吗?
据我所知,你有 22 个国家。目前尚不清楚 country_year
是什么,但假设它只是 country:year
的一个虚拟变量,那么将其作为固定效应(作为一个因素)包括在内可能不是一个好主意,因为有将有太多级别无法有用地解释。
由于您对时间趋势感兴趣,因此将 year
作为固定效应包括在内是有意义的:
DV ~ IV + (1|country/school) + as.factor(year)
如果有很多 years
,您可能会发现最好将年份包含为数字
DV ~ IV + (1|country/school) + as.numeric(year)
..因为这将估计一年的单一(线性)趋势,而如果它是一个因素,那么它将计算一个估计值,无论有多少年(减去 1),这在什么时候不容易解释有很多层次。但是,当编码为一个因素时,估计值可以指示是否存在非线性趋势,然后您可以切换到 as.numeric
并引入非线性项。
OP 的最后一段有点混乱。如果 country_year
确实嵌套在 country
中,那么我们将有:
DV ~ IV + (1|country/school) + (1|country:country_year)
..等同于:
DV ~ IV + (1|country) + (1/school:country) + (1|school:country_year)
...但是这不会估计任何时间趋势。如果你想估计一个趋势,那么你需要包括 year
(或 country_year
)作为上面提到的固定效应 - 你 可以 允许这个不同在学校(and/or 个国家/地区)之间,将其作为随机斜率包括在内,例如:
DV ~ IV + year + (1|country) + (year|school:country)