是否有必要在 gam 中包含一个因子(作为平滑因子相互作用拟合)作为参数项?
Is it necessary to include a factor (fitted as a smooth-factor interaction) as a parametric term within a gam?
我有兴趣研究数据集中的非线性时间趋势,因此我想使用 R 包 mgcv
来拟合以下 GAM:
model1 <- gam(Variable ~ s(Date, by = Site.Factor), data = data)
其中 Variable
是感兴趣的连续变量,Site.Factor
是具有两个水平的因子,Date
是连续变量。
我读过,因为在平滑函数中包含了 by factor,所以没有考虑两个因子水平的均值差异。因此,我应该包括 Site.Factor
作为参数项,如下所示:
model2 <- gam(Variable ~ Site.Factor + s(Date, by = Site.Factor), data = data)
然而,虽然我可能认为 Site.Factor
对平滑度的影响很大,但我并不认为每个因素水平的均值都很重要。我是否仍需要像 model1
那样在模型中单独包含该因子,或者 model2
可以吗?
除非您知道从中提取数据的人口具有完全相同的均值那么是的,您应该包括术语Site.Factor
作为固定效应项,样本 中的差异 是否显着。
我有兴趣研究数据集中的非线性时间趋势,因此我想使用 R 包 mgcv
来拟合以下 GAM:
model1 <- gam(Variable ~ s(Date, by = Site.Factor), data = data)
其中 Variable
是感兴趣的连续变量,Site.Factor
是具有两个水平的因子,Date
是连续变量。
我读过,因为在平滑函数中包含了 by factor,所以没有考虑两个因子水平的均值差异。因此,我应该包括 Site.Factor
作为参数项,如下所示:
model2 <- gam(Variable ~ Site.Factor + s(Date, by = Site.Factor), data = data)
然而,虽然我可能认为 Site.Factor
对平滑度的影响很大,但我并不认为每个因素水平的均值都很重要。我是否仍需要像 model1
那样在模型中单独包含该因子,或者 model2
可以吗?
除非您知道从中提取数据的人口具有完全相同的均值那么是的,您应该包括术语Site.Factor
作为固定效应项,样本 中的差异 是否显着。