是否有必要在 gam 中包含一个因子(作为平滑因子相互作用拟合)作为参数项?

Is it necessary to include a factor (fitted as a smooth-factor interaction) as a parametric term within a gam?

我有兴趣研究数据集中的非线性时间趋势,因此我想使用 R 包 mgcv 来拟合以下 GAM:

model1 <- gam(Variable ~ s(Date, by = Site.Factor), data = data)

其中 Variable 是感兴趣的连续变量,Site.Factor 是具有两个水平的因子,Date 是连续变量。

我读过,因为在平滑函数中包含了 by factor,所以没有考虑两个因子水平的均值差异。因此,我应该包括 Site.Factor 作为参数项,如下所示:

model2 <- gam(Variable ~ Site.Factor + s(Date, by = Site.Factor), data = data)

然而,虽然我可能认为 Site.Factor 对平滑度的影响很大,但我并不认为每个因素水平的均值都很重要。我是否仍需要像 model1 那样在模型中单独包含该因子,或者 model2 可以吗?

除非您知道从中提取数据的人口具有完全相同的均值那么是的,您应该包括术语Site.Factor 作为固定效应项,样本 中的差异 是否显着。