如何处理线性模型中没有可变性(即天花板地板效应)的预测变量?

How to deal with predictors with no variability (i.e. ceiling floor effect) in linear models?

我想测试 4 个数值预测变量对线性模型中 DV 的影响,但是其中一个预测变量没有可变性(即上限效应)。我应该删除它还是使用特定的线性模型?

这可能是一个更适合交叉验证、统计或 DS 的问题,因为它主要与编码无关。

尽管如此,我可以为您指明正确的方向。

首先,这取决于变量的确切性质。你说那不是 variability/variance 这意味着它是不变的。假设您的 DV 不是恒定的,显然没有相关性或影响,并且可以删除该变量,因为它没有影响(例如,如果我所有的测试对象都是男性,那么 SEX 是一个无用的测试变量,并且不会预测任何内容)。

但是,如果您只是简单地表示它具有较小的方差或受某个较低或较高阈值的约束(例如,永远不会超过 X),那就不同了。

对此的最佳答案始终是计算多个模型并进行简单比较。

如果包含所有变量的模型比去除特定变量的模型更好,那么保留它当然是有价值的。使用 r² 和预测变量的显着性来跟踪它,并记住您的变量可能用作抑制变量,即使它本身不能预测 DV。

最后说说选型。您已经假设预测变量和 DV 的关系是线性的,但也许这不是真的,或者至少不是对所有变量都是如此。您可以测试该假设并从那里开始工作。但是线性模型之间的切换不太可能影响结果,并且在检测几乎恒定的预测变量和 DV 之间的关系时,没有一种线性模型比另一种更好。