二分变量混合模型的 lme 函数：第 0 级反向求解中的奇异性，块 1

Question

我正在调整考虑一些协变量的固定效应模型。关于模型的规范，其中两个协变量是嵌套的并且具有固定效应。看到下面的错误正在发生。

library(nlme)
library(lme4)

dados$VarCat=as.factor(dados$VarCat)
dados$VarX5=as.factor(dados$VarX5)
dados$VarX6=as.factor(dados$VarX6)

modelANew <- lme(log(Resp)~log(VarX1)+log(VarX2)+(VarX3)+(VarX4)+VarX5/VarX6 ,random = ~1|VarCat, 
                 dados, method="REML")

Error in MEEM(object, conLin, control$niterEM) : 
  Singularity in backsolve at level 0, block 1

变量X6是一个二分变量。在我看来，这似乎会干扰模型的收敛或估计。我该如何解决？

Answer 1

您的数据不平衡，使得 fixed-effect 模型 rank-deficient（或多重共线性，如果您愿意）。当您包含 X5/X6 时，您表示您想要估计 X5 和 X6 的所有组合的效果。然而：

with(dd, table(VarX6,VarX5))
     VarX5
VarX6   A   B   H IND   Q   S   T
    0   2   9  94 155   0   1  15
    1   0   0   0   0   8   0   0

只有 VarX5=Q 曾在 VarX6=1 级别进行过测量，并且从未在 VarX6=0 级别进行过测量。这意味着 VarX6 变量及其与 VarX5 的交互是冗余信息。

正如评论中指出的那样，如果您运行在 lme4::lmer() 中使用它，它将自动为您删除多余的列，并显示一条消息：

library(lme4)
m2 <- lmer(log(Resp)~log(VarX1)+log(VarX2)+(VarX3)+(VarX4)+
                     VarX5/VarX6 + (1|VarCat),
                 dd, REML=TRUE)

fixed-effect model matrix is rank deficient so dropping 7 columns / coefficients

您可以通过 attr(getME(m2,"X"), "col.dropped").

找出它删除了哪些列

或者，如果您将其拟合到 lm()（我知道您想要拟合混合模型，但这是一个很好的诊断），您会发现它不会抱怨，但会自动设置NA:

的所有冗余系数

m3 <- lm(log(Resp)~log(VarX1)+log(VarX2)+(VarX3)+(VarX4)+
                     VarX5/VarX6, data=dd)
coef(m3)
    (Intercept)      log(VarX1)      log(VarX2)           VarX3           VarX4 
     0.46921538      0.79476848     -0.45769296      1.85386835     -2.78321092 
         VarX5B          VarX5H        VarX5IND          VarX5Q          VarX5S 
    -0.04677216      0.21896140      0.24584351     -2.00226719      0.32677006 
         VarX5T   VarX5A:VarX61   VarX5B:VarX61   VarX5H:VarX61 VarX5IND:VarX61 
     0.17474369              NA              NA              NA              NA 
  VarX5Q:VarX61   VarX5S:VarX61   VarX5T:VarX61 
             NA              NA              NA

这个问题和非常相似。当你有这样不平衡的设计时，“怎么办”不是一个只有一个简单答案的问题。

您可以自己从模型中删除项（例如，在这种情况下，您无法真正估计有关 VarX6 的任何内容，因为它与 VarX5 完全多余，因此请替换 VarX5/VarX6 在你的模型中 VarX5.
您可以使用 lmer 等功能自动为您删除条款

您不能做的实际上是估计 VarX5/VarX6 - 您的设计只是不包含该信息。这有点像说“我想估计汽车颜色对速度的影响，但我只测量了红色汽车”。

二分变量混合模型的 lme 函数：第 0 级反向求解中的奇异性，块 1

lme function for mixed models for dichotomous variables: Singularity in backsolve at level 0, block 1

statistics

regression

r

lme4

mixed-models