r 包 emmeans 中的 weights="cell" 和 weights="proportional" 有什么区别

what is the difference between weights="cell" and weights="proportional" in r package emmeans

我想在具有离散预测变量和不平衡数据的 glm 模型中计算边际均值。使用 emmeans 包的函数 emmeans 获得边际均值给我设置 weights="cell"weights="proportional" 的不同结果。包文档说 "proportional" 使用与平均的因子组合的频率(在原始数据中)成比例的权重,并且 "cells" 根据被平均的单元格的频率使用权重。但我不明白这到底是什么意思?!请在下面查看我的 r 代码的简化版本! 如果有任何帮助,我将不胜感激。

model <- glm(formula=y~x1+x2, data=df, family=gaussian)
library(emmeans)
marginal_means_cells <- summary(emmeans(model, "x1", weights="cells"))
marginal_means_prop  <- summary(emmeans(model, "x1", weights="prop"))

这在 emmeans 包的 "messy data" vignette 中有进一步讨论。假设在 2 因子设计中,您的细胞频率如下:

             Treatment
   Dose  |  A    B    C   |  sum
   ------------------------------
     a   |  5    0    3   |    8
     b   | 11    3    9   |   23
   ------------------------------
    sum  | 16    3   12   |   31

然后使用“prop”权重,Treatment 的边际均值将全部使用权重 8 和 23 计算,Dose 的边际均值将全部使用权重 16、3 和 12 计算。

使用“细胞”权重,通过 A 的权重 5 和 11,B 的权重 0 和 3,C 的权重 3 和 9 计算治疗的边际均值;并且 Dose 的边际均值是使用 a 的权重 5、0、3 和 b 的 11、3、9 计算的。

如果模型包含 Treatment:Dose 交互作用,则甚至无法估计具有 0 个观测值的单元格,因此使用“prop”权重,治疗 B 或剂量 a 的边际均值也不能。但是这些边际均值可以用“细胞”权重来估计。