r 包 emmeans 中的 weights="cell" 和 weights="proportional" 有什么区别
what is the difference between weights="cell" and weights="proportional" in r package emmeans
我想在具有离散预测变量和不平衡数据的 glm
模型中计算边际均值。使用 emmeans
包的函数 emmeans
获得边际均值给我设置 weights="cell"
和 weights="proportional"
的不同结果。包文档说 "proportional"
使用与平均的因子组合的频率(在原始数据中)成比例的权重,并且 "cells"
根据被平均的单元格的频率使用权重。但我不明白这到底是什么意思?!请在下面查看我的 r 代码的简化版本!
如果有任何帮助,我将不胜感激。
model <- glm(formula=y~x1+x2, data=df, family=gaussian)
library(emmeans)
marginal_means_cells <- summary(emmeans(model, "x1", weights="cells"))
marginal_means_prop <- summary(emmeans(model, "x1", weights="prop"))
这在 emmeans 包的 "messy data" vignette 中有进一步讨论。假设在 2 因子设计中,您的细胞频率如下:
Treatment
Dose | A B C | sum
------------------------------
a | 5 0 3 | 8
b | 11 3 9 | 23
------------------------------
sum | 16 3 12 | 31
然后使用“prop”权重,Treatment 的边际均值将全部使用权重 8 和 23 计算,Dose 的边际均值将全部使用权重 16、3 和 12 计算。
使用“细胞”权重,通过 A 的权重 5 和 11,B 的权重 0 和 3,C 的权重 3 和 9 计算治疗的边际均值;并且 Dose 的边际均值是使用 a 的权重 5、0、3 和 b 的 11、3、9 计算的。
如果模型包含 Treatment:Dose
交互作用,则甚至无法估计具有 0 个观测值的单元格,因此使用“prop”权重,治疗 B 或剂量 a 的边际均值也不能。但是这些边际均值可以用“细胞”权重来估计。
我想在具有离散预测变量和不平衡数据的 glm
模型中计算边际均值。使用 emmeans
包的函数 emmeans
获得边际均值给我设置 weights="cell"
和 weights="proportional"
的不同结果。包文档说 "proportional"
使用与平均的因子组合的频率(在原始数据中)成比例的权重,并且 "cells"
根据被平均的单元格的频率使用权重。但我不明白这到底是什么意思?!请在下面查看我的 r 代码的简化版本!
如果有任何帮助,我将不胜感激。
model <- glm(formula=y~x1+x2, data=df, family=gaussian)
library(emmeans)
marginal_means_cells <- summary(emmeans(model, "x1", weights="cells"))
marginal_means_prop <- summary(emmeans(model, "x1", weights="prop"))
这在 emmeans 包的 "messy data" vignette 中有进一步讨论。假设在 2 因子设计中,您的细胞频率如下:
Treatment
Dose | A B C | sum
------------------------------
a | 5 0 3 | 8
b | 11 3 9 | 23
------------------------------
sum | 16 3 12 | 31
然后使用“prop”权重,Treatment 的边际均值将全部使用权重 8 和 23 计算,Dose 的边际均值将全部使用权重 16、3 和 12 计算。
使用“细胞”权重,通过 A 的权重 5 和 11,B 的权重 0 和 3,C 的权重 3 和 9 计算治疗的边际均值;并且 Dose 的边际均值是使用 a 的权重 5、0、3 和 b 的 11、3、9 计算的。
如果模型包含 Treatment:Dose
交互作用,则甚至无法估计具有 0 个观测值的单元格,因此使用“prop”权重,治疗 B 或剂量 a 的边际均值也不能。但是这些边际均值可以用“细胞”权重来估计。