为什么这些 emmeans 对比度的标准误差比 emmeans 本身的标准误差低 100 倍?

Why are the standard errors of these emmeans contrasts 100x lower than those of the emmeans themselves?

我从一个我无法理解的 glm 模型中得到结果。在这个模型中,邦德是一个具有三个水平的因素。三个水平的 emmeans 具有较大的标准误差和较宽的置信区间。从这个角度看,等级之间似乎没有什么明显的区别。

然而,当我查看一些成对比较时,标准误差小了 100 倍,并且两个比较(A10 - A15 和 A14 - A15)实际上在 95% 的置信水平上是显着的。有没有属性的数据或模型可以解释这个?

对于我缺乏统计知识并且无法生成可重现的示例表示歉意,因为数据集有超过 1,000 行。非常感谢。

> emmeans(Model1, "Bond")

 Bonder emmean   SE  df asymp.LCL asymp.UCL
 A10     -6.75 21.6 Inf     -49.1      35.6
 A14     -6.48 21.6 Inf     -48.8      35.9
 A15     -6.12 21.6 Inf     -48.5      36.2

Results are averaged over the levels of: Spin, Type 
Results are given on the logit (not the response) scale. 
Confidence level used: 0.95 

> pairs(emmeans(Model1, "Bond"))

 contrast  estimate     SE  df z.ratio p.value
 A10 - A14   -0.271 0.2579 Inf -1.049  0.5456 
 A10 - A15   -0.636 0.2591 Inf -2.453  0.0376 
 A14 - A15   -0.365 0.0674 Inf -5.416  <.0001 

Results are averaged over the levels of: Spin, Type 
Results are given on the log odds ratio (not the response) scale. 
P value adjustment: tukey method for comparing a family of 3 estimates ```

很难确定,但最明显的原因是估计值之间存在很强的正相关性。通常 (A-B) 的方差是 Var(A)+Var(B)-2*Cov(A,B),所以(例如)如果 ABC 都有方差(因此有标准误差) 为 1,所有对之间的相关性(在本例中为 == 协方差)为 0.8;则任何成对差异的方差为 1+1-2*0.8=0.4,因此标准差将为 0.63.However,将标准误差降低两个数量级将需要 非常[=26] =] 强相关。

一种相关的可能性是,这是 完全分离的情况(这会导致较大的系数和更大的标准误差,尽管我通常希望它们更大(例如 |beta|>8、SD>5*beta)

什么是 cov2cor(vcov(Model))