哪个 MICE 估算数据集用于后续分析?

Which MICE imputed data set to use in succeeding analysis?

我不确定是否需要为此提供可重现的输出,因为这是一个更普遍的问题。无论如何,在 运行 鼠标包之后,它 returns m 多个插补数据集。我们可以使用 complete() 函数提取数据。

我很困惑,但是我应该使用哪个数据集进行后续分析(描述性估计、模型构建等)。

问题: 1.我需要提取特定的数据集吗? complete(imp,1)?或者我应该使用整个估算的数据集,例如complete(imp, "long", inc = TRUE)?

  1. 如果是后者complete(imp, "long", inc = TRUE),我如何计算一些描述性的东西,比如均值、比例等?例如,我将使用 SPSS 分析长数据。我是否应该根据推算数据集的 m 数量拆分数据并手动求平均值?应该怎么做?

感谢您的帮助。

您应该 运行 对每个 m 估算数据集分别进行统计分析,然后将结果合并在一起。这使您可以考虑插补程序引入的额外不确定性。 MICE 内置了这个功能。例如,如果你想做一个简单的线性模型,你可以这样做:

fit <- with(imp, lm(y ~ x1 + x2))
est <- pool(fit)
summary(est)

查看 ?pool?mira

多重插补包括以下三个步骤:

1. Imputation
2. Analysis
3. Pooling

在第一步中,生成了 m 个估算数据集,在第二步数据分析中,例如分别对每个数据集应用回归。最后,在第三步中,将分析结果汇总成最终结果。针对不同的参数实施了多种池化技术。 这是一个很好的 link 描述池的详细信息 - mice Vignettes