哪个 MICE 估算数据集用于后续分析？

Question

我不确定是否需要为此提供可重现的输出，因为这是一个更普遍的问题。无论如何，在运行鼠标包之后，它 returns m 多个插补数据集。我们可以使用 complete() 函数提取数据。

我很困惑，但是我应该使用哪个数据集进行后续分析（描述性估计、模型构建等）。

问题： 1.我需要提取特定的数据集吗？ complete(imp,1)？或者我应该使用整个估算的数据集，例如complete(imp, "long", inc = TRUE)?

如果是后者complete(imp, "long", inc = TRUE)，我如何计算一些描述性的东西，比如均值、比例等？例如，我将使用 SPSS 分析长数据。我是否应该根据推算数据集的 m 数量拆分数据并手动求平均值？应该怎么做？

感谢您的帮助。

Answer 1

您应该运行对每个 m 估算数据集分别进行统计分析，然后将结果合并在一起。这使您可以考虑插补程序引入的额外不确定性。 MICE 内置了这个功能。例如，如果你想做一个简单的线性模型，你可以这样做：

fit <- with(imp, lm(y ~ x1 + x2))
est <- pool(fit)
summary(est)

查看 ?pool 和 ?mira

Answer 2

多重插补包括以下三个步骤：

1. Imputation
2. Analysis
3. Pooling

在第一步中，生成了 m 个估算数据集，在第二步数据分析中，例如分别对每个数据集应用回归。最后，在第三步中，将分析结果汇总成最终结果。针对不同的参数实施了多种池化技术。这是一个很好的 link 描述池的详细信息 - mice Vignettes

Which MICE imputed data set to use in succeeding analysis?