哪个 MICE 估算数据集用于后续分析?
Which MICE imputed data set to use in succeeding analysis?
我不确定是否需要为此提供可重现的输出,因为这是一个更普遍的问题。无论如何,在 运行 鼠标包之后,它 returns m
多个插补数据集。我们可以使用 complete()
函数提取数据。
我很困惑,但是我应该使用哪个数据集进行后续分析(描述性估计、模型构建等)。
问题:
1.我需要提取特定的数据集吗? complete(imp,1)
?或者我应该使用整个估算的数据集,例如complete(imp, "long", inc = TRUE)
?
- 如果是后者
complete(imp, "long", inc = TRUE)
,我如何计算一些描述性的东西,比如均值、比例等?例如,我将使用 SPSS 分析长数据。我是否应该根据推算数据集的 m
数量拆分数据并手动求平均值?应该怎么做?
感谢您的帮助。
您应该 运行 对每个 m
估算数据集分别进行统计分析,然后将结果合并在一起。这使您可以考虑插补程序引入的额外不确定性。 MICE 内置了这个功能。例如,如果你想做一个简单的线性模型,你可以这样做:
fit <- with(imp, lm(y ~ x1 + x2))
est <- pool(fit)
summary(est)
查看 ?pool
和 ?mira
多重插补包括以下三个步骤:
1. Imputation
2. Analysis
3. Pooling
在第一步中,生成了 m
个估算数据集,在第二步数据分析中,例如分别对每个数据集应用回归。最后,在第三步中,将分析结果汇总成最终结果。针对不同的参数实施了多种池化技术。
这是一个很好的 link 描述池的详细信息 - mice Vignettes
我不确定是否需要为此提供可重现的输出,因为这是一个更普遍的问题。无论如何,在 运行 鼠标包之后,它 returns m
多个插补数据集。我们可以使用 complete()
函数提取数据。
我很困惑,但是我应该使用哪个数据集进行后续分析(描述性估计、模型构建等)。
问题:
1.我需要提取特定的数据集吗? complete(imp,1)
?或者我应该使用整个估算的数据集,例如complete(imp, "long", inc = TRUE)
?
- 如果是后者
complete(imp, "long", inc = TRUE)
,我如何计算一些描述性的东西,比如均值、比例等?例如,我将使用 SPSS 分析长数据。我是否应该根据推算数据集的m
数量拆分数据并手动求平均值?应该怎么做?
感谢您的帮助。
您应该 运行 对每个 m
估算数据集分别进行统计分析,然后将结果合并在一起。这使您可以考虑插补程序引入的额外不确定性。 MICE 内置了这个功能。例如,如果你想做一个简单的线性模型,你可以这样做:
fit <- with(imp, lm(y ~ x1 + x2))
est <- pool(fit)
summary(est)
查看 ?pool
和 ?mira
多重插补包括以下三个步骤:
1. Imputation
2. Analysis
3. Pooling
在第一步中,生成了 m
个估算数据集,在第二步数据分析中,例如分别对每个数据集应用回归。最后,在第三步中,将分析结果汇总成最终结果。针对不同的参数实施了多种池化技术。
这是一个很好的 link 描述池的详细信息 - mice Vignettes