具有多重插补的倾向得分匹配

Propensity score matching with multiple imputation

我有一个包含几个缺失值的数据集,需要 运行 倾向得分匹配,使用变量 'y' 作为治疗变量,x1、x2 和 x3 作为调整变量。 通过将以下代码与 Matchit

结合使用
ModMatch <- matchit(y ~ x1+x2+x3, method = 'nearest', data = data)

我得到错误'Missing values exist in the data'

因此,我尝试 运行 使用鼠标进行多重插补:

ImputedDF <- mice(data)
ModMatch <- matchit(y ~ x1+x2+x3, method = 'nearest', data = ImputedDF)

我收到错误 'cannot coerce an object of class mids to a dataframe'。 我可能需要一种方法来打印估算的数据框,有人知道这是否可行吗?

您应该使用 MatchThem 包,它是专门为在多重插补后执行匹配而设计的。 matchthem() 函数调用 matchit() 并在每个插补数据集中执行匹配。然后,您可以使用 cobalt 包检查估算数据集中的余额,该包旨在与 MatchThem 兼容。之后可以使用MatchThem中的with()函数来估计效果。这是此工作流程的示例:

library(mice); library(MatchThem); library(cobalt)

#Impute the data with 20 imputations (more is better)
imp <- mice(data, m = 20)

#Perform matching within each imputation
ModMatch <- matchthem(y ~ x1+x2+x3, method = 'nearest', data = imp)

#Assess balance
bal.tab(ModMatch, un = TRUE)
love.plot(Modmatch)

#Estimate the effect
summary(pool(with(ModMatch, svyglm(outcome ~ y + x1 + X2 + X2))))

我要提醒您,您使用的是高级统计技术,未经高级培训的人不应使用这些技术。在 miceMatchThem 中使用默认值很少是一个好主意。

关于您收到的错误消息:调用 mice() 的输出不是数据框;这是一个 mids 对象。 matchit() 中的 data 参数需要一个数据框。 matchthem() 接受一个 mids 对象以在每个估算的数据集中执行匹配。