具有多重插补的倾向得分匹配

Question

我有一个包含几个缺失值的数据集，需要运行倾向得分匹配，使用变量 'y' 作为治疗变量，x1、x2 和 x3 作为调整变量。通过将以下代码与 Matchit

结合使用

ModMatch <- matchit(y ~ x1+x2+x3, method = 'nearest', data = data)

我得到错误'Missing values exist in the data'

因此，我尝试运行使用鼠标进行多重插补：

ImputedDF <- mice(data)
ModMatch <- matchit(y ~ x1+x2+x3, method = 'nearest', data = ImputedDF)

我收到错误 'cannot coerce an object of class mids to a dataframe'。我可能需要一种方法来打印估算的数据框，有人知道这是否可行吗？

Answer 1

您应该使用 MatchThem 包，它是专门为在多重插补后执行匹配而设计的。 matchthem() 函数调用 matchit() 并在每个插补数据集中执行匹配。然后，您可以使用 cobalt 包检查估算数据集中的余额，该包旨在与 MatchThem 兼容。之后可以使用MatchThem中的with()函数来估计效果。这是此工作流程的示例：

library(mice); library(MatchThem); library(cobalt)

#Impute the data with 20 imputations (more is better)
imp <- mice(data, m = 20)

#Perform matching within each imputation
ModMatch <- matchthem(y ~ x1+x2+x3, method = 'nearest', data = imp)

#Assess balance
bal.tab(ModMatch, un = TRUE)
love.plot(Modmatch)

#Estimate the effect
summary(pool(with(ModMatch, svyglm(outcome ~ y + x1 + X2 + X2))))

我要提醒您，您使用的是高级统计技术，未经高级培训的人不应使用这些技术。在 mice 和 MatchThem 中使用默认值很少是一个好主意。

关于您收到的错误消息：调用 mice() 的输出不是数据框；这是一个 mids 对象。 matchit() 中的 data 参数需要一个数据框。 matchthem() 接受一个 mids 对象以在每个估算的数据集中执行匹配。

具有多重插补的倾向得分匹配

Propensity score matching with multiple imputation

r

r-mice

imputation

propensity-score-matching