使用 MICE 估算不同类型的变量

Impute different types of variables with MICE

我正在尝试对具有 69 列和超过 50000 行的数据集执行插补。我的数据集有不同类型的变量:

  1. 仅显示二进制变量 (0,1) 的列
  2. 分类列
  3. 采用连续数值数据的列

现在,我想执行插补,我知道我的列具有高水平的多重共线性。

我是否必须将我的数据集分成 3 个不同的子集(1、2、3)我可以拥有的列类型)或者我应该对整个数据集执行插补?

问题是包 mice 对于这些类型中的每一种都有不同的方法。如果我 运行 三个不同的时间,我是否必须考虑整个数据集或只考虑特定部分?

您可以一次将整个数据集输入鼠标。 (其实可以分别指定每个变量使用哪种方法)

我引用了老鼠的参考资料:

参数'method'

Can be either a single string, or a vector of strings with length length(blocks), specifying the imputation method to be used for each column in data. If specified as a single string, the same method will be used for all blocks. The default imputation method (when no argument is specified) depends on the measurement level of the target column, as regulated by the defaultMethod argument. Columns that need not be imputed have the empty method "". See details.