"imputeTS" 包中是否可以进行多重插补?
Is multiple imputations possible in "imputeTS" package?
这是关于 R 中的“imputeTS”包。我想知道是否有办法使用这个包进行多重插补?
任何关于这样做的可能性的 guidance/directions 将不胜感激。
此外,我想知道有关检查缺失机制(MCAR、MAR、MNAR)的想法,尤其是对于单变量时间序列。
我是 imputeTS 的作者,目前无法使用 imputeTS 进行多重插补。
(我有进一步更新的想法,但这将是一个更大的努力,这肯定需要一些时间)
如果您迫切需要多重插补,您可以使用以下解决方法(不使用 imputeTS):
对cross-sectional/non-time系列数据使用mice或其他多重插补包。由于您只有一个变量或者您没有将时间信息添加到数据集中,因此您必须从数据集中创建额外的时间变量。
因此,您将滞后和领先、季节、移动平均数……作为附加变量添加到您的数据集中。这样 mice 也适用于时间序列数据,并且还可以为您提供多重插补。 (另请参阅第 8 页起的 this paper )但您需要小心,您会得到多重插补,但整体模型可能不如使用专用时间序列方法时好)在这种方法中,您将 ML 方法用于时间序列,但并非每个 ML 模型都适用于时间序列,您必须做好将时间序列特征建模到您添加到数据集中的附加变量的工作。
这是关于 R 中的“imputeTS”包。我想知道是否有办法使用这个包进行多重插补? 任何关于这样做的可能性的 guidance/directions 将不胜感激。
此外,我想知道有关检查缺失机制(MCAR、MAR、MNAR)的想法,尤其是对于单变量时间序列。
我是 imputeTS 的作者,目前无法使用 imputeTS 进行多重插补。 (我有进一步更新的想法,但这将是一个更大的努力,这肯定需要一些时间)
如果您迫切需要多重插补,您可以使用以下解决方法(不使用 imputeTS):
对cross-sectional/non-time系列数据使用mice或其他多重插补包。由于您只有一个变量或者您没有将时间信息添加到数据集中,因此您必须从数据集中创建额外的时间变量。
因此,您将滞后和领先、季节、移动平均数……作为附加变量添加到您的数据集中。这样 mice 也适用于时间序列数据,并且还可以为您提供多重插补。 (另请参阅第 8 页起的 this paper )但您需要小心,您会得到多重插补,但整体模型可能不如使用专用时间序列方法时好)在这种方法中,您将 ML 方法用于时间序列,但并非每个 ML 模型都适用于时间序列,您必须做好将时间序列特征建模到您添加到数据集中的附加变量的工作。