使用相似的时间序列估算时间序列

Impute time series using similar time series

我有一个问题,我有很多关于 1 年恒温器记录的数据,每小时它都会给我那个家庭的平均温度。但是很多数据是不可用的,因为他们只在年中安装了恒温器,或者他们把恒温器关了一个星期,或者……但是这个恒温器的很多数据真的很相似。我想要做的是使用相似的时间序列来估算缺失的数据。

假设 A 屋在 7 月才开工,但从那里开始它们与 B 屋非常相似,然后我想使用来自 B 屋的信息来预测 A 屋在 7 月之前的数据。

我正在考虑训练一个可以为我做这件事的循环神经网络,但我不确定有什么可以做到这一点,当我搜索论文时,他们几乎只在多年的数据集上工作并使用前几年的数据估算数据。我没有这个数据,所以这不是一个选项。

有没有人知道如何解决这个问题或我可以使用的参考来解决类似的问题?

据我了解,您想使用横截面数据而不是时间序列信息来估算数据。

实际上有很多插补包可以在 R 中为您执行此操作。(如果您使用的是 R)

您需要等距数据。所以每小时 1 个值,如果不存在,则需要为 NA。所以理想情况下你有多个时间序列的质量长度。

然后你根据时间戳/小时合并这些时间序列。

之后您可以应用插补包,例如mice, missForest, imputeR 基本上一行代码。这些包将使用不同时间序列之间的相关性来估计这些序列中的缺失值。