tsfresh 时间序列缺失值

tsfresh timeseries missing values

我对 tsfresh 输入格式感到困惑。我可以为不同的 ID 提供缺失值的数据框吗?例如,时间序列 1 {t0: 1, t2: 4, t5: 1} 和时间序列 2 {t1: 5, t2: 2}。我应该用 0 填充缺失值(t1、t3 等)吗? 提前致谢

tsfresh 不“关心”您数据的时间条目。它的大多数特征计算器不需要有固定的时间间隔(例如,无论我们谈论的是哪个时间戳,时间序列的平均值仍然相同)。所以是的,从技术上讲,不同的 ID 可以有不同的时间。

也就是说,一些特征计算器确实依赖于时间戳和适当的时间间隔(例如傅里叶变换)。但是,存在许多不同的方法来填充这些需要大量领域知识的缺失值。这就是为什么 tsfresh 不会“自动”执行此操作的原因。但是,许多库(例如 pandas)为此提供了许多可能性,例如使用重采样方法。