tsfresh 时间序列缺失值
tsfresh timeseries missing values
我对 tsfresh 输入格式感到困惑。我可以为不同的 ID 提供缺失值的数据框吗?例如,时间序列 1 {t0: 1, t2: 4, t5: 1}
和时间序列 2 {t1: 5, t2: 2}
。我应该用 0 填充缺失值(t1、t3 等)吗?
提前致谢
tsfresh
不“关心”您数据的时间条目。它的大多数特征计算器不需要有固定的时间间隔(例如,无论我们谈论的是哪个时间戳,时间序列的平均值仍然相同)。所以是的,从技术上讲,不同的 ID 可以有不同的时间。
也就是说,一些特征计算器确实依赖于时间戳和适当的时间间隔(例如傅里叶变换)。但是,存在许多不同的方法来填充这些需要大量领域知识的缺失值。这就是为什么 tsfresh
不会“自动”执行此操作的原因。但是,许多库(例如 pandas)为此提供了许多可能性,例如使用重采样方法。
我对 tsfresh 输入格式感到困惑。我可以为不同的 ID 提供缺失值的数据框吗?例如,时间序列 1 {t0: 1, t2: 4, t5: 1}
和时间序列 2 {t1: 5, t2: 2}
。我应该用 0 填充缺失值(t1、t3 等)吗?
提前致谢
tsfresh
不“关心”您数据的时间条目。它的大多数特征计算器不需要有固定的时间间隔(例如,无论我们谈论的是哪个时间戳,时间序列的平均值仍然相同)。所以是的,从技术上讲,不同的 ID 可以有不同的时间。
也就是说,一些特征计算器确实依赖于时间戳和适当的时间间隔(例如傅里叶变换)。但是,存在许多不同的方法来填充这些需要大量领域知识的缺失值。这就是为什么 tsfresh
不会“自动”执行此操作的原因。但是,许多库(例如 pandas)为此提供了许多可能性,例如使用重采样方法。