如何使用线性插值来估算缺失的时间序列数据?
How can you use linear interpolation to impute missing time-series data?
考虑 pandas 时间序列,
0 NaN
1 72.0
2 63.0
3 30.0
4 26.0
5 NaN
6 NaN
7 35.0
8 NaN
9 37.0
...
传感器在那个时间点没有记录数据的地方出现了 NaN。出于这个原因,我们应该能够使用线性插值来插值丢失的数据。例如,条目 8 应为 36,条目 5 和 6 可能分别为 29.0 和 32.0。有没有可以做到这一点的库/函数?谢谢。
s.interpolate()
输出
0 NaN
1 72.0
2 63.0
3 30.0
4 26.0
5 29.0
6 32.0
7 35.0
8 36.0
9 37.0
Name: col2, dtype: float64
考虑 pandas 时间序列,
0 NaN
1 72.0
2 63.0
3 30.0
4 26.0
5 NaN
6 NaN
7 35.0
8 NaN
9 37.0
...
传感器在那个时间点没有记录数据的地方出现了 NaN。出于这个原因,我们应该能够使用线性插值来插值丢失的数据。例如,条目 8 应为 36,条目 5 和 6 可能分别为 29.0 和 32.0。有没有可以做到这一点的库/函数?谢谢。
s.interpolate()
输出
0 NaN
1 72.0
2 63.0
3 30.0
4 26.0
5 29.0
6 32.0
7 35.0
8 36.0
9 37.0
Name: col2, dtype: float64