测试时间序列数据中未标记的分钟数
Testing for unstamped minutes in time series data
我有一个详细价格的 df,想确定是否有分钟丢失(跨越 5 年)。价格只有在有交易的时候才会盖章,所以少了一些分钟。
不同的列中有 4 个实体,我想知道缺少分钟的实体以及它是什么时候。
我的第一个倾向是对 NaN 进行重采样和求和。这样做的最佳方法是什么?
在有更好的答案之前,我是如何处理这个问题的。
Merge with the nearest minute using pandas
写出这个问题的答案并打印所有 NaN 值。
df_time = pd.DataFrame({'date':pd.date_range(start='yyyy/mm/dd',end='yyyy/mm/dd', freq='1T')}) df_time.info()
这个简单的除法将确认你有正确的数据大小
df_combined = pd.merge(df_time, df_price, on='date') print(df_combined.isna())
然后我想要与前一分钟相同的价格,因为没有发生显着差异的交易,我通过 df_combined.ffill()
做到了
我有一个详细价格的 df,想确定是否有分钟丢失(跨越 5 年)。价格只有在有交易的时候才会盖章,所以少了一些分钟。
不同的列中有 4 个实体,我想知道缺少分钟的实体以及它是什么时候。
我的第一个倾向是对 NaN 进行重采样和求和。这样做的最佳方法是什么?
在有更好的答案之前,我是如何处理这个问题的。 Merge with the nearest minute using pandas
写出这个问题的答案并打印所有 NaN 值。
df_time = pd.DataFrame({'date':pd.date_range(start='yyyy/mm/dd',end='yyyy/mm/dd', freq='1T')}) df_time.info()
这个简单的除法将确认你有正确的数据大小
df_combined = pd.merge(df_time, df_price, on='date') print(df_combined.isna())
然后我想要与前一分钟相同的价格,因为没有发生显着差异的交易,我通过 df_combined.ffill()