时间序列数据的隔离林
Isolation Forest for time series data
我只是想知道隔离森林(iForest)是否可以处理时间序列数据。据我所知,iForest用于异常检测,它基于随机化技术对数据进行随机递归分区,然后将分区保存在树结构中。
我有一个理论问题。我只是想知道 iForest 是否可以处理时间序列数据,因为它基于一些随机化技术。这是否会违反时间序列特征,因为随机化可能会破坏时间依赖性?
默认情况下,隔离森林将有助于检测点异常,因为原则上它只是处理这些观察的稀有性。
但是假设我对时间序列数据中的异常感兴趣。隔离森林将能够挑选出作为 point anomalies 出现的极端峰和谷,但对于 collective anomalies,您可能需要转换数据,使每个观察值代表一组观察值(滚动 window 操作)等
原因是,在时间序列数据中,您对附加异常值或时间变化感兴趣,因此如果您计划使用隔离林,您的观察结果必须单独表示。但您可以尝试其他技术,例如 STL 分解、Arima、回归树、指数平滑。您应该找到很多关于如何使用上述内容进行时间序列异常检测的 material。
我只是想知道隔离森林(iForest)是否可以处理时间序列数据。据我所知,iForest用于异常检测,它基于随机化技术对数据进行随机递归分区,然后将分区保存在树结构中。
我有一个理论问题。我只是想知道 iForest 是否可以处理时间序列数据,因为它基于一些随机化技术。这是否会违反时间序列特征,因为随机化可能会破坏时间依赖性?
默认情况下,隔离森林将有助于检测点异常,因为原则上它只是处理这些观察的稀有性。
但是假设我对时间序列数据中的异常感兴趣。隔离森林将能够挑选出作为 point anomalies 出现的极端峰和谷,但对于 collective anomalies,您可能需要转换数据,使每个观察值代表一组观察值(滚动 window 操作)等
原因是,在时间序列数据中,您对附加异常值或时间变化感兴趣,因此如果您计划使用隔离林,您的观察结果必须单独表示。但您可以尝试其他技术,例如 STL 分解、Arima、回归树、指数平滑。您应该找到很多关于如何使用上述内容进行时间序列异常检测的 material。