多变量时间序列数据的随机砍伐森林异常检测

Random cut forest anomaly detection on multi variant time series data

我有来自具有时间序列和许多属性的设备的传感器数据,

我已经使用 RCF 算法检测异常。 现在的挑战是,如何说服最终用户它是否真的存在异常。 只想知道哪个属性导致了异常。

有什么最好的方法可以让最终用户相信它是否真的存在异常。

运行RCF 模型和获取异常解释的最简单方法是使用 Kinesis Analytics (KA) 中的 RCF 版本。这是 KA 文档中有关如何 运行 的 link 文档:https://docs.aws.amazon.com/kinesisanalytics/latest/sqlref/sqlrf-random-cut-forest-with-explanation.html

Kinesis 负责模型的训练、初始训练后的推理以及变量的归因和解释。