时间序列数据的无监督学习

Unsupervised Learning with Time Series Data

我有一个由许多系列组成的数据集。我想建立一个模型,能够确定哪些系列或系列集独立于系列,哪些系列与其相关性一起依赖。

换句话说,假设我有系列 A、B 和 C,但我对它们一无所知。输出可能是 A 和 B 是独立的,但是知道时间 t-1 的 B 有助于我们预测时间 t 的 C。

这叫什么问题?如果我有 N 系列而不是只有 3 个系列,我该如何解决这个问题?我熟悉 Python 中的机器学习技术,但我不确定是否有其他更好的方法,例如遗传算法等,可以帮助我找到解决方案。

也许我在考虑无监督学习或聚类方面的问题,但我不确定如何使用时间序列来完成。对此有什么想法吗?

如能提供链接等指点,将不胜感激!

如果我以正确的方式理解你的问题,你想知道你的时间序列(即向量)是否相关。确定我会鼓励您使用 spicy.stats or numpy.corrcoef

如果您只想确定它们的行为方式是否相同,您可以计算它们在一段时间内的百分比变化(以使其标准化)并进行比较。