如何使用动态时间扭曲获得距离矩阵?
How to get distance matrix using dynamic time wraping?
我有 6 个时间序列值如下。
import numpy as np
series = np.array([
[0., 0, 1, 2, 1, 0, 1, 0, 0],
[0., 1, 2, 0, 0, 0, 0, 0, 0],
[1., 2, 0, 0, 0, 0, 0, 1, 1],
[0., 0, 1, 2, 1, 0, 1, 0, 0],
[0., 1, 2, 0, 0, 0, 0, 0, 0],
[1., 2, 0, 0, 0, 0, 0, 1, 1]])
假设,我想获取动态时间扭曲的距离矩阵来执行聚类。我为此使用了 dtaidistance 库。
from dtaidistance import dtw
ds = dtw.distance_matrix_fast(series)
我得到的输出结果如下
array([[ inf, 1.41421356, 2.23606798, 0. , 1.41421356, 2.23606798],
[ inf, inf, 1.73205081, 1.41421356, 0. , 1.73205081],
[ inf, inf, inf, 2.23606798, 1.73205081, 0. ],
[ inf, inf, inf, inf, 1.41421356, 2.23606798],
[ inf, inf, inf, inf, inf, 1.73205081],
[ inf, inf, inf, inf, inf, inf]])
在我看来,我得到的输出是错误的。例如,据我所知,输出的对角线值应该是 0
(因为它们是理想匹配)。
我想知道我哪里做错了以及如何解决。我也很高兴使用其他 python 库获得答案。
如果需要,我很乐意提供更多详细信息
一切正确。根据 the docs:
The result is stored in a matrix representation. Since only the upper
triangular matrix is required this representation uses more memory then
necessary.
所有对角线元素都为0,下三角矩阵与上三角矩阵相同,镜像在对角线上。由于所有这些值都可以从上三角矩阵中扣除,因此它们不会显示在输出中。
您甚至可以使用 compact=True
参数仅从连接到一维数组的上对角矩阵中获取值。
您可以像这样将结果转换为完整矩阵:
ds[ds==np.inf] = 0
ds += dt.T
在dtw.py
中,距离矩阵元素的默认值指定为np.inf
。由于矩阵 returns 是不同序列之间的成对距离,因此不会将其填充到矩阵中,从而得到 np.inf
个值。
尝试 运行 dtw.distance_matrix_fast(series, compact=True)
以防止看到此填充信息。
我有 6 个时间序列值如下。
import numpy as np
series = np.array([
[0., 0, 1, 2, 1, 0, 1, 0, 0],
[0., 1, 2, 0, 0, 0, 0, 0, 0],
[1., 2, 0, 0, 0, 0, 0, 1, 1],
[0., 0, 1, 2, 1, 0, 1, 0, 0],
[0., 1, 2, 0, 0, 0, 0, 0, 0],
[1., 2, 0, 0, 0, 0, 0, 1, 1]])
假设,我想获取动态时间扭曲的距离矩阵来执行聚类。我为此使用了 dtaidistance 库。
from dtaidistance import dtw
ds = dtw.distance_matrix_fast(series)
我得到的输出结果如下
array([[ inf, 1.41421356, 2.23606798, 0. , 1.41421356, 2.23606798],
[ inf, inf, 1.73205081, 1.41421356, 0. , 1.73205081],
[ inf, inf, inf, 2.23606798, 1.73205081, 0. ],
[ inf, inf, inf, inf, 1.41421356, 2.23606798],
[ inf, inf, inf, inf, inf, 1.73205081],
[ inf, inf, inf, inf, inf, inf]])
在我看来,我得到的输出是错误的。例如,据我所知,输出的对角线值应该是 0
(因为它们是理想匹配)。
我想知道我哪里做错了以及如何解决。我也很高兴使用其他 python 库获得答案。
如果需要,我很乐意提供更多详细信息
一切正确。根据 the docs:
The result is stored in a matrix representation. Since only the upper triangular matrix is required this representation uses more memory then necessary.
所有对角线元素都为0,下三角矩阵与上三角矩阵相同,镜像在对角线上。由于所有这些值都可以从上三角矩阵中扣除,因此它们不会显示在输出中。
您甚至可以使用 compact=True
参数仅从连接到一维数组的上对角矩阵中获取值。
您可以像这样将结果转换为完整矩阵:
ds[ds==np.inf] = 0
ds += dt.T
在dtw.py
中,距离矩阵元素的默认值指定为np.inf
。由于矩阵 returns 是不同序列之间的成对距离,因此不会将其填充到矩阵中,从而得到 np.inf
个值。
尝试 运行 dtw.distance_matrix_fast(series, compact=True)
以防止看到此填充信息。