如何让 DTW 更快地达到 运行?

How to get DTW to run faster?

我有一个矩阵,包含 4500 个向量,长度为 1800,为此我需要计算矩阵中每 2 个向量之间的 DTW(动态时间扭曲)距离。

我使用嵌套循环来填充 4500x4500 矩阵的一半(看起来像三角形):

matr = zeros(4500,4500); %initializing empty matrix to fill dtw distance
for i=1:4500
    x = new(i,:); %new is where the data lies
    for j = i+1:4500
        y = new(j,:);
        matr(i,j) = dtw(x,y);
    end
end

问题是代码 运行 非常慢。根据我的计算,在我的计算机上 运行 需要 4 天。

我不知道矢量化是如何工作的。但是有没有一种方法可以对我的代码进行矢量化,使其更快 运行s?也没有内置函数,我可以插入所有向量并自动生成 DTW 距离矩阵吗?

不,没有明显的方法可以在 Matlab 中矢量化您的代码以使其更快。您要求进行大量计算(~4500^2 / 2 DTW 计算),无论您做什么,都可能需要时间。但是你有一些选择:

  • 如果您只需要执行一次此计算,只需 运行 并等待四天。如果您在学校或公司工作,您可以 运行 在个人计算机以外的计算机上进行。
  • 您可以尝试在对 pdist2 的调用中使用 dtw 作为自定义距离函数。这可能会稍微快一些。
  • 您可以在 Matlab 中编写自己的 DTW 并尝试在那里节省时间。一个明显的加速是每次调用 dtw 都必须分配一个 1800x1800 矩阵。在您自己的代码中,您可以分配一次并重新使用它。
  • 您可以用另一种语言编写自己的 DTW,或使用其他人的另一种语言的 DTW 代码。这些可以通过 MEX 从 Matlab 调用,并且可能更快,具体取决于语言和实现。
  • 您可以接受一个近似值。例如,选择一个参考信号 x0,然后为 4500 个向量中的每一个计算 dtw(x0, xi)。然后进行近似 dtw(xi, xj) = dtw(x0, xi) + dtw(x0, xj)。这样做比你建议的快 4500 倍。