Lukas-Kanade 步骤的高效 matlab 实现

efficient matlab implementation for Lukas-Kanade step

我在视频处理课程中接到了一个任务——实现 Lucas-Kanade 算法。由于我们必须在金字塔模型中进行,我首先为 2 个输入图像中的每一个构建一个金字塔,然后为每个级别执行多次 LK 迭代。在每个步骤(迭代)中,运行以下代码(注意:图像被零填充,因此我可以轻松处理图像边缘):

function [du,dv]= LucasKanadeStep(I1,I2,WindowSize)
It = I2-I1;
[Ix, Iy] = imgradientxy(I2);
Ixx = imfilter(Ix.*Ix, ones(5));
Iyy = imfilter(Iy.*Iy, ones(5));
Ixy = imfilter(Ix.*Iy, ones(5));
Ixt = imfilter(Ix.*It, ones(5));
Iyt = imfilter(Iy.*It, ones(5));
half_win = floor(WindowSize/2);
du = zeros(size(It));
dv = zeros(size(It));
A = zeros(2);
b = zeros(2,1);
%iterate only on the relevant parts of the images
for i = 1+half_win : size(It,1)-half_win  
    for j = 1+half_win : size(It,2)-half_win
          A(1,1) = Ixx(i,j);
          A(2,2) = Iyy(i,j);
          A(1,2) = Ixy(i,j);
          A(2,1) = Ixy(i,j);
          b(1,1) = -Ixt(i,j);
          b(2,1) = -Iyt(i,j);
          U = pinv(A)*b;
          du(i,j) = U(1);      
          dv(i,j) = U(2);
      end
  end
end

数学上我正在做的是计算每个像素 (i,j) 以下光流:

如您所见,在代码中我正在为每个像素计算这个,这需要相当长的时间(整个处理 2 张图像 - 包括构建 3 层金字塔和 3 个 LK 步骤,就像上面的每个级别 - 远程连接到我的大学服务器大约需要 25 秒(!))。

我的问题:有没有办法在没有嵌套 for 循环的情况下计算这个单个 LK 步骤?肯定效率更高,因为作业的下一步是用这个算法稳定一个短视频。谢谢。

我 运行 你的代码在我的系统上并做了分析。这是我得到的。

如您所见,反转矩阵 (pinv) 占用了大部分时间。我想您可以尝试对代码进行矢量化处理,但我不确定该怎么做。但我确实知道一个可以缩短计算时间的技巧。您必须利用矩阵 A 的最小方差。也就是说,仅当 A 的最小方差大于某个阈值时才计算逆矩阵。这将提高速度,因为您不会为所有像素反转矩阵。

您可以通过将代码修改为如下所示的代码来执行此操作。

function [du,dv]= LucasKanadeStep(I1,I2,WindowSize)
It = double(I2-I1);
[Ix, Iy] = imgradientxy(I2);
Ixx = imfilter(Ix.*Ix, ones(5));
Iyy = imfilter(Iy.*Iy, ones(5));
Ixy = imfilter(Ix.*Iy, ones(5));
Ixt = imfilter(Ix.*It, ones(5));
Iyt = imfilter(Iy.*It, ones(5));
half_win = floor(WindowSize/2);
du = zeros(size(It));
dv = zeros(size(It));
A = zeros(2);
B = zeros(2,1);
%iterate only on the relevant parts of the images
for i = 1+half_win : size(It,1)-half_win  
    for j = 1+half_win : size(It,2)-half_win
          A(1,1) = Ixx(i,j);
          A(2,2) = Iyy(i,j);
          A(1,2) = Ixy(i,j);
          A(2,1) = Ixy(i,j);
          B(1,1) = -Ixt(i,j);
          B(2,1) = -Iyt(i,j);
        % +++++++++++++++++++++++++++++++++++++++++++++++++++  
        % Code I added , threshold better be outside the loop.
        lambda = eig(A);
        threshold = 0.2
        if (min(lambda)> threshold)
            U = A\B;
            du(i,j) = U(1);
            dv(i,j) = U(2);
        end
        % end of addendum
        % +++++++++++++++++++++++++++++++++++++++++++++++++++


%           U = pinv(A)*B;
%           du(i,j) = U(1);      
%           dv(i,j) = U(2);
      end
  end
end

我已将阈值设置为 0.2。你可以试验一下。通过使用特征值技巧,我能够将计算时间从 37 秒缩短到 10 秒(如下所示)。使用eigen,pinv几乎不像以前那样占用时间。

希望这对您有所帮助。祝你好运:)

最终我找到了解决这个问题的更有效的方法。 它基于问题中显示的公式。最后 3 行是不同之处——我们得到了一个运行速度更快的无循环代码。与循环版本的差异可以忽略不计(结果矩阵之间的绝对差异约为 10^-18 或更小,忽略填充区域)。

代码如下:

function [du,dv]= LucasKanadeStep(I1,I2,WindowSize)

    half_win = floor(WindowSize/2);
    % pad frames with mirror reflections of itself
    I1 = padarray(I1, [half_win half_win], 'symmetric');
    I2 = padarray(I2, [half_win half_win], 'symmetric');

    % create derivatives (time and space)
    It = I2-I1;
    [Ix, Iy] = imgradientxy(I2, 'prewitt');

    % calculate dP = (du, dv) according to the formula
    Ixx = imfilter(Ix.*Ix, ones(WindowSize));
    Iyy = imfilter(Iy.*Iy, ones(WindowSize));
    Ixy = imfilter(Ix.*Iy, ones(WindowSize));
    Ixt = imfilter(Ix.*It, ones(WindowSize));
    Iyt = imfilter(Iy.*It, ones(WindowSize));

    % calculate the whole du,dv matrices AT ONCE!
    invdet = (Ixx.*Iyy - Ixy.*Ixy).^-1;
    du = invdet.*(-Iyy.*Ixt + Ixy.*Iyt);
    dv = invdet.*(Ixy.*Ixt - Ixx.*Iyt);

end