ORB Feature Descriptor 官方论文解释

ORB Feature Descriptor Official Paper Explanation

我刚读了 Ethan Rublee 的 ORB 官方论文Official Paper,我觉得有点难以理解“4.3 Learning Good Binary Features”部分

我正在网上冲浪以深入研究它,我发现了下面的段落。我还没有得到这个的实际解释。谁能用简单的术语向我解释一下。

"给定一个大小为 m × m 的局部图像块,假设局部 window 用于强度测试的(即BRIEF中使用的box filter)大小为r × r ,有N = (m − r )2这样的局部windows。

每两个都可以定义一个强度测试,所以我们有C2N位特征。在 ORB 的原始实现中,m 设置为 31,生成 228,150 个二进制测试。去除重叠的测试后,我们最终得到了一组 205,590 个候选位特征。基于训练集,ORB select根据贪心算法最多256位。"

从官方论文和上面的段落中得到的是。

我们的补丁大小为 31X31,select 大小为 5X5.. 我们将有 N=(31-5)^2 = 676 个可能的子 Windows。我没有得到以粗体标记的行。删除重叠的测试意味着什么,我们得到 205,590 位特征?

想象一个大小为 31x31(补丁)的小图像和一个 5x5 的小图像 window。这个 window 可以放在图像中多少个不同的位置?如果你将它滑动 1 × 1 像素那么它可以被放置在 (31-5)^2 = 676 个不同的位置,对吧?仅将 676 windows 的中心像素与 2 个元素相结合,得到 676!/(2!*(676-2)!) = 228,150 种组合。在 ORB 描述符的情况下,他们对以 1 x 1 像素滑动 window 不感兴趣,由于某些 windows 之间的重叠(它们非常接近),它可能会产生很大的噪音。然后他们删除了重叠 windows 将其滑动 5 x 5 像素并使用它们的中心像素创建二进制测试,这将总组合减少到 205,590。