为什么 SIFT 描述符是尺度不变的?

Why SIFT descriptors are scale invariant?

我的理解:SIFT描述符使用的是从16x16邻域像素计算出的方向梯度直方图。 大图像中的 16x16 区域可以是非常小的区域,例如猫爪一根毛的1/10, 当您将目标图像调整为小尺寸时,同一关键点周围的 16x16 邻域 可以是图像的很大一部分,例如猫的爪子 使用 SIFT 描述符比较原始图像和调整大小的图像对我来说没有意义, 谁能告诉我我的理解有什么问题吗?

这是一个粗略的描述,但应该能让您了解该方法。

SIFT 使用的其中一个阶段是创建图像尺度金字塔。它将使用低通滤波器按比例缩小和平滑。

特征检测器然后通过查找不仅在图像 space 中而且在尺度 space 中具有峰值响应的特征来工作。这意味着它会找到特征将产生最高响应的图像比例。

然后,描述符将按该比例计算。因此,当您使用 smaller/larger 版本时,它仍应为该功能找到相同的比例。