128 筛选描述符的值?

the value of 128 sift descriptor?

我知道我们在关键点周围取了一个 16x16 window 的 "in-between" 像素。我们将 window 分成十六个 4x4 windows。从每个 4x4 window,我们生成 8 个 bin 的直方图。每个 bin 对应于 0-44 度、45-89 度等。来自 4x4 的梯度方向被放入这些 bin 中。这是为所有 4x4 块完成的。最后,我们将您得到的 128 个值归一化。 他们从哪里获得价值

但我误解了 128 数字的值从何而来?是指方向值对应的大小还是什么?

如果有人描述任何数值示例,我将不胜感激!

在 SIFT(尺度不变特征变换)中,128 维特征向量由 4x4 个样本每个 window 在每个样本的 8 个方向上组成 -- 4x4x8 = 128.

有关图解指南,请参阅 A Short introduction to descriptors,尤其是这张图片,显示嵌入每个 4x4 网格方块(中心图像)中的 8 方向测量值(基数和基数间),然后是直方图方向(右图):

从你的问题来看,我相信你也不清楚描述符 中的信息是什么 -- 它被称为定向梯度直方图 (HOG)。为了进一步阅读,维基百科对 HOG 进行了概述 gradient computation:

Each pixel within the cell casts a weighted vote for an orientation-based histogram channel based on the values found in the gradient computation.

一切都建立在那些逐像素的基础上 "votes"。