HOG 特征维度的大小
size of HOG feature dimension
我在试图理解本文中 HOG 特征的大小时感到困惑。Mid-level Elements for Object Detection.。在 Dalal 的作品中,64*128 像素 window 由 4*9*7 表示*15=3780 维 HOG feature.But 在这些论文中,64*64 像素 window 由 6*6*31 HOG feature.I 表示已阅读其中引用的参考文献,但仍然不不明白是怎么回事calculated.Can谁能帮我理解一下每64*64提取6*6*31个HOG特征的想法window?这篇论文的cellsize,blocksize和stride是多少?
你需要知道有两种不同的HOG特征。
有 Dalal 建议的原始版本(图像被分成块,块被分成单元格,正如您在问题中所解释的那样)。第二个是 UoCTTI HoG 功能。
为了解释您的问题,让我首先解释数字 31。这是本文描述的 UoCTTI Hog 特征的维度(P. F. Felzenszwalb、R. B. Grishick、D. McAllester 和 D. Ramanan . 使用基于区分训练的部件模型进行目标检测。PAMI,2009 年)。在本文中,他们使用 PCA 将维度从 36 减少到 13,然后他们执行不同类型的扩充以添加其余维度 (18)。 6x6是将图像划分为单元格。
我在试图理解本文中 HOG 特征的大小时感到困惑。Mid-level Elements for Object Detection.。在 Dalal 的作品中,64*128 像素 window 由 4*9*7 表示*15=3780 维 HOG feature.But 在这些论文中,64*64 像素 window 由 6*6*31 HOG feature.I 表示已阅读其中引用的参考文献,但仍然不不明白是怎么回事calculated.Can谁能帮我理解一下每64*64提取6*6*31个HOG特征的想法window?这篇论文的cellsize,blocksize和stride是多少?
你需要知道有两种不同的HOG特征。 有 Dalal 建议的原始版本(图像被分成块,块被分成单元格,正如您在问题中所解释的那样)。第二个是 UoCTTI HoG 功能。
为了解释您的问题,让我首先解释数字 31。这是本文描述的 UoCTTI Hog 特征的维度(P. F. Felzenszwalb、R. B. Grishick、D. McAllester 和 D. Ramanan . 使用基于区分训练的部件模型进行目标检测。PAMI,2009 年)。在本文中,他们使用 PCA 将维度从 36 减少到 13,然后他们执行不同类型的扩充以添加其余维度 (18)。 6x6是将图像划分为单元格。