如何测量 Fisher Vector 之间的距离以进行图像检索?

How to measure distance between Fisher Vector for Image Retrieval?

我已经阅读了一些有关 Fisher Vector 的内容,但我仍在学习过程中。它比经典的 BoF 表示更好,利用 GMM(或 k-means,即使通常称为 VLAD)。

但是,我看到它们通常用于分类问题,例如 SVM。

但是图像检索呢?我已经看到它们也被用于图像检索(here),但我不明白一点:给定两个代表 2 个图像的 FV,我们如何计算它们的距离等等 "how similar the two images are?"

在这种情况下使用它们是否合理?

从下面两篇论文中可以看出,欧氏距离似乎是流行的选择。还提到使用点积作为相似性度量;余弦相似度(密切相关)是 ML 相似度的普遍流行指标。

http://link.springer.com/article/10.1007/s11263-013-0636-x

http://www.robots.ox.ac.uk/~vgg/publications/2013/Simonyan13/simonyan13.pdf

这足以让您选择满足您需求的东西吗?