Fast R-CNN 和 SPP-net 中用于假设生成的外部算法是什么?

What's the external algorithm used for hypothesis generation in Fast R-CNN and SPP-net?

我知道我们需要选择性搜索作为在 R-CNN 中生成感兴趣区域建议的外部算法,但在 Fast R-CNN 中我们可以简单地获取整个图像,然后将其传递给卷积网络创建特征图,然后使用单层 SPP(RoI 池化层)。

另一方面,我们在SPP-net中使用了多层SPP。供快速参考和理解

在慢速 R-CNN、SPP-net 和快速 R-CNN 中,感兴趣区域 (RoI) 来自 提议方法("selective search",?? ,??).

任何人都可以详细解释并引用它以来SPP-net和Fast R-CN中明确使用了哪些提案方法,没发现research papers里面有详细说清楚?

官方github repo显示SPP-net和Fast R-CNN都使用了与R-CNN相同的region proposal方法,即'selective search':

SPP_net and Fast R-CNN。在SPP_net repo中,有一个计算region proposals的selective search模块,在fast r-cnn repo中,作者特别提到了计算object proposals的方法是selective search。

但是同样,生成区域建议也可以使用其他方法,因为 R-CNN 和 Fast R-CNN 采用对象建议方法作为 独立于检测器的外部模块

一般来说,如果一个方法产生更多的proposals,它可以有利于最终的检测精度,但这当然会限制检测速度。 在 Faster R-CNN paper 第 2 节 'Related Work' 中,对所有对象提案生成方法进行了很好的总结。

对于后续的问题,即如何在feature map中直观地描绘region proposals,可以用下图更好地说明(ref):

图中左边的红色方框经过卷积运算后会变成右边输出体积中的红色方块,绿色方块对应绿色方块等等。现在想象一下整个7x7左边是region proposal,那么在输出的feature map上,依然是region proposal! 当然实际上左边的图像有更多的像素,所以可能有很多区域建议,并且这些建议中的每一个在输出特征图上看起来仍然像一个区域建议!

最后在原文SPP_net paper中,作者解释了他们是如何在特征图上准确地进行从原始图像到候选图像windows的region proposals的变换。