使用 >450K 个实例训练 Dlib 对象检测

Traning Dlib object detector with >450K instances

dlib 是否能够为训练对象检测器提供大规模数据集。我有超过 450K 的面部图像来训练面部检测器。是否可以使用 Dlib 或我需要转向另一个替代方案?

您可以使用多少数据取决于计算机中有多少 RAM。因此,也许您可​​以根据每个图像的大小和您拥有的 RAM 来训练那么多。

但更重要的是,您可能问的是 dlib 中的 HOG+SVM 检测器。而对于训练人脸检测器来说,450K 人脸远远超出了 HOG+SVM 的递减 returns 点。例如,dlib 自带的正面人脸检测器,非常准确,只在一个 62MB 的小数据集上训练(这个http://dlib.net/files/data/dlib_face_detector_training_data.tar.gz)。使用超过几千张图像训练这种检测器不会让您获得任何额外的准确性。

现在,如果您的数据中有大量姿势可变性,那么 HOG+SVM 将无法捕获它。在这种情况下,最好的办法是训练多个检测器,每个检测器对应一个姿势。您可以使用 dlib 的 imglab 工具的 --cluster 选项自动将您的数据集聚类成不同的姿势。