如何以编程方式收集巨大的面部数据集以进行面部识别?

How do I collect huge face dataset programatically for facial recognition?

所以,我正在尝试使用 Facenet 开发这个面部识别系统。该项目的难点在于数据,因为我需要至少 100K class 的带标签的人脸图像。最终我想将编码存储在数据库中以进行实时人脸检测。有像'labeled faces in the wild'这样的数据集,它由巨大的人脸数据集组成,但与人脸图像的质量和每个class上的图像数量不一致。我还研究了 facenet 是如何训练的,发现它是在“100 万名人脸数据集”上训练的。我假设我不能使用它,因为它被用来训练我试图用于我的项目的 facenet。所以,我的问题是如何以编程方式收集人脸数据集?谢谢

我推荐你看看VGGFace2数据集。它存储了 9K+ 身份的 330 万张人脸图像。

另一个不错的是FaceScrub。它存储了 530 个身份的 10 万张人脸图像。

FaceNet 未使用 VGGFace2 或 FaceScrub 进行训练。如今,许多研究使用这些数据集训练模型,并在 Labeled Faces in the Wild (LFW) 数据集上测试模型。 LFW 存储了 5749 个身份的 13K 人脸图像。