大量标签的一种热编码
one hot encoding for huge number of tags
有个问题很困惑,想请教各位大神。我正在研究张量流中的卷积神经网络。现在我有带标签的图像。大约有 10000 个唯一标签,我希望自动标记图像。
现在我对标签使用一种热编码。对于 10000 个唯一标签,它就像功能中断一样。我们如何处理这种情况?
facebook是怎么做人脸标注的?有数百万张面孔。我猜他们不会对面部标签进行一种热编码吧?
在人脸识别中,处理数百万 classes 的标准方法是使用 嵌入 。 CNN 生成大小介于 64 和 1024 之间的嵌入。
在这个嵌入space中,每个class图像应该形成一个图像簇,并且不同class的簇应该相距很远。
Facebook 的方法在他们的 DeepFace paper (June 2014), but I would recommend a more recent approach from Google using triplet loss: FaceNet: A Unified Embedding for Face Recognition and Clustering 中有所描述。
有个问题很困惑,想请教各位大神。我正在研究张量流中的卷积神经网络。现在我有带标签的图像。大约有 10000 个唯一标签,我希望自动标记图像。 现在我对标签使用一种热编码。对于 10000 个唯一标签,它就像功能中断一样。我们如何处理这种情况?
facebook是怎么做人脸标注的?有数百万张面孔。我猜他们不会对面部标签进行一种热编码吧?
在人脸识别中,处理数百万 classes 的标准方法是使用 嵌入 。 CNN 生成大小介于 64 和 1024 之间的嵌入。
在这个嵌入space中,每个class图像应该形成一个图像簇,并且不同class的簇应该相距很远。
Facebook 的方法在他们的 DeepFace paper (June 2014), but I would recommend a more recent approach from Google using triplet loss: FaceNet: A Unified Embedding for Face Recognition and Clustering 中有所描述。