训练级联分类器

Train cascade classifier

我有一些关于级联分类器训练的问题:

  1. 在我的一些图片中,一半的对象是可见的。我应该将可见部分标记为感兴趣区域,将图片用作负样本还是将其完全排序?
  2. 分类器是否能够检测部分可见的对象(使用 Haar 特征)?
  3. 负样本和正样本的比例应该是多少?我经常读到你应该使用更多的负样本。但是例如在this线程中提到比率应该是2:1(更多正样本)。
  4. 我当前的分类器检测到很多误报。根据 this 教程,您可以增加阶段数或降低每个阶段的误报率。但是我不能在不增加误报率的情况下增加阶段数。如果我只是增加阶段数,训练会在某个时候停止,因为分类器用完了样本。减少误报的唯一方法是增加样本数量吗?

如果有人能回答我的问题之一,我会很高兴:)

在级联分类器的情况下,我建议丢弃 "half" 对象。既然是正样本?不,因为它们不完全包含对象,它们是负样本吗?不,因为它们不是与我们的对象无关的东西。 根据我的经验,我开始使用几乎相似数量的负面和正面图像进行训练,但我遇到了类似的问题。增加样本数量是第一步。你可能应该增加负样本的数量,注意你需要得到不同的图像,仅仅有 100 张相似的背景图像几乎与只有 5-10 张图像一样。在我的例子中,最佳比例是 positive:negative = 2:1。尽管这取决于您尝试构建的分类器,但您仍然需要尝试。如果你的对象不是太花哨的东西并且有简单的形状和大小(比如公司标志或硬币,或橙色)你不必获得太多样本但如果你正在尝试构建一个分类器来检查一些复杂的物体(比如椅子,是的.. 椅子是一个严肃的物体,因为它有许多不同的形状和大小),而不是你需要大量的样品。 希望这可以帮助。