Object 在汽车座椅上寻找左侧 object 的检测与图像差异

Object detection vs image difference for finding left object on car seat

我对采用哪种方法感到困惑,这就是问题所在。 我应该实现一个 lost/found 模块来识别乘坐出租车的乘客是否在后座上留下了东西。 因此摄像头将被放置在后座正上方,一旦乘客离开出租车,AI 模块将被触发,检查乘客是否忘记了座位上的东西并发出警报 driver。 现在的问题是——为了确定是否还有东西,我可以使用 object 检测,但并不是所有的 object 都会被训练,就像在许多情况下他们只会留下一些东西在里面。很难量化。然后我想,因为我可以在他们坐下之前得到一张图像,然后在他们退出并执行图像差异以找到轮廓后通过拍摄另一张图像来比较它。但是,不同的照明条件可能会错误地识别出实质性差异。 [已编辑]还有图像分类而不是检测,因为我真的对 object 的位置不感兴趣,只是想知道 object 是否存在

所以任何人都可以向我推荐一个继续前进的好方法。 谢谢

人们可以在出租车上忘记的物品类型不多(phone、钱包、包、雨伞、钥匙、夹克、帽子……),所以我认为物体检测会在 99% 以上的情况下完成它的工作。 否则,“出租车先行”的方法听起来还不错。您可以使用直方图归一化之类的方法来减少光线变化的影响。

我希望你有一个数据集可以处理,否则你应该做的第一件事就是收集一个。

我认为您的方向是正确的。您可以选择任何一种方式,对象检测或图像分类。

对于初学者,我认为您应该尝试图像分类。如果主要目标只是了解那里是否有对象,那么这是一个二元分类问题,您将需要更少的标记过程。您只需要解决背景图像过多(无对象)和包含对象的图像太少的问题,但这是可行的。从像 ResNet-50 这样的预训练网络开始,看看效果如何,使用这种方法你应该会得到很好的结果。

对于物体检测,我看到的问题是可能留在座位上的物体数量和可能的变化,是的,有一些常见的物体,您可以在它们上训练网络,但是如果有一个你没有在其上训练过的完全不同的对象,网络甚至不会检测到它。物体的变化在这里也很重要,根据我的经验,物体检测需要大量具有物体各种位置和样式的数据。这是可能的,但很难。为了测试这一点,在 COCO 上预训练的模型应该给你一个整体的视角。