为卷积神经网络添加输入背景？

Adding a background on inputs for convolutional neural net?

我正在尝试使用 YOLOv2 训练神经网络来识别视频游戏中的角色和对象。对于输入数据，我从不同角度截取了游戏资产的屏幕截图。然而，这些角色模型中没有背景——只有模型本身。在游戏中，当然会有人物背后的背景。

这会混淆神经网络吗？如果是这样，我是否应该继续从游戏中找到一些示例背景图像并将它们随机应用于输入数据？

是的，您应该为您的模型添加游戏内背景，否则您将永远无法获得像样的质量检测。网络需要知道背景、物体在背景上的位置，甚至是场景中物体的光照。它们都有助于最终的检测质量。

用于混合背景和图像的技术也很重要。

有关该主题的好读物：Synthesizing Training Data for Object Detection in 室内场景