使用强化学习细化边界框

Bounding Box Refinement using Reinforcement Learning

我有一个模型可以检测 object 并在其上制作一个边界框。问题是那些边界框不准确,需要在 object 上更紧一些,而不是一些 body 超出框的部分或一些大于 object 大小的框。我想应用强化学习来使边界框更准确,因为我有作为目标的完美边界框的信息和具有不准确边界框或不准确坐标的输入图像。我在网上找到了一篇关于完全相同主题的论文,但我找不到它的代码,它构建了一个具有定义的状态、动作和奖励的环境。由于我是强化学习的新手,所以我无法从头开始构建环境。

这是论文https://melaniemitchell.me/ResearchGroupContent/MastersTheses/AndrewClelandThesis.pdf

使用和更改网格大小度量作为状态和操作的整个方法是否可行?如果是,那么有人可以 link 我最好在 github 上构建一个非常相似的环境的代码吗?如果没有,那么有人可以就构建环境或我可以使用的其他方法提出任何建议吗?

有一篇类似的论文:Multi-stage Reinforcement Learning for Object Detection做同样的事情。

论文的实现代码可以参考here.