将拼字游戏的屏幕截图解析为数据结构的最佳方法?

Best way to parse screen shot of scrabble game to data structure?

我想将在线拼字游戏的屏幕截图解析为数据结构,这样我就可以 运行 通过解算器获得最佳着法。我没有计算机视觉方面的经验,但通过大学课程对 ML 有了一些基础知识。任何想法将不胜感激!

我已经 google 尝试过 "how to parse image of game" 和相关主题,我有一些使用 OCR 库的经验,但最难的部分是不知何故知道如何分割图像,因此OCR 可以确定字符。

我想了一下你的问题。这里的主要目标是找到所有网格案例之间的水平和垂直间隙。

这里是通过图像水平渐变得到的图像。

在这里,我注意到案例之间不包含垂直边缘的水平线显示为全黑。因此,找到它们的一种方法是逐行计算此图像的平均值,并取最低值。

这是逐行计算平均值得到的图表:

由于第二张图片,我仍在努力拆分所有行。