检测表格数据结构的最佳方法是什么?

What is the best way to detect tabulated data structures?

我有一个项目,我有一张图片(.bmp、.jpeg 等),其中包含定义明确的 table 结构(比如 4x6 或 1x10,结构简单)。我需要从该图片的单元格中提取数据,我所需要的只是检测单元格的开始和结束位置(像素坐标,或者如果有其他方法,则为其他任何内容),这样我就可以处理该单元格内的图像部分。我在一些人工智能项目(TD-learning、Q-learning、神经网络)中获得了一些经验,但从未从事过需要计算机视觉的项目,所以我在该领域的知识非常有限。想到任何指示或算法来检测图片上的 table 结构吗?

我会使用 Hough transform 来识别单元格的边界。

然后(取决于单元格的内容)使用 OCR tool 来提取实际的单元格信息。