使用 python 将 jpg 图像中的 table 转换为 excel

convert table in a jpg image to excel using python

我有一张 table,它是一张 jpg 图片,如下面的 link 所示,我想知道如何将其转换为 excel。

https://www.mining.com/wp-content/uploads/2021/04/TOP-50-Value-mining-companies-jumps-600-billion-from-covid-lows-.jpg

哪些库或开源软件可以与 python 一起使用?

谢谢

我认为您需要执行 OCR(光学字符识别)。这可以通过 OpenCV 和 Tesseract 来完成。输出通常是结构化文档,有时甚至是可以再次加载到 Python 中的数据库。

首先,我建议裁剪图像,以便只有 table 可见。其次,您可以使用 OpenCV 进行轮廓和角点检测,并在 CSV 文件中进行检测和转换。您可以使用此 link 作为起点参考。

你要做的事情并不简单,叫做OCR

我强烈建议找到一种不同的方式来表示您的数据,一种简单而常见的方式是使用 JSON 或 CSV 之类的格式,但如果必须,您可以尝试 Tesseract从图像中提取文本。但它需要一些预处理和 post 处理。