如何从 python 上的文件图像中获取信息,例如姓名、CPF、RG?

How to get information from an image of a document, like name, CPF, RG, on python?

如果我的问题标题没有解决我的问题,我很抱歉。

我正在尝试使用 tesseract 从文档图像中获取信息,但它在图片上效果不佳(在文本打印屏幕上效果很好)。我想问问是否有人知道可以帮助我的技术。我认为让图像变成黑色和白色,我想要的信息是黑色的会很有帮助,但我不知道该怎么做。

如果有人知道如何帮助我,我会很高兴。 (:

使用 opencv 可能有助于在将图像传递给 tesseract 之前对其进行预处理。

我通常遵循这些步骤

  1. 将图像转换为灰度
  2. 如果图片中的文字很小,请使用 cv2.resize()
  3. 调整图片大小
  4. 模糊图像(GaussianBlur 或 MedianBlur)
  5. 应用阈值使文本突出显示(cv2.threshold)
  6. 使用 tesseract 配置指示 tesseract 查找特定字符。 例如,如果图像仅包含字母数字大写英文文本,则传递 config='-c tessedit_char_whitelist=0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ" 会有帮助。