如何从 python 上的文件图像中获取信息，例如姓名、CPF、RG？

How to get information from an image of a document, like name, CPF, RG, on python?

如果我的问题标题没有解决我的问题，我很抱歉。

我正在尝试使用 tesseract 从文档图像中获取信息，但它在图片上效果不佳（在文本打印屏幕上效果很好）。我想问问是否有人知道可以帮助我的技术。我认为让图像变成黑色和白色，我想要的信息是黑色的会很有帮助，但我不知道该怎么做。

如果有人知道如何帮助我，我会很高兴。 (:

使用 opencv 可能有助于在将图像传递给 tesseract 之前对其进行预处理。

我通常遵循这些步骤

将图像转换为灰度
如果图片中的文字很小，请使用 cv2.resize()
模糊图像（GaussianBlur 或 MedianBlur）
应用阈值使文本突出显示(cv2.threshold)
使用 tesseract 配置指示 tesseract 查找特定字符。例如，如果图像仅包含字母数字大写英文文本，则传递 config='-c tessedit_char_whitelist=0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ" 会有帮助。