使用 Python 在图像中进行光学字符识别

Optical character recognition in an image using Python

我有 an image file,Python 读取并将其转换为十六进制。这里的问题是,即使我给出一个空的空白图像,它也会给出十六进制数字作为输出。我需要 Python 只处理图像中的字母并将它们转换为十六进制并将其作为输出。

这是我看累了的节目

import binascii

filename = 'a.png'
with open(filename, 'rb') as f:
    content = f.read()

print(binascii.hexlify(content))

这是OCR(Optical Character Recognition)问题,在堆栈中讨论了好几次history

Pytesserect轻松做到这一点。

用法:

import pytesserect
from PIL import Image

# Get text in the image
text = pytesseract.image_to_string(Image.open(filename))

# Convert string into hexadecimal
hex_text = text.encode("hex")