OCR 与机器学习

OCR with machine learning

我需要使用 NN 创建一个 OCR 来训练和读取图像中的字符。所以有人支持我,我是机器学习的初学者,所以请指导我如何从图像中读取字符并与 numpy 数组进行比较

一个好的起点可能是获得一些关于如何处理图像的背景知识。您需要了解如何将图像转换为可以提供给算法的矩阵。

这可以使用 pillow、matplotlib 和其他工具来完成 - https://pillow.readthedocs.io/en/stable/reference/Image.html - https://matplotlib.org/api/_as_gen/matplotlib.pyplot.imread.html

这是使用 Pillow 和 numpy 的样子:

from numpy import asarray
from PIL import Image

image = Image.open('digits.jpeg')
data = asarray(image)

您可能希望先将图像转换为灰度,或者根据您尝试获得的结果以其他方式对其进行处理。