如何为 Tesseract 预处理此图像?
How to preprocess this image for Tesseract?
这张图找了很久的处理方法,画质很差,明显低于300ppi,正在尝试模糊加阈值处理。
Image
我所做的一切,是否可以使用这张图片?
img = cv2.imread(img_path, 0)
img = cv2.GaussianBlur(img, (3, 3), 0)
_, threshold = cv2.threshold(img, 65, 255, cv2.THRESH_BINARY)
Preprocessed
我的目标:从此文档中获取所有数据(名字、姓氏、日期)
目标示例:
Result
img = cv2.imread(img_path, 0)
y=53
x=230
h=335
w=380
img = img[y:y+h, x:x+w]
img = cv2.resize(img, (0,0), fx=1.5, fy=1.5)
img = cv2.GaussianBlur(img, (3, 3), 0)
_, threshold = cv2.threshold(img, 65, 255, cv2.THRESH_BINARY)
threshold = cv2.GaussianBlur(threshold, (3, 3), 0)
这张图找了很久的处理方法,画质很差,明显低于300ppi,正在尝试模糊加阈值处理。 Image
我所做的一切,是否可以使用这张图片?
img = cv2.imread(img_path, 0)
img = cv2.GaussianBlur(img, (3, 3), 0)
_, threshold = cv2.threshold(img, 65, 255, cv2.THRESH_BINARY)
Preprocessed
我的目标:从此文档中获取所有数据(名字、姓氏、日期)
目标示例: Result
img = cv2.imread(img_path, 0)
y=53
x=230
h=335
w=380
img = img[y:y+h, x:x+w]
img = cv2.resize(img, (0,0), fx=1.5, fy=1.5)
img = cv2.GaussianBlur(img, (3, 3), 0)
_, threshold = cv2.threshold(img, 65, 255, cv2.THRESH_BINARY)
threshold = cv2.GaussianBlur(threshold, (3, 3), 0)