使用 pytesseract 检测孟加拉字符

Question

我正在尝试使用 Python 从孟加拉语车牌图像中 detect Bangla characters，所以我决定使用 pytesseract。为此，我使用了以下代码：

import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
text = pytesseract.image_to_string(Image.open('input.png'),lang="ben")
print(text)

问题是当我打印时，它显示为空输出。

当我试图将其冻结在文本中时，它显示为：

示例图片：(Link)

预期输出（应该类似或应该有点相关）：

ঢাকামেট্রোহ

৪৫২৩০৭

P.S：我在安装 Tesseract-OCR-64 时下载了孟加拉语数据，我正在尝试运行在 VS Code 中下载它。

任何人都可以帮助我解决这个问题或者给我一个解决这个问题的想法吗？

Answer 1

这个问题的解决方法是：

你需要分割所有的字符（你可以根据需要采取任何方法，可以是深度学习或图像处理）并且只将字符提供给 PyTesseract。（只有清晰的照片）

原因：它可以从清晰且相当可接受的分辨率的图片中检测出孟加拉语。对于小尺寸图片，针对这种语言训练的模型可能要少得多。（很好理解）

代码：

### any deep learning approach or any image processing approach here

# load the segmented character

import pytesseract
from PIL import Image

pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
character = pytesseract.image_to_string(Image.open('char.png'),lang="ben")
print(character)

使用 pytesseract 检测孟加拉字符

Detecting Bangla characters using pytesseract

python

python-tesseract