Tesseract - 检测图像的小字体大小并转换为文本
Tesseract - Detecting small font size of image and convert to text
我有一张银行支票的截图,我需要这张截图中的所有文字,但 tesseract 无法正确读取。我也尝试过对图像进行预处理,但输出失败得很惨。
我使用 ImageMagick 进行预处理,使用 Tesseract 识别文本。
link转为图片:https://imgur.com/a/pcgizic
我可以找回帐号,但不能找回 IFSC 代码和人名 "SRINIVAS"
我执行的步骤如下:
magick -density 300 check1.jpg -depth 8 -strip -background white -alpha off check1.png
magick convert check1.png -resize 250% res_check1.png
convert -brightness-contrast 10x30 res_check1.png b_res_check1.png
convert b_res_check1.png -threshold 45% bin_res_check1.png
tesseract bin_res_check1.png o_res_check1
注意:我试图将图像的大小调整到 400%,但没有成功。
Google Vision API 能够正确阅读和转换每一个文本。
在ImageMagick中,您可以使用-lat(局部区域阈值)对图像进行处理以清洁背景。我还有一个 bash shell 脚本,文本清理器,位于 http://www.fmwconcepts.com/imagemagick/index.php.
输入:
对于 ImageMagick 6,尝试
convert input.jpg -negate -lat 25x25+10% -negate result.png
改变 -lat 参数以查看是否可以改善结果。
对于 ImageMagick 7,将 convert 替换为 magick。
有帮助吗?小字体将难以处理。放大光栅图像通常没有多大帮助。但是您可以尝试使用锐化过滤器或更锐利的调整大小过滤器,例如 -filter catrom。参见 http://www.imagemagick.org/Usage/filter/
您也可以尝试做透视变换,在进一步处理之前矫正原图。这也可能有帮助。参见 http://www.imagemagick.org/Usage/distorts/#perspective
我有一张银行支票的截图,我需要这张截图中的所有文字,但 tesseract 无法正确读取。我也尝试过对图像进行预处理,但输出失败得很惨。
我使用 ImageMagick 进行预处理,使用 Tesseract 识别文本。 link转为图片:https://imgur.com/a/pcgizic
我可以找回帐号,但不能找回 IFSC 代码和人名 "SRINIVAS"
我执行的步骤如下:
magick -density 300 check1.jpg -depth 8 -strip -background white -alpha off check1.png
magick convert check1.png -resize 250% res_check1.png
convert -brightness-contrast 10x30 res_check1.png b_res_check1.png
convert b_res_check1.png -threshold 45% bin_res_check1.png
tesseract bin_res_check1.png o_res_check1
注意:我试图将图像的大小调整到 400%,但没有成功。 Google Vision API 能够正确阅读和转换每一个文本。
在ImageMagick中,您可以使用-lat(局部区域阈值)对图像进行处理以清洁背景。我还有一个 bash shell 脚本,文本清理器,位于 http://www.fmwconcepts.com/imagemagick/index.php.
输入:
对于 ImageMagick 6,尝试
convert input.jpg -negate -lat 25x25+10% -negate result.png
改变 -lat 参数以查看是否可以改善结果。
对于 ImageMagick 7,将 convert 替换为 magick。
有帮助吗?小字体将难以处理。放大光栅图像通常没有多大帮助。但是您可以尝试使用锐化过滤器或更锐利的调整大小过滤器,例如 -filter catrom。参见 http://www.imagemagick.org/Usage/filter/
您也可以尝试做透视变换,在进一步处理之前矫正原图。这也可能有帮助。参见 http://www.imagemagick.org/Usage/distorts/#perspective