pytesser - 图像中的下一行文字?
pytesser - next line of text in image?
我在带有纯文本的简单图像上使用 pytesser。效果很好!但是,在 python 中,它会在新行上打印每行文本。但是它输出的字符串没有我可以提取的“\n”或换行符。
它如何在控制台的新行上打印图像的每一行?有什么办法可以拉出特定的线吗?还是自己拆分?
这很可能是我遗漏的非常简单的东西...
from pytesser import *
image = Image.open('image.jpg')
text = image_to_string(image)
print len(text)
print text
输出:
983
BACK RASHER 1.24
T CREAM 250ML 1.19
T COFFEE 200G 1.09
PEANUT BUTTER 1.12
DIET COKE * 2.39
感谢dlask指出我的错误。 repr() 显示了 interpeter 看到的输出,以及新行“\n”分隔符。使用 text.split("\n") 然后我可以逐行拆分输出。谢谢 dlask!
from pytesser import *
image = Image.open('image.jpg') # Open image object using PIL
text = image_to_string(image) # Run tesseract.exe on image
print(repr(text))
result = text.split("\n")
print result
我在带有纯文本的简单图像上使用 pytesser。效果很好!但是,在 python 中,它会在新行上打印每行文本。但是它输出的字符串没有我可以提取的“\n”或换行符。
它如何在控制台的新行上打印图像的每一行?有什么办法可以拉出特定的线吗?还是自己拆分?
这很可能是我遗漏的非常简单的东西...
from pytesser import *
image = Image.open('image.jpg')
text = image_to_string(image)
print len(text)
print text
输出:
983
BACK RASHER 1.24
T CREAM 250ML 1.19
T COFFEE 200G 1.09
PEANUT BUTTER 1.12
DIET COKE * 2.39
感谢dlask指出我的错误。 repr() 显示了 interpeter 看到的输出,以及新行“\n”分隔符。使用 text.split("\n") 然后我可以逐行拆分输出。谢谢 dlask!
from pytesser import *
image = Image.open('image.jpg') # Open image object using PIL
text = image_to_string(image) # Run tesseract.exe on image
print(repr(text))
result = text.split("\n")
print result