在 Windows 中使用 Tesseract 4
Using Tesseract 4 in Windows
我很难在 windows 中使用 tesseract ocr。这是我安装的:
tesseract-ocr-w32-setup-v4.0.0-rc1.20181002.exe 来自这里:
https://github.com/UB-Mannheim/tesseract/wiki
而且我已经在我的机器上安装了。之后,我设置了环境变量
但是当我试图从图像中获取文本时,使用这个命令:
C:\Users\flaviu.marc>tesseract c:\Flaviu\imagine.png C:\Flaviu\output.txt
我收到以下错误:
Error opening data file C:\Program Files (x86)\Tesseract-OCR\eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.
你能帮我解决我的问题吗?我正在尝试在 VC++ 应用程序中使用 tesseract,但我得到的错误与我在命令行中使用 tesseract 完全相同。
我更新环境变量后:
我收到以下错误:
C:\Users\flaviu.marc>tesseract c:\Flaviu\imagine.png C:\Flaviu\output.txt
Tesseract Open Source OCR Engine vv4.0.0-rc1.20181002 with Leptonica
Error in pixReadStreamPng: spp == 1, cmap, trans array, invalid depth: 4
稍后编辑:如果我尝试了另一张图片,现在初始化工作正常,但我仍然有一些错误消息:
Error in pixReadMemTiff: function not present
Error in pixReadMem: tiff: no pix returned
Error in pixaGenerateFontFromString: pix not made
Error in bmfCreate: font pixa not made
为什么我会遇到这些错误?因为当我尝试 运行 经典代码时(pImage 为 NULL)
Pix* pImage = pixRead(sFileName);
if(NULL == pImage)
{
m_sError.Format(_T("Could not read image with leptonica."));
return sRet;
}
代码取自这里:https://github.com/tesseract-ocr/tesseract/wiki/APIExample
以下是我编译 leptonica 的方式:
如何编译libtiff?我别无选择...
TESSDATA_PREFIX
应该指向包含训练数据文件的目录,例如:
我很难在 windows 中使用 tesseract ocr。这是我安装的: tesseract-ocr-w32-setup-v4.0.0-rc1.20181002.exe 来自这里:
https://github.com/UB-Mannheim/tesseract/wiki
而且我已经在我的机器上安装了。之后,我设置了环境变量
但是当我试图从图像中获取文本时,使用这个命令:
C:\Users\flaviu.marc>tesseract c:\Flaviu\imagine.png C:\Flaviu\output.txt
我收到以下错误:
Error opening data file C:\Program Files (x86)\Tesseract-OCR\eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.
你能帮我解决我的问题吗?我正在尝试在 VC++ 应用程序中使用 tesseract,但我得到的错误与我在命令行中使用 tesseract 完全相同。
我更新环境变量后:
我收到以下错误:
C:\Users\flaviu.marc>tesseract c:\Flaviu\imagine.png C:\Flaviu\output.txt
Tesseract Open Source OCR Engine vv4.0.0-rc1.20181002 with Leptonica
Error in pixReadStreamPng: spp == 1, cmap, trans array, invalid depth: 4
稍后编辑:如果我尝试了另一张图片,现在初始化工作正常,但我仍然有一些错误消息:
Error in pixReadMemTiff: function not present
Error in pixReadMem: tiff: no pix returned
Error in pixaGenerateFontFromString: pix not made
Error in bmfCreate: font pixa not made
为什么我会遇到这些错误?因为当我尝试 运行 经典代码时(pImage 为 NULL)
Pix* pImage = pixRead(sFileName);
if(NULL == pImage)
{
m_sError.Format(_T("Could not read image with leptonica."));
return sRet;
}
代码取自这里:https://github.com/tesseract-ocr/tesseract/wiki/APIExample
以下是我编译 leptonica 的方式:
如何编译libtiff?我别无选择...
TESSDATA_PREFIX
应该指向包含训练数据文件的目录,例如: