有什么方法可以在 venv/web 服务器上安装 Tesseract OCR?

Is there any way to install Tesseract OCR in a venv/web server?

我制作了一个执行 OCR 的 Python 脚本,然后我回收了该脚本并使用 Flask 制作了一个网络应用程序。 Web 应用程序及其库位于 virtualenv 中,但该应用程序正在使用安装在 OS (Windows) 中的 Tesseract OCR。我一直在本地服务器上测试它。现在是部署的时候了,我不知道如何在venv中安装Tesseract,或者是否可以在服务器上安装它。我不知道我说的是否有道理,但我很迷茫,我将非常感谢对此事的任何帮助。

提前致谢。

这取决于您要部署到的服务器的操作系统。如果您是 docker 中的 运行,这是基本图像的 OS。

您很可能会从 from a pre-built binary.

安装

安装完成后,找到二进制文件。在 linux 上使用命令:

which tesseract

这将输出如下内容:

/usr/bin/tesseract

然后在您的应用程序代码中,根据 usage instructions 指向此二进制文件的 pytesseract

pytesseract.pytesseract.tesseract_cmd = r'/usr/bin/tesseract'

如果您遇到的问题是 ModuleNotFoundError: No module named 'Image',即使在安装 Pillow、运行 之后也是如此:

python -m pip install --upgrade pip
python -m pip install --upgrade Pillow

之后,您应该可以安装 pytesseract 而不会出现错误。