有什么方法可以在 venv/web 服务器上安装 Tesseract OCR?
Is there any way to install Tesseract OCR in a venv/web server?
我制作了一个执行 OCR 的 Python 脚本,然后我回收了该脚本并使用 Flask 制作了一个网络应用程序。 Web 应用程序及其库位于 virtualenv 中,但该应用程序正在使用安装在 OS (Windows) 中的 Tesseract OCR。我一直在本地服务器上测试它。现在是部署的时候了,我不知道如何在venv中安装Tesseract,或者是否可以在服务器上安装它。我不知道我说的是否有道理,但我很迷茫,我将非常感谢对此事的任何帮助。
提前致谢。
这取决于您要部署到的服务器的操作系统。如果您是 docker 中的 运行,这是基本图像的 OS。
您很可能会从 from a pre-built binary.
安装
安装完成后,找到二进制文件。在 linux 上使用命令:
which tesseract
这将输出如下内容:
/usr/bin/tesseract
然后在您的应用程序代码中,根据 usage instructions 指向此二进制文件的 pytesseract
:
pytesseract.pytesseract.tesseract_cmd = r'/usr/bin/tesseract'
如果您遇到的问题是 ModuleNotFoundError: No module named 'Image'
,即使在安装 Pillow
、运行 之后也是如此:
python -m pip install --upgrade pip
python -m pip install --upgrade Pillow
之后,您应该可以安装 pytesseract
而不会出现错误。
我制作了一个执行 OCR 的 Python 脚本,然后我回收了该脚本并使用 Flask 制作了一个网络应用程序。 Web 应用程序及其库位于 virtualenv 中,但该应用程序正在使用安装在 OS (Windows) 中的 Tesseract OCR。我一直在本地服务器上测试它。现在是部署的时候了,我不知道如何在venv中安装Tesseract,或者是否可以在服务器上安装它。我不知道我说的是否有道理,但我很迷茫,我将非常感谢对此事的任何帮助。
提前致谢。
这取决于您要部署到的服务器的操作系统。如果您是 docker 中的 运行,这是基本图像的 OS。
您很可能会从 from a pre-built binary.
安装安装完成后,找到二进制文件。在 linux 上使用命令:
which tesseract
这将输出如下内容:
/usr/bin/tesseract
然后在您的应用程序代码中,根据 usage instructions 指向此二进制文件的 pytesseract
:
pytesseract.pytesseract.tesseract_cmd = r'/usr/bin/tesseract'
如果您遇到的问题是 ModuleNotFoundError: No module named 'Image'
,即使在安装 Pillow
、运行 之后也是如此:
python -m pip install --upgrade pip
python -m pip install --upgrade Pillow
之后,您应该可以安装 pytesseract
而不会出现错误。