ImportError: No module named textract

ImportError: No module named textract

我在 jupyter notebook 中使用 pip install 和 运行 import 命令安装了 textract,但出现以下错误。

我在一台 windows 机器上,使用 conda 安装了两个版本的 python(2.7 和 3.6)。我还按照其他帖子中的建议添加了环境变量的路径,但仍然出现错误。

import textract

ImportErrorTraceback (most recent call last)
<ipython-input-2-99b3b0e1733d> in <module>()
     1 #Code to extract pdf files
----> 2 import textract
    3 text = textract.process("C:/Users/username/Documents/Projects/Attachments/PDF/fileA.pdf")

ImportError: No module named textract 

编辑:

我只在 python 2.7 上成功安装了 textract。 我已将以下路径添加到环境变量 C:\Users\Username\AppData\Local\Continuum\anaconda3\envs\mypy27\ C:\Users\Username\AppData\Local\Continuum\anaconda3\envs\mypy27\Scripts---> 这是 textract 文件所在的位置 C:\Users\Username\AppData\Local\Continuum\anaconda3\envs\mypy27\Lib\lib-tk C:\Users\Username\AppData\Local\Continuum\anaconda3\envs\mypy27\库 C:\Users\Username\AppData\Local\Continuum\anaconda3\envs\mypy27\DLLs

更新: 我使用 pip install 安装了 pypdf2 并尝试将其导入到 juptyer notebooks 中。它返回了同样的错误。我想知道我是否安装不正确。

这可能是一种解决方法。

1.Uninstalled Anaconda 并重新安装。

2.Did 未在 anaconda 中创建任何 python 2.7 环境,并使用 pip 以及基本 anaconda 命令提示符中的所有其他依赖项重新安装了 textract。

3.Tried 导入 textract,效果非常好!

这对我有用ubuntu

1.Open 航站楼

python -m venv env 
source ./env/bin/activate
sudo apt update
sudo apt install python-pip && pip install --upgrade pip
sudo apt install python-dev libxml2-dev libxslt1-dev antiword unrtf poppler-utils pstotext tesseract-ocr flac ffmpeg lame libmad0 libsox-fmt-mp3 sox libjpeg-dev swig
pip install textract

如果您遇到更多错误:

尝试

pip install https://pypi.python.org/packages/ce/c7/ab6cd0d00ddf8dc3b537cfb922f3f049f8018f38c88d71fd164f3acb8416/SpeechRecognition-3.6.3-py2.py3-none-any.whl
sudo apt install libpulse-dev
pip install textract

现在您可以导入 textract

import textract
text = textract.process("/home/user/textract_test.pdf")