使用 Python 将 .doc 转换为纯文本

Converting .doc to pure text using Python

我正在尝试使用 textract 将我的 .doc 文件转换为纯文本。

import textract
text = textract.process('path/to/file.extension')

但是我收到了这个错误

AttributeError: 'module' object has no attribute 'process'

确保您尝试 运行 的 Python 文件未命名为 textract.py

如果这是名称,您将收到错误消息:

AttributeError: 'module' object has no attribute 'process'