正在解决 Python-找不到 pptx 包
Resolving Python-pptx package not found
我正在尝试做一些相当简单的事情:将每个文本框存储在 powerpoint 文件中作为一个巨大的 python 列表中的一个元素。这段代码应该让我得到那个结果:
text_array = []
for eachfile in glob.glob("master_folder\*.pptx"):
prs = Presentation(eachfile)
#print(eachfile)
#print("----------------------")
for slide in prs.slides:
for shape in slide.shapes:
if hasattr(shape, "text"):
text_array.append(shape.text)
然而,就像关于 SO (PPTX Package not Found) 的其他一些问题一样,我遇到了错误:
PackageNotFoundError: Package not found at
'master_folder\April_2020.pptx'
我尝试过的:
- 仔细检查我的 versions/dependencies:一切似乎都在
order/compatible
- 正在删除文件和目录中的所有空格
但是,错误仍然存在。
问题
有使用该库经验的人能否为我指出正确的方向,以完成抓取文档内文本并将其存储在本机 python 列表(如我的代码所示)的简单任务?
- 文件不存在
- 文件不是有效的 pptx(解压缩文件并检查文件夹和文件结构)
- 文件已损坏(在 MS Office 中打开,更改、保存可能会修复)
- 没有 python
的访问权限
- 文件被锁定,例如由 MS Office 打开
如果您找不到任何内容,请提供无法正常工作的示例 pptx。
我正在尝试做一些相当简单的事情:将每个文本框存储在 powerpoint 文件中作为一个巨大的 python 列表中的一个元素。这段代码应该让我得到那个结果:
text_array = []
for eachfile in glob.glob("master_folder\*.pptx"):
prs = Presentation(eachfile)
#print(eachfile)
#print("----------------------")
for slide in prs.slides:
for shape in slide.shapes:
if hasattr(shape, "text"):
text_array.append(shape.text)
然而,就像关于 SO (PPTX Package not Found) 的其他一些问题一样,我遇到了错误:
PackageNotFoundError: Package not found at 'master_folder\April_2020.pptx'
我尝试过的:
- 仔细检查我的 versions/dependencies:一切似乎都在 order/compatible
- 正在删除文件和目录中的所有空格
但是,错误仍然存在。
问题
有使用该库经验的人能否为我指出正确的方向,以完成抓取文档内文本并将其存储在本机 python 列表(如我的代码所示)的简单任务?
- 文件不存在
- 文件不是有效的 pptx(解压缩文件并检查文件夹和文件结构)
- 文件已损坏(在 MS Office 中打开,更改、保存可能会修复)
- 没有 python 的访问权限
- 文件被锁定,例如由 MS Office 打开
如果您找不到任何内容,请提供无法正常工作的示例 pptx。