正在解决 Python-找不到 pptx 包

Resolving Python-pptx package not found

我正在尝试做一些相当简单的事情:将每个文本框存储在 powerpoint 文件中作为一个巨大的 python 列表中的一个元素。这段代码应该让我得到那个结果:

text_array = []
for eachfile in glob.glob("master_folder\*.pptx"):
    prs = Presentation(eachfile)
    #print(eachfile)
    #print("----------------------")
    for slide in prs.slides:
        for shape in slide.shapes:
            if hasattr(shape, "text"):
                text_array.append(shape.text)

然而,就像关于 SO (PPTX Package not Found) 的其他一些问题一样,我遇到了错误:

PackageNotFoundError: Package not found at 'master_folder\April_2020.pptx'

我尝试过的:

但是,错误仍然存​​在。

问题

有使用该库经验的人能否为我指出正确的方向,以完成抓取文档内文本并将其存储在本机 python 列表(如我的代码所示)的简单任务?

  • 文件不存在
  • 文件不是有效的 pptx(解压缩文件并检查文件夹和文件结构)
  • 文件已损坏(在 MS Office 中打开,更改、保存可能会修复)
  • 没有 python
  • 的访问权限
  • 文件被锁定,例如由 MS Office 打开

如果您找不到任何内容,请提供无法正常工作的示例 pptx。