用密码打开docx文件?

Open docx file with password?

我正在尝试打开一个 word/pdf 文件,该文件使用 python、 而不 使用像 python-docx 这样的库被密码锁定或 PDFMiner 之类的。

我想知道是否有人知道可以为文件提供密码以便能够阅读文件内容的方法。 这有点类似于为 Web 表单输入用户名和密码的选项。

根据 this webpage,密码只是 settings.xml 文件(压缩)docx 文件中的一个设置。它似乎没有加密文件的实际内容,因为您可以删除 settings.xml,保存文档并仍然打开它...

因此您应该能够阅读内容。

请注意,这不适用于 office 2013,其中密码 "protection" 似乎已停用以支持加密。

是的,有一种方法可以打开受密码保护的 docx 文件,但它需要 python-docx 模块才能执行此操作。 你可以这样做:

import comtypes.client

word = comtypes.client.CreateObject('Word.Application')
doc = word.Documents.Open(document_path, False, True, None, psw)

参数psw为密码