如何将 XML 个 Word 文档转换为 DOCX?

How to convert XML Word Documents to DOCX?

我收到了一系列文件夹,其中包含大量 .xml 格式的 Word 文档。它们每个都包含一些VBA代码,但是它们上面的代码已经是运行,所以我不需要保留这个。

我需要打印每个文件夹中的所有文件,但由于网络上 XML 文件的限制,我不能简单地从 Windows 资源管理器中批量打印它们,所以我需要先将它们转换为 .docx(或 .doc)。

我该怎么做呢?我使用 python-docx:

尝试了一个简单的 python 脚本
import os
from docx import Document
folderPath=<folderpath>
fileNamesList=os.listdir(folderPath)
for xmlFileName in fileNamesList:
    currentDoc=Document(os.path.join(folderPath,xmlFileName))
    docxFileName=xmlFileName.replace('.xml','.docx')
    currentDoc.save(os.path.join(folderPath,docxFileName))
    currentDoc.close()

这给出:

docx.opc.exceptions.PackageNotFoundError: Package not found at <first file name>.xml

我猜这是因为 python-docx 并不意味着打开 .xml 文件,但这是一个没有根据的猜测。搜索此错误,我所能找到的只是未正确安装(据我所知)或使用 .doc 文件而不是 .docx 的问题。

我只是错误地使用了 python-docx 吗?如果没有,是否有更合适的包或技术我应该使用?

不清楚那些 .xml 文件是什么类型的文件,但我怀疑它们是我认为在 Word 2003 中使用的过渡格式,它基于 XML,但不是自 Word 2007 起在 Word 文档中使用的开放打包约定 (OPC) 格式。

python-docx 不会读取这些内容,现在或永远,因此您需要将它们转换为 .docx 格式或直接解析 XML。

如果我有 Windows 可用,我想我会使用 VBA 编写一个简短的转换脚本,然后使用 python-pptx 处理 .docx 文件。我将从查看 Word 是否可以加载 .xml 文件并从那里开始。

您或许可以找到一个实用程序来进行批量转换,但我在快速搜索中没有找到任何实用程序。

如果您只对一次性打印感兴趣,并且 Word 将加载文件,那么没有转换步骤的 VBA 脚本可能是一个不错的选择。 python-docx 不打印 .docx 个文件,只读和写它们。