我需要使用 python 将 .doc 和 .docx 文件转换为 .pdf

I need to convert .doc and .docx files to .pdf using python

我需要使用 python 将 .doc 和 .docx 文件转换为 .pdf。 我看到了一些已经可用的答案,但它们使用的是 comtypes 并打开 WordApplication。我做不到。 我寻求的是一种使用一些 python 库来实现它的方法,这些库保留字体、表格、标题大小和图像等,无需打开 MS Word 或 LibreOffice 或类似的东西 如果需要,将 .doc 和 .docx 文件转换为某种中间格式(然后将该格式转换为 pdf)也可以。请帮助我提供代码或指导说明(我不是 python 的专业人士)我应该遵循。

我之前也遇到过类似的问题,

我的建议:

抱歉,没有这样直接的 python 库来专门处理 Microsoft office 格式 (.doc)

所以尝试在 Ubuntu 它的 "libreoffice" 中使用 LibreOffice 作为服务 如果 windows 它的 "soffice.exe" 在命令行中使用它来将文档转换为 .PDF 而无需打开 LibreOffice

而且它简单快捷,而且几乎可以完美转换文件。

样本:

对于Windows:

    C:\Program Files (x86)\LibreOffice 4\program\soffice.exe" --headless --convert-to pdf "input_file_path" --outdir "output_dir_path"

这将在给定的输出目录中将输入文件转换为 pdf,而无需打开 LibreOffice 并仅将其用作服务。

对于 运行 来自 python 的命令,您可以像库一样使用 "subprocess"。