我需要使用 python 将 .doc 和 .docx 文件转换为 .pdf
I need to convert .doc and .docx files to .pdf using python
我需要使用 python 将 .doc 和 .docx 文件转换为 .pdf。 我看到了一些已经可用的答案,但它们使用的是 comtypes 并打开 WordApplication。我做不到。
我寻求的是一种使用一些 python 库来实现它的方法,这些库保留字体、表格、标题大小和图像等,无需打开 MS Word 或 LibreOffice 或类似的东西
如果需要,将 .doc 和 .docx 文件转换为某种中间格式(然后将该格式转换为 pdf)也可以。请帮助我提供代码或指导说明(我不是 python 的专业人士)我应该遵循。
我之前也遇到过类似的问题,
我的建议:
抱歉,没有这样直接的 python 库来专门处理 Microsoft office 格式 (.doc)
所以尝试在 Ubuntu 它的 "libreoffice" 中使用 LibreOffice 作为服务
如果 windows 它的 "soffice.exe" 在命令行中使用它来将文档转换为 .PDF 而无需打开 LibreOffice
而且它简单快捷,而且几乎可以完美转换文件。
样本:
对于Windows:
C:\Program Files (x86)\LibreOffice 4\program\soffice.exe" --headless --convert-to pdf "input_file_path" --outdir "output_dir_path"
这将在给定的输出目录中将输入文件转换为 pdf,而无需打开 LibreOffice 并仅将其用作服务。
对于 运行 来自 python 的命令,您可以像库一样使用 "subprocess"。
我需要使用 python 将 .doc 和 .docx 文件转换为 .pdf。 我看到了一些已经可用的答案,但它们使用的是 comtypes 并打开 WordApplication。我做不到。 我寻求的是一种使用一些 python 库来实现它的方法,这些库保留字体、表格、标题大小和图像等,无需打开 MS Word 或 LibreOffice 或类似的东西 如果需要,将 .doc 和 .docx 文件转换为某种中间格式(然后将该格式转换为 pdf)也可以。请帮助我提供代码或指导说明(我不是 python 的专业人士)我应该遵循。
我之前也遇到过类似的问题,
我的建议:
抱歉,没有这样直接的 python 库来专门处理 Microsoft office 格式 (.doc)
所以尝试在 Ubuntu 它的 "libreoffice" 中使用 LibreOffice 作为服务 如果 windows 它的 "soffice.exe" 在命令行中使用它来将文档转换为 .PDF 而无需打开 LibreOffice
而且它简单快捷,而且几乎可以完美转换文件。
样本:
对于Windows:
C:\Program Files (x86)\LibreOffice 4\program\soffice.exe" --headless --convert-to pdf "input_file_path" --outdir "output_dir_path"
这将在给定的输出目录中将输入文件转换为 pdf,而无需打开 LibreOffice 并仅将其用作服务。
对于 运行 来自 python 的命令,您可以像库一样使用 "subprocess"。