使用 php 将 pdf 转换为 word 文档

Convert pdf to word document using php

我正在尝试使用 php 中的 Libreoffice 将 pdf 转换为 doc,但无法正常工作。

path/to/soffice --infilter="writer_pdf_import" --convert-to doc file.pdf /path/to/test.docx

PS:是否有其他更好的解决方案来解析 pdf 并提取图像而不仅仅是文本,然后将其转换为文档表示形式。

嗯,你没有向我们展示错误,所以我不知道为什么你的命令不起作用。但是,该命令不是 Libreoffice's command. You are using a soffice 的命令:

这是一个使用 libreoffice 软件的示例:

path/to/libreoffice --headless --invisible --convert-to doc your_source_file.pdf

注:

此解决方案只转换文本而不转换图像。

备选方案 01:

如果LibreOffice doesn't work on your system, Abiword也以类似的方式工作。

  1. 通过在终端中键入以下命令安装 Abiword
sudo apt-get install abiword

然后进行转换:

abiword --to=doc your_source_file.pdf

备选方案 02:

如果您想继续使用 soffice 的命令,可能您可以使用以下语法:

path/to/soffice --headless --convert-to <TargetFileExtension>:<NameOfFilter> your_source_file.pdf

在您的示例中,对 doc 个文件使用 "MS Word 2007 XML",或者对 docx 使用 "Microsoft Word 2007/2010/2013 XML" 和 "Microsoft Word 2007-2013 XML" 作为过滤器:

path/to/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" your_source_file.pdf

Here 您可以找到更多过滤器。