使用 php 将 pdf 转换为 word 文档
Convert pdf to word document using php
我正在尝试使用 php 中的 Libreoffice 将 pdf 转换为 doc,但无法正常工作。
path/to/soffice --infilter="writer_pdf_import" --convert-to doc file.pdf /path/to/test.docx
PS:是否有其他更好的解决方案来解析 pdf 并提取图像而不仅仅是文本,然后将其转换为文档表示形式。
嗯,你没有向我们展示错误,所以我不知道为什么你的命令不起作用。但是,该命令不是 Libreoffice's command. You are using a soffice 的命令:
这是一个使用 libreoffice 软件的示例:
path/to/libreoffice --headless --invisible --convert-to doc your_source_file.pdf
注:
此解决方案只转换文本而不转换图像。
备选方案 01:
如果LibreOffice doesn't work on your system, Abiword也以类似的方式工作。
- 通过在终端中键入以下命令安装 Abiword:
sudo apt-get install abiword
然后进行转换:
abiword --to=doc your_source_file.pdf
备选方案 02:
如果您想继续使用 soffice 的命令,可能您可以使用以下语法:
path/to/soffice --headless --convert-to <TargetFileExtension>:<NameOfFilter> your_source_file.pdf
在您的示例中,对 doc
个文件使用 "MS Word 2007 XML",或者对 docx
使用 "Microsoft Word 2007/2010/2013 XML" 和 "Microsoft Word 2007-2013 XML" 作为过滤器:
path/to/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" your_source_file.pdf
Here 您可以找到更多过滤器。
我正在尝试使用 php 中的 Libreoffice 将 pdf 转换为 doc,但无法正常工作。
path/to/soffice --infilter="writer_pdf_import" --convert-to doc file.pdf /path/to/test.docx
PS:是否有其他更好的解决方案来解析 pdf 并提取图像而不仅仅是文本,然后将其转换为文档表示形式。
嗯,你没有向我们展示错误,所以我不知道为什么你的命令不起作用。但是,该命令不是 Libreoffice's command. You are using a soffice 的命令:
这是一个使用 libreoffice 软件的示例:
path/to/libreoffice --headless --invisible --convert-to doc your_source_file.pdf
注:
此解决方案只转换文本而不转换图像。
备选方案 01:
如果LibreOffice doesn't work on your system, Abiword也以类似的方式工作。
- 通过在终端中键入以下命令安装 Abiword:
sudo apt-get install abiword
然后进行转换:
abiword --to=doc your_source_file.pdf
备选方案 02:
如果您想继续使用 soffice 的命令,可能您可以使用以下语法:
path/to/soffice --headless --convert-to <TargetFileExtension>:<NameOfFilter> your_source_file.pdf
在您的示例中,对 doc
个文件使用 "MS Word 2007 XML",或者对 docx
使用 "Microsoft Word 2007/2010/2013 XML" 和 "Microsoft Word 2007-2013 XML" 作为过滤器:
path/to/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" your_source_file.pdf
Here 您可以找到更多过滤器。