如何使用 php 从 pdf、docx、doc 获取 html 代码

how to get html code from pdf,docx,doc using php

我想使用 php 将任何 pdf、docx、doc 文件转换为 html 代码。与pdf中的样式相同。我没有得到正确的解决方案。

                            Config::set('pdftohtml.bin', 'C:/poppler-0.37/bin/pdftohtml.exe');

                            // change pdfinfo bin location
                            Config::set('pdfinfo.bin', 'C:/poppler-0.37/bin/pdfinfo.exe');
                            // initiate
                            $pdf = new Gufy\PdfToHtml\Pdf($item);

                            // convert to html and return it as [Dom Object](https://github.com/paquettg/php-html-parser)
                            $html = $pdf->html();

不适合我。

我遇到了一个 Web 服务,它提供了一个 API 用于转换文档。我还没有对它进行非常彻底的测试,但它似乎在将 Word 转换为 HTML 时产生了不错的结果:

https://cloudconvert.org/

我认为 this post 可以在第一时间帮助到您。有了这个,您将能够使用 PHP.

将任何 pdf 转换为 HTML 代码

在此之后,您可以使用this post提供的帮助来转换.doc .docx 到 PDF 使用 PHP.

我认为您现在可以为每个要转换为 HTML 的文档扩展名构建一个函数。

祝你好运。

我遇到了类似的问题,我发现了一个与 word 文档一起使用的 github。当时它工作得相当好,但我最近没有测试过它。试试吧。

https://github.com/benbalter/Convert-Word-Documents-to-HTML