PHP - 检查 pdf 是否包含给定文本 - TcpdfFpdi / pdftk / fpdi

PHP - Check if pdf contains given text - TcpdfFpdi / pdftk / fpdi

我有一个 pdf 文档,我想检查文档中是否出现特定文本(这是我在生成 pdf 时放入的标签),但是使用这些库(tcpdfFpdi、pdftk 或 fdpi)我不能不知道这是否可能或如何去做。

$str = "{hello}";

$pdf = new TcpdfFpdi();
$pdf->setSourceFile($filePath);

$pdf->searchForText($str); // something like this which returns boolean

如果我尝试不使用任何库 dd(file_get_contents($filePath)),它 returns 一个很长的输出并且似乎不包含我想要的文件所以我认为最好使用其中一个库.

只是一个想法……

这不是真正的 PHP 解决方案,但您可以使用像 pdftotext 这样的工具,我从这个 post 中了解到(PDF 文件被转换成字符串以计算其字数) : https://superuser.com/a/221367/535203

您可以安装它并尝试使用该命令并从您的 PHP 应用程序中调用它。

据我所知(自从我使用 pdftotext 以来很久以前)输出的文本并不完全是 PDF 的内容,但在其中搜索一些标签至少是一个很好的尝试。