PDF 到文本(多页)

PDF to text (multiple pages)

如何从多页PDF中提取文本?我需要将每个页面作为单独的文本字符串

第 1 页为一个字符串,第 2 页为另一个字符串等

是否可以使用 pdftotext 或任何其他工具?

我需要一个Linux命令行工具

最简单的方法是使用已经命名的 pdftotext 工具,可以通过 运行ning sudo apt-get install poppler-utils 安装。之后你可以简单地 运行 pdftotext /link/to/input.pdf /link/to/output.txt.