PDF 到文本(多页)
PDF to text (multiple pages)
如何从多页PDF中提取文本?我需要将每个页面作为单独的文本字符串
第 1 页为一个字符串,第 2 页为另一个字符串等
是否可以使用 pdftotext
或任何其他工具?
我需要一个Linux命令行工具
最简单的方法是使用已经命名的 pdftotext
工具,可以通过 运行ning sudo apt-get install poppler-utils
安装。之后你可以简单地 运行 pdftotext /link/to/input.pdf /link/to/output.txt
.
如何从多页PDF中提取文本?我需要将每个页面作为单独的文本字符串
第 1 页为一个字符串,第 2 页为另一个字符串等
是否可以使用 pdftotext
或任何其他工具?
我需要一个Linux命令行工具
最简单的方法是使用已经命名的 pdftotext
工具,可以通过 运行ning sudo apt-get install poppler-utils
安装。之后你可以简单地 运行 pdftotext /link/to/input.pdf /link/to/output.txt
.