特定单词后的pdf字数

pdf word count after specific word

我有多个 pdf-files,我需要计算文本中出现特定标题或单词后的单词数。例如,给定的标题出现在 2 页文档中第二页的顶部,则只计算第 2 页上的单词。您知道现有的字数统计程序是否已经包含这样的功能吗?

非常感谢您的帮助

克里斯

如果您正在寻找命令行自动化,那么

  1. 您需要先使用 pdftotext:

    将 PDF 转换为文本文件

    $ pdftotext transcript.pdf

  2. 然后使用[wc][2]实用程序来统计字数:

    $ wc -w transcript.txt