从 pdf 中提取当前页面的文本（使用 MuPDF）

Question

我已经编写了从 pdf 中提取文本的代码，并且工作正常。问题是即使我在不同的页面上，也只有第一页的文本被提取。

这是我正在使用的代码 -

public void extracttext()
{
TextWord[][] textWord = core.textLines(mDocView.getDisplayedViewIndex());
 int z, j;

for (z = 0; z < textWord.length; z++) {
    for (j = 0; j < textWord[z].length; j++) {
        word = word + textWord[z][j].w + " ";
    }
  }
}

我犯了什么错误？

Answer 1

好吧，我犯了一个非常愚蠢的错误。我忘了将 word 重新初始化为 "" 。所以，提取的文本是在已经提取的文本之后添加的，我曾经认为文本只是从第一页提取的。

从 pdf 中提取当前页面的文本（使用 MuPDF）

Extract text of the current page from a pdf (using MuPDF)

android

text-extraction

current-page

mupdf