从 pdf 中提取当前页面的文本(使用 MuPDF)

Extract text of the current page from a pdf (using MuPDF)

我已经编写了从 pdf 中提取文本的代码,并且工作正常。问题是即使我在不​​同的页面上,也只有第一页的文本被提取。

这是我正在使用的代码 -

public void extracttext()
{
TextWord[][] textWord = core.textLines(mDocView.getDisplayedViewIndex());
 int z, j;

for (z = 0; z < textWord.length; z++) {
    for (j = 0; j < textWord[z].length; j++) {
        word = word + textWord[z][j].w + " ";
    }
  }
}

我犯了什么错误?

好吧,我犯了一个非常愚蠢的错误。我忘了将 word 重新初始化为 "" 。所以,提取的文本是在已经提取的文本之后添加的,我曾经认为文本只是从第一页提取的。