搜索文本 PDF - 双重结果

Search for Text a PDF - double results

我对附件中的 PDF 文件中的搜索文本有疑问: pdf shared link google drive。 如果我搜索文本示例“1500”,我看到 4 次出现,但在第 2 页中只有 2 次出现......如果我搜索文本 "musei" 找到 2 次出现,则相同,但该文本仅在第 1 页中出现.

研究分析单个页面并在每个页面中找到所有文档文本,因为我有双重结果。

谁能解释为什么会这样? 这个以特定方式生成的 PDF 文件是否尊重其他可以搜索文本的地方?

非常感谢

那个PDF确实很特别,每一页都包含两页的文字。在第一页上,第二页的文本位于右页边框的右侧,而在第二页上,第一页的文本位于左页边框的左侧。此外,其他页面的内容也在剪辑区域之外。

我把第一页的页面框(媒体框,裁剪框,...)向右放大,第二页向左放大,然后标记所有文本(Ctrl- A) 甚至显示剪辑区域之外的文本,您会看到:

对于只提取可见区域文本的文本提取,您应该将文本提取例程限制在相应页面的裁剪框中。