如何从 pdf 文件中的 table 获取文本？

how can get text from table in pdf file?

我想从 table 获取 PDF 文件中的文本？

我无法在 table 中获取单元格。我尝试使用 Leadtools 的运行示例，但它无法自动检测单元格。

https://www.leadtools.com/help/leadtools/v20/dh/fo/iocrtablezonemanager.html

你能给我点建议吗？谢谢大家

在与您发布的图像相似的 table 中，您应该能够使用 IOcrPage.TableZoneManager.AutoDetectCells() 方法找到单元格。当前版本的 LEADTOOLS 附带的 OcrMultiEngineDemo 项目中使用了此方法。

测试方法如下：

如果这没有给您带来预期的结果，请将您正在测试的实际文件发送至支持@leadtools.com，并解释您的测试方式。