Java pdf 小丑 vs apache pdf 框

Java pdf clown vs apache pdf box

我搜索了一个免费的 Java 库来分析商业程序中的 pdf。

哪个库可以更好地通过计算不同的单词和检测标题来对 pdf 进行数据挖掘?

PDFBox 将成为一个很棒的 Java PDF 库。目前,最新版本还不稳定,提供了很好的解决方案。文档很可爱,所以如果你想做简单的事情,你不会浪费太多时间学习。