使用 java 逐行读取 pdf 文件
Read pdf file line by line using java
如何使用 java 逐行读取 pdf 文件,并将行写入 .txt 和 .doc 文件?
请提及程序所需的 .jar。
使用 PDFBox
try{
PDDocument document = null;
document = PDDocument.load(new File("test.pdf"));
document.getClass();
if( !document.isEncrypted() ){
PDFTextStripperByArea stripper = new PDFTextStripperByArea();
stripper.setSortByPosition( true );
PDFTextStripper Tstripper = new PDFTextStripper();
String st = Tstripper.getText(document);
System.out.println("Text:"+st);
}
}catch(Exception e){
e.printStackTrace();
}
您可以从here
下载
如何使用 java 逐行读取 pdf 文件,并将行写入 .txt 和 .doc 文件? 请提及程序所需的 .jar。
使用 PDFBox
try{
PDDocument document = null;
document = PDDocument.load(new File("test.pdf"));
document.getClass();
if( !document.isEncrypted() ){
PDFTextStripperByArea stripper = new PDFTextStripperByArea();
stripper.setSortByPosition( true );
PDFTextStripper Tstripper = new PDFTextStripper();
String st = Tstripper.getText(document);
System.out.println("Text:"+st);
}
}catch(Exception e){
e.printStackTrace();
}
您可以从here
下载