"IOException: COSStream has been closed and cannot be read" 在使用 PdfBox 添加页面后尝试保存 PDF 时
"IOException: COSStream has been closed and cannot be read" when trying to save PDF after adding page with PdfBox
我在运行这段代码时遇到了一些问题。目标是将 pdf 与 PDDocument 对象中加载的 pdf 合并。我不想使用 PdfBox 的 mergeUtility 因为它意味着关闭 PDDocument 对象。我有很多数据要处理,我使用循环来处理它。加载和关闭 PDDocument 将花费太多时间和资源(也许我错了,但感觉就是这样)。
这是我的方法:
for (String path:pathList) {
/* ... */
if(path.endsWith("pdf")){
File pdfToMerge = new File(path);
try(PDDocument pdfToMergeDocument = PDDocument.load(pdfToMerge)){
for (int pageIndex = 0; pageIndex < pdfToMergeDocument.getNumberOfPages(); pageIndex++){
PDPage page = pdfToMergeDocument.getPage(pageIndex);
doc.addPage(page);
}
}catch (IOException e){
System.out.println("Pdf : " + path + ANSI_RED + " [FAILED]" + ANSI_RESET);
continue;
}finally {
System.out.println("Pdf : " + path + ANSI_GREEN +" [OK]" + ANSI_RESET);
}
}
}
doc.save("src/Kairos/OutPut/"+pdfName[pdfName.length - 1]+".pdf");
doc.close();
当我尝试保存文档时发生错误,第 65 行。
我收到此错误消息:
Exception in thread "main" java.io.IOException: COSStream has been closed and cannot be read. Perhaps its enclosing PDDocument has been closed?
at org.apache.pdfbox.cos.COSStream.checkClosed(COSStream.java:83)
at org.apache.pdfbox.cos.COSStream.createRawInputStream(COSStream.java:133)
at org.apache.pdfbox.pdfwriter.COSWriter.visitFromStream(COSWriter.java:1214)
at org.apache.pdfbox.cos.COSStream.accept(COSStream.java:402)
at org.apache.pdfbox.cos.COSObject.accept(COSObject.java:158)
at org.apache.pdfbox.pdfwriter.COSWriter.doWriteObject(COSWriter.java:521)
at org.apache.pdfbox.pdfwriter.COSWriter.doWriteObjects(COSWriter.java:459)
at org.apache.pdfbox.pdfwriter.COSWriter.doWriteBody(COSWriter.java:443)
at org.apache.pdfbox.pdfwriter.COSWriter.visitFromDocument(COSWriter.java:1108)
at org.apache.pdfbox.cos.COSDocument.accept(COSDocument.java:449)
at org.apache.pdfbox.pdfwriter.COSWriter.write(COSWriter.java:1381)
at org.apache.pdfbox.pdfwriter.COSWriter.write(COSWriter.java:1268)
at org.apache.pdfbox.pdmodel.PDDocument.save(PDDocument.java:1334)
at org.apache.pdfbox.pdmodel.PDDocument.save(PDDocument.java:1305)
at org.apache.pdfbox.pdmodel.PDDocument.save(PDDocument.java:1293)
at Kairos.Main.main(Main.java:65)
考虑一下:您在 pathList
中有一个 String
的列表,然后遍历它。
在第一个循环结束时,您保存 doc
并关闭它。
然后你再次循环并尝试保存doc
。您在上一次迭代中关闭了它。
如果你的objective是要把pathList
里面所有pdf的内容放到doc
指向的pdf里面,你就得在外面关闭 循环,在你遍历所有 pathList
.
之后
编辑:
正如 Tilman Hausherr 所指出的,还有另一个问题。当您调用 addPage
时,您并不是在复制原始页面,而是或多或少地链接到它。由于您使用的是 try-with-resources 构造,原始文件在 try-catch
构造结束时关闭,这意味着,一旦退出构造,您将失去对原始页面的任何引用。所以你必须在退出 try-catch
之前保存 before 或者你使用 importPage
来代替,这会制作一个副本(然后无论如何都会调用 addPage
)。所以
PDPage page = pdfToMergeDocument.getPage(pageIndex);
doc.importPage(page);
编辑 2:
当然,这个答案现在是错误的,因为 OP 在原始问题中发布了错误的代码 :) 我会把它留在这里,以备不时之需。
我在运行这段代码时遇到了一些问题。目标是将 pdf 与 PDDocument 对象中加载的 pdf 合并。我不想使用 PdfBox 的 mergeUtility 因为它意味着关闭 PDDocument 对象。我有很多数据要处理,我使用循环来处理它。加载和关闭 PDDocument 将花费太多时间和资源(也许我错了,但感觉就是这样)。
这是我的方法:
for (String path:pathList) {
/* ... */
if(path.endsWith("pdf")){
File pdfToMerge = new File(path);
try(PDDocument pdfToMergeDocument = PDDocument.load(pdfToMerge)){
for (int pageIndex = 0; pageIndex < pdfToMergeDocument.getNumberOfPages(); pageIndex++){
PDPage page = pdfToMergeDocument.getPage(pageIndex);
doc.addPage(page);
}
}catch (IOException e){
System.out.println("Pdf : " + path + ANSI_RED + " [FAILED]" + ANSI_RESET);
continue;
}finally {
System.out.println("Pdf : " + path + ANSI_GREEN +" [OK]" + ANSI_RESET);
}
}
}
doc.save("src/Kairos/OutPut/"+pdfName[pdfName.length - 1]+".pdf");
doc.close();
当我尝试保存文档时发生错误,第 65 行。
我收到此错误消息:
Exception in thread "main" java.io.IOException: COSStream has been closed and cannot be read. Perhaps its enclosing PDDocument has been closed?
at org.apache.pdfbox.cos.COSStream.checkClosed(COSStream.java:83)
at org.apache.pdfbox.cos.COSStream.createRawInputStream(COSStream.java:133)
at org.apache.pdfbox.pdfwriter.COSWriter.visitFromStream(COSWriter.java:1214)
at org.apache.pdfbox.cos.COSStream.accept(COSStream.java:402)
at org.apache.pdfbox.cos.COSObject.accept(COSObject.java:158)
at org.apache.pdfbox.pdfwriter.COSWriter.doWriteObject(COSWriter.java:521)
at org.apache.pdfbox.pdfwriter.COSWriter.doWriteObjects(COSWriter.java:459)
at org.apache.pdfbox.pdfwriter.COSWriter.doWriteBody(COSWriter.java:443)
at org.apache.pdfbox.pdfwriter.COSWriter.visitFromDocument(COSWriter.java:1108)
at org.apache.pdfbox.cos.COSDocument.accept(COSDocument.java:449)
at org.apache.pdfbox.pdfwriter.COSWriter.write(COSWriter.java:1381)
at org.apache.pdfbox.pdfwriter.COSWriter.write(COSWriter.java:1268)
at org.apache.pdfbox.pdmodel.PDDocument.save(PDDocument.java:1334)
at org.apache.pdfbox.pdmodel.PDDocument.save(PDDocument.java:1305)
at org.apache.pdfbox.pdmodel.PDDocument.save(PDDocument.java:1293)
at Kairos.Main.main(Main.java:65)
考虑一下:您在 pathList
中有一个 String
的列表,然后遍历它。
在第一个循环结束时,您保存 doc
并关闭它。
然后你再次循环并尝试保存doc
。您在上一次迭代中关闭了它。
如果你的objective是要把pathList
里面所有pdf的内容放到doc
指向的pdf里面,你就得在外面关闭 循环,在你遍历所有 pathList
.
编辑:
正如 Tilman Hausherr 所指出的,还有另一个问题。当您调用 addPage
时,您并不是在复制原始页面,而是或多或少地链接到它。由于您使用的是 try-with-resources 构造,原始文件在 try-catch
构造结束时关闭,这意味着,一旦退出构造,您将失去对原始页面的任何引用。所以你必须在退出 try-catch
之前保存 before 或者你使用 importPage
来代替,这会制作一个副本(然后无论如何都会调用 addPage
)。所以
PDPage page = pdfToMergeDocument.getPage(pageIndex);
doc.importPage(page);
编辑 2:
当然,这个答案现在是错误的,因为 OP 在原始问题中发布了错误的代码 :) 我会把它留在这里,以备不时之需。