使用 PDF 框阅读 PDF - 澄清页数

Question

使用 PDFbox 从 url 读取 pdf 文件，下面的 jave 代码非常适合读取 pdf 并存储在项目位置。

String pdfPageCount = 17;
String pdfUrl = "abc.org/invoicepdf.pdf?Range=1";
URL pdfDownload = new URL(pdfUrl);
connectionGet = (HttpsURLConnection) pdfDownload.openConnection();
String authorizationHeader1 = "Bearer " + getToken;
connectionGet.setRequestProperty("Authorization", authorizationHeader1);
connectionGet.setRequestProperty("Content-Type", "application/x-www-form-urlencoded");
connectionGet.setRequestMethod("GET");
int responseCode = connectionGet.getResponseCode();
    if (responseCode != 404) {
        PDDocument pd = new PDDocument();
        InputStream inputstreamFinal1 = connectionGet.getInputStream();
        PDDocument load = PDDocument.load(inputstreamFinal1);                        
        load.save("CopyOfInvoice1.pdf");
    }

我的下一步

我想根据 pdfPageCount 值循环处理，目前我在 pdfUrl (/invoicepdf.pdf?Range=1)

中将页数硬编码为 1

预计：

阅读所有 17 页并保存到一个 pdf 文件中

Answer 1

这是一些代码，基于评论中提到的 PDFMergerExample。请注意，我还没有检查您的 URL 检索代码是否正确。

List<InputStream> sources = new ArrayList<InputStream>();
int pdfPageCount = 17;
try
{
    for (int p = 1; p <= pdfPageCount; ++p)
    {
        String pdfUrl = "abc.org/invoicepdf.pdf?Range=" + p;
        URL pdfDownload = new URL(pdfUrl);
        HttpsURLConnection connectionGet = (HttpsURLConnection) pdfDownload.openConnection();
        String authorizationHeader1 = "Bearer " + getToken;
        connectionGet.setRequestProperty("Authorization", authorizationHeader1);
        connectionGet.setRequestProperty("Content-Type", "application/x-www-form-urlencoded");
        connectionGet.setRequestMethod("GET");
        int responseCode = connectionGet.getResponseCode();
        if (responseCode != 404)
        {
            sources.add(connectionGet.getInputStream());
        }
        else
        {
            //TODO error handling
            return;
        }
    }
    PDFMergerUtility pdfMerger = new PDFMergerUtility();
    pdfMerger.addSources(sources);
    pdfMerger.setDestinationFileName("CopyOfInvoice1.pdf");
    pdfMerger.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());
}
catch (IOException e)
{
     //TODO error handling
     return;
}
finally
{
    // cleanup
    for (InputStream source : sources)
    {
        IOUtils.closeQuietly(source);
    }   
}

使用 PDF 框阅读 PDF - 澄清页数

PDF Reading using PDF box - Clarification with page count

java

pdf-reader

pdfbox