使用 playwright 下载 pdf 文件-python

Downloading pdf files using playwright-python

我正在尝试使用 playwright (Python) 下载在浏览器中呈现的 PDF 文件(未显示为弹出窗口或已下载)。没有 URL 暴露,因此您不能简单地抓取 link 并使用 requests.get("file_url").

下载它

我试过:

async def main():
    async with async_playwright() as p:
        browser = await p.chromium.launch(headless=False)
        page = await browser.newPage(acceptDownloads=True)
    
        await page.goto("www.some_landing_page.com")
            
        async with page.expect_download() as download_info:
            await page.click("a")     # selector to a pdf file
        
        download = download_info.value
        path = download.path()

我也试过 page.expect_popup() 也没有成功。我的理解是,这不能使用 pyppeteer 来完成,但如果可能的话,也欢迎以这种方式解决。

对于有类似问题的任何人,请尝试使用 firefox 或 webkit 代替浏览器的 chromium。为我提供了解决方法。