使用 playwright 下载 pdf 文件-python
Downloading pdf files using playwright-python
我正在尝试使用 playwright
(Python) 下载在浏览器中呈现的 PDF 文件(未显示为弹出窗口或已下载)。没有 URL 暴露,因此您不能简单地抓取 link 并使用 requests.get("file_url")
.
下载它
我试过:
async def main():
async with async_playwright() as p:
browser = await p.chromium.launch(headless=False)
page = await browser.newPage(acceptDownloads=True)
await page.goto("www.some_landing_page.com")
async with page.expect_download() as download_info:
await page.click("a") # selector to a pdf file
download = download_info.value
path = download.path()
我也试过 page.expect_popup()
也没有成功。我的理解是,这不能使用 pyppeteer
来完成,但如果可能的话,也欢迎以这种方式解决。
对于有类似问题的任何人,请尝试使用 firefox 或 webkit 代替浏览器的 chromium。为我提供了解决方法。
我正在尝试使用 playwright
(Python) 下载在浏览器中呈现的 PDF 文件(未显示为弹出窗口或已下载)。没有 URL 暴露,因此您不能简单地抓取 link 并使用 requests.get("file_url")
.
我试过:
async def main():
async with async_playwright() as p:
browser = await p.chromium.launch(headless=False)
page = await browser.newPage(acceptDownloads=True)
await page.goto("www.some_landing_page.com")
async with page.expect_download() as download_info:
await page.click("a") # selector to a pdf file
download = download_info.value
path = download.path()
我也试过 page.expect_popup()
也没有成功。我的理解是,这不能使用 pyppeteer
来完成,但如果可能的话,也欢迎以这种方式解决。
对于有类似问题的任何人,请尝试使用 firefox 或 webkit 代替浏览器的 chromium。为我提供了解决方法。