如何自动打开和下载网页?

How do I automate opening and downloading a webpage?

有一个网站在加载时有一个 HTML <video> 元素,但是如果我用 wget 下载它,这个元素不存在,所以我猜当在浏览器中打开页面时,它由仅 运行 的脚本加载。我需要视频的直接 link,以自动方式。

能否请您告诉我我的想法是否正确,是否有可能的解决方案?例如,我可以从命令行 运行 一个浏览器,让它加载页面和所有引用的内容,然后保存 .html 文件吗?

您可以为此使用 headless Chrome, potentially with Puppeteer 脚本。

不过,根据详细信息,可能会有更简单的选项来满足您的需求。听起来您目前正在尝试使用 wget 抓取第三方网站。除了使用 wget 请求 .html 内容之外,您还可以请求相关的 javascript 文件,然后从那里提取视频 url。