使用 Python 从网站提取链接，不在 HTML

Extracting links from website using Python, NOT IN HTML

我需要从此页面收集 PDF 文件：http://www.anp.gov.br/?id=532。

当我在 HTML 源代码中找不到链接时，我想知道在 Python 中这怎么可能。在我使用 Beautifulsoup 和 pandas 找到此类文件的链接之前。

感谢您的各种回答！

看起来所有的 pdf 链接都在 <a> 标签中，因此您可以使用 BeautifulSoup 来获取这些链接。如果您需要进一步的建议，我建议您参考 this 讨论以了解如何完成该任务。