使用 Python 从网站提取链接,不在 HTML
Extracting links from website using Python, NOT IN HTML
我需要从此页面收集 PDF 文件:http://www.anp.gov.br/?id=532。
当我在 HTML 源代码中找不到链接时,我想知道在 Python 中这怎么可能。在我使用 Beautifulsoup 和 pandas 找到此类文件的链接之前。
感谢您的各种回答!
看起来所有的 pdf 链接都在 <a>
标签中,因此您可以使用 BeautifulSoup 来获取这些链接。如果您需要进一步的建议,我建议您参考 this 讨论以了解如何完成该任务。
我需要从此页面收集 PDF 文件:http://www.anp.gov.br/?id=532。
当我在 HTML 源代码中找不到链接时,我想知道在 Python 中这怎么可能。在我使用 Beautifulsoup 和 pandas 找到此类文件的链接之前。
感谢您的各种回答!
看起来所有的 pdf 链接都在 <a>
标签中,因此您可以使用 BeautifulSoup 来获取这些链接。如果您需要进一步的建议,我建议您参考 this 讨论以了解如何完成该任务。