是否可以自动从网站上抓取文章 - Python & Beautiful Soup
Is it possible to automatically scrape articles from websites - Python & Beautiful Soup
试图制作一个脚本来从不同的网站抓取一两篇文章(仅限文章 URL),我能够制作一个 Python 脚本,该脚本使用 BeautifulSoup 来获取网站的 HTML,通过 Class 名称找到网站的 Navbar 菜单,并遍历每个网站部分,问题是每个网站的 Navbar 菜单及其部分都有不同的 Class 名称或 Xpath。 .
有没有办法让脚本在尽可能少的人为干预的情况下适用于多个网站?
欢迎提出任何建议,
谢谢
是吗,我只需要使用 Python 和 Selenium,每个网站的导航栏元素的 Xpath 和不同网站页面上所有类型文章的另一个 Xpath,将所有内容保存在数据库中其余的只是根据我们的特定需求定制的,最终并没有那么复杂,感谢您的帮助<3
试图制作一个脚本来从不同的网站抓取一两篇文章(仅限文章 URL),我能够制作一个 Python 脚本,该脚本使用 BeautifulSoup 来获取网站的 HTML,通过 Class 名称找到网站的 Navbar 菜单,并遍历每个网站部分,问题是每个网站的 Navbar 菜单及其部分都有不同的 Class 名称或 Xpath。 .
有没有办法让脚本在尽可能少的人为干预的情况下适用于多个网站?
欢迎提出任何建议,
谢谢
是吗,我只需要使用 Python 和 Selenium,每个网站的导航栏元素的 Xpath 和不同网站页面上所有类型文章的另一个 Xpath,将所有内容保存在数据库中其余的只是根据我们的特定需求定制的,最终并没有那么复杂,感谢您的帮助<3