将网页中的数据提取到 excel

Pulling data from a web page into excel

假设一个像 https://www.wood-database.com/wood-finder/ 这样的站点(我们的工作示例)。它的每一页都有一个木材种类的数据。假设我们需要根据数据的比率对森林进行排序,例如 hardness/weight,该站点的工具不是很有用。

不过, 有用的是将该数据传递到 excel,它可以轻松计算比率和排序。

有什么方法可以自动填写sheet?除了 excel 还有什么其他工具可以做到这一点?

您应该看看 python,它非常适合这份工作。您可以首先将请求库与 beatifulsoup 一起使用,然后将所有数据加载到 Pandas Dataframe 中,然后将其导出到 excel(Pandas 的标准功能)。

如果你真的想彻底抓取网站,可以考虑使用Scrapy(https://scrapy.org/)