使用 Python 抓取 vs Google 趋势 API

Scraping vs Google Trends API using Python

我正尝试在 Google 趋势上按类别收集过去一年每个趋势的前五个搜索查询。

我不知道我是否应该使用 python 库（例如 pytrends）来执行此操作，从他们的文档中，它们需要关键字才能查询 GT，或者我不需要有任何特定的关键字，我想获取可以找到的每个类别的术语的任何搜索查询。

使用 scraping 库 Selenium 或 Beautifulsoup4 直接从 GT website.

收集此信息

这样做的目的是为了以后能够为每个查询检索前 5 个网站...

我该往哪个方向走？

最好使用非官方 API 之一。

这些链接到 Google 内部 API，后者通过结构化信息为趋势 UI 提供动力。但是抓取只会 return 大部分是非结构化的 HTML，您需要自己提取结构化数据。此信息将不那么可靠或完整。

这是通过用于 "machine to machine" 交流的 API 与用于 "machine to human" 交互的网络 UI 交谈之间的区别。