使用 Python 抓取 vs Google 趋势 API
Scraping vs Google Trends API using Python
我正尝试在 Google 趋势上按类别收集过去一年每个趋势的前五个搜索查询。
我不知道我是否应该使用 python 库(例如 pytrends
)来执行此操作,从他们的文档中,它们需要关键字才能查询 GT,或者我不需要有任何特定的关键字,我想获取可以找到的每个类别的术语的任何搜索查询。
使用 scraping 库 Selenium
或 Beautifulsoup4
直接从 GT website.
收集此信息
这样做的目的是为了以后能够为每个查询检索前 5 个网站...
我该往哪个方向走?
最好使用非官方 API 之一。
这些链接到 Google 内部 API,后者通过结构化信息为趋势 UI 提供动力。但是抓取只会 return 大部分是非结构化的 HTML,您需要自己提取结构化数据。此信息将不那么可靠或完整。
这是通过用于 "machine to machine" 交流的 API 与用于 "machine to human" 交互的网络 UI 交谈之间的区别。
我正尝试在 Google 趋势上按类别收集过去一年每个趋势的前五个搜索查询。
我不知道我是否应该使用 python 库(例如 pytrends
)来执行此操作,从他们的文档中,它们需要关键字才能查询 GT,或者我不需要有任何特定的关键字,我想获取可以找到的每个类别的术语的任何搜索查询。
使用 scraping 库 Selenium
或 Beautifulsoup4
直接从 GT website.
这样做的目的是为了以后能够为每个查询检索前 5 个网站...
我该往哪个方向走?
最好使用非官方 API 之一。
这些链接到 Google 内部 API,后者通过结构化信息为趋势 UI 提供动力。但是抓取只会 return 大部分是非结构化的 HTML,您需要自己提取结构化数据。此信息将不那么可靠或完整。
这是通过用于 "machine to machine" 交流的 API 与用于 "machine to human" 交互的网络 UI 交谈之间的区别。