IMPORTHTML 或 IMPORTXML 从站点收集数据

IMPORTHTML or IMPORTXML to collect data from a site

我已多次尝试收集此 table 中的数据:

我评论的两个函数的简单方法,我都试过了,没成功。

如果有人知道在 Google 表格中收集此数据的任何其他方法,我想知道。

站点 Link:
https://www.onlinebettingacademy.com/stats/team/brazil/operrio-pr/13217#tab=t_squad

您要抓取的table受JavaScript控制,因此无法抓取。

从该站点到 Google 表格的所有内容是:

=ARRAY_CONSTRAIN(IMPORTDATA(
 "https://www.onlinebettingacademy.com/stats/team/brazil/operrio-pr/13217#tab=t_squad&team_id=13217"); 10000; 10)

因为您尝试抓取的页面是使用 Javascript 呈现的——即您要抓取的内容不在标记中,您将无法使用像 [=17= 这样的工具] 床单。

但是...您可以使用“无头浏览器”轻松抓取它。你几乎会使用一个浏览器(没有 UI),它会用 Javascript 渲染你的 URL,然后一旦页面被加载,你就可以使用 XPATH 等查询数据。

查看 Puppeteer 以获取可用于此任务的 JS 框架示例。