第一个 URL Google 搜索结果

Grab first URL off a Google search result

我正在尝试使用以下公式从 Google 搜索结果中检索第一个 URL,但我得到的错误是 Imported content is empty. :

=IMPORTXML("https://www.google.com/search?q=cnn&num=1", "//cite")

看起来结果 URL 包含在结果页面的 cite 标记中,但公式没有按预期工作。我预计这个公式会 return https://www.cnn.com//h3 的公式与 XPath 的公式相同 return 标题。

知道我做错了什么吗?

问题:

cite 标签是通过脚本动态生成的,因此 IMPORTXML.

等公式无法访问它

如果您 disable JavaScript 并刷新页面,您会发现情况就是如此。您将不会再看到该元素。

解决方法:

URL 也可以在 div 中使用,它是包含标题的 h3 元素的同级元素。此元素未通过脚本动态注入,因此可以通过 IMPORTXML 访问。改为检索:

=IMPORTXML("https://www.google.com/search?q=cnn&num=1", "//h3/following-sibling::div")

相关: