第一个 URL Google 搜索结果
Grab first URL off a Google search result
我正在尝试使用以下公式从 Google 搜索结果中检索第一个 URL,但我得到的错误是 Imported content is empty.
:
=IMPORTXML("https://www.google.com/search?q=cnn&num=1", "//cite")
看起来结果 URL 包含在结果页面的 cite
标记中,但公式没有按预期工作。我预计这个公式会 return https://www.cnn.com
。 //h3
的公式与 XPath 的公式相同 return 标题。
知道我做错了什么吗?
问题:
cite
标签是通过脚本动态生成的,因此 IMPORTXML
.
等公式无法访问它
如果您 disable JavaScript 并刷新页面,您会发现情况就是如此。您将不会再看到该元素。
解决方法:
URL 也可以在 div
中使用,它是包含标题的 h3
元素的同级元素。此元素未通过脚本动态注入,因此可以通过 IMPORTXML
访问。改为检索:
=IMPORTXML("https://www.google.com/search?q=cnn&num=1", "//h3/following-sibling::div")
相关:
我正在尝试使用以下公式从 Google 搜索结果中检索第一个 URL,但我得到的错误是 Imported content is empty.
:
=IMPORTXML("https://www.google.com/search?q=cnn&num=1", "//cite")
看起来结果 URL 包含在结果页面的 cite
标记中,但公式没有按预期工作。我预计这个公式会 return https://www.cnn.com
。 //h3
的公式与 XPath 的公式相同 return 标题。
知道我做错了什么吗?
问题:
cite
标签是通过脚本动态生成的,因此 IMPORTXML
.
如果您 disable JavaScript 并刷新页面,您会发现情况就是如此。您将不会再看到该元素。
解决方法:
URL 也可以在 div
中使用,它是包含标题的 h3
元素的同级元素。此元素未通过脚本动态注入,因此可以通过 IMPORTXML
访问。改为检索:
=IMPORTXML("https://www.google.com/search?q=cnn&num=1", "//h3/following-sibling::div")