在 Google 动态 XML 路径中导入 XML 函数

Question

我正在尝试从该页面的 "New + Updated" 部分导入标题和着陆页 URL：
https://www.nytimes.com/wirecutter/

问题是 class "_988f698c" 不断变化，因为标题被新的 headline/topic.

我需要一种解决方法来使用 IMPORTXML 函数，该函数将动态捕获该位置的 object 的 class。当前公式为：

=IMPORTXML(https://www.nytimes.com/wirecutter/,"//*[@class='_988f698c']")

这里是 html 标签的例子。 class "_988f698c" 每隔一小时左右刷新一次新标题。

<li class="e9a6bea7">
    <a class="_988f698c" href="https://www.nytimes.com/wirecutter/reviews/gir-spatula-review/">Why We Love GIR Spatulas</a> 
    <p class="_9d1f22a9">today
    </p>
</li>

我有办法做到这一点吗？

Answer 1

回来一点，寻找替代路径，而不是强制使用随机数。

对于标题，使用：

=IMPORTXML(
           "https://www.nytimes.com/wirecutter/",
           "//ul[@data-testid='new-and-updated']/li/a"
          )

对于 URL 附加到标题：

=IMPORTXML(
           "https://www.nytimes.com/wirecutter/",
           "//ul[@data-testid='new-and-updated']/li/a/@href"
          )

对于表示发布日期的文字：

=IMPORTXML(
           "https://www.nytimes.com/wirecutter/",
           "//ul[@data-testid='new-and-updated']/li/p"
          )

如果你想把所有东西都收集起来，用|分割路径：

=IMPORTXML(
           "https://www.nytimes.com/wirecutter/",
           "//ul[@data-testid='new-and-updated']/li/a | 
            //ul[@data-testid='new-and-updated']/li/a/@href | 
            //ul[@data-testid='new-and-updated']/li/p"
          )

仅在您绝对确定这些值将始终存在时才使用它，因为如果它们不存在，则如果您定义 sheet 行中的位置就会出现问题取决于每个单元格中固定值的公式。

在 Google 动态 XML 路径中导入 XML 函数

ImportXML function in Google Dynamic XML path

google-sheets-formula