在 Google 动态 XML 路径中导入 XML 函数
ImportXML function in Google Dynamic XML path
我正在尝试从该页面的 "New + Updated"
部分导入标题和着陆页 URL:
https://www.nytimes.com/wirecutter/
问题是 class "_988f698c"
不断变化,因为标题被新的 headline/topic.
我需要一种解决方法来使用 IMPORTXML 函数,该函数将动态捕获该位置的 object 的 class。当前公式为:
=IMPORTXML(https://www.nytimes.com/wirecutter/,"//*[@class='_988f698c']")
这里是 html 标签的例子。 class "_988f698c"
每隔一小时左右刷新一次新标题。
<li class="e9a6bea7">
<a class="_988f698c" href="https://www.nytimes.com/wirecutter/reviews/gir-spatula-review/">Why We Love GIR Spatulas</a>
<p class="_9d1f22a9">today
</p>
</li>
我有办法做到这一点吗?
回来一点,寻找替代路径,而不是强制使用随机数。
对于标题,使用:
=IMPORTXML(
"https://www.nytimes.com/wirecutter/",
"//ul[@data-testid='new-and-updated']/li/a"
)
对于 URL 附加到标题:
=IMPORTXML(
"https://www.nytimes.com/wirecutter/",
"//ul[@data-testid='new-and-updated']/li/a/@href"
)
对于表示发布日期的文字:
=IMPORTXML(
"https://www.nytimes.com/wirecutter/",
"//ul[@data-testid='new-and-updated']/li/p"
)
如果你想把所有东西都收集起来,用|
分割路径:
=IMPORTXML(
"https://www.nytimes.com/wirecutter/",
"//ul[@data-testid='new-and-updated']/li/a |
//ul[@data-testid='new-and-updated']/li/a/@href |
//ul[@data-testid='new-and-updated']/li/p"
)
仅在您绝对确定这些值将始终存在时才使用它,因为如果它们不存在,则如果您定义 sheet 行中的位置就会出现问题取决于每个单元格中固定值的公式。
我正在尝试从该页面的 "New + Updated"
部分导入标题和着陆页 URL:
https://www.nytimes.com/wirecutter/
问题是 class "_988f698c"
不断变化,因为标题被新的 headline/topic.
我需要一种解决方法来使用 IMPORTXML 函数,该函数将动态捕获该位置的 object 的 class。当前公式为:
=IMPORTXML(https://www.nytimes.com/wirecutter/,"//*[@class='_988f698c']")
这里是 html 标签的例子。 class "_988f698c"
每隔一小时左右刷新一次新标题。
<li class="e9a6bea7">
<a class="_988f698c" href="https://www.nytimes.com/wirecutter/reviews/gir-spatula-review/">Why We Love GIR Spatulas</a>
<p class="_9d1f22a9">today
</p>
</li>
我有办法做到这一点吗?
回来一点,寻找替代路径,而不是强制使用随机数。
对于标题,使用:
=IMPORTXML(
"https://www.nytimes.com/wirecutter/",
"//ul[@data-testid='new-and-updated']/li/a"
)
对于 URL 附加到标题:
=IMPORTXML(
"https://www.nytimes.com/wirecutter/",
"//ul[@data-testid='new-and-updated']/li/a/@href"
)
对于表示发布日期的文字:
=IMPORTXML(
"https://www.nytimes.com/wirecutter/",
"//ul[@data-testid='new-and-updated']/li/p"
)
如果你想把所有东西都收集起来,用|
分割路径:
=IMPORTXML(
"https://www.nytimes.com/wirecutter/",
"//ul[@data-testid='new-and-updated']/li/a |
//ul[@data-testid='new-and-updated']/li/a/@href |
//ul[@data-testid='new-and-updated']/li/p"
)
仅在您绝对确定这些值将始终存在时才使用它,因为如果它们不存在,则如果您定义 sheet 行中的位置就会出现问题取决于每个单元格中固定值的公式。