如何在 Google 工作表中使用 ImportXML 从元 属性 中过滤日期
How to filter date from meta property with ImportXML in Google Sheets
我正在设置 Google Sheet 以从我网站上的某些文章中抓取发布日期。 Here's an example post 如果有帮助。
我为每个 post 生成元标记,如下所示:
<meta property="article:published_time" content="2018-12-14T19:41+00:00" />
因此,我使用此代码来抓取发布日期,A 列是 link 位置:
=IMPORTXML(A2,"//meta[@property='article:published_time']/@content")
但是,这会抓取完整的元内容,其中包括时间:2018-12-14T19:41+00:00
我只想要 2018-12-14,同时从 T 开始剥离所有内容。有没有办法用 xpath 以某种方式过滤掉它?
尝试:
=REGEXEXTRACT(IMPORTXML(A2, "//meta[@property='article:published_time']/@content"), "(.+)T")
我正在设置 Google Sheet 以从我网站上的某些文章中抓取发布日期。 Here's an example post 如果有帮助。
我为每个 post 生成元标记,如下所示:
<meta property="article:published_time" content="2018-12-14T19:41+00:00" />
因此,我使用此代码来抓取发布日期,A 列是 link 位置:
=IMPORTXML(A2,"//meta[@property='article:published_time']/@content")
但是,这会抓取完整的元内容,其中包括时间:2018-12-14T19:41+00:00
我只想要 2018-12-14,同时从 T 开始剥离所有内容。有没有办法用 xpath 以某种方式过滤掉它?
尝试:
=REGEXEXTRACT(IMPORTXML(A2, "//meta[@property='article:published_time']/@content"), "(.+)T")