筛选从站点导入的日期

Filter dates imported from a site

我正在尝试从该列表中收集尚未开始的每场比赛的日期、时间和 link:
https://int.soccerway.com/international/europe/uefa-champions-league/20192020/group-stage/r54142/

问题是正在导入的日期数大于小时数 links,因为它正在导入已经结束的游戏日期。

有什么方法可以过滤日期,只显示还没有开始的比赛吗?

我在下面留下了我正在使用的公式和电子表格的 link:

=ARRAYFORMULA(
              {
               IMPORTXML(A1,"//td[@class='date no-repetition']/span"),
               IMPORTXML(A1,"//td[@class='score-time status']/a/span"),
               "https://"&IMPORTXML(A1,"//td[@class='score-time status']/a/@href")
              }
             )

https://docs.google.com/spreadsheets/d/1-tfb7TTb-sEDIp0T8YfIIYwjBJLUgruckdgQN3oTEM8/edit?usp=sharing

这个修改怎么样?请将此视为几个可能的答案之一。

修改后的 xpath:

对于IMPORTXML(A1,"//td[@class='date no-repetition' and ../td[@class='score-time status']]/span"),下面的修改如何?

从:
//td[@class='date no-repetition']/span
到:
//td[@class='date no-repetition' and ../td[@class='score-time status']]/span

修改后的公式:

=ARRAYFORMULA(
              {
               IMPORTXML(A1,"//td[@class='date no-repetition' and ../td[@class='score-time status']]/span"),
               IMPORTXML(A1,"//td[@class='score-time status']/a/span"),
               "https://"&IMPORTXML(A1,"//td[@class='score-time status']/a/@href")
              }
             )

结果:

如果我误解了你的问题,这不是你想要的结果,我深表歉意。