通过 ImportDATA 过滤提取的数据

Filter extracted data via ImportDATA

尝试通过 ImportDATA 从 https://int.soccerway.com/ 中提取数据时,电子表格有时 returns 一条消息说它超出了数据限制。

我想做的是,与其导入所有内容,不如仅过滤 ||| 内的值td class = "score-time status" |||,因为我想捕获它在 "td".

中特定 "class" 中的链接

ImportXML to capture "//td[@class='score-time status']/@href" 不是一个选项,因为其中一些链接是隐藏的,只出现在一般页面记录中,所以只有使用 ImporDATA 才能搜索所有现有链接。

=IMPORTDATA("https://int.soccerway.com/")

我尝试了很多方法来添加 ARRAYFORMULA 和 FILTER,以便它只过滤这些数据,但每次都 returns 出错。

我需要能够收集的是以下链接: ||| td class = "score-time status" |||

你可以这样做:

=ARRAY_CONSTRAIN(IMPORTDATA("https://int.soccerway.com/"), 8000, 1)

然后您可以将其包装在查询中并根据您的需要对其进行过滤。例如:

=QUERY(ARRAY_CONSTRAIN(IMPORTDATA("https://int.soccerway.com/"), 8000, 1), 
 "where Col1 contains 'td'", 0)

=QUERY(ARRAY_CONSTRAIN(IMPORTDATA("https://int.soccerway.com/"), 8000, 1), 
 "where Col1 contains 'href'", 0)

等等