通过 ImportDATA 过滤提取的数据
Filter extracted data via ImportDATA
尝试通过 ImportDATA 从 https://int.soccerway.com/ 中提取数据时,电子表格有时 returns 一条消息说它超出了数据限制。
我想做的是,与其导入所有内容,不如仅过滤 ||| 内的值td class = "score-time status" |||,因为我想捕获它在 "td".
中特定 "class" 中的链接
ImportXML to capture "//td[@class='score-time status']/@href" 不是一个选项,因为其中一些链接是隐藏的,只出现在一般页面记录中,所以只有使用 ImporDATA 才能搜索所有现有链接。
=IMPORTDATA("https://int.soccerway.com/")
我尝试了很多方法来添加 ARRAYFORMULA 和 FILTER,以便它只过滤这些数据,但每次都 returns 出错。
我需要能够收集的是以下链接:
||| td class = "score-time status" |||
你可以这样做:
=ARRAY_CONSTRAIN(IMPORTDATA("https://int.soccerway.com/"), 8000, 1)
然后您可以将其包装在查询中并根据您的需要对其进行过滤。例如:
=QUERY(ARRAY_CONSTRAIN(IMPORTDATA("https://int.soccerway.com/"), 8000, 1),
"where Col1 contains 'td'", 0)
=QUERY(ARRAY_CONSTRAIN(IMPORTDATA("https://int.soccerway.com/"), 8000, 1),
"where Col1 contains 'href'", 0)
等等
尝试通过 ImportDATA 从 https://int.soccerway.com/ 中提取数据时,电子表格有时 returns 一条消息说它超出了数据限制。
我想做的是,与其导入所有内容,不如仅过滤 ||| 内的值td class = "score-time status" |||,因为我想捕获它在 "td".
中特定 "class" 中的链接ImportXML to capture "//td[@class='score-time status']/@href" 不是一个选项,因为其中一些链接是隐藏的,只出现在一般页面记录中,所以只有使用 ImporDATA 才能搜索所有现有链接。
=IMPORTDATA("https://int.soccerway.com/")
我尝试了很多方法来添加 ARRAYFORMULA 和 FILTER,以便它只过滤这些数据,但每次都 returns 出错。
我需要能够收集的是以下链接: ||| td class = "score-time status" |||
你可以这样做:
=ARRAY_CONSTRAIN(IMPORTDATA("https://int.soccerway.com/"), 8000, 1)
然后您可以将其包装在查询中并根据您的需要对其进行过滤。例如:
=QUERY(ARRAY_CONSTRAIN(IMPORTDATA("https://int.soccerway.com/"), 8000, 1),
"where Col1 contains 'td'", 0)
=QUERY(ARRAY_CONSTRAIN(IMPORTDATA("https://int.soccerway.com/"), 8000, 1),
"where Col1 contains 'href'", 0)
等等