用于获取缺少单元格图像的 table 行的 xpath

xpath for getting table rows with missing cell images

我正在尝试使用 Xpath 抓取包含图像和文本的 table 行。只要图像存在,一切都可以正常工作 as on this 3rd table on this page. But when images are missing as in the table as on this page 它不起作用。我需要将图像与 table 数据的右行连接起来。

这是我在 google 工作表中使用的 xpath_query 字符串类型,其中 A1 包含 url.

=importXML(A1,"//tbody//img/@src")
=importXML(A1,"//tbody//tr")

感谢您的帮助。

像这样:

=ARRAYFORMULA(IMAGE("https://www.patentati.it"&TRIM(SUBSTITUTE(FLATTEN(
 SPLIT(QUERY(IFNA(REGEXEXTRACT(QUERY(ARRAY_CONSTRAIN(IMPORTDATA(A1), 500, 1), 
 "where Col1 matches '.*zoomImage.*|.*rowspan.*'"), 
 "src=""(.+png)"), "♀♫"),,9^9), "♫")), "♀", ))))


和整个table:

=ARRAYFORMULA({{"figura"; IMAGE("https://www.patentati.it"&TRIM(SUBSTITUTE(FLATTEN(
 SPLIT(QUERY(IFNA(REGEXEXTRACT(QUERY(ARRAY_CONSTRAIN(IMPORTDATA(A1), 500, 1), 
 "where Col1 matches '.*zoomImage.*|.*rowspan.*'"), 
 "src=""(.+png)"), "♀♫"),,9^9), "♫")), "♀", )))}, 
 QUERY(IMPORTHTML(A1, "table", 1), "select Col2,Col3", 0)})


使用 XPath 过滤的更短替代方案(C2 中的url,I27 中的公式):

=ARRAYFORMULA({{"figura:";IMAGE("https://www.patentati.it/"&IMPORTXML(C2;"//tr//img/@src|//tr[not(.//img)]/td[@class='domanda']"))}\QUERY(IMPORTHTML(C2;"table";1);"select Col2,Col3")})

输出:

旁注:我住在欧洲。美国语言环境的公式:

=ARRAYFORMULA({{"figura:";IMAGE("https://www.patentati.it/"&IMPORTXML(C2,"//tr//img/@src|//tr[not(.//img)]/td[@class='domanda']"))},QUERY(IMPORTHTML(C2,"table",1),"select Col2,Col3")})