使用 Google 个表格进行网页抓取。 IMPORTXML 函数需要正确的 xpath

Using Google Sheets for web scraping. Need the correct xpath for IMPORTXML function

google sheet 包含 MPN(制造商部件号)列表。当我有一个项目的 MPN 时,试图为 UPC 代码抓取一个名为 wikiarms 的网站。

我有在另一个网站上执行此操作的正确公式。

=IMPORTXML("http://gun.deals/search/apachesolr_search/"&B1,"//dd/a[../../dt[contains(text(),'UPC')]]|//dd/span[../../dt[contains(text(),'UPC')]]")

试图找出完成此公式的正确 xpath。我看过的一些视频说在Chrome打开页面,用inspector到select复制xpath完成importxml功能。我没有运气就试过了。

样本 访问 https://www.wikiarms.com/guns?q=20071

在 table 中有一个按钮 "available in 6 stores" 单击该按钮可显示列表。 UPC 应列在 MPN 之后。

如果我在 Chrome 中复制 xpath,这就是结果

/html/body/div[1]/div/div/div[2]/div/div/div[2]/div[2]/table/tbody/tr[2]/td[5]

=IMPORTXML("https://www.wikiarms.com/guns?q="&B2,"xpath here")

我必须在此公式的末尾添加什么才能提取 UPC 代码?我将使用此公式提取大约 1000 件商品的 UPC 代码。

感谢您的帮助。

使用您的示例 link,试试

=IMPORTXML("https://www.wikiarms.com/guns?q=20071","//td[@class='upc']/a/@title")

看看它是否适合你。