使用 Google 个表格进行网页抓取。 IMPORTXML 函数需要正确的 xpath
Using Google Sheets for web scraping. Need the correct xpath for IMPORTXML function
google sheet 包含 MPN(制造商部件号)列表。当我有一个项目的 MPN 时,试图为 UPC 代码抓取一个名为 wikiarms 的网站。
我有在另一个网站上执行此操作的正确公式。
=IMPORTXML("http://gun.deals/search/apachesolr_search/"&B1,"//dd/a[../../dt[contains(text(),'UPC')]]|//dd/span[../../dt[contains(text(),'UPC')]]")
试图找出完成此公式的正确 xpath。我看过的一些视频说在Chrome打开页面,用inspector到select复制xpath完成importxml功能。我没有运气就试过了。
样本
访问 https://www.wikiarms.com/guns?q=20071
在 table 中有一个按钮 "available in 6 stores" 单击该按钮可显示列表。 UPC 应列在 MPN 之后。
如果我在 Chrome 中复制 xpath,这就是结果
/html/body/div[1]/div/div/div[2]/div/div/div[2]/div[2]/table/tbody/tr[2]/td[5]
=IMPORTXML("https://www.wikiarms.com/guns?q="&B2,"xpath here")
我必须在此公式的末尾添加什么才能提取 UPC 代码?我将使用此公式提取大约 1000 件商品的 UPC 代码。
感谢您的帮助。
使用您的示例 link,试试
=IMPORTXML("https://www.wikiarms.com/guns?q=20071","//td[@class='upc']/a/@title")
看看它是否适合你。
google sheet 包含 MPN(制造商部件号)列表。当我有一个项目的 MPN 时,试图为 UPC 代码抓取一个名为 wikiarms 的网站。
我有在另一个网站上执行此操作的正确公式。
=IMPORTXML("http://gun.deals/search/apachesolr_search/"&B1,"//dd/a[../../dt[contains(text(),'UPC')]]|//dd/span[../../dt[contains(text(),'UPC')]]")
试图找出完成此公式的正确 xpath。我看过的一些视频说在Chrome打开页面,用inspector到select复制xpath完成importxml功能。我没有运气就试过了。
样本 访问 https://www.wikiarms.com/guns?q=20071
在 table 中有一个按钮 "available in 6 stores" 单击该按钮可显示列表。 UPC 应列在 MPN 之后。
如果我在 Chrome 中复制 xpath,这就是结果
/html/body/div[1]/div/div/div[2]/div/div/div[2]/div[2]/table/tbody/tr[2]/td[5]
=IMPORTXML("https://www.wikiarms.com/guns?q="&B2,"xpath here")
我必须在此公式的末尾添加什么才能提取 UPC 代码?我将使用此公式提取大约 1000 件商品的 UPC 代码。
感谢您的帮助。
使用您的示例 link,试试
=IMPORTXML("https://www.wikiarms.com/guns?q=20071","//td[@class='upc']/a/@title")
看看它是否适合你。