无法找到 Xpath
Not able to find the Xpath
我正在尝试使用 scrapy 抓取 IMDB 排名前 250 的电影,但一直无法找到 xpath [我需要提取“2”、“h”、“44”和“m”] 每部电影。网站 link:https://www.imdb.com/title/tt15097216/?ref_=adv_li_tt
这是 HTML 的图像:
我试过这个 Xpath,但它不准确:
//li[@class ='ipc-inline-list__item']/following::li/text()
如果一直在同一个位置,那么:
//li[@class ='ipc-inline-list__item']/following::li[2]
或更简单地说:
//li[@class ='ipc-inline-list__item'][3]
或者因为其他人有超链接作为子节点,过滤到只有 li
有 text()
个子节点:
//li[@class ='ipc-inline-list__item'][text()]
但是,原始的 XPath 可能没问题 - 它可能是您使用信息的方式。如果您使用的是 .get()
,请尝试使用 .getAll()
。
您可以使用此 XPath 来定位元素:
//span[contains(@class,'Runtime')]
要提取文本,您可以使用:
//span[contains(@class,'Runtime')]/text()
我正在尝试使用 scrapy 抓取 IMDB 排名前 250 的电影,但一直无法找到 xpath [我需要提取“2”、“h”、“44”和“m”] 每部电影。网站 link:https://www.imdb.com/title/tt15097216/?ref_=adv_li_tt
这是 HTML 的图像:
我试过这个 Xpath,但它不准确:
//li[@class ='ipc-inline-list__item']/following::li/text()
如果一直在同一个位置,那么:
//li[@class ='ipc-inline-list__item']/following::li[2]
或更简单地说:
//li[@class ='ipc-inline-list__item'][3]
或者因为其他人有超链接作为子节点,过滤到只有 li
有 text()
个子节点:
//li[@class ='ipc-inline-list__item'][text()]
但是,原始的 XPath 可能没问题 - 它可能是您使用信息的方式。如果您使用的是 .get()
,请尝试使用 .getAll()
。
您可以使用此 XPath 来定位元素:
//span[contains(@class,'Runtime')]
要提取文本,您可以使用:
//span[contains(@class,'Runtime')]/text()