如何使用 xpath 从 html 中提取数据
How Extract data from html with xpath
我正在尝试使用 Google 电子表格从 Google 购物 中提取产品价格:
=IMPORTXML("https://www.google.com.br/?source=pshome-c-0-3&sa=X&ved=0ahUKEwjfguD5xaHKAhXMiZAKHWjuBi8Q7j8IEA#tbm=shop&q=Samsung+Galaxy+S6&spd=0";"/div[@class='product-results']/div[@class='psli'][2]/div[@class='pslicont']/div[@class='pslmain']/div[@class='pslline'][1]/div[@class='_tyb shop__secondary']/span[@class='price']/b")
我的 xpath 查询 是:
/div[@class='product-results']/div[@class='psli'][2]/div[@class='pslicont']/div[@class='pslmain']/div[@class='pslline'][1]/div[@class='_tyb shop__secondary']/span[@class='price']/b
但是我没有结果。
怎么了?
HTML 来自 Google 购物
因为 google 实际上没有返回 HTML。查看页面源代码
view-source:https://www.google.com.br/?source=pshome-c-0-3&sa=X&ved=0ahUKEwjfguD5xaHKAhXMiZAKHWjuBi8Q7j8IEA#tbm=shop&q=Samsung+Galaxy+S6&spd=0
从 Google 获取 HTML 时尝试使用用户代理。这是我几天前遇到的一个问题,我通过将用户代理模仿为 Chrome 浏览器来解决这个问题。
您可以找到在 Google 本身上模仿 User-Agent 的不同方法(没有双关语意)。
我正在尝试使用 Google 电子表格从 Google 购物 中提取产品价格:
=IMPORTXML("https://www.google.com.br/?source=pshome-c-0-3&sa=X&ved=0ahUKEwjfguD5xaHKAhXMiZAKHWjuBi8Q7j8IEA#tbm=shop&q=Samsung+Galaxy+S6&spd=0";"/div[@class='product-results']/div[@class='psli'][2]/div[@class='pslicont']/div[@class='pslmain']/div[@class='pslline'][1]/div[@class='_tyb shop__secondary']/span[@class='price']/b")
我的 xpath 查询 是:
/div[@class='product-results']/div[@class='psli'][2]/div[@class='pslicont']/div[@class='pslmain']/div[@class='pslline'][1]/div[@class='_tyb shop__secondary']/span[@class='price']/b
但是我没有结果。
怎么了?
HTML 来自 Google 购物
因为 google 实际上没有返回 HTML。查看页面源代码
view-source:https://www.google.com.br/?source=pshome-c-0-3&sa=X&ved=0ahUKEwjfguD5xaHKAhXMiZAKHWjuBi8Q7j8IEA#tbm=shop&q=Samsung+Galaxy+S6&spd=0
从 Google 获取 HTML 时尝试使用用户代理。这是我几天前遇到的一个问题,我通过将用户代理模仿为 Chrome 浏览器来解决这个问题。 您可以找到在 Google 本身上模仿 User-Agent 的不同方法(没有双关语意)。