HTTP 请求中的 XPath
XPath inside HTTP request
我想从 public 页面抓取每日价值变化:
[1] http://www.example.com/page.html
我有一个完整的 xpath:
[2] /html/body/div[5]/table[1]/tbody/tr[4]/td[2]/@data-val
或通过 Chrome 控制台获取该值的命令:
[3] $x("字符串(/html/body/div[5]/table[1]/tbody/tr[4]/td[2]/@data-val) ")
但我不知道如何 make/encode [1] + [2]/[3],仅使用 http 请求就可以检索该数据值? (我正在使用 integromat 来发出 http 请求,但未能找到任何合理的示例)。
您必须发出获取请求才能加载文档。
之后您可以使用库通过 xpath 提取值。
请提供有关 Language/Framework 您所在的更多信息。
以下是 python 中的示例供参考:
from scrapy.selector import Selector
from scrapy.http import HtmlResponse
response = HtmlResponse(url='http://example.com', body=body)
Selector(response=response).xpath('//span/text()').get()
我想从 public 页面抓取每日价值变化:
[1] http://www.example.com/page.html
我有一个完整的 xpath:
[2] /html/body/div[5]/table[1]/tbody/tr[4]/td[2]/@data-val
或通过 Chrome 控制台获取该值的命令:
[3] $x("字符串(/html/body/div[5]/table[1]/tbody/tr[4]/td[2]/@data-val) ")
但我不知道如何 make/encode [1] + [2]/[3],仅使用 http 请求就可以检索该数据值? (我正在使用 integromat 来发出 http 请求,但未能找到任何合理的示例)。
您必须发出获取请求才能加载文档。 之后您可以使用库通过 xpath 提取值。
请提供有关 Language/Framework 您所在的更多信息。 以下是 python 中的示例供参考:
from scrapy.selector import Selector
from scrapy.http import HtmlResponse
response = HtmlResponse(url='http://example.com', body=body)
Selector(response=response).xpath('//span/text()').get()