Google 来自网站的工作表 IMPORTXML 文本字段

Google Sheets IMPORTXML Text Field from Website

我正在尝试动态提取符合 Kelley Blue Book 特定标准的汽车的汽车价值。我有这个 IMPORTXML 查询,其中有一个 link 到显示汽车以旧换新价值的特定页面。

=IMPORTXML("https://www.kbb.com/Api/3.9.462.0/71553/vehicle/upa/PriceAdvisor/meter.svg?action=Get&intent=trade-in-sell&pricetype=FPP&zipcode=12345&vehicleid=411852&selectedoptions=6762567|true|6762674|false|6762900|false|6762905|false|6762909|false|6762913|false|6762915|true|6762926|false|6762928|false&hideMonthlyPayment=False&condition=verygood&mileage=40000", "//text[@y='-8']")

在此URL中,有一个y坐标为-8的文本字段。我希望这足以识别我想要提取的数据(以旧换新价值)。我收到标准的 Can't fetch URL 错误并且无法弄清楚原因。

问题不在于您的 XPath "//text[@y='-8']",而在于网站本身。

基本上你有两个选项来测试网站是否可以被抓取:

=IMPORTXML("URL", "//*")

其中 XPath //* 表示 "everything that's possible to scrape"

和直接源代码抓取方法:

=IMPORTDATA("URL")

有时源代码非常庞大,Google Sheets 无法处理它,因此需要对其进行限制,例如:

=ARRAY_CONSTRAIN(IMPORTDATA("URL"), 10000, 10)

无论如何,这些都不能从你的 URL

中抓取任何东西