如何将 substring() 与 Import.io 一起使用?

How to use substring() with Import.io?

我在使用 XPath 和 import.io 时遇到一些问题,希望您能帮助我。 :)

html代码:

<a href="page.php?var=12345">

目前,我设法提取 href ( page.php?var=12345 ) 的内容:

./td[3]/a[1]/@href

不过,我只想收集:12345

substring 可能是解决方案,但在我使用它时它似乎不适用于 import.io...

substring(./td[3]/a[1]/@href,13)

知道问题出在哪里吗?

提前致谢!

你的路径表达式没问题,但也许应该是

substring(./td[3]/a[1]/@href,14)

"Does not seem to work" 不是很清楚的描述出了什么问题。你收到错误信息了吗?输出错误吗?您是否有围绕可以显示的路径表达式的任何代码?


您可以使用子字符串,但使用 substring-after() 会更好。

substring-after(/a/@href,'=')

假设输入您显示的小片段:

<a href="page.php?var=12345"/>

将select

12345

并考虑到您输入的结构

substring-after(./td[3]/a[1]/@href,'=')

路径表达式中的前导 . select 当前上下文节点的唯一直接子 td 节点。我相信你知道你在做什么。

尝试将其用于 xpath:(将字段选为文本)

.//*[@class='oeil']/a/@href

然后将其用于您的正则表达式:

([^=]*)$

这将为您提供所需的 ISBN 编号。

import.io 仅在 return 节点列表

时支持 XPath 中的函数