在保持结构的同时提取文本
Extracting text while keeping the structure
假设我有以下文件:
<bookstore>
<book>
<title lang="en">Harry Potter</title>
<price>29.99</price>
Berlin
</book>
<book>
<title lang="en">Learning XML</title>
<price>39.95</price>
Tokyo
</book>
</bookstore>
如何使用 XPath 获取以下文档?
<bookstore>
<book>
Berlin
</book>
<book>
Tokyo
</book>
</bookstore>
我试过 /bookstore/book/text()
但这显然破坏了文档的结构。
据我所知,这在 XPath 中是不可能的。
使用 XPath,您可以 select 单个节点,而不是 return 复杂的文档结构。
假设我有以下文件:
<bookstore>
<book>
<title lang="en">Harry Potter</title>
<price>29.99</price>
Berlin
</book>
<book>
<title lang="en">Learning XML</title>
<price>39.95</price>
Tokyo
</book>
</bookstore>
如何使用 XPath 获取以下文档?
<bookstore>
<book>
Berlin
</book>
<book>
Tokyo
</book>
</bookstore>
我试过 /bookstore/book/text()
但这显然破坏了文档的结构。
据我所知,这在 XPath 中是不可能的。
使用 XPath,您可以 select 单个节点,而不是 return 复杂的文档结构。