使用节点访问者时如何获得两个节点之间的不间断空格?

How can I get the non-breaking spaces between two nodes when using a node visitor?

我尝试解析以下 HTML 源代码:

<a href="./">Home</a>&nbsp;&nbsp;&nbsp;
<a href="http://gouessej.wordpress.com/tag/tuer/">Blog</a>&nbsp;&nbsp;&nbsp;

我实现了接口org.jsoup.select.NodeVisitor。但是,它似乎跳过了</a><a之间的内容。禁用漂亮打印并不能解决我的问题。

您可以 运行 第一个 JUnit 测试来重现此错误: https://github.com/gouessej/HtmlFlow/blob/patch-1/src/test/java/htmlflow/flowifier/test/TestFlowifier.java 它将我主页的 HTML 源代码转换为 Java 源代码,将此 Java 源代码转换回 HTML 并比较生成的 HTML 源代码代码到原始源代码。

P.S:实际上是TextNode.getWholeText()returns\n而不是&nbsp;&nbsp;&nbsp;\n.

TextNode.getWholeText() returns 一些未转义的文本,我只需要通过调用 Entities.escape(TextNode.getWholeText()).

来转义它