使用节点访问者时如何获得两个节点之间的不间断空格?
How can I get the non-breaking spaces between two nodes when using a node visitor?
我尝试解析以下 HTML 源代码:
<a href="./">Home</a>
<a href="http://gouessej.wordpress.com/tag/tuer/">Blog</a>
我实现了接口org.jsoup.select.NodeVisitor
。但是,它似乎跳过了</a>
和<a
之间的内容。禁用漂亮打印并不能解决我的问题。
您可以 运行 第一个 JUnit 测试来重现此错误:
https://github.com/gouessej/HtmlFlow/blob/patch-1/src/test/java/htmlflow/flowifier/test/TestFlowifier.java
它将我主页的 HTML 源代码转换为 Java 源代码,将此 Java 源代码转换回 HTML 并比较生成的 HTML 源代码代码到原始源代码。
P.S:实际上是TextNode.getWholeText()
returns\n
而不是 \n
.
TextNode.getWholeText()
returns 一些未转义的文本,我只需要通过调用 Entities.escape(TextNode.getWholeText())
.
来转义它
我尝试解析以下 HTML 源代码:
<a href="./">Home</a>
<a href="http://gouessej.wordpress.com/tag/tuer/">Blog</a>
我实现了接口org.jsoup.select.NodeVisitor
。但是,它似乎跳过了</a>
和<a
之间的内容。禁用漂亮打印并不能解决我的问题。
您可以 运行 第一个 JUnit 测试来重现此错误: https://github.com/gouessej/HtmlFlow/blob/patch-1/src/test/java/htmlflow/flowifier/test/TestFlowifier.java 它将我主页的 HTML 源代码转换为 Java 源代码,将此 Java 源代码转换回 HTML 并比较生成的 HTML 源代码代码到原始源代码。
P.S:实际上是TextNode.getWholeText()
returns\n
而不是 \n
.
TextNode.getWholeText()
returns 一些未转义的文本,我只需要通过调用 Entities.escape(TextNode.getWholeText())
.