如何用xpath解析html?

How to parse html with xpath?

我 运行 在 Whosebug 上问了几个关于使用 Java 使用 xpath 解析 html 的问题。

这是我迄今为止找到的最佳答案here

但是 DomSerializer 似乎在 Java 11 中不再可用。

如何在 Java 11 中使用 DomSerializer

将以下依赖项添加到 pom.xml :

<dependency>
    <groupId>net.sourceforge.htmlcleaner</groupId>
    <artifactId>htmlcleaner</artifactId>
    <version>2.6.1</version>
</dependency>

您可以从 here 下载 htmlcleaner-2.6.1.jar

那个罐子(或神器)里面有 DomSerializer class。

Link 阅读文档:http://htmlcleaner.sourceforge.net/doc/org/htmlcleaner/DomSerializer.html