有没有办法解析 HTML 代码但解析输出没有改变？

Question

美好的一天，

这是我的示例输入 HTML:

<html>
<head>
<meta>
</head>
<body>
...
</body>
</html>

然后在 Jsoup XmlParser 之后，这里是输出：

<html>
<head>
<meta>
</meta>
</head>
<body>
...
</body>
</html>

XmlParser 解析了 HTML 代码而不改变排列 HTML 个代码。但是 XmlParser 将结束标记放在每个没有标记的标记中结束标记作为示例中的 meta 标记。我想问问有没有是一种使用 Jsoup 的方法，它可以解析 HTML 代码而无需添加或更改源 HTML 代码中的任何内容？

请帮忙，谢谢

Answer 1

您需要知道 html 来源是 DOM Tree。当 Jsoup 或其他库加载 html 源时，它会生成一个 DOM Tree。所以它必须有打开和关闭标签才能操作节点。

有没有办法解析 HTML 代码但解析输出没有改变？

Is there a way to parse HTML codes but parsed output doesn't changed?

html

java

jsoup