有没有办法解析 HTML 代码但解析输出没有改变?

Is there a way to parse HTML codes but parsed output doesn't changed?

美好的一天,

这是我的示例输入 HTML:

<html>
<head>
<meta>
</head>
<body>
...
</body>
</html>

然后在 Jsoup XmlParser 之后,这里是输出:

<html>
<head>
<meta>
</meta>
</head>
<body>
...
</body>
</html>

XmlParser 解析了 HTML 代码而不改变排列 HTML 个代码。但是 XmlParser 将结束标记放在每个没有标记的标记中 结束标记作为示例中的 meta 标记。我想问问有没有 是一种使用 Jsoup 的方法,它可以解析 HTML 代码而无需添加或 更改源 HTML 代码中的任何内容?

请帮忙,谢谢

您需要知道 html 来源是 DOM Tree。当 Jsoup 或其他库加载 html 源时,它会生成一个 DOM Tree。所以它必须有打开和关闭标签才能操作节点。