如何在不影响大小写和换行符的情况下获取实际源代码?

How to get actual source code without compromising case and line break?

我正在使用 jsoup 获取源代码。我正在使用 jsoup 版本 1.13.1。当我使用下面的代码获取源代码时,我发现大小写被转换为小写。

Document doc = Jsoup.connect("https://example.com").get();
webview.loadData(doc);

我看到几个答案,他们更喜欢 xml 解析器。但我不知道如何使用 xml 解析器从 url 解析 html。还有我不明白的基础url。我正在处理一个 Android 应用程序项目。所以任何答案都会对我有所帮助。提前致谢

使用不同于默认的解析器很容易 - XML 解析器(保留大小写并禁用漂亮打印(即保留换行符)),或配置的 HTML 解析器相似地。只需使用 Connection#parser() 方法:

Document document = Jsoup.connect("https://example.com")
    .parser(Parser.xmlParser())
    .get();
Document document = Jsoup.connect("https://example.com")
    .parser(Parser.htmlParser().settings(ParseSettings.preserveCase))
    .get();
document.outputSettings().prettyPrint(false);