为什么用Jsoup解析后内容不一样

Question

我正在尝试解析 this url using JSOUP. I am getting parsed doc something like unicode format not the actual data while I am parsing this url 根据需要给我正确的印地文文本。我正在使用下面的代码来解析 URl。顺便说一句 url 托管在我的网站上。服务器上的文本文件有问题吗？我想不通。

    Document doc = Jsoup
            .connect(
                    "hindi-stories.kratav.com/content/social_aalha.html")
            .userAgent("Mozilla").timeout(15 * 1000).get();

Answer 1

你查看第一个URL的源代码，没有指定编码。而第二个有一个元：

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

尝试使用指定字符集的方法解析第一个 URL，即：

Document document = Jsoup.parse(new URL(url).openStream(), "UTF-16", url);

为什么用Jsoup解析后内容不一样

Why content is not same after parsing with Jsoup

java

parsing

jsoup