使用 Jsoup 从网页中提取语言

extract language from a web page with Jsoup

比如我有

<html lang="en"> ...... web page </html>

我想用 Jsoup 提取字符串 "en"。

我尝试使用选择器和属性但没有成功。

Document htmlDoc = Jsoup.parse(html);
Element taglang = htmlDoc.select("html").first();
System.out.println(taglang.text());

您似乎想要获取 lang 属性 的值。在这种情况下,您可以使用 attr("nameOfAttribute") like

System.out.println(taglang.attr("lang"));