使用 Jsoup 从网页中提取语言
extract language from a web page with Jsoup
比如我有
<html lang="en"> ...... web page </html>
我想用 Jsoup 提取字符串 "en"。
我尝试使用选择器和属性但没有成功。
Document htmlDoc = Jsoup.parse(html);
Element taglang = htmlDoc.select("html").first();
System.out.println(taglang.text());
您似乎想要获取 lang
属性 的值。在这种情况下,您可以使用 attr("nameOfAttribute")
like
System.out.println(taglang.attr("lang"));
比如我有
<html lang="en"> ...... web page </html>
我想用 Jsoup 提取字符串 "en"。
我尝试使用选择器和属性但没有成功。
Document htmlDoc = Jsoup.parse(html);
Element taglang = htmlDoc.select("html").first();
System.out.println(taglang.text());
您似乎想要获取 lang
属性 的值。在这种情况下,您可以使用 attr("nameOfAttribute")
like
System.out.println(taglang.attr("lang"));