如何使用 Jsoup 从 html 检索数据
How can I retrieve data from html using Jsoup
我是 HTML 的新手,我试图通过尝试从 HTML 字符串中检索数据来了解一些关于 HTML 标签的知识。
<li>
<div class="item" data-youtube_code="code_for_youtuber" data-feature_code="data" data-feature_url="/movies/Truman">
<div class="title">
<span>the title of the video</span>
</div>
<div class="image">
<img src="/media/image.png" data-src="http://url_of_image.jpg" alt="">
</div>
</div> </li>
我正在使用 Java Jsoup 库,到目前为止,我已经设法使用以下方法提取 <span>
内容:
Document doc = Jsoup.connect("http://www.yesplanet.co.il/movies").get();
System.out.println(doc.html());
Elements elem = doc.select(".item").text();
如何获得其他东西,例如 data-youtube_code
和 img src
。
编辑:
例如:
System.out.println("doc...data-youtube_code");//some code that retrieves
//data-youtube_code. The ouptup will be "code_for_youtuber"
System.out.println("data-src")
//some code that retrieves
//data-src. The ouptup will be "http://url_of_image.jpg"
可以先select先div然后通过属性
取值
Element elements = Jsoup.parse(s).select("div").first();
System.out.println(elements.attr("data-youtube_code"));
输出:
code_for_youtuber
编辑:
Element elements = Jsoup.parse(s).select(".item").first();
System.out.println(elements.attr("data-youtube_code"));
Element element1 = elements.select(".image img").first();
System.out.println(element1.attr("data-src"));
输出:
code_for_youtuber
http://url_of_image.jpg
既然你是初学者,我建议你找找这个link
我是 HTML 的新手,我试图通过尝试从 HTML 字符串中检索数据来了解一些关于 HTML 标签的知识。
<li>
<div class="item" data-youtube_code="code_for_youtuber" data-feature_code="data" data-feature_url="/movies/Truman">
<div class="title">
<span>the title of the video</span>
</div>
<div class="image">
<img src="/media/image.png" data-src="http://url_of_image.jpg" alt="">
</div>
</div> </li>
我正在使用 Java Jsoup 库,到目前为止,我已经设法使用以下方法提取 <span>
内容:
Document doc = Jsoup.connect("http://www.yesplanet.co.il/movies").get();
System.out.println(doc.html());
Elements elem = doc.select(".item").text();
如何获得其他东西,例如 data-youtube_code
和 img src
。
编辑: 例如:
System.out.println("doc...data-youtube_code");//some code that retrieves
//data-youtube_code. The ouptup will be "code_for_youtuber"
System.out.println("data-src")
//some code that retrieves
//data-src. The ouptup will be "http://url_of_image.jpg"
可以先select先div然后通过属性
取值 Element elements = Jsoup.parse(s).select("div").first();
System.out.println(elements.attr("data-youtube_code"));
输出:
code_for_youtuber
编辑:
Element elements = Jsoup.parse(s).select(".item").first();
System.out.println(elements.attr("data-youtube_code"));
Element element1 = elements.select(".image img").first();
System.out.println(element1.attr("data-src"));
输出:
code_for_youtuber
http://url_of_image.jpg
既然你是初学者,我建议你找找这个link