如何访问网页内容

How to access the web page contents

我将网页文本存储在字符串中。但网页的某些内容并未存储在字符串中。我不知道为什么不存储 div 之类元素中的内容。即使是 div 内的链接也无法使用我实施的网络爬虫访问。谁能帮我解决这个问题!!!

 List<String> tags = new ArrayList<String>();
for(int i=0;i<8;i++)
{
Document doc = Jsoup.connect("some link here").get();
Elements taglinks = doc.select("html");
for (Element link : taglinks) {
tags.add(link.text());}
System.out.println(tags);

你的问题不够清楚,但从你的代码中我了解到你正在寻找,保存 Link 的文本并使用你必须使用的 .select() 语法 doc.select("a[href"]); 然后你可以使用你当前的for循环。