Jsoup 从文件中获取绝对 url 并解析
Jsoup get absolute url from file and parse
我想加载一些包含链接的 txt 文件。我想按顺序解析此链接(一些结果 - 标签等)以列出视图。我开始尝试这样的事情(但我对 JSOUP
的了解很差)。
File input = new File("http://files.parsetfss.com/ce686da3-4464-47ec-ba73-24747f2da937/tfss-75cfc482-96ab-45f8-8d8b-80b40a5a0298-http.txt");
try {
Document doc = Jsoup.parse(input, "UTF-8", "http://vao-priut.ru/");
} catch (IOException e) {
e.printStackTrace();
}
如果您在服务器上有一些文件可以通过浏览器访问,您可以简单地逐行阅读它。为此,您可以使用 URL
class 和 Scanner
等。当您阅读每一行时,您可以根据需要对其进行解析。
URL input = new URL("http://files.parsetfss.com/ce686da3-4464-47ec-ba73-24747f2da937/tfss-75cfc482-96ab-45f8-8d8b-80b40a5a0298-http.txt");
Scanner sc = new Scanner(input.openStream());
while(sc.hasNextLine()){
String link = sc.nextLine();
//since each line contains link to some resource
//now you can use jsoup to parse it
Document doc = Jsoup.connect(link).get();
//here place rest of code responsible for parsing
//...
}
我想加载一些包含链接的 txt 文件。我想按顺序解析此链接(一些结果 - 标签等)以列出视图。我开始尝试这样的事情(但我对 JSOUP
的了解很差)。
File input = new File("http://files.parsetfss.com/ce686da3-4464-47ec-ba73-24747f2da937/tfss-75cfc482-96ab-45f8-8d8b-80b40a5a0298-http.txt");
try {
Document doc = Jsoup.parse(input, "UTF-8", "http://vao-priut.ru/");
} catch (IOException e) {
e.printStackTrace();
}
如果您在服务器上有一些文件可以通过浏览器访问,您可以简单地逐行阅读它。为此,您可以使用 URL
class 和 Scanner
等。当您阅读每一行时,您可以根据需要对其进行解析。
URL input = new URL("http://files.parsetfss.com/ce686da3-4464-47ec-ba73-24747f2da937/tfss-75cfc482-96ab-45f8-8d8b-80b40a5a0298-http.txt");
Scanner sc = new Scanner(input.openStream());
while(sc.hasNextLine()){
String link = sc.nextLine();
//since each line contains link to some resource
//now you can use jsoup to parse it
Document doc = Jsoup.connect(link).get();
//here place rest of code responsible for parsing
//...
}