为什么爬取relatedwords.org没有显示结果?

Why does crawling relatedwords.org shows no results?

我正在尝试抓取 relatedwords.org 网站以查找相似的词,但显示这些词的块不在源代码中。这是我正在使用的代码:

public class SimilarWords {

public static void main(String[] args) throws IOException {

    Document homePage = Jsoup.connect("https://relatedwords.org/relatedto/towing").ignoreHttpErrors(true).get();

    System.out.println(homePage);

}

}

可能是什么原因?

你基本上是在请求错误url。

https://relatedwords.org/relatedto/towing returns 等同于 https://relatedwords.org

如果您检查浏览器发出的请求,您会看到一个 XHR 请求,它正在请求您搜索的字词的实际答案:https://relatedwords.org/api/related?term=towing

这是您要查询的url。它 returns 您的数据采用 JSON 格式。

您可以在浏览器中使用开发人员工具检查请求。按 F12