如何从维基百科文章的 "See Also" 部分提取链接?

How to extract links from "See Also" section of an article in Wikipedia?

有没有办法通过 Wikpedia API 从维基百科文章的 "See Also" 部分提取所有链接?

我想知道一种方法,但找不到。

不直接通过 API。 MediaWiki 按页跟踪 link,它不存储有关 link 来自哪个部分的信息。

我认为你最好的选择是获取该部分的 HTML,解析它并收集所有 <a href 个元素。

是的,您可以使用 Wikipedia API 和 action=parse. For this goal we need two properties: sections and links. For example for Wikipedia article Chicago 我们使用下一个查询来获取名称为 index 的部分=33=]:

https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Chicago

从响应中我们看到它是 43。然后我们使用该索引仅在该部分中获取链接:

https://en.wikipedia.org/w/api.php?action=parse&prop=links&page=Chicago&section=43

注意: 最后的响应还可以包含来自某些模板的链接,如我们的示例 Portal:Chicago传送门:伊利诺伊州。如果您愿意,可以在请求中使用命名空间 &ns=0 来过滤它们。