如何使用 API 从维基百科获取 table 数据

How to get table data from Wikipedia with API

我应该如何构建我的查询以从 https://en.wikipedia.org/wiki/Michael_Bisping 综合武术记录 部分的(第一个)table 获取数据?理想情况下,我希望将 table 数据作为 json,但 HTML 也可以。

我试过这个查询来获取页面的部分:https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Michael_Bisping

结果告诉我 table 在索引为 12 的部分中。我不知道接下来应该 运行 查询什么。

我设法通过此查询获得了整个部分:https://en.wikipedia.org/w/api.php?action=parse&format=json&page=Michael_Bisping&section=12

我通过查询其索引(在本例中为 12)来定位特定部分。

在那里使用 API Sandbox 生成 url!

action 设置为 parse

PageMichael Bisping

Section12(综合格斗记录)

最终 url:

https://en.wikipedia.org/wiki/Special:ApiSandbox#action=parse&format=json&page=Michael%20Bisping&prop=text&section=12&callback=


我使用 prop=extractsaction=query 来获得解析结果:

https://en.wikipedia.org/w/api.php?action=query&format=json&titles=Michael%20Bisping&prop=extracts

然而,这个请求是不可能的(?)section=12,也许还有另一种方法来匹配结果