如何使用 API 从维基百科获取 table 数据
How to get table data from Wikipedia with API
我应该如何构建我的查询以从 https://en.wikipedia.org/wiki/Michael_Bisping 的 综合武术记录 部分的(第一个)table 获取数据?理想情况下,我希望将 table 数据作为 json,但 HTML 也可以。
我试过这个查询来获取页面的部分:https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Michael_Bisping
结果告诉我 table 在索引为 12 的部分中。我不知道接下来应该 运行 查询什么。
我设法通过此查询获得了整个部分:https://en.wikipedia.org/w/api.php?action=parse&format=json&page=Michael_Bisping§ion=12
我通过查询其索引(在本例中为 12)来定位特定部分。
在那里使用 API Sandbox 生成 url!
将 action
设置为 parse
。
Page
到 Michael Bisping
Section
到12
(综合格斗记录)
最终 url:
https://en.wikipedia.org/wiki/Special:ApiSandbox#action=parse&format=json&page=Michael%20Bisping&prop=text§ion=12&callback=
我使用 prop=extracts
和 action=query
来获得解析结果:
https://en.wikipedia.org/w/api.php?action=query&format=json&titles=Michael%20Bisping&prop=extracts
然而,这个请求是不可能的(?)section=12
,也许还有另一种方法来匹配结果
我应该如何构建我的查询以从 https://en.wikipedia.org/wiki/Michael_Bisping 的 综合武术记录 部分的(第一个)table 获取数据?理想情况下,我希望将 table 数据作为 json,但 HTML 也可以。
我试过这个查询来获取页面的部分:https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Michael_Bisping
结果告诉我 table 在索引为 12 的部分中。我不知道接下来应该 运行 查询什么。
我设法通过此查询获得了整个部分:https://en.wikipedia.org/w/api.php?action=parse&format=json&page=Michael_Bisping§ion=12
我通过查询其索引(在本例中为 12)来定位特定部分。
在那里使用 API Sandbox 生成 url!
将 action
设置为 parse
。
Page
到 Michael Bisping
Section
到12
(综合格斗记录)
最终 url:
https://en.wikipedia.org/wiki/Special:ApiSandbox#action=parse&format=json&page=Michael%20Bisping&prop=text§ion=12&callback=
我使用
prop=extracts
和 action=query
来获得解析结果:
https://en.wikipedia.org/w/api.php?action=query&format=json&titles=Michael%20Bisping&prop=extracts
然而,这个请求是不可能的(?)section=12
,也许还有另一种方法来匹配结果