维基百科 API 信息框

Wikipedia API infobox

我正在使用维基百科 API 从某些页面获取信息框。 一个例子是 Imperial College London 我的问题是我得到的 HESA student population|INSTID=0132 值。我希望只获得学生人数,但我得到的是上面的 ID。如何获取页面中信息框的值?

此外,如果您检查 wiki page,则有两个信息框(主要信息框和排名信息框)。我怎样才能同时获得它们?

您可以使用另一种方法 REST API 来访问维基百科内容。要获得结构良好的文章 HTML,您需要:

https://en.wikipedia.org/api/rest_v1/page/html/Imperial_College_London

HTML是由Parsoid service which produced HTML/RDFa content following the DOM Spec产生的。收件箱将是 html table 元素和 class `信息框,因此您可以轻松地在页面上找到所有收件箱。

收件箱通常由复杂的模板创建,因此您只解析 table HTML 可能更容易。