维基百科内容解析 JSON

Wikipedia content parsing JSON

我想获取维基百科页面的内容,然后用它做一些有趣的事情。

我的想法是,我想以 XML/JSON 格式获取它们,但目前我似乎没有找到方法。

目前我成功地做到了这一点:

https://en.wikipedia.org/w/api.php?action=query&format=jsonfm&prop=revisions&titles=April_1&rvprop=content&rvcontentformat=text%2Fx-wiki

Bu 我在 XWiki 中收到内容,但由于该页面不支持,我无法将其更改为 JSON。

如何将 XWiki 解析为 JSON 或者如何获取页面内容。

谢谢!

是的,您可以使用 XWiki Rendering 中的 HTML 解析器来解析维基百科生成的 HTML。这给了你一个 AST,你可以在上面做任何你想做的事。

有关详细信息,请参阅 http://rendering.xwiki.org/xwiki/bin/view/Main/WebHome

您只需要找到一种方法来获取 HTML 中的维基百科内容。