维基百科多语言解析器

Wikipedia multi language parser

我在 JavaScript 中为 jQuery 终端(在 404 error page).

代码使用 API 从维基百科获取文章并在终端中显示文章。我遇到的问题是我不知道如何解析其他语言。解析器是为英语创建的,但我刚刚添加了 -l 选项并且它的工作原理相同。除非由于语言而存在输出问题,例如在英语维基百科上有 Category 但在波兰语上是 Kategoria。 你知道有什么方法可以找出任何语言的元名称吗?其他关键字是 FilePlik。而且有很多语言,为其他 wiki 创建关键字列表是找出这些名称的唯一方法吗?

有帮助文章 Help:Category 但波兰语翻译不是 Kategoria 而是 Kategorie(复数),所以我不能只使用帮助页面来确定翻译。还有不同的模板(我不确定如何处理它们)。为每种语言编写不同的解析器是正确解析维基百科文章的唯一方法吗?

如果您只对命名空间的本地化版本感兴趣,您可以通过 API 获取这些版本,例如https://pl.wikipedia.org/w/api.php?action=query&format=jsonfm&meta=siteinfo&siprop=namespaces 将为您提供波兰命名空间列表(请注意,不同维基百科中的命名空间集不一定相同)。

更一般地说,大多数关键字翻译都可以在 MessagesPl.php for MediaWiki core, and various alias files for extensions (e.g. Gadgets.namespaces.php and Gadgets.alias.php 中找到 Gadgets 扩展),但考虑到大量正在使用的扩展,这可能没什么帮助。