Python 用于访问本地维基百科的库?

Python library for accessing local wikipedia?

我正在尝试对维基百科数据做一些研究,我擅长Python。

我发现了这个库,看起来不错:https://pypi.python.org/pypi/wikipedia/

我不想直接访问维基百科,因为这很慢,而且我正在尝试访问大量数据,并且可能 运行 超出他们的 API 限制。

我能以某种方式破解它以使其访问维基百科数据的本地实例吗?我知道我可以 运行 整个维基百科服务器并尝试这样做,但这似乎是一种迂回的方式。

有没有办法只指向文件夹并让这个库正常工作。或者您是否知道任何其他这样做的图书馆?

谢谢。

我想出了我需要什么。我想我不应该搜索 API,我正在寻找的是一个解析器。到目前为止,这是我缩小范围的几个选项。两者似乎都是坚实的起点。

维基转储: https://pypi.python.org/pypi/wikidump/0.1.2

mwlib: https://pypi.python.org/pypi/mwlib/0.15.14

更新:虽然这些是维基百科数据的良好解析器,但我发现它们在某种程度上过于局限,更不用说缺乏文档了。所以我最终选择了很好的旧 python ElementTree 并直接使用 XML。