Python 用于访问本地维基百科的库?
Python library for accessing local wikipedia?
我正在尝试对维基百科数据做一些研究,我擅长Python。
我发现了这个库,看起来不错:https://pypi.python.org/pypi/wikipedia/
我不想直接访问维基百科,因为这很慢,而且我正在尝试访问大量数据,并且可能 运行 超出他们的 API 限制。
我能以某种方式破解它以使其访问维基百科数据的本地实例吗?我知道我可以 运行 整个维基百科服务器并尝试这样做,但这似乎是一种迂回的方式。
有没有办法只指向文件夹并让这个库正常工作。或者您是否知道任何其他这样做的图书馆?
谢谢。
我想出了我需要什么。我想我不应该搜索 API,我正在寻找的是一个解析器。到目前为止,这是我缩小范围的几个选项。两者似乎都是坚实的起点。
维基转储:
https://pypi.python.org/pypi/wikidump/0.1.2
mwlib:
https://pypi.python.org/pypi/mwlib/0.15.14
更新:虽然这些是维基百科数据的良好解析器,但我发现它们在某种程度上过于局限,更不用说缺乏文档了。所以我最终选择了很好的旧 python ElementTree 并直接使用 XML。
我正在尝试对维基百科数据做一些研究,我擅长Python。
我发现了这个库,看起来不错:https://pypi.python.org/pypi/wikipedia/
我不想直接访问维基百科,因为这很慢,而且我正在尝试访问大量数据,并且可能 运行 超出他们的 API 限制。
我能以某种方式破解它以使其访问维基百科数据的本地实例吗?我知道我可以 运行 整个维基百科服务器并尝试这样做,但这似乎是一种迂回的方式。
有没有办法只指向文件夹并让这个库正常工作。或者您是否知道任何其他这样做的图书馆?
谢谢。
我想出了我需要什么。我想我不应该搜索 API,我正在寻找的是一个解析器。到目前为止,这是我缩小范围的几个选项。两者似乎都是坚实的起点。
维基转储: https://pypi.python.org/pypi/wikidump/0.1.2
mwlib: https://pypi.python.org/pypi/mwlib/0.15.14
更新:虽然这些是维基百科数据的良好解析器,但我发现它们在某种程度上过于局限,更不用说缺乏文档了。所以我最终选择了很好的旧 python ElementTree 并直接使用 XML。