Wikipedia.sectionreturns一个None

Wikipedia.section returns a None

python 的 wikipedia 包能够从维基百科页面检索部分。您可以提取部分列表并使用该列表中的元素来检索该部分的内容。我已经在很多页面上使用它并遇到了一页,其中一个特定部分 returns 一个 None

import wikipedia

wikipedia.set_lang("nl")
page = wikipedia.page("Samenstelling_Tweede_Kamer_1875-1879")

secs = page.sections         #Get a complete list of the page's sections
print(page.section(secs[1])) #returns the section
print(page.section(secs[2])) #doesn't work, returns a None

我检查了维基百科页面源,没有发现任何奇怪的东西

注意:我已经安装了wikipedia包如下:

pip3 install git+https://github.com/lucasdnd/Wikipedia.git

该包中的 .section() 方法查找格式如下的节标题:

section = u"== {} ==".format(section_title)

注意标题两边的空格。但是您正在查看的页面的大部分部分都没有这些空间:例如 ==Gekozen bij de verkiezingen van 8 juni 1875==。对我来说,这看起来像是程序包中的一个错误,因为我认为没有理由期望这些部分的格式会如此精确。

问题是由以下 2 个查询的响应引起的:

https://nl.wikipedia.org/w/api.php?action=parse&prop=sections&page=Samenstelling_Tweede_Kamer_1875-1879&format=json
https://nl.wikipedia.org/w/api.php?explaintext=&rvprop=ids&titles=Samenstelling_Tweede_Kamer_1875-1879&prop=extracts|revisions&action=query&format=json

不起作用的部分似乎有两个 space。此双 space 仅在第二个查询中被删除:

Conservatief-Katholiek  (14 zetels)
Conservatief-Katholiek (14 zetels)

这会导致维基百科 python 模块出现问题。我在维基媒体问题页面上有 reported 这个问题。