Wikipedia.sectionreturns一个None
Wikipedia.section returns a None
python 的 wikipedia
包能够从维基百科页面检索部分。您可以提取部分列表并使用该列表中的元素来检索该部分的内容。我已经在很多页面上使用它并遇到了一页,其中一个特定部分 returns 一个 None
:
import wikipedia
wikipedia.set_lang("nl")
page = wikipedia.page("Samenstelling_Tweede_Kamer_1875-1879")
secs = page.sections #Get a complete list of the page's sections
print(page.section(secs[1])) #returns the section
print(page.section(secs[2])) #doesn't work, returns a None
我检查了维基百科页面源,没有发现任何奇怪的东西
注意:我已经安装了wikipedia
包如下:
pip3 install git+https://github.com/lucasdnd/Wikipedia.git
该包中的 .section()
方法查找格式如下的节标题:
section = u"== {} ==".format(section_title)
注意标题两边的空格。但是您正在查看的页面的大部分部分都没有这些空间:例如 ==Gekozen bij de verkiezingen van 8 juni 1875==
。对我来说,这看起来像是程序包中的一个错误,因为我认为没有理由期望这些部分的格式会如此精确。
问题是由以下 2 个查询的响应引起的:
https://nl.wikipedia.org/w/api.php?action=parse&prop=sections&page=Samenstelling_Tweede_Kamer_1875-1879&format=json
https://nl.wikipedia.org/w/api.php?explaintext=&rvprop=ids&titles=Samenstelling_Tweede_Kamer_1875-1879&prop=extracts|revisions&action=query&format=json
不起作用的部分似乎有两个 space。此双 space 仅在第二个查询中被删除:
Conservatief-Katholiek (14 zetels)
Conservatief-Katholiek (14 zetels)
这会导致维基百科 python 模块出现问题。我在维基媒体问题页面上有 reported 这个问题。
python 的 wikipedia
包能够从维基百科页面检索部分。您可以提取部分列表并使用该列表中的元素来检索该部分的内容。我已经在很多页面上使用它并遇到了一页,其中一个特定部分 returns 一个 None
:
import wikipedia
wikipedia.set_lang("nl")
page = wikipedia.page("Samenstelling_Tweede_Kamer_1875-1879")
secs = page.sections #Get a complete list of the page's sections
print(page.section(secs[1])) #returns the section
print(page.section(secs[2])) #doesn't work, returns a None
我检查了维基百科页面源,没有发现任何奇怪的东西
注意:我已经安装了wikipedia
包如下:
pip3 install git+https://github.com/lucasdnd/Wikipedia.git
该包中的 .section()
方法查找格式如下的节标题:
section = u"== {} ==".format(section_title)
注意标题两边的空格。但是您正在查看的页面的大部分部分都没有这些空间:例如 ==Gekozen bij de verkiezingen van 8 juni 1875==
。对我来说,这看起来像是程序包中的一个错误,因为我认为没有理由期望这些部分的格式会如此精确。
问题是由以下 2 个查询的响应引起的:
https://nl.wikipedia.org/w/api.php?action=parse&prop=sections&page=Samenstelling_Tweede_Kamer_1875-1879&format=json
https://nl.wikipedia.org/w/api.php?explaintext=&rvprop=ids&titles=Samenstelling_Tweede_Kamer_1875-1879&prop=extracts|revisions&action=query&format=json
不起作用的部分似乎有两个 space。此双 space 仅在第二个查询中被删除:
Conservatief-Katholiek (14 zetels) Conservatief-Katholiek (14 zetels)
这会导致维基百科 python 模块出现问题。我在维基媒体问题页面上有 reported 这个问题。