如何获取 python 中文章的维基百科外链?
How to get wikipedia out-links of an article in python?
我想获取维基百科文章的外链。我所说的外链是指维基百科文章中 What links here
部分的链接。
例如,考虑 data mining
维基百科文章。 What links here
本文部分位于:https://en.wikipedia.org/wiki/Special:WhatLinksHere/Data_mining
我尝试使用 pywikibot
如下。
import pywikibot as pw
site = pw.Site('en', 'wikipedia')
print([
cat.title()
for cat in pw.Page(site, 'data mining').categories()
if 'hidden' not in cat.categoryinfo
])
但是,pywikibot 中的 categories
似乎与维基百科文章的外链不同。因此,我想知道如何在 python.
中执行此操作
注意:我不仅限于 pywikibot,而且很乐意探索其他库,例如 mediawiki
。
如果需要,我很乐意提供更多详细信息。
尝试Page.embeddedin()
and Page.backlinks()
方法。您也可以直接使用 MediaWiki 的 API:
的等效模块
我想获取维基百科文章的外链。我所说的外链是指维基百科文章中 What links here
部分的链接。
例如,考虑 data mining
维基百科文章。 What links here
本文部分位于:https://en.wikipedia.org/wiki/Special:WhatLinksHere/Data_mining
我尝试使用 pywikibot
如下。
import pywikibot as pw
site = pw.Site('en', 'wikipedia')
print([
cat.title()
for cat in pw.Page(site, 'data mining').categories()
if 'hidden' not in cat.categoryinfo
])
但是,pywikibot 中的 categories
似乎与维基百科文章的外链不同。因此,我想知道如何在 python.
注意:我不仅限于 pywikibot,而且很乐意探索其他库,例如 mediawiki
。
如果需要,我很乐意提供更多详细信息。
尝试Page.embeddedin()
and Page.backlinks()
方法。您也可以直接使用 MediaWiki 的 API: