如何使用 Wikipedia api 获取 table 信息和页面摘要?

how to get table info and summary of page using Wikipedia api?

我想使用像 DuckDuckGo 这样的 MediaWiki API 获取维基百科页面的最少信息。例如史蒂夫卡瑞尔:https://duckduckgo.com/?q=steve+carell&t=hp&ia=news&iax=about

如何使用 HTML 格式的维基百科 url(例如 https://en.wikipedia.org/wiki/Steve_Carell)获取此信息?

您可以为此使用 MediaWiki API。有一个扩展程序 TextExtracts,它正是为此而设计的(它安装在维基百科上)。

在你的情况下,例如: https://en.wikipedia.org/w/api.php?action=query&prop=extracts&exsentences=1&titles=Steve%20Carell

会 return 像这样:

<p class=\"mw-empty-elt\">\n</p>\n\n<p class=\"mw-empty-elt\">\n \n</p>\n<p><b>Steven John Carell</b> (<span></span>; born August 16, 1962) is an American actor, comedian, producer, writer and director.</p>

可以自定义APIreturn的句子(或字符)个数,具体请参考API documentation

还有一种方法可以检索保存在维基数据中的简短描述(并且在维基百科的移动视图中可见)。这个电话是: https://en.wikipedia.org/w/api.php?action=query&prop=pageprops&titles=Steve_Carell

此 return 在页面的 pageprops 中有以下 属性:

"wikibase-shortdesc": "American actor"

根据您的用例,这可能更适合。

您甚至可以通过一个合并的请求获得两个结果: https://en.wikipedia.org/w/api.php?action=query&prop=extracts|pageprops&exsentences=1&titles=Steve_Carell