如何使用 Wikipedia api 获取 table 信息和页面摘要?
how to get table info and summary of page using Wikipedia api?
我想使用像 DuckDuckGo
这样的 MediaWiki API 获取维基百科页面的最少信息。例如史蒂夫卡瑞尔:https://duckduckgo.com/?q=steve+carell&t=hp&ia=news&iax=about
如何使用 HTML
格式的维基百科 url(例如 https://en.wikipedia.org/wiki/Steve_Carell)获取此信息?
您可以为此使用 MediaWiki API。有一个扩展程序 TextExtracts,它正是为此而设计的(它安装在维基百科上)。
在你的情况下,例如:
https://en.wikipedia.org/w/api.php?action=query&prop=extracts&exsentences=1&titles=Steve%20Carell
会 return 像这样:
<p class=\"mw-empty-elt\">\n</p>\n\n<p class=\"mw-empty-elt\">\n \n</p>\n<p><b>Steven John Carell</b> (<span></span>; born August 16, 1962) is an American actor, comedian, producer, writer and director.</p>
可以自定义APIreturn的句子(或字符)个数,具体请参考API documentation
还有一种方法可以检索保存在维基数据中的简短描述(并且在维基百科的移动视图中可见)。这个电话是:
https://en.wikipedia.org/w/api.php?action=query&prop=pageprops&titles=Steve_Carell
此 return 在页面的 pageprops 中有以下 属性:
"wikibase-shortdesc": "American actor"
根据您的用例,这可能更适合。
您甚至可以通过一个合并的请求获得两个结果:
https://en.wikipedia.org/w/api.php?action=query&prop=extracts|pageprops&exsentences=1&titles=Steve_Carell
我想使用像 DuckDuckGo
这样的 MediaWiki API 获取维基百科页面的最少信息。例如史蒂夫卡瑞尔:https://duckduckgo.com/?q=steve+carell&t=hp&ia=news&iax=about
如何使用 HTML
格式的维基百科 url(例如 https://en.wikipedia.org/wiki/Steve_Carell)获取此信息?
您可以为此使用 MediaWiki API。有一个扩展程序 TextExtracts,它正是为此而设计的(它安装在维基百科上)。
在你的情况下,例如: https://en.wikipedia.org/w/api.php?action=query&prop=extracts&exsentences=1&titles=Steve%20Carell
会 return 像这样:
<p class=\"mw-empty-elt\">\n</p>\n\n<p class=\"mw-empty-elt\">\n \n</p>\n<p><b>Steven John Carell</b> (<span></span>; born August 16, 1962) is an American actor, comedian, producer, writer and director.</p>
可以自定义APIreturn的句子(或字符)个数,具体请参考API documentation
还有一种方法可以检索保存在维基数据中的简短描述(并且在维基百科的移动视图中可见)。这个电话是: https://en.wikipedia.org/w/api.php?action=query&prop=pageprops&titles=Steve_Carell
此 return 在页面的 pageprops 中有以下 属性:
"wikibase-shortdesc": "American actor"
根据您的用例,这可能更适合。
您甚至可以通过一个合并的请求获得两个结果: https://en.wikipedia.org/w/api.php?action=query&prop=extracts|pageprops&exsentences=1&titles=Steve_Carell