如何从维基百科页面 URL 获取页面标题?
How to get the page title from Wikipedia page URL?
我正在尝试创建一个系统,用户将在其中输入他们的 Wikipedia 页面 link,应用程序将从 Wikipedia 页面 URL.
获取页面标题
比如,如果用户给出:https://id.wikipedia.org/wiki/Eminem
,我想获取页面标题Eminem
。
或者如果用户给出:https://id.wikipedia.org/wiki/Eminem#1992%E2%80%931997:_Awal_karier,_Infinite_dan_masalah_keluarga
,我想要页面标题,即Eminem
我试过寻找 regex 模式。我正在考虑如果我可以创建/找到一个正则表达式模式来查找位于 /wiki/
之间并以 /
结尾的单词会怎样。到目前为止还没有找到任何方法。
那我该怎么办?我还有哪些其他选择?
这会部分起作用:/(?<=https?:\/\/..\.wikipedia\.org\/wiki\/).+(?=\/(.+)?|#)/
但是最后没有 / 就不能工作。
我正在尝试创建一个系统,用户将在其中输入他们的 Wikipedia 页面 link,应用程序将从 Wikipedia 页面 URL.
获取页面标题比如,如果用户给出:https://id.wikipedia.org/wiki/Eminem
,我想获取页面标题Eminem
。
或者如果用户给出:https://id.wikipedia.org/wiki/Eminem#1992%E2%80%931997:_Awal_karier,_Infinite_dan_masalah_keluarga
,我想要页面标题,即Eminem
我试过寻找 regex 模式。我正在考虑如果我可以创建/找到一个正则表达式模式来查找位于 /wiki/
之间并以 /
结尾的单词会怎样。到目前为止还没有找到任何方法。
那我该怎么办?我还有哪些其他选择?
这会部分起作用:/(?<=https?:\/\/..\.wikipedia\.org\/wiki\/).+(?=\/(.+)?|#)/
但是最后没有 / 就不能工作。