使用 python 解析推特 url
Using python to parse twitter url
我正在使用以下代码,但我无法从 url.
中提取任何信息
from urllib.parse import urlparse
if __name__ == "__main__":
z = 5
url = 'https://twitter.com/isro/status/1170331318132957184'
df = urlparse(url)
print(df)
ParseResult(scheme='https', netloc='twitter.com', path='/isro/status/1170331318132957184', params='', query='', fragment='')
我希望从 link 中提取推文消息、推文时间和其他可用信息,但上面的代码显然无法实现。我该如何从这里开始?
print(df)
ParseResult(scheme='https', netloc='twitter.com', path='/isro/status/1170331318132957184', params='', query='', fragment='')
我认为您可能误解了 urllib parseurl 函数的用途。来自 Python 文档:
urllib.parse.urlparse(urlstring, scheme='', allow_fragments=True)
Parse a URL into six components, returning a 6-item named tuple. This
corresponds to the general structure of a URL:
scheme://netloc/path;parameters?query#fragment
从您在 ParseResult 中看到的结果来看,您的代码运行完美 - 它将您的 URL 分解为组件部分。
听起来好像您真的想获取 URL 处的网络内容。在那种情况下,我可能会看看 urllib.request.urlopen。
我正在使用以下代码,但我无法从 url.
中提取任何信息from urllib.parse import urlparse
if __name__ == "__main__":
z = 5
url = 'https://twitter.com/isro/status/1170331318132957184'
df = urlparse(url)
print(df)
ParseResult(scheme='https', netloc='twitter.com', path='/isro/status/1170331318132957184', params='', query='', fragment='')
我希望从 link 中提取推文消息、推文时间和其他可用信息,但上面的代码显然无法实现。我该如何从这里开始?
print(df)
ParseResult(scheme='https', netloc='twitter.com', path='/isro/status/1170331318132957184', params='', query='', fragment='')
我认为您可能误解了 urllib parseurl 函数的用途。来自 Python 文档:
urllib.parse.urlparse(urlstring, scheme='', allow_fragments=True)
Parse a URL into six components, returning a 6-item named tuple. This corresponds to the general structure of a URL: scheme://netloc/path;parameters?query#fragment
从您在 ParseResult 中看到的结果来看,您的代码运行完美 - 它将您的 URL 分解为组件部分。
听起来好像您真的想获取 URL 处的网络内容。在那种情况下,我可能会看看 urllib.request.urlopen。