Python - 将 url 拆分为其组件
Python - Split url into its components
我有一长串 url 都是这样的:
http://www.example.com/site/section1/VAR1/VAR2
其中 VAR1 和 VAR2 是 url 的动态元素。我想要做的是从这个 url 字符串中仅提取 VAR1。我尝试使用 urlparse 但输出如下所示:
ParseResult(scheme='http', netloc='www.example.com', path='/site/section1/VAR1/VAR2', params='', query='', fragment='')
或者,您可以应用 split()
方法:
>>> url = "http://www.example.com/site/section1/VAR1/VAR2"
>>> url.split("/")[-2:]
['VAR1', 'VAR2']
你可以记住这个。 url 的不同部分可以使用 urlparse
获得。这里可以通过urlparse(url).path
得到path
,然后通过split()
函数
得到想要的变量
>>> from urlparse import urlparse
>>> url = 'http://www.example.com/site/section1/VAR1/VAR2'
>>> urlparse(url)
ParseResult(scheme='http', netloc='www.example.com', path='/site/section1/VAR1/VAR2', params='', query='', fragment='')
>>> urlparse(url).path
'/site/section1/VAR1/VAR2'
>>> urlparse(url).path.split('/')[-2]
'VAR1'
我会尝试
url = 'http://www.example.com/site/section1/VAR1/VAR2'
var1 = url.split('/')[-2]
检查这个,它非常有效,因为它从带有 maxsplit 选项的字符串末尾开始,我们可以停止拆分次数。
最后你可以使用索引来获取 url
的最后两部分
>>> url.rsplit('/',2)[1:]
['VAR1', 'VAR2']
我有一长串 url 都是这样的:
http://www.example.com/site/section1/VAR1/VAR2
其中 VAR1 和 VAR2 是 url 的动态元素。我想要做的是从这个 url 字符串中仅提取 VAR1。我尝试使用 urlparse 但输出如下所示:
ParseResult(scheme='http', netloc='www.example.com', path='/site/section1/VAR1/VAR2', params='', query='', fragment='')
或者,您可以应用 split()
方法:
>>> url = "http://www.example.com/site/section1/VAR1/VAR2"
>>> url.split("/")[-2:]
['VAR1', 'VAR2']
你可以记住这个。 url 的不同部分可以使用 urlparse
获得。这里可以通过urlparse(url).path
得到path
,然后通过split()
函数
>>> from urlparse import urlparse
>>> url = 'http://www.example.com/site/section1/VAR1/VAR2'
>>> urlparse(url)
ParseResult(scheme='http', netloc='www.example.com', path='/site/section1/VAR1/VAR2', params='', query='', fragment='')
>>> urlparse(url).path
'/site/section1/VAR1/VAR2'
>>> urlparse(url).path.split('/')[-2]
'VAR1'
我会尝试
url = 'http://www.example.com/site/section1/VAR1/VAR2'
var1 = url.split('/')[-2]
检查这个,它非常有效,因为它从带有 maxsplit 选项的字符串末尾开始,我们可以停止拆分次数。
最后你可以使用索引来获取 url
的最后两部分>>> url.rsplit('/',2)[1:]
['VAR1', 'VAR2']