美丽的汤。如何获得包含特定单词的 link?
Beautiful Soup. How to get a link containing a specific word?
HTML 包含 div 中的字符串:
- 'div class="slide"''img src="xttps://site.com/files/r_1000,kljg894/43k5j/35h43jkl.jpg''/div'
- 'div class="slide"''img src="xttps://site.com/files/r_2000,kljg894/43k5j/35h43jkl.jpg''/div'
- 'div class="slide"''img src="xttps://site.com/files/r_3000,kljg894/43k5j/35h43jkl.jpg''/div'
需要获取仅包含 "r_3000"
的 link
此代码获取所有 links:
imglink = soup.find_all('img')
print(imglink)
我浏览并尝试了很多技巧。例如:
('img', string="*r_3000*")
、('img', string=re.compile('r_3000')
和 ('img', string=lambda s: 'r_3000' in s)
以及许多其他的,但这一切都不起作用 :(
请帮帮我。
我会先从文档中提取 select,然后使用 Python 进行过滤。例如:
img_links = soup.find_all('img', src=True)
r_3000_links = [ l['src'] for l in img_links if 'r_3000' in l['src'] ]
将 return 包含 'r_3000'
的所有链接的列表
您可以通过多种方式实现 that.Try css 选择器。
from bs4 import BeautifulSoup
html='''<div class="slide"><img src="xttps://site.com/files/r_1000,kljg894/43k5j/35h43jkl.jpg"></div>
<div class="slide"> <img src="xttps://site.com/files/r_2000,kljg894/43k5j/35h43jkl.jpg"></div>
<div class="slide"><img src="xttps://site.com/files/r_3000,kljg894/43k5j/35h43jkl.jpg"></div>'''
soup=BeautifulSoup(html,"html.parser")
for item in soup.select("img[src*='r_3000']"):
print(item['src'])
HTML 包含 div 中的字符串:
- 'div class="slide"''img src="xttps://site.com/files/r_1000,kljg894/43k5j/35h43jkl.jpg''/div'
- 'div class="slide"''img src="xttps://site.com/files/r_2000,kljg894/43k5j/35h43jkl.jpg''/div'
- 'div class="slide"''img src="xttps://site.com/files/r_3000,kljg894/43k5j/35h43jkl.jpg''/div'
需要获取仅包含 "r_3000"
的 link此代码获取所有 links:
imglink = soup.find_all('img')
print(imglink)
我浏览并尝试了很多技巧。例如:
('img', string="*r_3000*")
、('img', string=re.compile('r_3000')
和 ('img', string=lambda s: 'r_3000' in s)
以及许多其他的,但这一切都不起作用 :(
请帮帮我。
我会先从文档中提取 select,然后使用 Python 进行过滤。例如:
img_links = soup.find_all('img', src=True)
r_3000_links = [ l['src'] for l in img_links if 'r_3000' in l['src'] ]
将 return 包含 'r_3000'
您可以通过多种方式实现 that.Try css 选择器。
from bs4 import BeautifulSoup
html='''<div class="slide"><img src="xttps://site.com/files/r_1000,kljg894/43k5j/35h43jkl.jpg"></div>
<div class="slide"> <img src="xttps://site.com/files/r_2000,kljg894/43k5j/35h43jkl.jpg"></div>
<div class="slide"><img src="xttps://site.com/files/r_3000,kljg894/43k5j/35h43jkl.jpg"></div>'''
soup=BeautifulSoup(html,"html.parser")
for item in soup.select("img[src*='r_3000']"):
print(item['src'])