Python bs4: select 汤中的特定链接
Python bs4: select specific links in soup
我知道之前有人问过类似的问题,但没有采用其他解决方案来产生预期的结果。假设一个 bs4 汤包含许多元素,如下所示:
<a class="employee background-white text-center col-xs-6 col-sm-4 col-md-3" data-cid="74" href="extract_this_link">
<div class="image" style="background-image: url(xxx.jpg) !important">
<div class="overlay flex center">
<div class="background">
</div>
</div>
</div>
<div class="bubble-description">
<p>
<b>
content1
</b>
<br/>
content2
</p>
</div>
</a>
<a class="hidden" href="link1">
</a>
<a class="hidden" href="link2">
</a>
<a class="hidden" href="link3">
</a>
如何提取汤中所有元素的第一行 (href="extract_this_link") 中的 link 并将它们存储在列表中?
非常感谢任何帮助!
goal = [x['href'] for x in soup.select_one('.employee')]
我知道之前有人问过类似的问题,但没有采用其他解决方案来产生预期的结果。假设一个 bs4 汤包含许多元素,如下所示:
<a class="employee background-white text-center col-xs-6 col-sm-4 col-md-3" data-cid="74" href="extract_this_link">
<div class="image" style="background-image: url(xxx.jpg) !important">
<div class="overlay flex center">
<div class="background">
</div>
</div>
</div>
<div class="bubble-description">
<p>
<b>
content1
</b>
<br/>
content2
</p>
</div>
</a>
<a class="hidden" href="link1">
</a>
<a class="hidden" href="link2">
</a>
<a class="hidden" href="link3">
</a>
如何提取汤中所有元素的第一行 (href="extract_this_link") 中的 link 并将它们存储在列表中?
非常感谢任何帮助!
goal = [x['href'] for x in soup.select_one('.employee')]