BeautifulSoup 个连续块

BeautifulSoup consecutive blocks

我正在使用 BeautifulSoup 来解析我抓取的 html 数据, 我正在看的模式是

<div>
....
</div>
<p>
...
</p>

我关心的内容总是包含在 div 后跟一个 p 子句。当然在html中还有其他独立的divp标签,但是p 后跟 div 是我想要的独特模式

帮助知道如何在beautifulSoup中实现查询连续标签非常感谢

有相关的.next_sibling, .next_siblings, .find_next_sibling() and .find_next_siblings()方法可以帮助您找到divp兄弟姐妹:

div = soup.find("div", id="test")
p = div.find_next_sibling("p") 

您还可以使用 "adjacent" CSS selector:

soup.select("div#test + p")