BS4:删除 <a> 标签

BS4: removing <a> tags

我正在使用 BeautifulSoup 4,我有以下 HTML:

<tr>
  <td>London <a href="/company/mcrt/5" target="_blank">10 vol</a> 54 page</td>
</tr>

我试图只删除 "a" 标签并保留文本,如下所示:

<tr>
  <td>London 10 vol 54 page</td>
</tr>

有什么办法可以用 bs4 做到吗?

您正在搜索 .unwrap() 方法:

txt = '''<tr>
  <td>London <a href="/company/mcrt/5" target="_blank">10 vol</a> 54 page</td>
</tr>'''

from bs4 import BeautifulSoup

soup = BeautifulSoup(txt, 'html.parser')

soup.a.unwrap()

print(soup)

打印:

<tr>
<td>London 10 vol 54 page</td>
</tr>