BS4:删除 <a> 标签
BS4: removing <a> tags
我正在使用 BeautifulSoup 4,我有以下 HTML:
<tr>
<td>London <a href="/company/mcrt/5" target="_blank">10 vol</a> 54 page</td>
</tr>
我试图只删除 "a" 标签并保留文本,如下所示:
<tr>
<td>London 10 vol 54 page</td>
</tr>
有什么办法可以用 bs4 做到吗?
您正在搜索 .unwrap()
方法:
txt = '''<tr>
<td>London <a href="/company/mcrt/5" target="_blank">10 vol</a> 54 page</td>
</tr>'''
from bs4 import BeautifulSoup
soup = BeautifulSoup(txt, 'html.parser')
soup.a.unwrap()
print(soup)
打印:
<tr>
<td>London 10 vol 54 page</td>
</tr>
我正在使用 BeautifulSoup 4,我有以下 HTML:
<tr>
<td>London <a href="/company/mcrt/5" target="_blank">10 vol</a> 54 page</td>
</tr>
我试图只删除 "a" 标签并保留文本,如下所示:
<tr>
<td>London 10 vol 54 page</td>
</tr>
有什么办法可以用 bs4 做到吗?
您正在搜索 .unwrap()
方法:
txt = '''<tr>
<td>London <a href="/company/mcrt/5" target="_blank">10 vol</a> 54 page</td>
</tr>'''
from bs4 import BeautifulSoup
soup = BeautifulSoup(txt, 'html.parser')
soup.a.unwrap()
print(soup)
打印:
<tr>
<td>London 10 vol 54 page</td>
</tr>