使用 BeautifulSoup 删除 del 标签
remove del tag with BeautifulSoup
我对 BeautifulSoup 和 Python3 有一些愚蠢的问题。这是我的 HTML :
<span id="gaixm--1521602--15686128--ADHP.GEO_LONG" Visibility="None">
<del class="cellChanged NO_REVISION_MARK AmdtDeletedAIRAC" title="Date d'entrée en vigueur: 17 SEP 2015. " id="geaip_4b6c6e3f-9841-400c-9359-6ae9b334448d">001°49'57"E</del>
<ins class="cellChanged AmdtInsertedAIRAC" title="Date d'entrée en vigueur: 17 SEP 2015. " id="geaip_311221e8-2de7-4fce-b261-e0e9fb988238">001°49'52"E</ins>
</span>
我想删除所有的 del 标签。但是当我这样做时:
soup = BeautifulSoup(html, 'lxml')
soup.del.decompose()
tbody_tag = soup.table.tbody
print(tbody_tag)
我有一个错误(这很正常,删除它是一个 python 名称..):
File "algo.py", line 52
soup.del.decompose()
^
SyntaxError: invalid syntax.
所以...我该怎么做?
感谢您的帮助!
您可以使用 findAll 函数,然后删除所有结果
for d in soup.findAll('del'):
d.decompose()
我对 BeautifulSoup 和 Python3 有一些愚蠢的问题。这是我的 HTML :
<span id="gaixm--1521602--15686128--ADHP.GEO_LONG" Visibility="None">
<del class="cellChanged NO_REVISION_MARK AmdtDeletedAIRAC" title="Date d'entrée en vigueur: 17 SEP 2015. " id="geaip_4b6c6e3f-9841-400c-9359-6ae9b334448d">001°49'57"E</del>
<ins class="cellChanged AmdtInsertedAIRAC" title="Date d'entrée en vigueur: 17 SEP 2015. " id="geaip_311221e8-2de7-4fce-b261-e0e9fb988238">001°49'52"E</ins>
</span>
我想删除所有的 del 标签。但是当我这样做时:
soup = BeautifulSoup(html, 'lxml')
soup.del.decompose()
tbody_tag = soup.table.tbody
print(tbody_tag)
我有一个错误(这很正常,删除它是一个 python 名称..):
File "algo.py", line 52
soup.del.decompose()
^
SyntaxError: invalid syntax.
所以...我该怎么做?
感谢您的帮助!
您可以使用 findAll 函数,然后删除所有结果
for d in soup.findAll('del'):
d.decompose()