Python abcd="_blank"> 和 </a> 之间的正则表达式匹配字符串
Python Regex matching string between abcd="_blank"> and </a>
如何在 Python 2.7 中使用 Regex 匹配 abcd="_blank">
和 </a>
之间的字符串。
例如 abcd="_blank">ABBA</a>
结果应该是 ABBA
.
如何使用 HTML 解析器,例如,BeautifulSoup
:
from bs4 import BeautifulSoup
data = """
<div>
<a xyz="_blank">NO MATCH 1</a>
<a abcd="_blank">ABBA</a>
<a>NO MATCH 2</a>
</div>
"""
soup = BeautifulSoup(data)
for a in soup.find_all('a', abcd='_blank'):
print(a.text)
打印 ABBA
.
如何在 Python 2.7 中使用 Regex 匹配 abcd="_blank">
和 </a>
之间的字符串。
例如 abcd="_blank">ABBA</a>
结果应该是 ABBA
.
如何使用 HTML 解析器,例如,BeautifulSoup
:
from bs4 import BeautifulSoup
data = """
<div>
<a xyz="_blank">NO MATCH 1</a>
<a abcd="_blank">ABBA</a>
<a>NO MATCH 2</a>
</div>
"""
soup = BeautifulSoup(data)
for a in soup.find_all('a', abcd='_blank'):
print(a.text)
打印 ABBA
.