如何提取此 span 标记中括号内的数字?
How can I extract the number within the parenthesis in this span tag?
我正在尝试获取下面标记中的值。更具体地说,我想要括号之间的数字。
<span class="bv-rating-label bv-text-link"> (12) </span>
我的脚本中没有返回正确响应的行:
'reviews' : item.find('span', {'class': 'bv-rating-label bv-text-link'}).text
我也试过了
'reviews' : int(item.find('span', {'class': 'bv-rating-label bv-text-link'}).text)
感谢任何指导!
import bs4
import re
'reviews' : item.find('span', {'class': 'bv-rating-label bv-text-link'}).text
for item in items:
print(re.sub(r" ?\([^)]+\)", "", item))
正则表达式来拯救。
import re
string_='<span class="bv-rating-label bv-text-link"> (12) </span>'
num = int(re.search(r'>\s*\((\d+)\)\s*</span>', string_)[1])
num
包含整数格式的所需数字
要仅过滤数字并删除括号,您可以使用 .isdigit()
方法。
result = ''.join(
tag for tag in soup.find('span', class_='bv-rating-label bv-text link').text
if tag.isdigit()
)
>>> print(result)
12
我正在尝试获取下面标记中的值。更具体地说,我想要括号之间的数字。
<span class="bv-rating-label bv-text-link"> (12) </span>
我的脚本中没有返回正确响应的行:
'reviews' : item.find('span', {'class': 'bv-rating-label bv-text-link'}).text
我也试过了
'reviews' : int(item.find('span', {'class': 'bv-rating-label bv-text-link'}).text)
感谢任何指导!
import bs4
import re
'reviews' : item.find('span', {'class': 'bv-rating-label bv-text-link'}).text
for item in items:
print(re.sub(r" ?\([^)]+\)", "", item))
正则表达式来拯救。
import re
string_='<span class="bv-rating-label bv-text-link"> (12) </span>'
num = int(re.search(r'>\s*\((\d+)\)\s*</span>', string_)[1])
num
包含整数格式的所需数字
要仅过滤数字并删除括号,您可以使用 .isdigit()
方法。
result = ''.join(
tag for tag in soup.find('span', class_='bv-rating-label bv-text link').text
if tag.isdigit()
)
>>> print(result)
12