Python 使用 beautifulsoup 不带标签打印抓取的数据
Python print scraped data with beautifulsoup without tags
<div class="number" title="Player number">1211</div>
<div class="shirt" title="sName">Ronaldo 1211</div>
我正在抓取一个网站。我已经设法打印出 .这是我的代码:
web = urllib2.urlopen("WEBSITE")
soupit = BeautifulSoup(web, 'html.parser')
scrapeme = soupit.findAll("div", { "class" : "number" })
print scrapeme
打印出来:
<div class="id" title="Player number">1211</div>
我希望它只打印 1211。我该怎么做?
获得元素列表后,scrapeme
,您可以遍历列表中的每个元素并使用以下方法打印其文本属性:
for element in scrapeme:
print(element.text)
由于在您的示例中,抓取仅生成一个包含一个元素的列表 scrapeme
,因此本例中的输出将仅为:
1211
任何 beautifulsoup 对象的 get_ text()
方法正是这样做的。
print(scrapeme.get_text())
<div class="number" title="Player number">1211</div>
<div class="shirt" title="sName">Ronaldo 1211</div>
我正在抓取一个网站。我已经设法打印出 .这是我的代码:
web = urllib2.urlopen("WEBSITE")
soupit = BeautifulSoup(web, 'html.parser')
scrapeme = soupit.findAll("div", { "class" : "number" })
print scrapeme
打印出来:
<div class="id" title="Player number">1211</div>
我希望它只打印 1211。我该怎么做?
获得元素列表后,scrapeme
,您可以遍历列表中的每个元素并使用以下方法打印其文本属性:
for element in scrapeme:
print(element.text)
由于在您的示例中,抓取仅生成一个包含一个元素的列表 scrapeme
,因此本例中的输出将仅为:
1211
任何 beautifulsoup 对象的 get_ text()
方法正是这样做的。
print(scrapeme.get_text())