Python 使用 beautifulsoup 不带标签打印抓取的数据

Question

<div class="number" title="Player number">1211</div>
<div class="shirt" title="sName">Ronaldo 1211</div>

我正在抓取一个网站。我已经设法打印出 .这是我的代码：

web = urllib2.urlopen("WEBSITE")
soupit = BeautifulSoup(web, 'html.parser')
scrapeme = soupit.findAll("div", { "class" : "number" })
print scrapeme

打印出来：

<div class="id" title="Player number">1211</div>

我希望它只打印 1211。我该怎么做？

Answer 1

获得元素列表后，scrapeme，您可以遍历列表中的每个元素并使用以下方法打印其文本属性：

for element in scrapeme:
    print(element.text)

由于在您的示例中，抓取仅生成一个包含一个元素的列表 scrapeme，因此本例中的输出将仅为：

Answer 2

任何 beautifulsoup 对象的 get_ text() 方法正是这样做的。

print(scrapeme.get_text())

Python print scraped data with beautifulsoup without tags