网络抓取中的间距
Spacing in web scraping
我有以下 html 代码,我在 python 中用 BS 提取文本“蛋白质家族分类”。
<h1 class="item-title__primary">
Classification of protein families
但是,当我将数据导出到 excel 文件时,文本中有很多空格。我怎样才能克服这个问题?谢谢你。
网页抓取代码:
titles.append(soup.find('h1',class_='item-title__primary').text)
e = " word "
print(e.strip())
# "word"
e = "word and word 2"
print(e.replace(" ", " "))
# word and word 2
我有以下 html 代码,我在 python 中用 BS 提取文本“蛋白质家族分类”。
<h1 class="item-title__primary">
Classification of protein families
但是,当我将数据导出到 excel 文件时,文本中有很多空格。我怎样才能克服这个问题?谢谢你。
网页抓取代码:
titles.append(soup.find('h1',class_='item-title__primary').text)
e = " word "
print(e.strip())
# "word"
e = "word and word 2"
print(e.replace(" ", " "))
# word and word 2