如何在没有 class 的对象上使用 bs4 中的 find_all 方法
How to use find_all method in bs4 on an object without class
import requests
from bs4 import BeautifulSoup
result=requests.get('http://textfiles.com/stories/').text
soup=BeautifulSoup (result, 'lxml')
stories=soup.find_all('tr')
print (stories)
find
方法有效,但 find_all
无效 我不确定为什么可能是因为它没有 class?
正确的代码是
import requests
from bs4 import BeautifulSoup
result=requests.get('http://textfiles.com/stories/')
soup = BeautifulSoup(result.content, 'html5lib')
stories=soup.find_all('tr')
您可以通过
访问每个'tr'
stories[0]
0可以替换为列表中的任意数字
您也可以使用 Pandas
例如
import pandas
import requests
from bs4 import BeautifulSoup
result=requests.get('http://textfiles.com/stories/')
soup = BeautifulSoup(result.content, 'html5lib')
df=pandas.read_html(soup.prettify())
print(df)
import requests
from bs4 import BeautifulSoup
result=requests.get('http://textfiles.com/stories/').text
soup=BeautifulSoup (result, 'lxml')
stories=soup.find_all('tr')
print (stories)
find
方法有效,但 find_all
无效 我不确定为什么可能是因为它没有 class?
正确的代码是
import requests
from bs4 import BeautifulSoup
result=requests.get('http://textfiles.com/stories/')
soup = BeautifulSoup(result.content, 'html5lib')
stories=soup.find_all('tr')
您可以通过
访问每个'tr'stories[0]
0可以替换为列表中的任意数字 您也可以使用 Pandas 例如
import pandas
import requests
from bs4 import BeautifulSoup
result=requests.get('http://textfiles.com/stories/')
soup = BeautifulSoup(result.content, 'html5lib')
df=pandas.read_html(soup.prettify())
print(df)