我正在使用 BeautifulSoup 并且我想获取 img 标签的 alt 值
I am using BeautifulSoup and i want to get img tag's alt value
我想得到一支棒球队今天比赛的对手球队。
所以我编码了这个。
此代码从网站获取今天的比赛信息。
from bs4 import BeautifulSoup
import datetime
import urllib.request
req = urllib.request.Request("http://www.hanwhaeagles.co.kr/html/game/1st_schedule_list1.asp")
data = urllib.request.urlopen(req).read()
bs = BeautifulSoup(data, 'html.parser')
l = bs.find_all('div')
idx = 0
for s in l:
try:
prop = s.get('class')
if prop != None and prop[0] == "box" and len(prop) == 2:
l = s
break
except UnicodeEncodeError:
print("Error")
finally:
idx += 1
print(l)
和'variable l'是今天的比赛信息
img 标签的 alt 值是对方球队的球队名称。
我要打印...帮帮我
因为您对 box
class 中存在的数据更感兴趣。您可以直接提取 class 并进一步处理它:
from bs4 import BeautifulSoup
import datetime
import urllib.request
req = urllib.request.Request("http://www.hanwhaeagles.co.kr/html/game/1st_schedule_list1.asp")
data = urllib.request.urlopen(req).read()
bs = BeautifulSoup(data, 'html.parser')
for item in bs.select('.box'):
team_name = item.find('img')['alt']
print(team_name)
'NC'
'NC'
...
from bs4 import BeautifulSoup
import urllib.request
req = urllib.request.Request("http://www.hanwhaeagles.co.kr/html/game/1st_schedule_list1.asp")
data = urllib.request.urlopen(req).read()
bs = BeautifulSoup(data, 'html.parser')
table = bs.find('table')
for tr in table.find_all('tr'):
for td in tr.find_all('td'):
if td.find('img'):
if 'alt' in td.find('img').attrs:
print(td.find('img')['alt'])
输出:
NC
NC
NC
KIA
KIA
KIA
두산
두산
삼성
삼성
넥센
넥센
SK
SK
NC
NC
롯데
롯데
KT
KT
KIA
KIA
SK
SK
LG
LG
KT
我想得到一支棒球队今天比赛的对手球队。
所以我编码了这个。
此代码从网站获取今天的比赛信息。
from bs4 import BeautifulSoup
import datetime
import urllib.request
req = urllib.request.Request("http://www.hanwhaeagles.co.kr/html/game/1st_schedule_list1.asp")
data = urllib.request.urlopen(req).read()
bs = BeautifulSoup(data, 'html.parser')
l = bs.find_all('div')
idx = 0
for s in l:
try:
prop = s.get('class')
if prop != None and prop[0] == "box" and len(prop) == 2:
l = s
break
except UnicodeEncodeError:
print("Error")
finally:
idx += 1
print(l)
和'variable l'是今天的比赛信息
img 标签的 alt 值是对方球队的球队名称。
我要打印...帮帮我
因为您对 box
class 中存在的数据更感兴趣。您可以直接提取 class 并进一步处理它:
from bs4 import BeautifulSoup
import datetime
import urllib.request
req = urllib.request.Request("http://www.hanwhaeagles.co.kr/html/game/1st_schedule_list1.asp")
data = urllib.request.urlopen(req).read()
bs = BeautifulSoup(data, 'html.parser')
for item in bs.select('.box'):
team_name = item.find('img')['alt']
print(team_name)
'NC'
'NC'
...
from bs4 import BeautifulSoup
import urllib.request
req = urllib.request.Request("http://www.hanwhaeagles.co.kr/html/game/1st_schedule_list1.asp")
data = urllib.request.urlopen(req).read()
bs = BeautifulSoup(data, 'html.parser')
table = bs.find('table')
for tr in table.find_all('tr'):
for td in tr.find_all('td'):
if td.find('img'):
if 'alt' in td.find('img').attrs:
print(td.find('img')['alt'])
输出:
NC
NC
NC
KIA
KIA
KIA
두산
두산
삼성
삼성
넥센
넥센
SK
SK
NC
NC
롯데
롯데
KT
KT
KIA
KIA
SK
SK
LG
LG
KT