如何在 HTML 元素中获取项目
How to get an item inside an HTML Element
我正在用美汤采集HTML的数据。
我需要帮助来获取里面的数据'class': 'Profile-userFullName-_EP'
这是我从当前 HTML 中获取 First Last name
的尝试。
import requests
from requests_html import HTMLSession
from bs4 import BeautifulSoup
url ='https://www.website.com'
r= requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
name = soup.find_all('h1', {'class': 'Profile-userFullName-_EP'})
print(name)
我当前的输出是:
[<h1 class="Profile-userFullName-_EP">First Last name</h1>]
打印名称时我需要的输出是:
First Last name
soup.find_all()
returns 一个数组,因此 name
是一个数组。
要获取 name
数组中第一个元素的 innerHTML,您可以这样做:
innerHTML= name[0].decode_contents()
print(innerHTML)
应该打印:
First Last name
我正在用美汤采集HTML的数据。
我需要帮助来获取里面的数据'class': 'Profile-userFullName-_EP'
这是我从当前 HTML 中获取 First Last name
的尝试。
import requests
from requests_html import HTMLSession
from bs4 import BeautifulSoup
url ='https://www.website.com'
r= requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
name = soup.find_all('h1', {'class': 'Profile-userFullName-_EP'})
print(name)
我当前的输出是:
[<h1 class="Profile-userFullName-_EP">First Last name</h1>]
打印名称时我需要的输出是:
First Last name
soup.find_all()
returns 一个数组,因此 name
是一个数组。
要获取 name
数组中第一个元素的 innerHTML,您可以这样做:
innerHTML= name[0].decode_contents()
print(innerHTML)
应该打印:
First Last name