如何使用 BeautifulSoup bs4 获取 HTML 标签的内部文本值?
How to get inner text value of an HTML tag with BeautifulSoup bs4?
当使用 BeautifulSoup bs4 时,如何从 HTML 标签中获取文本?当我 运行 这一行时:
oname = soup.find("title")
我得到的 title
标签是这样的:
<title>page name</title>
现在我只想获取它的内部文本,page name
,没有标签。怎么做?
使用 .text 从标签中获取文本。
oname = soup.find("title")
oname.text
或者只是 soup.title.text
In [4]: from bs4 import BeautifulSoup
In [5]: import requests
In [6]: r = requests.get("")
In [7]: BeautifulSoup(r.content).title.text
Out[7]: u'html - How to Retrieve information inside a tag with python - Stack Overflow'
要打开文件并使用文本作为名称,只需像使用任何其他字符串一样使用它:
with open(oname.text, 'w') as f
当使用 BeautifulSoup bs4 时,如何从 HTML 标签中获取文本?当我 运行 这一行时:
oname = soup.find("title")
我得到的 title
标签是这样的:
<title>page name</title>
现在我只想获取它的内部文本,page name
,没有标签。怎么做?
使用 .text 从标签中获取文本。
oname = soup.find("title")
oname.text
或者只是 soup.title.text
In [4]: from bs4 import BeautifulSoup
In [5]: import requests
In [6]: r = requests.get("")
In [7]: BeautifulSoup(r.content).title.text
Out[7]: u'html - How to Retrieve information inside a tag with python - Stack Overflow'
要打开文件并使用文本作为名称,只需像使用任何其他字符串一样使用它:
with open(oname.text, 'w') as f