您如何从 bs4 解析的响应中获取指定 html 文本?
How do you get specify html text from bs4 parsed response?
我正在使用这段代码来解析一些上下文形式 url:
response = requests.get(url)
cnbeta_article_content = BeautifulSoup(response.content, "html.parser").find("div", {"class": "cnbeta-article-body"})
return cnbeta_article_content.contents
但我需要得到 cnbeta_article_content.contents 是列表的结果。你如何从 url 的 class cnbeta-article-body
得到普通的 html? cnbeta_article_content.text
不是原来的html。
cnbeta_article_content.prettify() 是否呈现您期望的效果?
你得到了 class 的多个结果,所以你必须找出你应该选择哪一个。如果可能,为特定元素使用唯一选择器,或者您可以从当前列表中提取它 (cnbeta_article_content.contents)
转到网站并找出 class 您的元素序列号(我的意思是您得到的多个元素具有相同的 class 那么您期望的元素的位置是什么)提及。你会得到这样的文字
cnbeta_article_content.contents[4].text
这里4是第5个元素(零索引系统)
我正在使用这段代码来解析一些上下文形式 url:
response = requests.get(url)
cnbeta_article_content = BeautifulSoup(response.content, "html.parser").find("div", {"class": "cnbeta-article-body"})
return cnbeta_article_content.contents
但我需要得到 cnbeta_article_content.contents 是列表的结果。你如何从 url 的 class cnbeta-article-body
得到普通的 html? cnbeta_article_content.text
不是原来的html。
cnbeta_article_content.prettify() 是否呈现您期望的效果?
你得到了 class 的多个结果,所以你必须找出你应该选择哪一个。如果可能,为特定元素使用唯一选择器,或者您可以从当前列表中提取它 (cnbeta_article_content.contents)
转到网站并找出 class 您的元素序列号(我的意思是您得到的多个元素具有相同的 class 那么您期望的元素的位置是什么)提及。你会得到这样的文字
cnbeta_article_content.contents[4].text
这里4是第5个元素(零索引系统)