您如何从 bs4 解析的响应中获取指定 html 文本？

Question

我正在使用这段代码来解析一些上下文形式 url:

response = requests.get(url)
cnbeta_article_content = BeautifulSoup(response.content, "html.parser").find("div", {"class": "cnbeta-article-body"})
return cnbeta_article_content.contents

但我需要得到 cnbeta_article_content.contents 是列表的结果。你如何从 url 的 class cnbeta-article-body 得到普通的 html？ cnbeta_article_content.text不是原来的html。

Answer 1

cnbeta_article_content.prettify() 是否呈现您期望的效果？

Answer 2

你得到了 class 的多个结果，所以你必须找出你应该选择哪一个。如果可能，为特定元素使用唯一选择器，或者您可以从当前列表中提取它 (cnbeta_article_content.contents)

转到网站并找出 class 您的元素序列号（我的意思是您得到的多个元素具有相同的 class 那么您期望的元素的位置是什么）提及。你会得到这样的文字

cnbeta_article_content.contents[4].text

这里4是第5个元素（零索引系统）

您如何从 bs4 解析的响应中获取指定 html 文本？

How do you get specify html text from bs4 parsed response?

python

html-parsing