我不能用 Beautiful Soup 抽出时间……为什么？

Question

我需要提取日期和时间，但是当我这样做时：

html = BeautifulSoup(htmlText, "html.parser")

contenido = html.find('span', {'id': 'hora'}).getText()

print(contenido)

在输出中不显示任何内容，但没有 "getText()" 输出是 <span id="hora"></span> 没有小时。我能做什么？我正在 Python.

编码

Answer 1

最有可能的时间是用JS插入的。尝试加载整个页面并使用解释器搜索此字符串。如果及时这条线不会 - 那么我是对的。浏览器和脚本通常会以不同的方式查看页面。如果是这样，您可以尝试使用 Ctrl + Chift + U 并在“网络”选项卡中查找时间。如果不存在，则在页面上查找脚本。

在网络 -> XHR 中查找。如果这次还没有请求时间，这次就需要用Selenium来解析了。解析器不支持脚本内部处理。

Answer 2

它与硒一起工作！谢谢 Jrazor！

hora = driver.find_element_by_class_name("segundaLinea").text

现在我可以得到时间了！ :)

I can't extract time with Beautiful Soup ...why?