我不能用 Beautiful Soup 抽出时间……为什么?
I can't extract time with Beautiful Soup ...why?
我需要提取日期和时间,但是当我这样做时:
html = BeautifulSoup(htmlText, "html.parser")
contenido = html.find('span', {'id': 'hora'}).getText()
print(contenido)
在输出中不显示任何内容,但没有 "getText()" 输出是
<span id="hora"></span>
没有小时。我能做什么?我正在 Python.
编码
最有可能的时间是用JS插入的。尝试加载整个页面并使用解释器搜索此字符串。如果及时这条线不会 - 那么我是对的。浏览器和脚本通常会以不同的方式查看页面。如果是这样,您可以尝试使用 Ctrl + Chift + U 并在“网络”选项卡中查找时间。如果不存在,则在页面上查找脚本。
在网络 -> XHR 中查找。如果这次还没有请求时间,这次就需要用Selenium来解析了。解析器不支持脚本内部处理。
它与硒一起工作!谢谢 Jrazor!
hora = driver.find_element_by_class_name("segundaLinea").text
现在我可以得到时间了! :)
我需要提取日期和时间,但是当我这样做时:
html = BeautifulSoup(htmlText, "html.parser")
contenido = html.find('span', {'id': 'hora'}).getText()
print(contenido)
在输出中不显示任何内容,但没有 "getText()" 输出是
<span id="hora"></span>
没有小时。我能做什么?我正在 Python.
最有可能的时间是用JS插入的。尝试加载整个页面并使用解释器搜索此字符串。如果及时这条线不会 - 那么我是对的。浏览器和脚本通常会以不同的方式查看页面。如果是这样,您可以尝试使用 Ctrl + Chift + U 并在“网络”选项卡中查找时间。如果不存在,则在页面上查找脚本。
在网络 -> XHR 中查找。如果这次还没有请求时间,这次就需要用Selenium来解析了。解析器不支持脚本内部处理。
它与硒一起工作!谢谢 Jrazor!
hora = driver.find_element_by_class_name("segundaLinea").text
现在我可以得到时间了! :)