如何使用 Selenium Python 在#shadow-root(打开)中提取信息?
How to extract info within a #shadow-root (open) using Selenium Python?
我得到了与在线商店相关的下一个 url https://www.tiendasjumbo.co/buscar?q=mani,但我无法在另一个字段中提取产品标签:
from selenium import webdriver
import time
from random import randint
driver = webdriver.Firefox(executable_path= "C:\Program Files (x86)\geckodriver.exe")
driver.implicitly_wait(10)
time.sleep(4)
url = "https://www.tiendasjumbo.co/buscar?q=mani"
driver.maximize_window()
driver.get(url)
driver.find_element_by_xpath('//h1[@class="impulse-title"]')
我做错了什么,我也试过切换iframe,但是没有办法实现我的目标?欢迎任何帮助。
网站 https://www.tiendasjumbo.co/buscar?q=mani 内的产品位于 #shadow-root (open)
.
内
解决方案
要提取产品标签,您必须使用 and you can use the following :
代码块:
driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
print(item.text)
控制台输出:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
参考资料
您可以在以下位置找到一些相关讨论:
我得到了与在线商店相关的下一个 url https://www.tiendasjumbo.co/buscar?q=mani,但我无法在另一个字段中提取产品标签:
from selenium import webdriver
import time
from random import randint
driver = webdriver.Firefox(executable_path= "C:\Program Files (x86)\geckodriver.exe")
driver.implicitly_wait(10)
time.sleep(4)
url = "https://www.tiendasjumbo.co/buscar?q=mani"
driver.maximize_window()
driver.get(url)
driver.find_element_by_xpath('//h1[@class="impulse-title"]')
我做错了什么,我也试过切换iframe,但是没有办法实现我的目标?欢迎任何帮助。
网站 https://www.tiendasjumbo.co/buscar?q=mani 内的产品位于 #shadow-root (open)
.
解决方案
要提取产品标签,您必须使用
代码块:
driver.get('https://www.tiendasjumbo.co/buscar?q=mani') item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')") print(item.text)
控制台输出:
La especial mezcla de nueces, maní, almendras y marañones x 450 g
参考资料
您可以在以下位置找到一些相关讨论: