硒 GDPR NoSuchElementException

Selenium GDPR NoSuchElementException

我想从“https://www.techadvisor.co.uk/review/wearable-tech/”抓取一些数据。我发现用 Beautifulsoup 循环浏览页面是行不通的。这就是我尝试用硒打开它的原因。无法找到克服 GDPR 拦截器的“全部接受”按钮。

我试过了:

browser = webdriver.Chrome()
browser.get("https://www.techadvisor.co.uk/review/wearable-tech/")
# button = browser.find_element_by_xpath('/html/body/div/div[3]/div[5]/button[2]')
# WebDriverWait(browser, 20).until(EC.element_to_be_clickable((By.XPATH, "html/body/div/div[3]/div[5]/button[2]"))).click()

我总是收到 NoSuchElementException

老实说,我发现 Xpath 真的很奇怪,但我是从 Google Chrome 检查中得到的。

感谢每个解决方案建议或提示:)

要单击 iframe 内的 Accept All 按钮。您需要先切换到 iframe 才能单击该按钮。

诱导 WebDriverWait() 并等待 frame_to_be_available_and_switch_to_it() 并使用以下 css 选择器。

Induce WebDriverWait() 并等待 element_to_be_clickable() 并使用以下 xpath 选择器。

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

browser = webdriver.Chrome()
browser.get("https://www.techadvisor.co.uk/review/wearable-tech/")
WebDriverWait(browser,10).until(EC.frame_to_be_available_and_switch_to_it((By.CSS_SELECTOR,"iframe[id^='sp_message_iframe']")))
WebDriverWait(browser, 10).until(EC.element_to_be_clickable((By.XPATH, "//button[text()='Accept All']"))).click()

我知道这个问题很老了, 但我想提供我自己的解决方案! 第一步是识别你实际查看的表单的“id”,然后你需要将焦点移到它上面!

driver.switch_to_frame(driver.find_element_by_xpath('//*[@id="gdpr-consent-notice"]'))

    cookies = driver.find_element_by_xpath('/html/body/app-root/app-theme/div/div/app-notice/app-theme/div/div/app-home/div/div[3]/div[2]/a[3]/span')

    cookies.click()