如何使用 selenium 获取页面 html 代码？

Question

我正在尝试使用 selenium 解析 cloudflare 网站。我可以在页面上找到单个元素，但我没有找到如何获取页面的整个代码。

options = webdriver.ChromeOptions()
options.add_argument('user-agent=')
options.add_argument('--disable-blink-features=AutomationControlled')

s = Service(executable_path='')
driver = webdriver.Chrome(service=s, options=options)

try:
    driver.get('https://mangalib.me/manga-list')
    time.sleep(10)
    print(driver.find_element_by_xpath(''))
except Exception as ex:
    print(ex)
finally:
    driver.close()
    driver.quit()

Answer 1

获取您刚才做的全部源代码：

driver.get('https://mangalib.me/manga-list')
html = browser.page_source

然后你可以用它做任何你想做的事

Answer 2

在 webdriver 接口 "getpagesource()" 中有一个方法。在我提到的这个代码片段下面。它将为您提供网页的总html代码。

public void getPgSource() {
    WebDriverManager.chromedriver().setup();
    ChromeDriver driver = new ChromeDriver();
    driver.get("https://www.tutorialspoint.com/java/java_basic_syntax.htm");
    String s = driver.getPageSource();
    System.out.println(s);
}

此方法returns字符串数据类型，因此您可以相应地使用。

如何使用 selenium 获取页面 html 代码？

How to get page html code using selenium?

python

selenium

cloudflare