如何使用 selenium 获取页面 html 代码?
How to get page html code using selenium?
我正在尝试使用 selenium 解析 cloudflare 网站。我可以在页面上找到单个元素,但我没有找到如何获取页面的整个代码。
options = webdriver.ChromeOptions()
options.add_argument('user-agent=')
options.add_argument('--disable-blink-features=AutomationControlled')
s = Service(executable_path='')
driver = webdriver.Chrome(service=s, options=options)
try:
driver.get('https://mangalib.me/manga-list')
time.sleep(10)
print(driver.find_element_by_xpath(''))
except Exception as ex:
print(ex)
finally:
driver.close()
driver.quit()
获取您刚才做的全部源代码:
driver.get('https://mangalib.me/manga-list')
html = browser.page_source
然后你可以用它做任何你想做的事
在 webdriver 接口 "getpagesource()" 中有一个方法。
在我提到的这个代码片段下面。它将为您提供网页的总html代码。
public void getPgSource() {
WebDriverManager.chromedriver().setup();
ChromeDriver driver = new ChromeDriver();
driver.get("https://www.tutorialspoint.com/java/java_basic_syntax.htm");
String s = driver.getPageSource();
System.out.println(s);
}
此方法returns字符串数据类型,因此您可以相应地使用。
我正在尝试使用 selenium 解析 cloudflare 网站。我可以在页面上找到单个元素,但我没有找到如何获取页面的整个代码。
options = webdriver.ChromeOptions()
options.add_argument('user-agent=')
options.add_argument('--disable-blink-features=AutomationControlled')
s = Service(executable_path='')
driver = webdriver.Chrome(service=s, options=options)
try:
driver.get('https://mangalib.me/manga-list')
time.sleep(10)
print(driver.find_element_by_xpath(''))
except Exception as ex:
print(ex)
finally:
driver.close()
driver.quit()
获取您刚才做的全部源代码:
driver.get('https://mangalib.me/manga-list')
html = browser.page_source
然后你可以用它做任何你想做的事
在 webdriver 接口 "getpagesource()" 中有一个方法。 在我提到的这个代码片段下面。它将为您提供网页的总html代码。
public void getPgSource() {
WebDriverManager.chromedriver().setup();
ChromeDriver driver = new ChromeDriver();
driver.get("https://www.tutorialspoint.com/java/java_basic_syntax.htm");
String s = driver.getPageSource();
System.out.println(s);
}
此方法returns字符串数据类型,因此您可以相应地使用。