Selenium 网页抓取信息到列表中
Selenium web scraping information into a list
我想从以下网站抓取 ISBN 编号 link:http://bookscouter.com/tools/recent.php
我想从列表中每本书的粗体纯文本中抓取 ISBN 编号,并将它们全部放入一个数组中。我打算通过使用 xPath 来做到这一点,但那是我有点卡住的地方。由于我是 selenium w/Java 的新手,所以我很难理解如何让整个过程正常工作。我知道每本书的每个 ISBN 编号都位于一个名为 "recent-table" 的 table class 中,但我并不完全熟悉如何从那里开始。任何指导将不胜感激。谢谢
假设您想要包含 ISBN 的文本
以下代码将等待 10 秒以加载所有元素和 return 列表。之后打印所有元素的文本。
By byXpath = By.xpath("//strong[contains(text(),'ISBN')]");
List<WebElement> iSBNList = (new WebDriverWait(driver , 10).until(ExpectedConditions.presenceOfAllElementsLocatedBy(byXpath)));
for (WebElement element :iSBNList){
System.out.println(element.getText());
}
我想从以下网站抓取 ISBN 编号 link:http://bookscouter.com/tools/recent.php
我想从列表中每本书的粗体纯文本中抓取 ISBN 编号,并将它们全部放入一个数组中。我打算通过使用 xPath 来做到这一点,但那是我有点卡住的地方。由于我是 selenium w/Java 的新手,所以我很难理解如何让整个过程正常工作。我知道每本书的每个 ISBN 编号都位于一个名为 "recent-table" 的 table class 中,但我并不完全熟悉如何从那里开始。任何指导将不胜感激。谢谢
假设您想要包含 ISBN 的文本
以下代码将等待 10 秒以加载所有元素和 return 列表。之后打印所有元素的文本。
By byXpath = By.xpath("//strong[contains(text(),'ISBN')]");
List<WebElement> iSBNList = (new WebDriverWait(driver , 10).until(ExpectedConditions.presenceOfAllElementsLocatedBy(byXpath)));
for (WebElement element :iSBNList){
System.out.println(element.getText());
}