Jsoup:获取某个元素之前的所有元素/移除某个元素之后的所有堆叠元素
Jsoup: get all elements before a certain element / remove all stacked elements after a certain element
这个问题有另一个版本,我将使用它作为我的基础
我想获取 .friend-pets 之前的所有 .pet。我尝试使用原始问题中提出的解决方案,但我遇到了这个用例的结果。
输入:
<div class="pets">
<div>
<div class="pet">1</div>
<div class="pet">2</div>
</div>
<div class="pet">3</div>
<div class="friends-pets">Your friends have these pets:</div>
<div class="pet">4</div>
<div>
<div class="pet">5</div>
<div class="pet">6</div>
</div>
<div>
预期:
<div class="pet">1</div>
<div class="pet">2</div>
<div class="pet">3</div>
实际:
<div class="pet">1</div>
<div class="pet">2</div>
<div class="pet">3</div>
<div class="pet">5</div>
<div class="pet">6</div>
这发生在我 运行:
Element petsWrapper = document.selectFirst(".pets");
Elements pets = petsWrapper.select(".pet");
// select middle element
Element middleElement = petsWrapper.selectFirst(".friends-pets");
// remove from "pets" every element that comes after the middle element
pets.removeAll(middleElement.nextElementSiblings());
System.out.println(pets);
因为 nextSiblings() 方法只能获取属于同一父级的元素。
当我像第二个答案中建议的那样使用 css 选择器时:
.pet:not(.friends-pets ~ .pet)
我收到这个错误:
Did not find balanced marker at '.friends-pets ~ .pet'
所以我无法真正测试它是否真的有效。
谢谢。
我的方法是 select 你想要什么和不想要什么 selector。您可以使用逗号 ,
连接 selectors,这样它将作为 AND
运算符工作。元素的顺序将被保留,您将拥有一个包含“同一级别”的所有元素的列表,而没有 parents。那么你只能得到该列表的前半部分。
Elements goodElementsWithBadElement = document.select(".pet,.friends-pets");
Element badElement = goodElementsWithBadElement.select(".friends-pets").first();
int positionOfBadElement = goodElementsWithBadElement.indexOf(badElement);
List<Element> onlyWhatYouWant = goodElementsWithBadElement.subList(0, positionOfBadElement);
System.out.println(onlyWhatYouWant);
顺便说一句,我是之前那个答案的作者 ;)
这个问题有另一个版本,我将使用它作为我的基础
我想获取 .friend-pets 之前的所有 .pet。我尝试使用原始问题中提出的解决方案,但我遇到了这个用例的结果。
输入:
<div class="pets">
<div>
<div class="pet">1</div>
<div class="pet">2</div>
</div>
<div class="pet">3</div>
<div class="friends-pets">Your friends have these pets:</div>
<div class="pet">4</div>
<div>
<div class="pet">5</div>
<div class="pet">6</div>
</div>
<div>
预期:
<div class="pet">1</div>
<div class="pet">2</div>
<div class="pet">3</div>
实际:
<div class="pet">1</div>
<div class="pet">2</div>
<div class="pet">3</div>
<div class="pet">5</div>
<div class="pet">6</div>
这发生在我 运行:
Element petsWrapper = document.selectFirst(".pets");
Elements pets = petsWrapper.select(".pet");
// select middle element
Element middleElement = petsWrapper.selectFirst(".friends-pets");
// remove from "pets" every element that comes after the middle element
pets.removeAll(middleElement.nextElementSiblings());
System.out.println(pets);
因为 nextSiblings() 方法只能获取属于同一父级的元素。 当我像第二个答案中建议的那样使用 css 选择器时:
.pet:not(.friends-pets ~ .pet)
我收到这个错误:
Did not find balanced marker at '.friends-pets ~ .pet'
所以我无法真正测试它是否真的有效。
谢谢。
我的方法是 select 你想要什么和不想要什么 selector。您可以使用逗号 ,
连接 selectors,这样它将作为 AND
运算符工作。元素的顺序将被保留,您将拥有一个包含“同一级别”的所有元素的列表,而没有 parents。那么你只能得到该列表的前半部分。
Elements goodElementsWithBadElement = document.select(".pet,.friends-pets");
Element badElement = goodElementsWithBadElement.select(".friends-pets").first();
int positionOfBadElement = goodElementsWithBadElement.indexOf(badElement);
List<Element> onlyWhatYouWant = goodElementsWithBadElement.subList(0, positionOfBadElement);
System.out.println(onlyWhatYouWant);
顺便说一句,我是之前那个答案的作者 ;)