Jsoup:获取某个元素之前的所有元素/移除某个元素之后的所有堆叠元素

Jsoup: get all elements before a certain element / remove all stacked elements after a certain element

这个问题有另一个版本,我将使用它作为我的基础

我想获取 .friend-pets 之前的所有 .pet。我尝试使用原始问题中提出的解决方案,但我遇到了这个用例的结果。

输入:

<div class="pets">
  <div>
    <div class="pet">1</div>
    <div class="pet">2</div>
  </div>
    <div class="pet">3</div>
    <div class="friends-pets">Your friends have these pets:</div>
    <div class="pet">4</div>
  <div>
     <div class="pet">5</div>
     <div class="pet">6</div>
  </div>
<div>

预期:

<div class="pet">1</div>
 <div class="pet">2</div>
 <div class="pet">3</div>

实际:

<div class="pet">1</div>
<div class="pet">2</div>
<div class="pet">3</div>
<div class="pet">5</div>
<div class="pet">6</div>

这发生在我 运行:

Element petsWrapper = document.selectFirst(".pets");
Elements pets = petsWrapper.select(".pet");
// select middle element
Element middleElement = petsWrapper.selectFirst(".friends-pets");
// remove from "pets" every element that comes after the middle element
pets.removeAll(middleElement.nextElementSiblings());
System.out.println(pets);

因为 nextSiblings() 方法只能获取属于同一父级的元素。 当我像第二个答案中建议的那样使用 css 选择器时:

.pet:not(.friends-pets ~ .pet)

我收到这个错误:

Did not find balanced marker at '.friends-pets ~ .pet'

所以我无法真正测试它是否真的有效。

谢谢。

我的方法是 select 你想要什么和不想要什么 selector。您可以使用逗号 , 连接 selectors,这样它将作为 AND 运算符工作。元素的顺序将被保留,您将拥有一个包含“同一级别”的所有元素的列表,而没有 parents。那么你只能得到该列表的前半部分。

Elements goodElementsWithBadElement = document.select(".pet,.friends-pets");
Element badElement = goodElementsWithBadElement.select(".friends-pets").first();
int positionOfBadElement = goodElementsWithBadElement.indexOf(badElement);
List<Element> onlyWhatYouWant = goodElementsWithBadElement.subList(0, positionOfBadElement);
System.out.println(onlyWhatYouWant);

顺便说一句,我是之前那个答案的作者 ;)