Jsoup:提取内部标签

Jsoup: extract inner tag

我的这个 HTML 代码包含很多这样的块:

    <tr>
     <td headers="header1"><b><a href="www.site.com">TITLE</a></b></td>
     <td headers="header2"><ul class="list_attachments">
     <li><a href="/"><img src='/img/fileicons/pdf.png' alt='pdf'/>A</a>
     </li><li><a href=""><img src='/img/fileicons/pdf.png' alt='pdf'/> B</a>
     </li></ul></td><td headers="header3" class="centrato">DATE</td></tr>
    <tr>

为了迭代所有这些块,我尝试了:

Elements elements = document.select("tr").select("td[headers=header1]");

此命令有效,但仅 select

 <td headers="header1"><b><a href="www.site.com">TITLE</a></b></td>

而不是所有块。我该如何解决这个问题?不可能说:“jsoup,请 select 所有具有内部的块?

为了完成选择包含内部 <td headers="header1"> 的所有 <tr> 块的任务,我提出以下解决方案。

Elements elements = document.select("tr:has(td[headers=header1])");